4月30日,在第九屆數字中國建設峰會上,微博COO、新浪移動CEO王巍發表了題為《可靠數據,驅動可信AI——微博的大模型實踐與思考》的演講。結合微博的實踐,王巍分享了數據賦能可信AI的路徑與思考。
![]()
王巍指出,當前大模型能力加速躍遷,數據重要性同步提升。一方面,DeepSeek V4等開源模型實現深度思考能力躍升,OpenAI GPT-Image-2等多模態生成技術已達以假亂真的商用水平;另一方面,OpenClaw推出后,AI智能體快速普及,“養龍蝦”熱潮成為AI自主執行任務落地的典型現象。然而,在模型能力加速進化的同時,數據質量決定模型輸出質量的核心規律始終不變。可信AI的根基,在于可靠的數據。
王巍以微博為例介紹,作為運營超16年、月活用戶近6億的平臺,微博在數據的結構和質量上有自己的獨特優勢。第一個優勢是數據規模扎實,質量可信。權威機構和媒體、專業大V、普通用戶三層信源交織,形成了微博數據兼具權威性和真實性的獨特屬性。第二個優勢是實時、多元、有溫度。微博是重大熱點事件的“第一現場”,幾乎覆蓋全社會不同視角,這種“有溫度”的維度在許多其他數據源中相對稀缺。
王巍表示,基于這一數據基礎,微博探索了微博智搜、微博評論機器人、微博龍蝦助手等大模型應用實踐。微博智搜引入深度思考大模型,實現智能總結、多輪交互、可信驗證,滿足用戶在熱點事件中快速獲得完整、權威信息的需求。微博評論機器人具備多模態理解與情緒價值供給能力,不僅能生成更精準、更有趣的評論,也能理解用戶情緒并給出恰當回應。微博龍蝦助手則打通了OpenClaw生態和微博用戶場景,大幅降低AI智能體使用門檻,滿足用戶對AI Agent的需求,同時也給AI廠商提供了一條相對可復制的落地路徑。
王巍認為,可信AI不是單一技術命題,而是系統工程。概括成一個公式就是:可信AI = 可靠數據 + 可解釋模型 + 可溯源內容,三者缺一不可。在數據側,要確保真實信源、合規采集和持續治理;在模型側,雖然AI具有不可解釋性,也要努力去實現決策路徑和推理過程的透明;在內容側,則需要落實《人工智能生成合成內容標識辦法》,讓生成內容有身份標簽,能夠被追溯,也能夠被問責。
“微博既是數據的守護者,也是AI應用的實踐者,更希望成為可信AI生態的積極共建者。這件事需要數據提供方、AI開發者、內容平臺和監管機構一起發力。”王巍在分享結束時表示,數據要素和人工智能雙向賦能的進程正在持續推進,微博愿與各方共同推動這個進程走得更穩、更遠。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.