智源大會連甩1個大腦3個大模型4個智能體，圖靈獎得主：2050機(jī)器智能將主宰世界

2026-06-12 15:23:19　來源: 智東西

北京舉報

分享至

智東西
作者王涵
編輯云鵬

智東西6月12日報道，今天，在智源大會2026上，智源研究院分享并發(fā)布了近一年以來的多項(xiàng)研究成果，包括基座大模型、智能體和基礎(chǔ)軟硬件生態(tài)三部分。

基座大模型方面，智源分享了原生多模態(tài)大模型悟界Emu3.5、AI藥物發(fā)現(xiàn)模型悟界·OpenComplex 2.5等的研究進(jìn)展，并在會上發(fā)布了神經(jīng)科學(xué)模型悟界·Brainμ 1.0、全球最大最全的AI-Ready神經(jīng)科學(xué)領(lǐng)域數(shù)據(jù)集，以及全球最大的AI-Ready神經(jīng)科學(xué)數(shù)據(jù)平臺BrainToken。

智能體方面，智源進(jìn)一步介紹了其具身大腦悟界·RoboBrain Orca v0，發(fā)布了四款智能體產(chǎn)品，包括面向心臟疾病的輔助診斷智能體、面向科學(xué)發(fā)現(xiàn)的自主研究智能體、智源大會專屬聽會智能體、有害蛋白識別智能體。在基礎(chǔ)軟硬件生態(tài)方面，智源發(fā)布眾智FlagOS 2.1，該系統(tǒng)能夠適配18家芯片廠商的32款芯片。

在大會開幕演講中，美國工程院院士、2015年圖靈獎得主Whitfield Diffie圍繞AI安全提出：當(dāng)前依賴反饋控制的方法效果不佳，他主張形式化方法才是未來，即先明確形式化規(guī)范、再編寫程序、最后數(shù)學(xué)證明程序符合規(guī)范，他樂觀認(rèn)為未來AI將成為完成這些證明的工具，大幅提升可靠性。演講尾聲，Diffie給出驚人預(yù)測：到2050年，機(jī)器智能將超越人類，成為世界運(yùn)行的主宰。

圖靈獎得主、馬薩諸塞大學(xué)阿默斯特分校榮譽(yù)退休教授Andrew Barto，將強(qiáng)化學(xué)習(xí)歸結(jié)為“控制、搜索與聯(lián)想記憶”的三位一體，指出“機(jī)器學(xué)習(xí)最初就是強(qiáng)化學(xué)習(xí)”。他強(qiáng)調(diào)強(qiáng)化學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)研究從一開始便緊密交織，深度強(qiáng)化學(xué)習(xí)結(jié)合大腦獎勵系統(tǒng)的最新成果將指引下一輪方向。最后他警示：獎勵信號設(shè)計可能帶來“反常實(shí)例化”風(fēng)險。

在播客環(huán)節(jié)，中國工程院院士、阿里云創(chuàng)始人王堅(jiān)與智源研究院理事長黃鐵軍展開對話，圍繞中國大模型的發(fā)展路徑展開，重點(diǎn)討論了從追趕驗(yàn)證到路線選擇、體系構(gòu)建與范式創(chuàng)新的轉(zhuǎn)型，如何突破互聯(lián)網(wǎng)文本數(shù)據(jù)的天花板和算力短缺的極限，以及如何從“跟隨國際主流范式”轉(zhuǎn)向“形成自身問題意識”、實(shí)現(xiàn)原創(chuàng)范式躍遷。

在智源研究院院長王仲遠(yuǎn)主持的圓桌對話中，小米羅福莉、清華朱軍、清華劉知遠(yuǎn)、南洋理工安波四位專家進(jìn)行了近50分鐘的深度交流。

羅福莉認(rèn)為引發(fā)熱議的Claude Fable 5本質(zhì)仍是預(yù)訓(xùn)練、數(shù)據(jù)與強(qiáng)化學(xué)習(xí)持續(xù)推進(jìn)的自然結(jié)果；朱軍指出新版模型Token消耗下降是正確方向；劉知遠(yuǎn)分析Anthropic的成功源于找準(zhǔn)代碼這一專業(yè)領(lǐng)域，并強(qiáng)調(diào)智能革命在于用AI替代機(jī)械重復(fù)的腦力勞動；安波則提出AI自進(jìn)化不能依賴封閉環(huán)境。

一、“悟界”登《Nature》，發(fā)布全球最大最全的神經(jīng)科學(xué)數(shù)據(jù)集

智源研究院院長王仲遠(yuǎn)分享了近一年來智源研究院的相關(guān)研究進(jìn)展。

基座大模型方面，智源研發(fā)的原生多模態(tài)大模型悟界Emu3.5，在去年10月30日就已經(jīng)正式發(fā)布并且開源。今年1月份，悟界·Emu正式登上《Nature》正刊，也是國內(nèi)多模態(tài)大模型方向的第一篇。

悟界·Emu3.5通過Next-Token Prediction這一實(shí)現(xiàn)方式，實(shí)現(xiàn)了文本、圖像、視頻的統(tǒng)一學(xué)習(xí)，實(shí)現(xiàn)了多模態(tài)理解任務(wù)和多模態(tài)生成任務(wù)的統(tǒng)一學(xué)習(xí)。

智源將Next-Token Prediction擴(kuò)展到了神經(jīng)科學(xué)領(lǐng)域，研發(fā)出了悟界·Brainμ1.0，該模型能夠?qū)⒛X信號與其它模態(tài)互相轉(zhuǎn)化，可以將腦信號轉(zhuǎn)成文字、圖像、聲音，同時可以反過來轉(zhuǎn)換。

同時，智源發(fā)布了全球最大最全的AI-Ready神經(jīng)科學(xué)領(lǐng)域數(shù)據(jù)集，以及全球最大的AI-Ready神經(jīng)科學(xué)數(shù)據(jù)平臺BrainToken。

此外，智源還發(fā)布了悟界·OpenComplex 2.5，是可泛化物理支持的下一代AI驅(qū)動藥物發(fā)現(xiàn)模型。通過單一的流程，該模型覆蓋了制藥的四大關(guān)鍵步驟，包括口袋識別、反向篩選、結(jié)構(gòu)預(yù)測、形成力預(yù)測。OpenComplex 2.5在多個benchmark上的核心指標(biāo)，超過了傳統(tǒng)的物理方法和其他的AI模型。

二、提出世界模型四類技術(shù)路線，自研世界模型即將開源

世界模型方面，智源將當(dāng)下世界模型的技術(shù)路線分為四類：

1、第一類是語言為中心的世界模型，包括VIMA等。

2、第二類是以像素為中心的視覺模型，如Sora。

3、第三類是以三維結(jié)構(gòu)為中心的視覺模型，代表是李飛飛團(tuán)隊(duì)成果。

4、第四類是以視覺表征為中心的世界模型，像是楊立昆團(tuán)隊(duì)成果。

王仲遠(yuǎn)分享稱，智源認(rèn)為，以上四類技術(shù)路線距離真正的世界模型還存在一定差距。智源正在研發(fā)當(dāng)中的世界基座模型——悟界·Physis v0.1。該模型具有AI底層典型四大核心能力：物理一致性、動作靈活性、長程可推演、通用泛化性。其通過為理前的空間建模，能夠真正實(shí)現(xiàn)全模態(tài)的輸入，以及下一步物理狀態(tài)的預(yù)測。

該模型目前還在訓(xùn)練中，將在未來幾個月開源。

三、發(fā)布具身大腦，推出四款智能體

具身智能方面，王仲遠(yuǎn)透露，智源最新研發(fā)的具身大腦悟界·RoboBrain Orca v0，是以下一個物理狀態(tài)預(yù)測為核心的具身大腦。它通過融合大量的多模態(tài)交互數(shù)據(jù)，強(qiáng)化了世界模型在具身上的表征，提升下游少量樣本泛化能力，目前已與50余家企業(yè)進(jìn)行了合作。

智能體方面，王仲遠(yuǎn)在現(xiàn)場發(fā)布了四款智能體產(chǎn)品，包括：

1、面向心臟疾病的輔助診斷智能體：BAAI Cardiac Agent

該智能體是智源智源與安貞醫(yī)院共同研發(fā)的，能夠有效識別和處理心臟磁共振的多模態(tài)數(shù)據(jù)，提升醫(yī)生的診斷效率。其心臟疾病診斷的精確度，能夠達(dá)到安貞醫(yī)院頂尖心血管醫(yī)生的診斷水平。

2、面向科學(xué)發(fā)現(xiàn)的自主研究智能體：AREX

該智能體能夠覆蓋科學(xué)研究的幾個關(guān)鍵環(huán)節(jié)，包括信息調(diào)研、方案設(shè)計、實(shí)驗(yàn)探究、報告撰寫。其背后所依賴的基座模型由智源自主研發(fā)。在權(quán)威的基準(zhǔn)測試上，不僅能夠顯著超越同等參數(shù)的開源模型，更能夠比肩萬億參數(shù)級別的旗艦?zāi)Ｐ汀?/p>

3、本屆智源大會專屬的聽會智能體：SoulAgent

該智能體可以幫助參會者實(shí)現(xiàn)智源大會一站式參會體驗(yàn)，同時也能夠與先期入駐的智源大會的專家進(jìn)行AI問答。

4、面向有害蛋白獲取的風(fēng)險發(fā)現(xiàn)智能體

智源首次通過紅隊(duì)實(shí)驗(yàn)的方法驗(yàn)證：智能體能夠輔助篩查并獲取有害的蛋白，進(jìn)而合成蛋白，將在近期公布相關(guān)的測試報告。

四、FlagOS更新至2.1版本，適配32款芯片

在基礎(chǔ)軟硬件生態(tài)方面，王仲遠(yuǎn)介紹，智源研究院聯(lián)合開源社區(qū)打造的眾智FlagOS 現(xiàn)已更新至 2.1 版本。該系統(tǒng)適配18家芯片廠商的32款芯片，是目前全球適配芯片品類最多的計算系統(tǒng)。

FlagOS內(nèi)置算子超600個且數(shù)量仍在持續(xù)擴(kuò)充，不僅為18家芯片廠商提供統(tǒng)一AI編譯器、為12家廠商提供通用技術(shù)支持，還同時完成國際標(biāo)準(zhǔn)與國家標(biāo)準(zhǔn)立項(xiàng)。

目前該系統(tǒng)可支撐90%以上主流開源模型部署，近期已完成DeepSeek、千問、MiniMax、MiniCPM、混元等多款熱門模型的無縫適配。

結(jié)語：AI技術(shù)發(fā)展，已經(jīng)迎來拐點(diǎn)

本屆智源大會釋放出多項(xiàng)行業(yè)動向。

首先，AI研究方向日趨多元，行業(yè)不再單純追逐模型參數(shù)規(guī)模，逐步向腦科學(xué)、藥物研發(fā)、心臟疾病診斷等實(shí)體應(yīng)用領(lǐng)域深耕。其次，基礎(chǔ)軟硬件生態(tài)落地提速，眾智FlagOS已實(shí)現(xiàn)對32款芯片的適配，底層技術(shù)布局初見成效。

此外，兩位圖靈獎得主與國內(nèi)專家在分享中形成共識：隨著AI技術(shù)持續(xù)演進(jìn)，僅依靠算力與數(shù)據(jù)堆砌已難實(shí)現(xiàn)長遠(yuǎn)發(fā)展，技術(shù)路線規(guī)劃、安全體系搭建以及人機(jī)協(xié)同關(guān)系等核心議題，亟待全行業(yè)深入探索與正視。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.