![]()
智東西
作者 王涵
編輯 云鵬
智東西6月12日報道,今天,在智源大會2026上,智源研究院分享并發(fā)布了近一年以來的多項(xiàng)研究成果,包括基座大模型、智能體和基礎(chǔ)軟硬件生態(tài)三部分。
基座大模型方面,智源分享了原生多模態(tài)大模型悟界Emu3.5、AI藥物發(fā)現(xiàn)模型悟界·OpenComplex 2.5等的研究進(jìn)展,并在會上發(fā)布了神經(jīng)科學(xué)模型悟界·Brainμ 1.0、全球最大最全的AI-Ready神經(jīng)科學(xué)領(lǐng)域數(shù)據(jù)集,以及全球最大的AI-Ready神經(jīng)科學(xué)數(shù)據(jù)平臺BrainToken。
![]()
智能體方面,智源進(jìn)一步介紹了其具身大腦悟界·RoboBrain Orca v0,發(fā)布了四款智能體產(chǎn)品,包括面向心臟疾病的輔助診斷智能體、面向科學(xué)發(fā)現(xiàn)的自主研究智能體、智源大會專屬聽會智能體、有害蛋白識別智能體。在基礎(chǔ)軟硬件生態(tài)方面,智源發(fā)布眾智FlagOS 2.1,該系統(tǒng)能夠適配18家芯片廠商的32款芯片。
在大會開幕演講中,美國工程院院士、2015年圖靈獎得主Whitfield Diffie圍繞AI安全提出:當(dāng)前依賴反饋控制的方法效果不佳,他主張形式化方法才是未來,即先明確形式化規(guī)范、再編寫程序、最后數(shù)學(xué)證明程序符合規(guī)范,他樂觀認(rèn)為未來AI將成為完成這些證明的工具,大幅提升可靠性。演講尾聲,Diffie給出驚人預(yù)測:到2050年,機(jī)器智能將超越人類,成為世界運(yùn)行的主宰。
![]()
圖靈獎得主、馬薩諸塞大學(xué)阿默斯特分校榮譽(yù)退休教授Andrew Barto,將強(qiáng)化學(xué)習(xí)歸結(jié)為“控制、搜索與聯(lián)想記憶”的三位一體,指出“機(jī)器學(xué)習(xí)最初就是強(qiáng)化學(xué)習(xí)”。他強(qiáng)調(diào)強(qiáng)化學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)研究從一開始便緊密交織,深度強(qiáng)化學(xué)習(xí)結(jié)合大腦獎勵系統(tǒng)的最新成果將指引下一輪方向。最后他警示:獎勵信號設(shè)計可能帶來“反常實(shí)例化”風(fēng)險。
![]()
在播客環(huán)節(jié),中國工程院院士、阿里云創(chuàng)始人王堅(jiān)與智源研究院理事長黃鐵軍展開對話,圍繞中國大模型的發(fā)展路徑展開,重點(diǎn)討論了從追趕驗(yàn)證到路線選擇、體系構(gòu)建與范式創(chuàng)新的轉(zhuǎn)型,如何突破互聯(lián)網(wǎng)文本數(shù)據(jù)的天花板和算力短缺的極限,以及如何從“跟隨國際主流范式”轉(zhuǎn)向“形成自身問題意識”、實(shí)現(xiàn)原創(chuàng)范式躍遷。
![]()
在智源研究院院長王仲遠(yuǎn)主持的圓桌對話中,小米羅福莉、清華朱軍、清華劉知遠(yuǎn)、南洋理工安波四位專家進(jìn)行了近50分鐘的深度交流。
羅福莉認(rèn)為引發(fā)熱議的Claude Fable 5本質(zhì)仍是預(yù)訓(xùn)練、數(shù)據(jù)與強(qiáng)化學(xué)習(xí)持續(xù)推進(jìn)的自然結(jié)果;朱軍指出新版模型Token消耗下降是正確方向;劉知遠(yuǎn)分析Anthropic的成功源于找準(zhǔn)代碼這一專業(yè)領(lǐng)域,并強(qiáng)調(diào)智能革命在于用AI替代機(jī)械重復(fù)的腦力勞動;安波則提出AI自進(jìn)化不能依賴封閉環(huán)境。
![]()
一、“悟界”登《Nature》,發(fā)布全球最大最全的神經(jīng)科學(xué)數(shù)據(jù)集
智源研究院院長王仲遠(yuǎn)分享了近一年來智源研究院的相關(guān)研究進(jìn)展。
基座大模型方面,智源研發(fā)的原生多模態(tài)大模型悟界Emu3.5,在去年10月30日就已經(jīng)正式發(fā)布并且開源。今年1月份,悟界·Emu正式登上《Nature》正刊,也是國內(nèi)多模態(tài)大模型方向的第一篇。
悟界·Emu3.5通過Next-Token Prediction這一實(shí)現(xiàn)方式,實(shí)現(xiàn)了文本、圖像、視頻的統(tǒng)一學(xué)習(xí),實(shí)現(xiàn)了多模態(tài)理解任務(wù)和多模態(tài)生成任務(wù)的統(tǒng)一學(xué)習(xí)。
智源將Next-Token Prediction擴(kuò)展到了神經(jīng)科學(xué)領(lǐng)域,研發(fā)出了悟界·Brainμ1.0,該模型能夠?qū)⒛X信號與其它模態(tài)互相轉(zhuǎn)化,可以將腦信號轉(zhuǎn)成文字、圖像、聲音,同時可以反過來轉(zhuǎn)換。
![]()
同時,智源發(fā)布了全球最大最全的AI-Ready神經(jīng)科學(xué)領(lǐng)域數(shù)據(jù)集,以及全球最大的AI-Ready神經(jīng)科學(xué)數(shù)據(jù)平臺BrainToken。
![]()
此外,智源還發(fā)布了悟界·OpenComplex 2.5,是可泛化物理支持的下一代AI驅(qū)動藥物發(fā)現(xiàn)模型。通過單一的流程,該模型覆蓋了制藥的四大關(guān)鍵步驟,包括口袋識別、反向篩選、結(jié)構(gòu)預(yù)測、形成力預(yù)測。OpenComplex 2.5在多個benchmark上的核心指標(biāo),超過了傳統(tǒng)的物理方法和其他的AI模型。
![]()
二、提出世界模型四類技術(shù)路線,自研世界模型即將開源
世界模型方面,智源將當(dāng)下世界模型的技術(shù)路線分為四類:
1、第一類是語言為中心的世界模型,包括VIMA等。
2、第二類是以像素為中心的視覺模型,如Sora。
3、第三類是以三維結(jié)構(gòu)為中心的視覺模型,代表是李飛飛團(tuán)隊(duì)成果。
4、第四類是以視覺表征為中心的世界模型,像是楊立昆團(tuán)隊(duì)成果。
![]()
王仲遠(yuǎn)分享稱,智源認(rèn)為,以上四類技術(shù)路線距離真正的世界模型還存在一定差距。智源正在研發(fā)當(dāng)中的世界基座模型——悟界·Physis v0.1。該模型具有AI底層典型四大核心能力:物理一致性、動作靈活性、長程可推演、通用泛化性。其通過為理前的空間建模,能夠真正實(shí)現(xiàn)全模態(tài)的輸入,以及下一步物理狀態(tài)的預(yù)測。
該模型目前還在訓(xùn)練中,將在未來幾個月開源。
![]()
三、發(fā)布具身大腦,推出四款智能體
具身智能方面,王仲遠(yuǎn)透露,智源最新研發(fā)的具身大腦悟界·RoboBrain Orca v0,是以下一個物理狀態(tài)預(yù)測為核心的具身大腦。它通過融合大量的多模態(tài)交互數(shù)據(jù),強(qiáng)化了世界模型在具身上的表征,提升下游少量樣本泛化能力,目前已與50余家企業(yè)進(jìn)行了合作。
![]()
智能體方面,王仲遠(yuǎn)在現(xiàn)場發(fā)布了四款智能體產(chǎn)品,包括:
1、面向心臟疾病的輔助診斷智能體:BAAI Cardiac Agent
該智能體是智源智源與安貞醫(yī)院共同研發(fā)的,能夠有效識別和處理心臟磁共振的多模態(tài)數(shù)據(jù),提升醫(yī)生的診斷效率。其心臟疾病診斷的精確度,能夠達(dá)到安貞醫(yī)院頂尖心血管醫(yī)生的診斷水平。
![]()
2、面向科學(xué)發(fā)現(xiàn)的自主研究智能體:AREX
該智能體能夠覆蓋科學(xué)研究的幾個關(guān)鍵環(huán)節(jié),包括信息調(diào)研、方案設(shè)計、實(shí)驗(yàn)探究、報告撰寫。其背后所依賴的基座模型由智源自主研發(fā)。在權(quán)威的基準(zhǔn)測試上,不僅能夠顯著超越同等參數(shù)的開源模型,更能夠比肩萬億參數(shù)級別的旗艦?zāi)P汀?/p>
![]()
3、本屆智源大會專屬的聽會智能體:SoulAgent
該智能體可以幫助參會者實(shí)現(xiàn)智源大會一站式參會體驗(yàn),同時也能夠與先期入駐的智源大會的專家進(jìn)行AI問答。
![]()
4、面向有害蛋白獲取的風(fēng)險發(fā)現(xiàn)智能體
智源首次通過紅隊(duì)實(shí)驗(yàn)的方法驗(yàn)證:智能體能夠輔助篩查并獲取有害的蛋白,進(jìn)而合成蛋白,將在近期公布相關(guān)的測試報告。
![]()
四、FlagOS更新至2.1版本,適配32款芯片
在基礎(chǔ)軟硬件生態(tài)方面,王仲遠(yuǎn)介紹,智源研究院聯(lián)合開源社區(qū)打造的眾智FlagOS 現(xiàn)已更新至 2.1 版本。該系統(tǒng)適配18家芯片廠商的32款芯片,是目前全球適配芯片品類最多的計算系統(tǒng)。
FlagOS內(nèi)置算子超600個且數(shù)量仍在持續(xù)擴(kuò)充,不僅為18家芯片廠商提供統(tǒng)一AI編譯器、為12家廠商提供通用技術(shù)支持,還同時完成國際標(biāo)準(zhǔn)與國家標(biāo)準(zhǔn)立項(xiàng)。
目前該系統(tǒng)可支撐90%以上主流開源模型部署,近期已完成DeepSeek、千問、MiniMax、MiniCPM、混元等多款熱門模型的無縫適配。
![]()
結(jié)語:AI技術(shù)發(fā)展,已經(jīng)迎來拐點(diǎn)
本屆智源大會釋放出多項(xiàng)行業(yè)動向。
首先,AI研究方向日趨多元,行業(yè)不再單純追逐模型參數(shù)規(guī)模,逐步向腦科學(xué)、藥物研發(fā)、心臟疾病診斷等實(shí)體應(yīng)用領(lǐng)域深耕。其次,基礎(chǔ)軟硬件生態(tài)落地提速,眾智FlagOS已實(shí)現(xiàn)對32款芯片的適配,底層技術(shù)布局初見成效。
此外,兩位圖靈獎得主與國內(nèi)專家在分享中形成共識:隨著AI技術(shù)持續(xù)演進(jìn),僅依靠算力與數(shù)據(jù)堆砌已難實(shí)現(xiàn)長遠(yuǎn)發(fā)展,技術(shù)路線規(guī)劃、安全體系搭建以及人機(jī)協(xié)同關(guān)系等核心議題,亟待全行業(yè)深入探索與正視。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.