一凡 發自 副駕寺
智能車參考 | 公眾號 AI4Auto
前DeepSeek核心成員阮翀,加盟元戎后首次亮相了。
![]()
阮翀(chōng),本碩均畢業于北京大學,早年從事NLP研發,2023年加入DeepSeek,參與了DeepSeek VL、V3和R1等工作,是VL2的通訊作者,也是最新發布的V4的作者之一。
![]()
△圖源:DeepSeek V4論文
如今他以新身份元戎首席科學家,現身北京車展,分享了元戎如何利用40B基座模型,評估模型表現,用模型迭代模型的過程。
![]()
這意味著AI不再是被訓練出的結果,而是訓練系統本身的組成部分。這也是AI領域當前的趨勢。
比如,同樣是在自動駕駛行業,小馬智行最近發布世界模型2.0,就具備自我診斷能力,可以實現自我強化。
再比如,OpenAI今年在發布 GPT-5.3 Codex時透露,該模型的早期版本,加速了其自身的開發進度。
在數字世界和物理世界,AI都初步呈現出自我進化的趨勢。而能同時深刻理解這兩個領域的人才,非常稀缺,阮翀正是這樣一位罕見的人才,從LLM轉身自動駕駛,橫跨兩大領域。
阮翀詳解基座模型,元戎研發提效10倍
據阮翀介紹,過去自動駕駛研發,會選擇用很多小模型,專門解決不同的問題,這給開發和管理,帶來了很多挑戰。
所以,行業正在向統一基座模型收斂,用一個大模型,分化出多個不同版本,解決幾乎所有問題。
![]()
其中元戎的基座模型,是一個40B參數規模的VLA(Vision-Language-Action Model),可以拆分成三個部分來看:
- 駕駛模型:AI司機,專門負責開車
- 分析模型:AI分析員,分析和解釋AI司機為什么這么開
- 評估模型:AI教練,評估AI司機開車的表現
![]()
基座模型如何落地,加速元戎開發呢?阮翀舉了三個例子。
第一個例子是數據表征任務。自動駕駛研發的關鍵,是實現數據閉環,但阮翀認為過去數據驅動的方式,其實帶有滯后性:
你必須先訓練出模型,才能發現模型的問題,進而知道哪些數據不夠。
數據表征則改變了這個順序,它可以提前分析數據,并進行歸類,這樣研發團隊在訓練前就知道,自己手頭什么場景的數據多,又缺什么場景數據,在訓練時就可以有所側重,調整數據配比。
第二個例子是數據質量評估。過去分析數據質量,需要通過間接方式,根據這批數據,訓出的模型表現,反推數據質量,迭代周期比較長。
現在基于一個龐大的基座模型,只需要進行簡單的微調,就能評估數據質量。
最后,基座模型不僅在數據維度實現了提效,同時也加快了模型評估。過去評估模型能力,主要依賴路測,要先更新模型上車,再找人跟車,實測后回傳數據,這種方式費時又費力。
現在利用云端虛擬環境,就能評估模型,判斷AI司機開得好不好,并進行修正。
![]()
據阮翀估計,以前迭代一版模型可能需要100多個小時,現在加速了10倍,迭代時間縮短到了十幾個小時。
在詳解技術成果后,阮翀還參與了圓桌討論,回應了外界最關心的問題:
為什么他會加盟元戎,轉向物理AI?
以下是圓桌實錄,經編輯
阮翀回應入局物理AI
Q:什么才是物理AI?
阮翀:從狹義的角度講,物理AI一定要有一個現實載體,比如人能操縱它,然后現實世界會給出反饋,像機械手或者車。
但我認為物理AI最重要的事其實是閉環。
所以從廣義的角度講,比如說AI Coding,寫了代碼然后編譯器會給出反饋,告訴你這個地方寫了對不對,然后你再去調試。
只有這樣的一個閉環,才是AI真正進入物理世界的最重要手段,能夠讓它不斷提升。
Q:什么情況讓你意識到了大模型的能力邊界?
阮翀:我認為視覺模型現在最難的問題是空間方位感知,經常前后左右不分,然后導致一些奇奇怪怪的行為,比如分不清車門在左邊還是右邊,東西在車內和車外。
Q:哪些領域的突破性進展,值得大模型借鑒?
阮翀:我想強調的一個概念還是閉環。我覺得這個問題可以反過來看,就是如何把LLM推廣到其他領域,比如用AI去預測化學分子性質,比如它的熔點或溶解度,然后用這項技術,加速藥物研發。
![]()
Q:我們如何保證AI發展,是對人類有利的?
阮翀:我個人現在非常贊同Harness(約束AI邊界的系統工程)的概念。人需要法律和規章制度,保證他成為一個好人。
對AI也是一樣的,如果你堅信AI能超越人,那么你也需要一些工具來控制它,而不是期待它性本善。
Q:為什么近期不少LLM公司的多模態負責人,入局物理AI?
阮翀:對我來說,我覺得有兩方面的原因:
第一,我自己不太喜歡做邊際收益遞減的事情。我覺得做LLM很多年了,當然它的能力在不斷提升,但和ChatGPT剛出來時,感覺已經完全不一樣了,有一種疲倦的感覺。
LLM發展非常好,比其他領域領先,一個模型幾乎可以解決你想要的所有事。
但在別的領域,比如多模態或者具身智能,還沒有發展到這樣的階段,我自己更愿意參與這樣的階段,而不是進入一個相對成熟的階段。
第二,我自己性格的原因。我不喜歡跟別人搶著做事,比如LLM很好,那大家都一窩蜂去做,但我更在意某種使命感或者責任感:
一件事情,如果我去做和我不去做,對世界來說都沒有差別,那我為什么要做?
所以,我選擇換一個領域。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.