在當下的創投市場里,“世界模型”毫無疑問是熱詞中的熱詞。我們幾乎每天都能看到有新的“世界模型”公司完成融資,估值增長迅猛,股東列表豪華。并且在這些融資新聞的通稿里,人們還會反復地強調一個事實:一個合格的超級智能體不應該只靠數據投喂來獲得能力,而是要像人類那樣去主動理解物理世界。
但皮特·弗洛倫斯(Pete Florence)卻在創業之后寫了一篇長長的公開信,一開頭就寫到:“不要將我的公司,貼上世界模型的標簽。”
這真是倒反天罡。因為皮特·弗洛倫斯可不僅僅是一個“創業者”這么簡單。在創業之前,皮特·弗洛倫斯一直在谷歌DeepMind團隊工作,一路從普通研究員升級到了高級研究科學家。2025年DeepMind發布的機器人控制模型Gemini Robotics,皮特·弗洛倫斯就是最核心的開發者之一。不過在此期間他最有影響力的就成,就是在2023年與他的同事們一起,向全世界介紹了一個全新的機器人模型架構“Vision-Language-Action Models”。
是的沒錯,如果說當下“世界模型”或者“VLA”是最前沿、最具共識的方向,那么皮特·弗洛倫斯就是這條路上當之無愧的先行者。這樣的人帶頭扔掉“世界模型”的標簽,實在是太沖擊了。
而現在,沖擊感加倍了。近日,皮特·弗洛倫斯創辦的具身智能公司Generalist AI完成了一輪新融資,總規模為4億美元(約合人民幣27億元),估值為20億美元(約合人民幣135.5億元)。本輪投資方包括英偉達旗下的NVentures、知名天使投資人納特·弗里德曼(Nat Friedman)和丹尼爾·格羅斯(Daniel Gross)共同管理的NFDG、貝索斯的家族辦公司Bezos Expeditions,還有小米聯合創始人林斌、Zoom創始人袁征,以及世界模型領域內最具代表性的科學家李飛飛。
“目標”比“標簽”更重要
為什么作為世界模型的主要奠基者之一,皮特·弗洛倫斯如此抗拒貼上“世界模型”的標簽?為什么李飛飛作為世界模型領域最有代表性的學者,卻用真金白銀支持了這樣一位公開“離經叛道”的異端?故事或許要從2019年講起。
那個時候的皮特·弗洛倫斯正在麻省理工大學攻讀計算機科學博士,主要研究方向是機器人操控、計算機視覺和自然語言處理等領域——從這層出身來看,皮特·弗洛倫斯堪稱“根正苗紅”,研究方向正統、學術背景也很正統,并不是一個需要依靠“特立獨行”來爭取資源的“江湖兒女”。但問題在于,麻省理工卻給他分配了一位叫做拉斯·泰德雷克(Russ Tedrake)的導師。
拉斯·泰德雷克是誰?首先,他肯定是學術大拿。在2019年,他分別擔任麻省理工大學電氣工程與計算機科學教授、計算機科學與人工智能實驗室機器人中心主任。每年到了著名的DARPA機器人挑戰賽,他還要負責帶領麻省理工校隊參賽。在校外,他還兼任豐田研究院機器人研究中心的副總裁。可以說,拉斯·泰德雷克是機器人領域內最頂尖的學者之一,有充足的資源幫助年輕的皮特·弗洛倫斯兌現自己的學術夢想。
然而在拉斯·泰德雷克的自我認知里,讓他著迷的并不是編程代碼,而是“物理”。在一篇自我介紹里,拉斯·泰德雷克回憶說,自己之所以踏上了計算機科學的學術道路,一切源于自己在研究“雙腿直立機器人”的時候,看到了“豐富動力學特性”,讓他對“復雜流體動力學控制”產生了濃厚的興趣。因此相比于其他研究者在入行的時候,會首先去研究如何讓機器人抓蘋果、疊被子,他首先研究的課題是如何控制“失速后的飛行器或撲翼飛行器”,如何“高速穿越密集障礙物”。
這樣的背景,注定了拉斯·泰德雷克非常重視“理解物理世界”這件事。麻省理工官網上如是介紹拉斯·泰德雷克的學術特點:“該教授的研究重點在于為有趣的(欠驅動、隨機和/或難以建模的)動力系統尋找優雅的控制解決方案,并能夠構建這些系統進行實驗驗證。他尤其關注力學(特別是非光滑力學)與機器學習/優化理論之間的聯系,從而為復雜機械系統實現魯棒控制設計。”
皮特·弗洛倫斯耳濡目染,自然也成為了計算機科學中的“物理派”。比如博士期間最有代表性的學術成果,就是一篇題為《視覺運動策略學習中的自監督對應》。這篇論文提出,他們找到了一種方法通過模仿學習,可以讓機器人用僅僅50次演示就能完成具有挑戰性的操作任務,還能能夠對不同類別的物體進行泛化,適應可變形物體的構型。這篇論文也因此獲得了2020年度IEEE(國際電氣與電子工程師協會)機器人與自動化領域最佳論文獎。
當然屬于什么“派”不重要,重要的是皮特·弗洛倫斯在這種環境的影響下,擁有了迥然的思考方式。大量研究者習慣現有技術,再通過實驗來得出技術的可能性,最后再確定技術的落地場景。而皮特·弗洛倫斯相信正確的順序應該是“先設置具體的目標”,再設計技術路徑。
加入谷歌DeepMind團隊后,皮特·弗洛倫斯正是沿著這一方向開展了自己的工作,其第一個代表作就是2021年谷歌推出的初代機器人模型架構Transporter Network。在模型發布的論文中,皮特·弗洛倫斯說整理物品本應該是一項非常基礎的技能,但對于機器人來說完成這個動作意味著“高層次和低層次的感知推理”,需要先后考慮考慮書應該放在哪里,以及按照什么順序堆放,同時還要確保書的邊緣彼此對齊,形成整齊的書堆。
Transporter Network正是旨在“讓簡單的動作變得簡單”而推出的模型架構,可以讓機器人通用地基于視覺去完成各種操作,訓練速度快,對訓練環境依賴性也更低。
2023年與DeepMind團隊共同發布VLA架構,也正是基于這一思路的“順水推舟”。在那篇開啟了如今世界模型盛世的論文中,作者們表示他們希望VLA架構能夠“顯著提升對新物體的泛化能力、能夠解讀機器人訓練數據中未出現的指令(例如將物體放置在特定數字或圖標上),以及能夠根據用戶指令進行基本的推理(例如拾取最小或最大的物體,或拾取距離其他物體最近的物體)”。
再回到開頭的問題,作為世界模型的主要奠基者之一,皮特·弗洛倫斯如此抗拒貼上“世界模型”的標簽?答案也是這樣:皮特·弗洛倫斯認為“目標”比“標簽”更重要。
在他看來目前關于世界模型的熱情,實際上是“理念驅動型”的,比如相當一部分熱情,可以歸結為資本市場在大熱方向上發現非共識的興奮。并且如果想要真正地推動機器人進入我們的工作生活,創造生產力,那么構建“世界模型”顯然不是一個目標。真正的目標實際上應該是機器人能夠以極高的成功率和速度完成從未見過的各類任務,且完全無需任何特定任務的數據。
而這也正是皮特·弗洛倫斯決定離開谷歌DeepMind,獨立創業的原因。2025年英偉達GTC大會上,皮特·弗洛倫斯首次作為Generalist AI的聯合創始人兼首席執行官出現在人們的視野當中。他說:“我們決心制造出能夠做任何事的機器人……試想一下,如果體力勞動的邊際成本降至零,那會是怎樣一番景象。”
99%的成功率
除了技術理念上的“離經叛道”,皮特·弗洛倫斯的創業之路也顯得很非主流。
理論上,擁有如此履歷的創業者,在當下必然會受到VC們的熱捧。楊立昆、伊利亞·蘇茨克維、米拉·穆拉蒂都是例子,都是公司剛一注冊成立(甚至沒注冊)就完成了超過10億美元的種子輪。但皮特·弗洛倫斯的Generalist AI在起步階段只接受了英偉達、貝索斯家辦、NFDG等少數幾家機構的投資。如果不是英偉達的風投部門NVentures在2025年的GTC大會上組織了一場“被投企業圓桌”,大家都不知道這人已經離職創業了。
為什么會這樣?最可能的答案,就是皮特·弗洛倫斯的主動選擇。正如上文所提到的那樣,皮特·弗洛倫斯一畢業就進入了谷歌DeepMind團隊,從2019年一直干到了2025年,中間再也沒有其他的工作履歷。也就是說,Generalist AI是他人生中的第一段創業經歷,是完全有必要慎之又慎的。
事實上,在第一次以創業者公開亮相的2025年英偉達GTC大會上,皮特·弗洛倫斯就非常直觀地表現出了自己的“謹慎”。除了告訴大家自己在造“機器人”之外沒有透露任何具體的業務方向,直接表示“我們目前仍處于隱秘狀態”。
直到2025年11月,人們才第一次看到Generalist AI的具體業務。2025年11月,Generalist AI發布了他們的初代具身智能模型GEN-0。在官方介紹中,Generalist AI表示GEN-0融合了視覺模型與語言模型的優勢,并同步完成了超越——Gen-0能夠捕捉人類級別的反射能力和物理常識。
簡單來說,它能夠隨著模型規模和訓練數據的增大而持續提升能力,突破了以往小型模型的瓶頸;它可以像人類一樣邊思考邊行動,在真實物理環境中做出快速而自然的反應;它天然適配不同類型的機器人,無需額外改造;更重要的是,它依托海量的真實操作數據,不再受數據匱乏的制約,并且通過靈活調整訓練數據的構成。大量科技媒體指出,GEN-0證明了驅動ChatGPT等大型語言模型的數學“擴展規律”也適用于物理運動。
不過GEN-0并不是完美的。例如GEN-0也并沒有解決困擾具身智能領域的數據集問題。因此到了2026年4月,Generalist AI迅速迭代到了全新的版本GEN-1。
為了解決數據集問題,Generalist AI開發了一款可穿戴設備,用于捕捉人類執行手工任務時的微小動作和視覺信息。Generalist AI表示在開發GEN-1的過程中,他們通過這對機械手收集了超過50萬小時的“PB級物理交互數據”,用于訓練其物理模型。在得到充分訓練后,GeneralistAI表示GEN-1在折疊紙箱、打包手機和維護掃地機器人等重復性但精細的機械任務上,成功率高達99%,速度約為上一代GEN-0型號的三倍,并且只需花費大約一個小時的時間就可以達成這一目標。
由此,Generalist AI驕傲的宣布,GEN-1的物理模型已經接近類似GPT-3的拐點,一些任務的性能開始“達到在商業實用環境中部署所需的水平”,并且“我們可以預期每一代新模型都會帶來一系列日益復雜的新任務,這些任務都可以被掌握”。
在官方博客中,皮特·弗洛倫斯則指出,GEN-1的開發過程是他個人技術理念的最好詮釋:首先,他設置了一個理性的目標,即機器人能夠以極高的成功率和速度完成從未見過的各類任務,且完全無需任何特定任務的數據。接著基于這個目標設定了一個解決路徑,允許針對特定任務使用少量機器人數據(稱之為X),并實現該任務的高水平執行,然后不斷減小X,同時提升性能。
聊到這里,前面我們提出的那個問題也得到了回答。Generalist AI所開發的產品到底叫不叫“世界模型”已經不重要了,只要你看到具身智能行業,看好機器人能夠大規模地進入實際生產當中,那么Generalist AI確實是值得下注的選擇。而Generalist AI這一輪融資也確實是在GEN-1發布之后的兩個月內迅速敲定的。
根據報道,老股東英偉達、貝索斯家辦Bezos Expeditions、NDFG全部選擇了復投,并且是加倍復投。除此而外,新晉投資者包括小米聯合創始人林斌、Zoom創始人袁征,華人科學家李飛飛,也包括Radical Ventures、8VC、Union Square Ventures、Hanabi Capital、Norwest這些機構投資人。
換句話說,2026年6月的皮特·弗洛倫斯已經不需要再證明自己了。最起碼那些年他吹過的牛逼——比如2025年剛剛創業的皮特·弗洛倫斯曾經在一檔播客中說:“通用機器人不是樣樣都淺嘗輒止,而是要在真實任務上專業到足夠有用”——已經走在“一一兌現”的路上了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.