夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI
離職阿里后,千問大模型前負責人林俊旸的最新動態曝光了。
他的下一步,是創業。
具體公司還不知道名字,但據說種子輪目標估值已經高達20億美元(約135億元人民幣)。
根據The Information消息,高榕資本與紅杉中國被曝就投資事宜與該實驗室進行深入洽談。
![]()
對于一家還沒發產品的中國AI初創公司而言,這一估值,幾乎沒有先例。但相比林俊旸之前同臺競速的硅谷同行,不算貴。
Qwen負責人,還是太有含金量了。
![]()
Qwen前負責人創業
林俊旸2019年加入阿里,早期研究方向集中在搜索、推薦場景下的自然語言處理和多模態建模。
2020年起,他開始投身大規模預訓練模型研究與部署。
此后,他深度參與M6等超大規模預訓練模型工作。M6是阿里早期最有代表性的多模態大模型項目之一。
2022年以后,他轉向通用大模型方向。
Qwen項目成立后,林俊旸成為技術負責人,帶隊打造Qwen系列大語言與多模態模型,并主導開源工作。
Qwen后來變成了阿里AI對外最清晰的技術名片之一。
它有不同尺寸的模型,有面向開發者的開源路線,也有持續更新的多模態、代碼和輕量化模型版本。對開發者來說,Qwen是真正能下載、能微調、能部署、能二次開發的實用模型。
這也是他創業備受關注的底層原因。
那么,林俊旸下一步到底想做什么?
在有具體消息之前,還可以從他離職后發的一篇長文尋找線索。
首篇長文給出線索:Agentic Thinking
林俊旸離職后的首篇長文,標題為《From “Reasoning” Thinking to “Agentic” Thinking》。
這是他對過去一年模型競爭的復盤,也像是下一階段創業方向的技術宣言。
![]()
他的判斷可以壓縮成一句話:
上一階段的AI競爭,是讓模型更會思考;下一階段的競爭,是讓模型為了行動而思考。
思考模型花更多推理算力,強化學習得到更穩定的反饋,數學、代碼、邏輯等可驗證任務成為核心訓練場景。
但林俊旸認為,問題已經開始變了。
尤其是在代碼和智能體工作流里,真正重要的是代碼庫導航、計劃拆解、錯誤恢復、工具編排,以及長時間執行任務的質量。
這就引出全文核心概念:Agentic Thinking。
林俊旸把它定義為一種“為了行動而思考”的能力。它不只是讓模型在回答前想更久,而是讓模型在環境里行動、觀察反饋、修正計劃,再繼續推進。
推理浪潮的第一階段確立了一件重要的事:
當反饋信號可靠且基礎設施能夠支撐時,語言模型之上的RL可以產出質的飛躍式的認知能力。
更深層的轉變是從推理式思考到智能體式思考:
從想得更久,到為了行動而想。訓練的核心對象已經改變了——它變成了模型+環境的系統,或者更具體地說,是智能體和圍繞它的編排框架。
這改變了哪些研究要素最重要:
模型架構和訓練數據當然仍然重要,但環境設計、軌跡采樣基礎設施、評估器魯棒性、以及多智能體之間的協調接口同樣關鍵。
這也改變了“好的思考”的定義:
最有用的軌跡,是能在真實世界約束下維持有效行動的那個——而非最長或最醒目的那個。
這也改變了競爭優勢的來源:
在推理時代,優勢來自更好的RL算法、更強的反饋信號和更可擴展的訓練流水線。
在智能體時代,優勢將來自更好的環境、更緊密的訓練-推理耦合、更強的編排工程,以及在模型的決策與這些決策產生的后果之間實現閉環的能力。
One More Thing
自林俊旸發長文探討Agentic Thinking后,個人社交媒體賬號就沒在發聲。
不過轉發了一條持續學習基準測試的消息。
難道與創業方向相關?
![]()
參考鏈接:
[1]
https://x.com/jingyanghk/status/2054450088400093359
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.