AI圈最知名的技術布道者,“Vibe Coding之父”,選擇了OpenAI最強勁的對手。
5月19日深夜11點,Andrej Karpathy在X上發(fā)了四句話,宣告了AI人才格局的又一次重新洗牌。
這條帖子一小時內瀏覽量接近300萬。Karpathy寫道:
個人動態(tài):我已加入Anthropic。我認為未來幾年大語言模型的前沿發(fā)展將尤為重要。很高興能加入這個團隊,重返研發(fā)工作。同時,我依然對教育事業(yè)充滿熱忱,計劃適時恢復相關工作的推進。
![]()
Karpathy本周已正式入職,加入Anthropic預訓練團隊,該團隊由另一位前OpenAI員工Nicholas Joseph領導,負責Claude所有大規(guī)模訓練運行。Anthropic發(fā)言人向TechCrunch確認,Karpathy將在該團隊下組建新的子團隊,專注于用Claude自身來加速預訓練研究。
美媒Axios將此次招募定性為“Anthropic在人才爭奪中的重大勝利”。
Karpathy是誰:一個能用一個詞改變行業(yè)的人
要理解這次加入的分量,先要理解Karpathy的稀缺性在哪里。
1986年生于斯洛伐克,15歲移民加拿大。本科在多倫多大學選修了深度學習之父Geoffrey Hinton的課程,隨后在斯坦福師從李飛飛攻讀博士,期間創(chuàng)建了計算機視覺課程CS231n——從2015年的150名學生增長到2017年的750人,全部視頻公開上網,成為全球工程師自學深度學習的入門首選。
2015年,他成為OpenAI創(chuàng)始研究科學家。2017年被馬斯克挖至特斯拉擔任AI高級總監(jiān),主導自動駕駛純視覺方案。同年他在Medium發(fā)表“Software 2.0”,提出神經網絡權重就是新的代碼、數(shù)據集就是新的源代碼——這個框架重塑了整個行業(yè)對“什么是編程”的認知。
2022年離開特斯拉后,他在YouTube創(chuàng)建“Neural Networks: Zero to Hero”系列,頻道突破百萬訂閱。開源項目micrograd、nanoGPT代碼量極少,卻被稱為“可運行的教科書”。
2025年2月,他在X上造出了“Vibe Coding”一詞——“完全順應直覺,擁抱指數(shù)級增長,忘掉代碼本身的存在”——隨后被柯林斯詞典選為年度詞匯,引發(fā)了關于SaaS公司生死存亡的廣泛討論,數(shù)百億美元市值隨之蒸發(fā)。
TIME在2024年將他列入“AI領域最具影響力100人”。他在X上擁有250萬粉絲。
正如X用戶@sa_vatsa所評論的:
Andrej給人的感覺從來不像一個AI網紅,更像是這個領域的公共解讀者。他翻譯現(xiàn)實,而不是兜售立場。
![]()
他去做什么:用最強的錘子改進錘子本身
Karpathy加入Anthropic的具體任務,指向一個明確方向:用Claude加速預訓練研究本身。
預訓練是大模型獲得核心知識和能力的基礎階段,也是算力消耗最密集的環(huán)節(jié)。據Anthropic向TechCrunch確認,Karpathy將組建團隊,探索讓Claude自主發(fā)現(xiàn)更優(yōu)訓練架構、數(shù)據配比和實驗方向的方法——也就是“AI改進AI”的路線。
這并非憑空而來。今年3月,Karpathy曾做過一個實驗:將一個AI編程智能體接入一個小型語言模型,讓它無監(jiān)督運行兩天,自主測試和調整訓練代碼。經過700次實驗、20項自主發(fā)現(xiàn)的優(yōu)化后,他表示同樣的調整應用到更大模型上,訓練時間縮短了11%。他將這個方法稱為“autoresearch”,該項目隨后成為GitHub熱門項目,這套方法也被稱為“Karpathy Loop”。
他在Anthropic要做的,正是將這套思路系統(tǒng)化、規(guī)模化。
Nicholas Joseph在X上寫道:
他將建立一個團隊,專注于用Claude加速預訓練研究本身。我想不出還有誰比他更適合做這件事——期待我們一起構建的東西!!
TechCrunch評價稱,“Karpathy是少數(shù)能在LLM理論與大規(guī)模訓練實踐之間架起橋梁的研究者之一。”
為什么是Anthropic,而不是回OpenAI
Karpathy的職業(yè)軌跡有一條清晰的邏輯:哪里是當下最大的實驗,他就去哪里。
2017年去特斯拉,因為自動駕駛是Software 2.0最大的實驗場。2022年離開,因為架構已定,剩下的是工程優(yōu)化。2023年回OpenAI,因為GPT-4帶來的爆發(fā)期是最刺激的前沿。2024年創(chuàng)辦AI教育公司Eureka Labs,想驗證AI原生教育的假設。
這一次選擇Anthropic,他的判斷是:“用AI研究AI”的預訓練革命正在這里發(fā)生。
而他沒有回OpenAI,背后有一個不可忽視的結構性信號:
2024年5月,OpenAI前對齊負責人Jan Leike加入Anthropic;
2024年8月,OpenAI聯(lián)合創(chuàng)始人John Schulman跟進;
2026年5月,Karpathy加入。
三年,三位OpenAI核心人物,全部單向流入Anthropic,沒有任何可比的反向案例。
與此同時,OpenAI的戰(zhàn)略重心已明顯轉向平臺化——相繼收購Chat.com、io Products、Windsurf等,節(jié)奏越來越快,金額越來越大。對于一個想”回歸研發(fā)“的研究者而言,Anthropic”以研究質量取勝“的路線,顯然更有吸引力。
據Business Insider報道,Anthropic的估值在二級市場近期已超過1萬億美元,超越OpenAI。Anthropic目前正在以約9000億美元估值洽談300億美元新一輪融資。據新智元援引Polymarket數(shù)據,交易者給Anthropic在6月底擁有最佳AI模型的概率定價為65%,而OpenAI為4%。
“Anthropic正在贏得AI競賽”
對于這則重磅人事變動,X用戶@Shashank評論道:
Anthropic開始看起來像2000年代中期的皇家馬德里,把所有AI傳奇人物和CTO都招進來當技術成員。Anthropic正在打造一支絕對的超級戰(zhàn)隊。
![]()
X用戶@Balu0X表示:
天哪,太瘋狂了,完全沒想到。Anthropic正在贏得AI競賽。
![]()
@HegsethWarDesk用戶表示,
Anthropic發(fā)展勢頭良好,我認為在未來三四年內他們會超越OpenAI。
![]()
![]()
![]()
Anthropic為什么非要招他
Anthropic的招募動機可以分幾層來看。
技術層面:Anthropic的算力預算無法與微軟支持的OpenAI或坐擁TPU的谷歌正面競爭。它必須找到用更少算力訓出更好模型的方法。Karpathy同時具備預訓練理論深度、大規(guī)模工程經驗和對AI輔助研究的直覺,三者兼?zhèn)涞娜藰O少。
人才信號層面:每一個Karpathy級別的加入,都在降低下一個頂級人才加入的心理門檻。人才吸引人才,飛輪自轉。
IPO敘事層面:Karpathy是AI領域公眾辨識度最高的技術人物之一——百萬YouTube訂閱,年度詞匯造詞者,GitHub上22萬星標的CLAUDE.md倉庫。他的名字出現(xiàn)在員工名單上,本身就是一句可以寫進招股書的話。
但據新智元分析,最深層的價值可能是Anthropic沒有明說的:Karpathy定義范式的能力。他在Anthropic做的任何技術探索,都會通過他的推文、博客和YouTube視頻公開傳播。當他用他特有的方式給正在發(fā)生的事情命名時,Anthropic就自然成為那個范式的原產地。
招了一個頂級預訓練研究者,附帶獲得了行業(yè)最有影響力的技術敘事者。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.