![]()
新智元報道
![]()
【新智元導讀】5 月 19 日,OpenAI 聯合創始人、「Vibe Coding」之父 Andrej Karpathy 宣布加入 Anthropic 預訓練團隊。他將組建新團隊,用 Claude 加速預訓練研究。一個做過Hinton和李飛飛學生、奧特曼同事、馬斯克直屬下屬的人,為什么甘愿做 Dario Amodei 的「-2」?Anthropic 又為什么非要招他?
5 月 19 日晚上 11 點,Andrej Karpathy 親自官宣加入了 Anthropic。
![]()
這個名字的分量不需要多解釋。
OpenAI 聯合創始人,特斯拉前 AI 總監,「Vibe Coding」之父,全球最有影響力的 AI 教育者。
他在 AI 領域的地位,大概相當于籃球界的詹姆斯,到哪支隊伍都是頭條。
他在 X 上只發了三句話。
![]()
https://x.com/karpathy/status/2056753169888334312
第一句說 LLM 前沿的未來幾年「尤其具有塑造性」。第三句說他仍然熱愛教育。中間那句最關鍵,五個詞,「回歸研發」。
這是兩年內第三位從 OpenAI 陣營投奔 Anthropic 的核心人物。
也是一個即將 40 歲、功成名就、財務自由的人,主動選擇去給別人的下屬當下屬。
為什么走?為什么是 Anthropic?Anthropic 又為什么非要招他?
每一個問題背后都有一層值得拆開看的東西。
他去做什么
Karpathy 本周已經開始工作,進入了 Anthropic 預訓練團隊。
這個團隊由 Nick Joseph 領導,負責 Claude 所有大規模訓練運行。
Anthropic 發言人向 TechCrunch 確認,Karpathy 將組建一個新的子團隊,專注于用 Claude 自身來加速預訓練研究。
Nick Joseph 也在 X 上補充了背景,「他將建立一個團隊,專注于用 Claude 加速預訓練研究本身。」
![]()
https://x.com/nickevanjoseph/status/2056760504949842219
TechCrunch 評價稱,「Karpathy 是少數能在 LLM 理論與大規模訓練實踐之間架起橋梁的研究者之一。」
Axios 則把這件事定性為「Anthropic 在人才爭奪中的重大勝利」。
同日宣布加入 Anthropic 的還有網絡安全專家 Chris Rohlf,此前 xAI 創始成員 Ross Nordeen 也于本月早些時候加入。人才流向的方向性越來越明顯。
![]()
https://x.com/chrisrohlf/status/2056744653165092983
在 Polymarket 的數據可以作為市場情緒的旁證——交易者給 Anthropic 在 6 月底擁有最佳 AI 模型的概率定價為 65%,而 OpenAI 為 4%。
![]()
https://polymarket.com/event/which-company-has-best-ai-model-end-of-june
Karpathy 的加入進一步強化了這個判斷。
定義者 Karpathy
要理解這次加入的重量,需要理解 Karpathy 這個人的稀缺性。
他的稀缺不在于技術能力,頂級研究者有一批。
他的稀缺,在于他能用一個詞改變整個行業理解某件事的方式。
1986 年生于斯洛伐克,15 歲移民加拿大多倫多。
在多倫多大學讀本科時選修了 Geoffrey Hinton 的課程并參加了他的讀書會。
Hinton 是深度學習復興運動的精神領袖,2018 年圖靈獎得主,2024 年諾貝爾物理學獎得主。
![]()
Karpathy 是最早被這把火點燃的年輕人之一。
之后在 Stanford 師從另一位傳奇人物李飛飛,博士期間創建了 CS231n 課程。
![]()
這門課從 2015 年的 150 名學生漲到 2017 年的 750 人,全部視頻講義公開上網,成為全球無數工程師自學深度學習的第一站,更是計算機視覺第一神課,沒有之一。
![]()
2015 年,他成為 OpenAI 的創始研究科學家。
![]()
2017 年被馬斯克招至特斯拉擔任 AI 高級總監,推動自動駕駛走向純視覺方案。
在這次挖角中,馬斯克承受了巨大的壓力。
![]()
https://www.cnbc.com/2026/05/19/anthropic-hires-openai-cofounder-andrej-karpathy-former-tesla-ai-lead.html
同年,Karpathy 在 Medium 上發表了一篇文章,提出了「Software 2.0」概念,主張神經網絡權重就是新的代碼,數據集就是新的源代碼,梯度下降就是新的編譯器。
這個框架重塑了整個行業對「什么是編程」的認知。
2022 年離開特斯拉后,他在 YouTube 上創建了「Neural Networks: Zero to Hero」系列課程,頻道突破百萬訂閱。
同期的開源項目 micrograd、nanoGPT、nanochat,代碼量極少但精準擊中核心概念,被稱為「可運行的教科書」。
2025 年 2 月,他造出了「Vibe Coding」一詞,被柯林斯詞典選為年度詞匯。
![]()
https://x.com/karpathy/status/1886192184808149383
6 月在 YC AI Startup School 演講中提出「Software 3.0」和「Agent 的十年」框架,成為當年討論最廣的 AI 演講之一。
TIME 在 2024 年將他列入「AI 領域最具影響力 100 人」。
從 Hinton,到李飛飛,到奧特曼,再到馬斯克,他在每個節點都站在最前沿。
但他留下的最持久的東西不是任何一個產品或論文,而是那些概念框架。
Software 2.0、Vibe Coding、LLM OS。這些詞改變了人們思考 AI 的方式。
![]()
為什么甘愿做「-2」
Karpathy 的職業生涯有一條清晰的線索,他追逐的從來不是頭銜。
他做過Hinton和李飛飛的學生、奧特曼的同事、馬斯克的直接下屬。
每一段經歷里,他的組織架構位置都是高層。
現在他加入 Anthropic,直接上司是 Nick Joseph,預訓練負責人。
![]()
Nick Joseph 匯報給 Dario Amodei。
Karpathy 在組織架構中排到了第三層。
Nick Joseph 是 Anthropic 創始 11 人之一,此前在 Vicarious 和 OpenAI 工作。
在 OpenAI 期間,他在安全團隊做代碼模型,看到 GPT-3 微調之后能寫代碼,意識到 AI 可以自我改進,于是跟著安全團隊的領導一起離開,創建了 Anthropic。
他的團隊訓出了 Claude 全系列模型,包括 Mythos。
Karpathy 愿意在 Nick Joseph 下面做研究,原因很簡單,這個位置離他想做的事最近。
回溯他的每一次職業變動,驅動力都是同一個,「此刻最大的實驗在哪里」。
2017 年去 Tesla,因為自動駕駛是 Software 2.0 最大的實驗場。
2022 年離開,因為架構已定,剩下的是工程優化。
2023 年回 OpenAI,因為 ChatGPT 隨著 GPT-4 發布帶來的爆發期是最刺激的前沿。
2024 年創辦 Eureka Labs,想驗證 AI 原生教育的假設。
2026 年加入 Anthropic,因為「用 AI 研究 AI」的預訓練革命正在這里發生。
每一次離開都不是出于不滿,而是當下的位置不再是最大的實驗所在。
為什么不回 OpenAI?人才流向給出了答案。
Jan Leike,OpenAI 前對齊負責人,2024 年 5 月加入 Anthropic。
![]()
OpenAI 聯合創始人 John Schulman,同年 8 月跟進。
![]()
現在輪到了 Karpathy。
兩年三人,全部單向流動,沒有任何可比的反向案例。
OpenAI 的戰略重心已經從純研究轉向了平臺化和收購。Chat.com、io Products、Windsurf、TBPN,收購間隔越來越短,金額越來越大。
這是一家正在變成「AI 時代消費巨頭」的公司。
對一個想「回歸研發」的研究者來說,Anthropic「以研究質量取勝」的路線更有吸引力。
Anthropic 為什么如此想要他
Anthropic 的招聘動機可以分成幾層。
最表層是技術需求。
Anthropic 的算力預算再大,也比不過微軟撐腰的 OpenAI 和坐擁 TPU 的谷歌。
純堆算力的競賽,Anthropic 贏不了。
它必須找到一種用更少算力訓出更好模型的方法。
「用 Claude 加速預訓練研究」就是這條路線,而 Karpathy 同時具備預訓練理論深度、大規模工程經驗、和對 AI 輔助研究的直覺,三者兼備的人極少。
再往下是人才信號。
兩年三位 OpenAI 核心人物單向流入 Anthropic,「一線研究者用腳投票」的敘事已經成型。
每一個 Karpathy 級別的加入,都在降低下一個頂級人才加入的心理門檻。人才吸引人才,飛輪自轉。
還有 IPO 前的品牌鍍金。
Anthropic 正在以 9000 億美元估值談 300 億美元融資,IPO 準備也在推進。
Karpathy 是 AI 領域公眾辨識度最高的技術人物之一,百萬 YouTube 訂閱,年度詞匯造詞者,22 萬 GitHub 星標的 CLAUDE.md 倉庫。
他的名字出現在 Anthropic 的員工名單上,直接給了投行一句可以寫進招股書的話。
但最有意思的一層可能是 Anthropic 沒有明確作為招聘動機、卻注定會收獲最大回報的東西,Karpathy 定義范式的能力。
他在 Anthropic 做的任何技術探索都會被他公開談論,推文、博客、YouTube 視頻。
當他用他特有的方式給正在發生的事情命名時,Anthropic 就自然成為那個范式的原產地。
招了一個頂級預訓練研究者,附帶獲得了行業最有影響力的技術敘事者。
飛輪的臨界點
把這件人事變動放到更大的背景下看,它標記的是一個技術拐點。
2026 年 4 月,Anthropic 發布了 Mythos Preview,迄今最強大的 AI 模型。
![]()
Mythos 過于強大,僅能通過 Project Glasswing 受邀內測
Mythos 在沒有被專門訓練網絡安全的情況下,自主發現并利用了 FreeBSD 中一個存在 17 年的遠程代碼執行漏洞,找到了 OpenBSD 中 27 年的漏洞和 FFmpeg 中 16 年的缺陷。
英國 AI 安全研究所的獨立評估確認,它是第一個能從頭到尾完成 32 步企業網絡攻擊模擬的模型。
Anthropic 自己也承認,這些能力不是刻意訓練的結果,是通用推理和軟件工程能力提升的「下游涌現」。
預訓練做得越好,涌現出的能力越超出預期。
Mythos 是當前最強大的模型,也是當前最強大的工具。
Karpathy 來 Anthropic 要做的,就是拿這把最強的錘子,去改進錘子本身的制造方式。
用 Mythos / Claude 來發現更優的訓練架構、數據配比、實驗方向,讓模型改進的速度脫離人類研究者的線性節奏,轉起「AI 改進 AI」的進化飛輪。
這也是 Anthropic 最期望的結局。
當這個飛輪真正轉起來,「AI 自我改進預訓練」就不再只是一個研究方向,而是通往 AGI 乃至 ASI 的加速通道。
目前所有關于算力軍備競賽、數據壁壘、人才爭奪的競爭維度,都可能被這一個變量改寫。
三年內,OpenAI 失去三位核心人物給同一個競爭對手。
這個事實的影響可能比任何融資數字都大。
算力可以用錢買,數據可以用時間積累,但能讓 AI 進化飛輪轉起來的人,全世界一只手數得過來。
Karpathy 選擇在這個時刻放下自由身份回到一線。他認為窗口就在眼前。
參考資料:
https://x.com/karpathy/status/2056753169888334312
編輯:馬可 摩西
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.