<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      AI能改10萬行代碼,卻讓你走路去洗車!Karpathy戳破「鋸齒狀智能」

      0
      分享至


      新智元報道

      編輯:元宇

      【新智元導讀】能重構10萬行代碼的頂尖模型,卻會建議你走路去洗車店洗車?最近,Karpathy把這件怪事講透了:AI能力是鋸齒狀的,背后是一門經濟學。他還提到Vibe Coding抬高了編程的地板,但專業開發者還需要智能體工程。智能體時代,你可以外包思考,卻不能外包理解。

      今天最先進的大模型,可以一口氣重構一個10萬行的代碼庫,也會在你想要洗車的時候,建議你走路去50米外的洗車店。

      為什么同一個模型,一會兒它表現得像一位超級工程師,一會兒卻又像一個剛畢業的實習生?

      這是Karpathy近日在Sequoia AI Ascent 2026爐邊談話中拋出的一個畫面,他用鋸齒狀智能(jaggedness)來概括這種能力分布。


      2026年4月29日,Karpathy在Sequoia AI Ascent 2026爐邊談話現場

      談話結束后,他在X上發帖復盤整場對話的亮點。


      他想講的第一件事是,大模型根本不只是在加速已有的東西,它還在打開幾條全新的地平線:有些事第一次變得可能,有些事開始顯得不必要。

      第二件事,就是鋸齒狀智能。為什么模型一邊能干超人的活,一邊在常識題上翻車?Karpathy把鋸齒狀能力解釋為可驗證性與經濟激勵共同影響的結果。

      第三件事,一個面向原生智能體(agent-native)的新經濟正在長出來。所有今天為人類寫的軟件、文檔、流程,都要被重寫為「為agent寫」。

      這三件事共同指向同一個判斷:AI已經不是「寫代碼更快」那么簡單。它在重寫軟件本身,也在重寫人類在系統里的位置。

      Karpathy自己就是最鮮明的例子。

      這位OpenAI創始成員、前Tesla AI負責人、Vibe Coding詞語的發明者,前不久還公開撂下一句話:「我從未感覺作為程序員這么落后過。」

      Sequoia的主持人正是把這句話拎出來,作為爐邊談的開場白。

      這并不是謙虛。

      一年前發明「氛圍編程」(vibe coding)的人,親口承認自己跟不上AI時代的浪潮,只能說明一點:AI發展的速度實在太快了。

      能改10萬行代碼

      卻讓你走路去洗車

      「太離譜了。」

      Karpathy在Sequoia現場講了這個洗車的段子:最先進的模型,可以重構10萬行代碼庫,也會建議你走路去50米外的洗車店洗車。

      10萬行代碼已經足以構成一個相當復雜的軟件項目,而「走路去洗車店」呢?這是一個三歲孩子都能搞清楚的常識題。

      你想洗的是車,車不能走路,所以人走路去洗車店是一個毫無意義的建議。一個能改10萬行代碼的模型,就在這種小學生級別的常識題上崩了。

      Karpathy用這個例子來說明大模型的鋸齒狀智能,他認為AI的能力并非均勻進步的,而是參差不齊,就像一塊凹凸不平的鋸齒板。

      因此今天理解AI最危險的事,就是用「它行/它不行」二分法去判斷。

      新地平線

      當軟件可以「直接做到」

      Karpathy在爐邊談里講了一個讓他自己有點尷尬的故事。

      他寫過一個App,叫MenuGen。在餐廳拍下看不懂的菜單,App幫你把每道菜畫出來。OCR加圖像生成,這是一個標準的軟件1.0項目。

      然后有一天他看到了一個軟件3.0的版本。

      那個版本只有一句話:把菜單照片發給Gemini,然后說「用Nanobanana把菜品貼到菜單上」。

      Gemini直接吐出一張圖。還是那張菜單,但每一道菜旁邊都貼上了圖。


      那一刻,Karpathy感覺到自己寫的MenuGen是多余的,因為它還活在舊范式里。

      這是Karpathy想說的第一個新地平線,不只是把舊軟件做得更快,而是把許多原本要靠一整個工程才能完成的事,壓縮成模型的一次輸出。

      第二個地平線,是.md而不是.sh。

      過去你裝一個軟件,用bash腳本,寫得密密麻麻,環境一變就崩。Karpathy提到OpenClaw的安裝方式:不是腳本,是一段Markdown文字,寫著「把這段復制粘貼給你的agent」。

      Agent查看你的環境、debug并完成調試。Markdown不再是給人看的說明書,而是給agent看的指令。

      第三個地平線,是LLM Wiki。

      這是Karpathy 2026年4月在GitHub Gist上發布的一個新理念。普通RAG(檢索增強生成)是你每問一次,模型就從零開始重新拆解一次文檔,知識不累積。

      LLM Wiki不一樣,它讓模型在一個Markdown文件夾里持續維護知識庫,你用Obsidian瀏覽:新文檔進來,模型自動更新已有條目、修訂摘要、補足鏈接、標記矛盾。

      在那份Gist里,Karpathy用了一個比喻:Obsidian是IDE(集成開發環境),LLM是程序員,wiki是代碼庫。

      在LLM Wiki里,知識被進一步組織成一個像代碼庫一樣可積累、可維護、可版本控制的工程產物。

      三個例子,指向同一件事:軟件1.0你寫代碼,軟件2.0你訓權重,軟件3.0你寫提示詞(prompt)、控上下文窗口(context window)、調智能體。

      鋸齒狀的背后

      可驗證性和經濟學

      講了新范式,Karpathy詳細解釋了那個讓全場最困惑的問題:為什么模型智能有時會表現得這么「鋸齒」?

      他認為這主要不是一個技術問題,而是一個經濟學問題。

      是收入和市場規模(revenue/TAM),決定了前沿實驗室在強化學習階段把什么打包進訓練數據分布。


      Karpathy在解釋鋸齒狀能力時,特別強調了強化學習( RL )環境的作用。

      強化學習要獎勵信號(reward),獎勵信號要可驗證。一個領域只要可以被驗證(代碼能不能跑、數學題答案對不對、漏洞能不能復現),就可以構建強化學習環境,模型就在這個領域飛速進化。

      但「可驗證」還不夠,還要有錢賺。

      OpenAI、Anthropic、Google選什么進訓練分布,背后是收入和市場規模的考量。

      市場大、付費意愿強、能形成商業閉環的領域,會被打包進RL;反之就沒人投入。

      Karpathy給了一個畫面感很強的比喻:在RL的軌道上,你在飛;離開數據分布,你拿著砍刀進叢林。

      所以今天看到的所謂鋸齒狀,不是缺陷,是結構。是「可驗證 + 有錢賺」這兩條線把模型能力雕成的形狀。

      這件事對創業者特別重要。

      Karpathy在爐邊談里直接給了建議:如果你想做AI創業,找一個可驗證、但前沿實驗室還沒顧上的領域,自己去構建RL環境,自己去微調(fine-tune)模型。這是當下最有可能跑出護城河的方向。

      換句話說,下一波AI-native公司,可能會是驗證環境本身。誰能定義可驗證任務、構建獎勵循環(reward loop)、積累邊緣案例(edge cases),誰就握有底牌。

      Karpathy在爐邊談話中,將神秘的AI鋸齒狀智能,還原成一個可以被分析的工程經濟問題。

      Vibe Coding的發明人

      又造出新詞

      2025年2月,Karpathy在X上發明了一個詞:Vibe Coding,以此形容一種高度依賴AI、幾乎不親手寫代碼的開發方式。

      這個詞后來火到被Collins字典選為2025年度詞匯。Cursor、Lovable、Replit這一批公司估值飆到幾十億美金,背后都是這股風。

      一年后,在這次對話中,Karpathy給這個詞又升了級,叫智能體工程(Agentic Engineering)。

      他對這兩個詞的看法是:Vibe Coding是「把地板抬高」(raising the floor),讓所有人都能寫軟件。

      智能體工程是「把天花板保住」(preserving the ceiling),讓專業軟件不因為AI而掉到不該掉的水準。


      因為今天AI寫出來的代碼,在Karpathy眼中顯得很臃腫(bloaty),一堆復制粘貼,抽象很怪很脆弱,能跑,但真的很糟。

      他還講了一個真實案例。

      他的智能體在MenuGen里,居然試圖用Stripe和Google返回的email地址去做用戶匹配,而不是用一個持久化的用戶ID(user ID)。

      這是任何一個有經驗的工程師都不會犯的錯,但智能體卻犯了。

      因此,Karpathy給了智能體一個非常準確的定位:智能體就是一群實習生(intern entities)。

      實習生有用,但你不能讓他們獨自上線生產代碼。你得管需求定義、管系統架構、管安全、管審美、管驗證。這些事,智能體干不了。

      Vibe Coding的爽感區,屬于業余項目和原型,而智能體工程才是專業開發的下一站。前者降低門檻,后者抬高要求,兩件事不能混為一談。

      這也是今天行業最容易踩的坑。

      Vibe Coding浪潮下,所有人都在喊AI讓人人都是程序員,但Karpathy卻說:能在智能體時代活下來的工程師,不是寫得快的,是管得住智能體的。

      你能外包思考

      但不能外包理解

      爐邊談話中,主持人還問了一個所有人都在焦慮的問題:當智能體能寫代碼、能調度、能自己裝軟件,人類還剩什么?

      Karpathy引用了一條讓他打開腦洞的推文:

      你可以外包你的思考,但你不能外包你的理解。

      他對此的理解是:我仍然是瓶頸,因為只有我才知道我們到底要建什么、為什么要建。

      Karpathy將人類在智能體流程里的角色定位為工程管理/工程導演職能。

      第一是需求定義(spec),寫清楚要做什么;

      第二是拆解計劃(plan),拆清楚怎么做;

      第三是系統架構(architecture),決定系統長什么樣;

      第四是品味判斷(taste),判斷哪個方案是好的;

      第五是過程監督(oversight),盯著智能體別跑偏;

      第六是結果驗證(verification),驗證智能體的產出是否真的正確。

      這六件事,智能體可以輔助,但不能獨立承擔最終責任。

      Karpathy重提了他此前提到的「動物與幽靈」(animals versus ghosts)比喻。


      2025年10月,Karpathy曾系統闡述過這個比喻:幽靈之于動物,正如飛機之于鳥類。

      他認為今天的前沿大模型研究不是在造動物,而是在「召喚幽靈」。

      動物有內在動機,幽靈沒有,它只是被數據和獎勵塑形出來的智能模擬,是一個全新的物種:你不能像對待人一樣對待智能體,也不能像對待傳統軟件一樣對待智能體。

      而人類的位置,是導演。

      導演雖然不親自演戲,但導演要懂戲。你不親手寫每一行代碼,但你要知道這個產品該長什么樣、為什么這樣比那樣好、上線之后會出什么事。

      Sequoia在2026年給出的判斷是:AI應用的滲透速度還在加快,「0到1億美金」的俱樂部,正在升級成「0到10億美金」。

      最好的AI創業公司,每個員工的年產出已經過百萬美金。這背后是智能體在干活,但能讓智能體真正干出百萬產出的,是那些懂得當導演的創始人。

      Karpathy在爐邊談話尾聲,描述了他的更遠愿景:未來某一天,神經網絡會變成主進程,CPU反過來淪為協處理器。

      但就算這條路真的走通,導演的位置也不會消失。因為幽靈永遠不會替你想清楚,你到底要什么。那些不能外包的部分,就是你的位置。

      參考資料:

      https://x.com/karpathy/status/2049903821095354523

      https://www.youtube.com/watch?v=96jN2OCOfLs

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      田亮兒子脖子粗到和頭一樣,網友集體急勸:快帶娃去醫院

      田亮兒子脖子粗到和頭一樣,網友集體急勸:快帶娃去醫院

      一盅情懷
      2026-05-01 15:56:23
      夏洛特公主美甲出圈!威廉凱特15周年全家福曝光,冰藍色美甲少女感拉滿

      夏洛特公主美甲出圈!威廉凱特15周年全家福曝光,冰藍色美甲少女感拉滿

      白宸侃片
      2026-05-02 18:17:40
      烏度卡:我們選擇簽下杜蘭特,原本是為了打這樣的比賽

      烏度卡:我們選擇簽下杜蘭特,原本是為了打這樣的比賽

      懂球帝
      2026-05-02 13:14:49
      湖媒曬圖打臉15位專家!整整1085天啊,湖人終于贏下系列賽

      湖媒曬圖打臉15位專家!整整1085天啊,湖人終于贏下系列賽

      球童無忌
      2026-05-02 14:32:42
      值得嗎?杜蘭特降薪合同下賽季開始執行,2年9000萬美元

      值得嗎?杜蘭特降薪合同下賽季開始執行,2年9000萬美元

      懂球帝
      2026-05-02 13:14:49
      五一的莫氏雞煲現場爆滿:上午客人沒吃完,下午客人又開始排隊,還有人花80元買號

      五一的莫氏雞煲現場爆滿:上午客人沒吃完,下午客人又開始排隊,還有人花80元買號

      極目新聞
      2026-05-01 18:33:42
      趙又廷一家三口五一出游,46歲高圓圓體態真好,散步都像在走臺步

      趙又廷一家三口五一出游,46歲高圓圓體態真好,散步都像在走臺步

      八怪娛
      2026-05-02 14:14:03
      湖人晉級,全隊唯一失望的球員?場均18+4,2.4億大合同打沒了

      湖人晉級,全隊唯一失望的球員?場均18+4,2.4億大合同打沒了

      你的籃球頻道
      2026-05-02 13:48:40
      “甲亢哥”不小心把在中國買的三折疊手機掉進海里,嘴里念叨“我的中國手機、花了4000美元”,感覺整個人要碎掉;網友:出新款了再來一趟

      “甲亢哥”不小心把在中國買的三折疊手機掉進海里,嘴里念叨“我的中國手機、花了4000美元”,感覺整個人要碎掉;網友:出新款了再來一趟

      瀟湘晨報
      2026-05-01 20:15:11
      判決來了!三星向中興支付 27 億專利費

      判決來了!三星向中興支付 27 億專利費

      云頭條
      2026-05-01 22:31:43
      真相大白!世乒賽首戰王曼昱缺陣比賽原因曝光,馬琳真是良苦用心

      真相大白!世乒賽首戰王曼昱缺陣比賽原因曝光,馬琳真是良苦用心

      曹說體育
      2026-05-02 18:45:22
      心理學有個殘忍發現:讓別人對你產生敬畏感的,不是你的強勢,不是你的反擊,而是你骨子里的這兩種“人性破綻”操控術

      心理學有個殘忍發現:讓別人對你產生敬畏感的,不是你的強勢,不是你的反擊,而是你骨子里的這兩種“人性破綻”操控術

      心理觀察局
      2026-05-02 06:39:34
      董卿五一帶兒子現身浙江,坐游艇出海,13歲兒子長相普通肚子好鼓

      董卿五一帶兒子現身浙江,坐游艇出海,13歲兒子長相普通肚子好鼓

      東方不敗然多多
      2026-05-02 12:46:50
      千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

      千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

      情感大頭說說
      2026-04-24 12:46:24
      暴風雨時代被處決的第一個高級知識分子

      暴風雨時代被處決的第一個高級知識分子

      深度報
      2026-05-02 21:50:36
      五種廢品價格暴漲,家里有這五種東西的,提醒老人千萬別亂扔!

      五種廢品價格暴漲,家里有這五種東西的,提醒老人千萬別亂扔!

      好笑娛樂君每一天
      2026-05-02 01:15:07
      為什么男生在相親時,聽到女生喜歡瑜伽、旅游、烘焙,會很抵觸?

      為什么男生在相親時,聽到女生喜歡瑜伽、旅游、烘焙,會很抵觸?

      舒山有鹿
      2026-05-01 12:50:32
      人不會無緣無故患帶狀皰疹!調查發現:得帶狀皰疹,離不開這5點

      人不會無緣無故患帶狀皰疹!調查發現:得帶狀皰疹,離不開這5點

      岐黃傳人孫大夫
      2026-05-01 14:35:03
      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      周軍律師聊案子
      2026-04-21 09:50:16
      當年的1070有多變態?看完和5070的對比,才知道什么叫青春結束了

      當年的1070有多變態?看完和5070的對比,才知道什么叫青春結束了

      小兔子發現大事情
      2026-05-01 00:50:30
      2026-05-02 23:12:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15116文章數 66829關注度
      往期回顧 全部

      科技要聞

      AI熱潮耗盡庫存,Mac Mini起售調高200美元

      頭條要聞

      美媒:伊朗放寬與美國恢復和談的條件 暗示會做出妥協

      頭條要聞

      美媒:伊朗放寬與美國恢復和談的條件 暗示會做出妥協

      體育要聞

      休賽期總冠軍,輪到休斯頓火箭

      娛樂要聞

      高圓圓趙又廷游三亞 牽手逛街好甜蜜

      財經要聞

      雷軍很努力 小米還是跌破了30港元大關

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      游戲
      旅游
      教育
      親子
      房產

      超燃!崩鐵玩家全員集結對抗吼姆王,幻月新游戲見證團隊的力量

      旅游要聞

      河南博物院迎來五一客流高峰 西夏特展成“暖心分流站”

      教育要聞

      如何幫助孩子恢復社交?一定要告訴他這個821定律!

      親子要聞

      孩子真的別生這么多,他們真的會生氣啊,這我要是生了...

      房產要聞

      五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲国产精品日韩AV专区| 少妇人妻偷人精品无码视频| 亚洲天堂一区二区成人在线| 免费一级大毛片a一观看不卡| 欧美老熟妇又粗又大| 蜜桃av无码免费看永久| 亚洲免费成人小说| 亚洲日本中文综合在线| 水蜜桃av导航| 高清破外女出血AV毛片| 巨大黑人极品videos精品| 精品日韩免费在线观看| 久久蜜桃精品一区二区三区综合网| 亚洲肥熟女一区二区三区| аⅴ天堂中文在线网| 色综合久久中文综合网| 天天视频入口| 国产精品护士| H工口全彩里番库18禁无遮挡| av天堂午夜精品一区| 精品国产香蕉在线播出| 精品一区二区三区少妇蜜臀| 3p小视频| 长葛市| 国产放荡对白视频在线观看| 国产成人av电影在线观看第一页 | 性色AV一区二区三区人妻| 天堂va亚洲va欧美va国产| 色色播播| 色欲狠狠躁天天躁无码中文字幕 | 欧美牲交a欧美牲交aⅴ一| 热久久这里是精品6免费观看| 人妻在厨房被色诱 中文字幕| 成人深夜视频| 国产一区二区三区粉嫩av| mdapptv免费下载| 在线无码免费的毛片视频| 男人天堂网2020| 女高中生强奷系列在线播放| 印度成人av| 国产欧美va欧美va在线|