<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      Karpathy 親手終結了RAG的草莽時代

      0
      分享至


      作者|冬梅

      在“每一枚 Token 都要精打細算”的共識下,AI 圈一度流行一種略帶調侃的說法:真正的高手,不是把 Token 用在寫代碼上,而是用在更高杠桿的事情上。

      最近,這一理念被再次推向臺前——主角是患上了“AI 精神病”的 Andrej Karpathy。

      Karpathy 新項目爆火,
      技術細節完整披露

      幾天前,Karpathy 在 X 上分享了一套自己正在實踐的工作流,稱之為“LLM Wiki”:他不再把大模型主要用于寫代碼,而是將絕大多數 Token 消耗,轉向構建一個圍繞個人研究興趣的“可演化知識庫”(以 Markdown 和圖片形式存儲)。

      這條帖子在 x 上瀏覽量超 1700 萬,圍觀者眾多。

      項目地址:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

      Karpathy 詳細介紹了 LLM Wiki 項目的工程實現、數據采集、工具選擇等技術細節。


      從工程實現上看,Karpathy 的方法并不依賴復雜的基礎設施,甚至可以說極其“樸素”。一切始于一個名為 raw/ 的原始目錄。在這個目錄中,他將與研究主題相關的所有素材一股腦地收集進來——包括論文、技術博客、代碼倉庫、數據集,乃至圖片等多模態內容。這一步并沒有任何結構設計,核心目標只有一個:最大化原始信息的完整性

      接著,Karpathy 調用 LLM 對這些素材進行增量“編譯”,生成一個 Wiki。這個 Wiki 本質上是一個具備清晰目錄結構的 Markdown 文件集合,類似一個由 AI 自動撰寫和維護的知識百科系統。

      Karpathy 把Obsidian作為這個系統的“前端 IDE”,在這里他可以查看原始數據、編譯好的 Wiki 以及衍生的可視化內容。Karpathy 介紹,這么做的核心點在于:Wiki 中的所有數據都由 LLM 編寫和維護,自己極少直接動手修改。

      他還嘗試了一些 Obsidian 插件來以不同方式展示數據,比如用 Marp 插件生成演示幻燈片。

      當知識庫規模逐漸擴大,這一系統開始展現出更強的能力。Karpathy 提到,在一個包含約 100 篇文章、總計 40 萬字的研究項目中,他已經可以直接向 LLM Agent 提出復雜的系統性問題。與傳統認知不同,他并沒有引入復雜的 RAG 架構,而是依賴 LLM 對 Wiki 的“內生理解”能力——模型通過自動維護的索引與摘要,可以高效定位相關信息并進行綜合分析。

      這一點尤為關鍵。過去一年,RAG 幾乎成為企業級 AI 應用的“標配”,但 Karpathy 的實踐表明,在中等規模的數據集上,LLM 本身已經具備足夠強的“自檢索”與“自組織”能力。這意味著,一部分復雜的系統設計,可能正在被模型能力的提升所“吞噬”


      在輸出層面,Karpathy 同樣不滿足于傳統的文本回答。他將 LLM 生成能力進一步擴展到多種格式:包括 Markdown 文檔、基于 Marp 的演示幻燈片,甚至是通過 Matplotlib 繪制的數據圖表。這些結果統一在 Obsidian 中進行可視化呈現,使知識不再停留在“答案”,而是轉化為可以復用、傳播和沉淀的資產。

      更重要的是,這些輸出并不會被丟棄。相反,它們會被重新歸檔進 Wiki,成為知識庫的一部分。換言之,每一次提問與探索,都會對系統進行“增量訓練”——盡管不是傳統意義上的模型訓練,但在知識層面,系統的能力確實在持續累積。

      為了維持這一系統的長期健康運行,Karpathy 還設計了一套“自動化運維”機制。他會定期調用 LLM 對整個 Wiki 進行“體檢”:檢測數據不一致、補全缺失信息、通過聯網搜索引入新資料,甚至主動挖掘潛在的關聯關系并生成新的專題文章。

      此外,他還通過“Vibe Coding”的方式快速開發了一些輔助工具。例如,一個用于檢索 Wiki 的簡易搜索引擎,可以通過網頁界面或命令行調用。在更復雜的場景下,這些工具甚至可以作為 LLM 的外部能力接口,由模型自主調用完成任務。

      隨著知識庫規模的進一步擴大,Karpathy 也在思考下一階段的演化方向:是否可以通過合成數據生成與微調,將這些結構化知識“壓縮”進模型權重之中。換句話說,從依賴上下文窗口的外部知識系統,邁向模型內部的長期記憶。

      簡單總結一下,該架構設計極簡,僅包含三個組件:

      1、一個 Markdown 文件文件夾。 這是你的知識庫。它可以包含任何內容:研究筆記、會議紀要、項目文檔、讀書筆記、個人參考資料、帶有解釋的代碼片段。

      2、每個文件內部結構一致。優秀的 LLM Wiki 文檔采用一致的內部格式——標題、簡短摘要、標簽主題以及正文內容。模型利用這種結構更快地找到相關信息。

      3、使用 Claude Code 作為查詢界面。打開終端,導航到你的 wiki 文件夾,啟動 Claude Code,然后向它提出問題。Claude 會讀取所需的文件,綜合生成答案,甚至可以根據你的要求更新或添加注釋。

      就是這樣,無需數據庫,無需向量嵌入也無需服務器。只需文件和一個功能強大的模型。

      LLM Wiki “殺死了”RAG?

      Karpathy 的這一實踐之所以能夠迅速引發關注,是因為它并非只是一個效率工具的升級,而更像是對“個人知識管理”(PKM)體系的一次重構。從 Notion、Roam Research 到 Obsidian,過去十年里,人們始終在尋找更好的知識組織方式,而在 LLM 的加持下,這一問題的解法,正在從“如何記錄”轉向“如何自動生成與演化”。

      因此有 X 用戶認為,LLM Wiki “殺死了”RAG。


      過去三年,為 LLM 提供專有數據訪問的主要范式是檢索增強生成(RAG)。在標準的 RAG 設置中,文檔被分割成任意的“塊”,轉換為數學向量(嵌入),并存儲在專門的數據庫中。

      當用戶提出問題時,系統會執行“相似性搜索”來查找最相關的數據塊,并將它們輸入到 LLM 中。Karpathy 的方法,他稱之為 LLM 知識庫,摒棄了中等規模數據集的向量數據庫的復雜性。

      相反,它依賴于 LLM 對結構化文本進行推理能力的不斷提高。

      系統架構(由 X 用戶 @himanshu 在對 Karpathy 帖子的廣泛回應中可視化呈現)分三個不同的階段運行:

      1. 數據導入:原始資料——研究論文、GitHub 代碼庫、數據集和網絡文章——被導入到一個 raw/ 目錄中。Karpathy 使用 Obsidian Web Clipper 將網頁內容轉換為 Markdown.md 文件,確保即使是圖像也存儲在本地,以便 LLM 可以通過視覺功能引用它們。

      2. 編譯步驟:這是核心創新點。LLM 不僅僅是對文件進行索引,而是對文件進行“編譯”。它讀取原始數據并生成結構化的維基百科頁面。這包括生成摘要、識別關鍵概念、撰寫百科全書式條目,以及——至關重要的是——在相關概念之間創建反向鏈接。

      3. 主動維護(代碼檢查):該系統并非一成不變。Karpathy 描述了運行“健康檢查”或“代碼檢查”的過程,LLM 會掃描 wiki 以查找不一致之處、缺失數據或新連接。正如社區成員 Charly Wargnier 所觀察到的,“它就像一個活的 AI 知識庫,能夠自我修復。”

      Karpathy 將 Markdown 文件視為“真理之源”,從而避免了向量嵌入的“黑箱”問題。AI 做出的每一項聲明都可以追溯到特定的.md 文件,而這些文件可以由人閱讀、編輯或刪除。


      在 Youtube 上,也有不少關于 “LLM Wiki killed RAG”相關話題的討論。

      一位 ID 名為 DIY Smart Code 的博主闡述了為什么他認為有了 LLM Wiki 后,就不再需要 RAG 了。

      該博主表示:“人類并不缺少信息,缺的是對信息的持續組織與有效利用。

      研究顯示,人類在獲取新知識后的短時間內就會遺忘其中的大部分內容,而現代知識工作者每天平均需要花費近兩個小時,去查找那些“自己曾經讀過”的信息。這不僅意味著巨大的時間浪費,也揭示了一個現實困境——無論是筆記工具、收藏夾,還是所謂的“第二大腦”,在長期使用后,往往都會演變為一個信息堆積卻難以調用的“知識墓地”。

      過去幾年,AI 行業嘗試通過 RAG 等技術路徑解決這一問題,即通過向量數據庫對海量文檔進行索引,在需要時檢索相關片段并生成答案。然而在實際應用中,這類方案往往面臨落地難題:檢索可以做到,但理解不足;信息可以找到,但難以形成結構化認知。某種程度上,這類系統只是讓用戶“更快地搜索混亂”,卻沒有真正解決知識組織的問題。

      Karpathy 的思路則截然不同。他并沒有繼續優化“檢索”,而是從源頭出發,提出“寫出更好的文檔”。在他的體系中,原始數據被視為“源代碼”,大語言模型則充當“編譯器”,而最終生成的 Wiki 知識庫,則是可以直接使用的“可執行產物”

      在這種情況下,基本就不會再需要 RAG 了。

      技術社區和企業反響熱烈

      雖然 Karpathy 自己將 LLM Wiki 描述為“一堆蹩腳的腳本”,但它在技術社區和企業級市場還是引發了不少的關注。

      企業家 Vamshi Reddy (@tammireddy) 在回應 Karpathy 帖子時表示:“每個企業都有一個原始目錄。從來沒有人把它整理過。這就是產品。”


      Karpathy 對此表示贊同,并認為這種方法代表了一種“令人難以置信的新產品”類別。

      目前大多數公司都“淹沒”在非結構化數據中——Slack 日志、內部維基和 PDF 報告,沒有人有時間去進行綜合分析。

      “Karpathy 式”企業層不僅會搜索這些文檔,還會主動編寫實時更新的“公司圣經”。

      AI 教育家兼簡報作者 Ole Lehmann 在 x 上發帖稱:“我認為,誰能把這個功能打包成普通用戶都能用的東西,就掌握了一項巨大的技術。一個應用就能與你已經使用的工具、書簽、稍后閱讀應用、播客應用、保存的討論串同步。”


      AI 企業 Agent 構建和編排初創公司 Edra 的聯合創始人兼首席執行官 Eugen Alpeza 在一篇 X 帖子中指出: “從個人研究維基到企業運營的飛躍才是真正的挑戰所在。成千上萬的員工,數百萬條記錄,以及團隊間相互矛盾的經驗知識。的確,企業級市場需要一款新產品,而我們正在打造它。”


      AI 代理創建平臺 Secondmate 的創始人 @jumperz 最近發布的一份架構分解報告,通過“群體知識庫”展示了這一演變過程,該知識庫將 wiki 工作流程擴展到通過 OpenClaw 管理的 10 個代理系統。


      另一位 x 用戶還將 Karpathy 的腳本方案成功“產品化”了。她推出了一款名為:Claudeopedia(Claude 百科)的產品,并說明了她構建該產品的幾大步驟,她寫道:

      1. 我采納了 @karpathy 的 “llm-wiki” 構想(這占了本項目 90% 的功勞,所以大頭要歸功于 Karpathy); 2. 結合了過去 30 天的技能(感謝 @mvanhorn 的靈感); 3. 新增了一個 /wiki 技能,支持截圖和下載參數,能更飛速地傳輸原始素材; 4. 構建了一個交互式可視化界面來搜索我的知識庫(甚至帶日期范圍,可以對比知識隨時間演進的變化!); 5. 設置了一個“質疑自我假設”的定時任務(cron job),自動將我最近的隨筆和客戶郵件與 Wiki 內容進行比對復核。 目前這一切都在 Obsidian 中運行。包括測試在內,所有這些都是在這個周末搞定的。我會繼續添加更多功能。我重點構建的是:企業級 AI。我已經非常期待了。


      整體來看,Karpathy 提出的這一方法的意義不僅在于提升效率,更在于重構知識工作的底層邏輯。當大模型能夠持續維護并擴展一個結構化知識體系時,傳統意義上的“筆記”正在演變為一種動態系統。對于個體而言,這意味著可以將認知能力部分外包給機器;而對于行業而言,這也預示著一個潛在的新產品方向——將“知識編譯”本身,作為核心能力進行產品化。

      在信息不斷膨脹的時代,這種從“存儲信息”到“演化知識”的轉變,或許正是下一階段 AI 應用的重要突破口。

      https://www.youtube.com/watch?v=RQsLXmenr48

      https://x.com/NickSpisak_/status/2040448463540830705

      https://x.com/alliekmiller/status/2040884878229565816

      https://www.mindstudio.ai/blog/andrej-karpathy-llm-wiki-knowledge-base-claude-code

      https://obsidian.md/clipper

      https://venturebeat.com/data/karpathy-shares-llm-knowledge-base-architecture-that-bypasses-rag-with-an

      聲明:本文為 InfoQ 原創,不代表平臺觀點,未經許可禁止轉載。

      會議推薦

      QCon 全球軟件開發大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節跳動、小米、百度等一線科技企業與創新團隊的技術專家,圍繞 AI 工程化、系統架構與研發模式演進展開深入探討。更多詳情可掃碼或聯系票務經理 18514549229 進行咨詢。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      李澤楷做錯了?香港拿下世界杯轉播權,官媒銳評:給內地談判底氣

      李澤楷做錯了?香港拿下世界杯轉播權,官媒銳評:給內地談判底氣

      好賢觀史記
      2026-05-09 18:00:07
      凌晨咳到吐!全國多地中招“干咳毒株”,患者猜疑新冠病毒新變種

      凌晨咳到吐!全國多地中招“干咳毒株”,患者猜疑新冠病毒新變種

      譚談社會
      2026-05-08 23:19:21
      臺積電的美國亞利桑那廠已悄然失敗,400億美元燒完,良率不到日本廠一半

      臺積電的美國亞利桑那廠已悄然失敗,400億美元燒完,良率不到日本廠一半

      風向觀察
      2026-05-09 13:29:53
      1-2出局!鄭欽文被奧斯塔彭科逆轉,無緣進羅馬站16強,排名大跌

      1-2出局!鄭欽文被奧斯塔彭科逆轉,無緣進羅馬站16強,排名大跌

      侃球熊弟
      2026-05-09 22:16:45
      法拉奇橫空出世,英國政治正式進入“川普化”新時代

      法拉奇橫空出世,英國政治正式進入“川普化”新時代

      壹家言
      2026-05-09 16:03:04
      韋東奕形象大變,簡直像換了個人!韋神包換了,頭發少了,老了許多,變的洋氣了不少!

      韋東奕形象大變,簡直像換了個人!韋神包換了,頭發少了,老了許多,變的洋氣了不少!

      白宸侃片
      2026-05-08 12:09:25
      員工人均獎金達610萬人民幣?SK海力士回應

      員工人均獎金達610萬人民幣?SK海力士回應

      第一財經資訊
      2026-05-09 16:50:23
      性能有傳承,油電有遠見:一汽奧迪在變革時代交出穩健答卷

      性能有傳承,油電有遠見:一汽奧迪在變革時代交出穩健答卷

      汽車投訴網
      2026-05-06 17:55:53
      澤連斯基真的失控了,這或許是俄烏戰爭即將結束的標志

      澤連斯基真的失控了,這或許是俄烏戰爭即將結束的標志

      羅富強說
      2026-05-09 14:02:37
      張皓嘉絕殺北京!聽聽劉曉宇李克怎么說,為何能反敗為勝?

      張皓嘉絕殺北京!聽聽劉曉宇李克怎么說,為何能反敗為勝?

      南海浪花
      2026-05-09 22:39:08
      重磅反轉 曝央視砸5億美元買近2屆世界杯轉播權 預計一周內簽合同

      重磅反轉 曝央視砸5億美元買近2屆世界杯轉播權 預計一周內簽合同

      風過鄉
      2026-05-09 19:57:32
      央視報價34億打包兩屆世界杯!與國際足聯要價差6億 有望達成協議

      央視報價34億打包兩屆世界杯!與國際足聯要價差6億 有望達成協議

      念洲
      2026-05-09 19:24:36
      汪峰森林北被曝分手,森林北立即斷舍離,自嘲是汪峰5任中最差的

      汪峰森林北被曝分手,森林北立即斷舍離,自嘲是汪峰5任中最差的

      露珠聊影視
      2026-05-09 22:16:53
      75歲曹查理:香港沒房到東莞定居,30年婚姻被騙,遺憾沒有親子女

      75歲曹查理:香港沒房到東莞定居,30年婚姻被騙,遺憾沒有親子女

      以茶帶書
      2026-05-09 17:08:39
      套現百億跑路瑞士,25萬股民或血本無歸,上百億國資也被荷蘭凍結

      套現百億跑路瑞士,25萬股民或血本無歸,上百億國資也被荷蘭凍結

      林小明商業評說
      2026-05-09 12:53:38
      光纖大利好!外資最新重倉3家低價光纖股,最高6元,最低5元

      光纖大利好!外資最新重倉3家低價光纖股,最高6元,最低5元

      長風價值掘金
      2026-05-09 17:04:58
      9.9元手機殼抽檢合格率不足5% 鉛超標1550倍 使用有腎衰竭致癌風險

      9.9元手機殼抽檢合格率不足5% 鉛超標1550倍 使用有腎衰竭致癌風險

      快科技
      2026-05-08 14:10:45
      “4只皮皮蝦1035元”當事人否認想吃白食,刪除評論;隔壁海鮮店發聲

      “4只皮皮蝦1035元”當事人否認想吃白食,刪除評論;隔壁海鮮店發聲

      上觀新聞
      2026-05-09 09:58:08
      穿長裙的美女,氣質太好了

      穿長裙的美女,氣質太好了

      藍色海洋009
      2026-05-09 16:19:06
      震驚!桂林《印象·劉三姐》演員被質疑擦邊低俗,此前曾全裸出境

      震驚!桂林《印象·劉三姐》演員被質疑擦邊低俗,此前曾全裸出境

      火山詩話
      2026-05-09 07:37:50
      2026-05-10 00:11:00
      InfoQ incentive-icons
      InfoQ
      有內容的技術社區媒體
      12350文章數 51880關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      親子
      藝術
      家居
      公開課
      軍事航空

      親子要聞

      告別每日一針!兒童長高治療迎來“周制劑”時代,全新專家共識在滬發布

      藝術要聞

      齊白石 紫藤蜜蜂

      家居要聞

      菁英人居 全能豪宅

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美伊突然再次交火 伊朗外長:戰爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精品一二三四区在线观看| 免费看国产美女裸体视频| 又黄又爽又色的少妇毛片| 国产精品久久中文字幕| 亚洲综合成人精品| 精品国产成人亚洲午夜福利| 中文字幕日韩一区二区不卡| 67194熟妇| 亚洲欧美中文高清在线专区| 丁香五月激情图片| 国产精品日韩中文字幕| 最大胆裸体人体牲交| 欧美自拍另类欧美综合图片区| 少妇人妻av无码专区| 国产成人精品1024免费下载| 免费观看的av毛片的网站| 久人人视频精品国内| 激情国产一区二区三区四区| 日韩精品国产二区三区| 亚洲精品一区二区三区四区乱码| 久久夜色撩人精品国产小说| 无码AV在线播放| 久久热精品视频在线视频| 欧美丰满熟妇hdxx| 亚洲VA中文字幕无码毛片春药| 欧洲亚洲AV| 国产伦人人人人人人性| 欧美色综合天天久久综合精品| 国模gogo啪啪中国人体| 中文字幕亚洲资源一区二区| 日韩熟女乱综合一区二区| 国内熟女中文字幕第一页| XXX国产| 精品福利一区二区三区免费视频| 极品少妇的粉嫩小泬看片| 顶级欧美熟妇xx| 97成人精品视频在线观看| 最新av免费在线播放| 国产精品一国产精品亚洲| 熟女另类| 亚洲欧美一级一级a|