<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      壓縮即是全部 —— 菲爾茲獎得主 Michael Freedman 給數(shù)學(xué)和 AI 的一封信

      0
      分享至

      來源:市場資訊

      (來源:圖靈人工智能)

      您想知道的人工智能干貨,第一時間送達(dá)



      2026 年 3 月,菲爾茲獎得主 Michael Freedman 發(fā)了一篇只有 30 多頁的論文,標(biāo)題叫《Compression is all you need》。他用一個優(yōu)雅的代數(shù)模型回答了三個古老問題:人類怎么構(gòu)建數(shù)學(xué)?人類數(shù)學(xué)和形式數(shù)學(xué)的本質(zhì)區(qū)別是什么?未來人類數(shù)學(xué)家如何和 AI 協(xié)作?答案只有兩個字——壓縮。

      2017 年 6 月,Google Brain 的八個人把一篇論文扔上了 arXiv。

      標(biāo)題狂得不像論文:《Attention Is All You Need》。

      九年過去了,這個標(biāo)題成了 AI 史上最著名的七個單詞。基于它的 Transformer,撐起了 ChatGPT、Gemini、Claude、DeepSeek、萬億市值、一代人的焦慮。

      2026 年 3 月 27 日,又一篇論文悄悄上了 arXiv。標(biāo)題只有七個單詞,格式一模一樣:

      Compression is all you need: Modeling Mathematics

      看到這個標(biāo)題,任何做 AI 的人都會下意識笑一下——"又一個蹭熱度的"。點(diǎn)開作者一欄,笑容消失。

      Michael Freedman。

      這不是什么 ML 工程師。這是 1986 年菲爾茲獎得主,四維龐加萊猜想的證明者,過去二十年微軟 Station Q 的靈魂人物,當(dāng)今在世的數(shù)學(xué)家里戲份最重的那一批。

      他在寫 AI?不是。他在告訴所有搞 AI 的人:你們一直在用的那個詞"壓縮",其實(shí)比你們想象的要深得多。

      這篇文章不是《Attention Is All You Need》那種工程突破。它是一封信——一位數(shù)學(xué)家,用他畢生訓(xùn)練出來的直覺,回答了三個困擾人類上千年的問題:

      人類究竟是怎么構(gòu)建數(shù)學(xué)知識的?

      人類做的數(shù)學(xué),和形式化的"純邏輯數(shù)學(xué)",本質(zhì)區(qū)別是什么?

      未來的人類數(shù)學(xué)家,到底該怎么和 AI 協(xié)同工作?

      他給出的答案,只有一個詞:壓縮。

      今天這篇文章,就把這封信翻譯給你。

      第一章:Freedman 是誰

      先說清楚為什么這個人開口說話,AI 圈必須聽。

      1981 年,三十歲的 Freedman 在加州大學(xué)圣地亞哥分校解決了四維龐加萊猜想——這個問題懸了 77 年。三維版本讓 Perelman 在 2006 年拿到菲爾茲獎(他拒絕了);五維以上早在 60 年代就被解決。唯獨(dú)四維——卡在最要命的那個維度——是 Freedman 攻下來的。

      1986 年,柏克萊,國際數(shù)學(xué)家大會。Freedman 領(lǐng)走了菲爾茲獎。

      1997 年,F(xiàn)reedman 做了一件數(shù)學(xué)家很少做的事——從學(xué)術(shù)界出走。微軟給他開了一個幾乎是為他量身定做的部門 Station Q,目標(biāo)只有一個:用數(shù)學(xué)家的思路造拓?fù)淞孔佑?jì)算機(jī)。他當(dāng)了主任,一干就是二十五年。

      2023 年,他回到哈佛 CMSA(數(shù)學(xué)與應(yīng)用中心),換了一個身份:思考 AI 和數(shù)學(xué)的關(guān)系。

      所以當(dāng) Freedman 這個人在 2026 年 3 月扔出一篇叫《Compression is all you need》的論文——這不是某個追熱點(diǎn)的研究員,這是一個一輩子在數(shù)學(xué)內(nèi)部看世界的人,突然轉(zhuǎn)身跟所有人說:

      "我看清楚了一件事。你們要聽嗎?"

      第二章:一個讓所有人尷尬的事實(shí)

      Freedman 論文的切入點(diǎn),是一個數(shù)學(xué)界人盡皆知、但幾乎沒人能解釋的尷尬事實(shí)。

      先建立兩個概念:

      • 形式數(shù)學(xué)(Formal Mathematics, FM)

        :所有合乎邏輯規(guī)則的推演。

      • 人類數(shù)學(xué)(Human Mathematics, HM)

        :人類真正寫下、收錄、引用的那部分?jǐn)?shù)學(xué)。

      FM 的空間有多大?假設(shè)你有 n 個基礎(chǔ)符號,組合出來的"合法推演"是指數(shù)級——n 上百以后就超過了整個宇宙里的原子數(shù)。

      HM 呢?從歐幾里得到今天所有數(shù)學(xué)家加起來寫過的定理,約百萬量級。Lean 4 的 MathLib 收錄其中約 14 萬條。

      兩個數(shù)字并排寫

      FM:> 1080HM:~ 105中間隔了 75 個零。

      人類數(shù)學(xué),是形式數(shù)學(xué)這個宇宙里一粒塵埃都不到的小角落。

      而且——為什么是這一粒?

      FM 里有無窮無盡的"合法但無聊"的定理。比如:"對任意整數(shù) n,n + 0 = n","對任意整數(shù) n,n + 0 + 0 = n","對任意整數(shù) n,n + 0 + 0 + 0 = n"……每一條都合法,每一條都無意義。人類數(shù)學(xué)家從來不寫這些。

      一百年來這個問題有過無數(shù)個哲學(xué)回答:"美""簡潔""有用""深刻"——都是詞語的游戲。沒有一個是數(shù)學(xué)答案。

      直到 Freedman 2026 年給出了第一個能算的回答:

      因?yàn)?HM 是 FM 里那個"可壓縮"的子集。

      第三章:壓縮——先站在日常地面上

      Freedman 說的"壓縮"是什么意思?先別想數(shù)學(xué),先想幾個你已經(jīng)懂的例子。

      例子一:Huffman 編碼

      你家貓叫小花。照片里出現(xiàn)最多的動作是"睡覺"(4000 次),其次"吃飯"(3000)、"抓沙發(fā)"(2000)、"發(fā)呆"(1000)。

      固定 8 位編碼:80000 位。Huffman 編碼:"睡覺→0;吃飯→10;抓沙發(fā)→110;發(fā)呆→111"——19000 位。壓縮率 4 倍,沒有丟失任何信息。

      只要事物分布是不均勻的,就存在壓縮。

      例子二:牛頓三定律

      宇宙里每一秒都在發(fā)生無數(shù)次的運(yùn)動:蘋果落地、月亮繞地、彈簧振動、子彈出膛、潮汐起落……你想記錄所有這些運(yùn)動,需要多少信息?

      不需要。

      你只需要記住 F = m·a,外加兩條(慣性、反作用),就能重新生成上面所有運(yùn)動。

      牛頓三定律是一個幾十字符的程序,它編碼了經(jīng)典力學(xué)的全部。

      例子三:zip 文件

      "to be or not to be, that is the question; to be"——把反復(fù)出現(xiàn)的"to be"和"the"命名成 A、B,之后只寫名字。這是 LZ77 算法(zip / gzip / PNG 的底層),1977。

      例子四:大型語言模型

      喂整個互聯(lián)網(wǎng)給 LLM——幾萬億字、幾百萬小時文本。訓(xùn)練完得到幾百億參數(shù)的模型(幾百 GB)。它能生成類似訓(xùn)練集里的任何內(nèi)容。

      這件事,用信息論的語言說叫:LLM 就是互聯(lián)網(wǎng)的一次有損壓縮。

      DeepMind 2023 年做了一件讓人血壓升高的事:他們把 Chinchilla 70B 當(dāng)成一個通用壓縮器,用它去壓縮原始字節(jié)流——不僅是文本,還有從沒訓(xùn)練過的圖像和音頻。結(jié)果:

      • 文本壓縮率:比 gzip 好很多

      • 圖像壓縮率:比 PNG 好

      • 音頻壓縮率:比 FLAC 好

      一個只訓(xùn)練了語言的模型,居然能壓縮它從沒見過的圖像——因?yàn)樗鼘W(xué)到了"通用的世界結(jié)構(gòu)"。


      從 Huffman 的字符編碼到 LLM 的幾百億參數(shù)——壓縮的顆粒度越來越粗,本質(zhì)是同一個。

      任何"理解"的行為,本質(zhì)都是找到更短的描述。這不是比喻。這是 Freedman 論文的出發(fā)點(diǎn)。

      第四章:Freedman 的建模——字符串和"宏"

      Freedman 說的第一件事:把數(shù)學(xué)推演當(dāng)成字符串。你在黑板上寫證明,本質(zhì)就是一串字符。所有"合法的證明字符串"排起來——就是 FM。

      但數(shù)學(xué)家從來不這樣寫。他會說:"設(shè) f 在 [a, b] 上連續(xù),則 f 一致連續(xù)。"

      "連續(xù)"是一段定義,展開約三行字符。"一致連續(xù)"是另一段,展開約五行。表面 20 個字,完全展開超過 100 個字符。繼續(xù)挖下去——一條"短句子"背后,是一棵很深的定義樹。

      Freedman 給這種"名字 → 一段長字符串"的約定起了個名字:宏(macro)。

      • "連續(xù)" = 一個宏

      • "一致連續(xù)" = 一個宏

      • "積分" = 一個宏(調(diào)用"極限""分割""黎曼和"的宏)

      • "勒貝格積分" = 一個宏(調(diào)用"測度""可測函數(shù)"的宏)

      • "黎曼-勒貝格引理" = 一個宏(調(diào)用以上所有)

      一條現(xiàn)代定理"完全展開"往往是億級字符。但數(shù)學(xué)家永遠(yuǎn)只看最外層。

      數(shù)學(xué)家的工作,就是不斷造宏。一位數(shù)學(xué)家的一生,可能就干了一件事——看到了一個之前沒人壓縮過的模式,給它起了一個名字。

      高斯給"正態(tài)分布"起了名字。黎曼給"流形"起了名字。伽羅瓦給"群"起了名字。康托爾給"集合"起了名字。圖靈給"可計(jì)算性"起了名字。香農(nóng)給"熵"起了名字。

      你今天學(xué)的所有數(shù)學(xué),都是在站在前人造好的宏上。如果不能層層壓縮,人類根本學(xué)不動數(shù)學(xué)。

      第五章:$A_n$ vs $F_n$——兩種宇宙

      到這里一切都是直覺。Freedman 接下來要做的,是把這個直覺變成數(shù)學(xué)。

      他引入兩個代數(shù)對象(別緊張,用直覺講):

      A_n 像拼樂高

      你有一堆樂高積木——紅、藍(lán)、綠。紅拼藍(lán)上加綠,還是先綠再藍(lán)再紅——最后模型一樣。順序無關(guān)緊要,只在乎哪些積木。

      F_n 像編辮子

      先壓左繩再壓右繩,和先壓右再壓左——得到的辮子完全不一樣。順序決定一切。

      Freedman 的定理說了一件"漂亮得像魔法"的事:

      Freedman 的核心代數(shù)發(fā)現(xiàn)

      在 An 里,只要用 O(log n) 個宏(對數(shù)級稀疏),就能讓表達(dá)力指數(shù)級擴(kuò)張。在 Fn 里,就算用 O(nk) 個宏(多項(xiàng)式級稠密),表達(dá)力也只能線性擴(kuò)張。


      同樣的"造宏"策略,在兩種宇宙里結(jié)果天差地別——可壓縮性是結(jié)構(gòu)性的。

      用大白話翻譯:

      • 在"樂高宇宙"里,造幾個宏頂一萬個宏——積木自由組合,宏之間也自由組合

      • 在"辮子宇宙"里,造再多宏也救不了你——順序是死的,每個組合都得單獨(dú)記

      這個對比為什么重要?因?yàn)樗嬖V我們:"可壓縮性"不是普世的,它只在特定結(jié)構(gòu)里才存在。

      數(shù)學(xué)里的加法、乘法、集合并、函數(shù)復(fù)合——都是可交換或近似可交換的。所以數(shù)學(xué)是可壓縮的。

      那人類的語言呢?主語動詞賓語順序很要命——"狗咬人"和"人咬狗"不是一回事。所以語言壓縮程度遠(yuǎn)低于數(shù)學(xué)。

      那生物學(xué)呢?DNA 順序至關(guān)重要——所以生物學(xué)長期是描述性的,沒有"F = m·a"級別的簡潔定律。

      那LLM 的參數(shù)空間呢?第八章再說。

      第六章:MathLib 實(shí)證——數(shù)據(jù)來說話

      光有理論不夠。Freedman 做了一件讓這篇論文從"哲學(xué)隨筆"升級成"硬科學(xué)"的事:把模型拿到真實(shí)的人類數(shù)學(xué)上驗(yàn)證。

      測試對象:MathLib——Lean 4 的數(shù)學(xué)形式化庫,14 萬條定理,覆蓋代數(shù)、分析、拓?fù)洹?shù)論、范疇論……

      對每條定理,測三個量:

      • depth

        :嵌套深度

      • wrapped length

        :定義里的 token 數(shù)

      • unwrapped length

        :完全展開后的原始符號數(shù)

      結(jié)果 1:unwrapped length 隨 depth 指數(shù)爆炸。

      越深,完全展開后字符數(shù)按指數(shù)增長。到深度 10+,展開一條定理就要數(shù)千萬字符。

      結(jié)果 2:wrapped length 幾乎是常數(shù)。

      但數(shù)學(xué)家寫出來的定義,無論 depth 是 2 還是 12,長度幾乎不變——永遠(yuǎn)就是幾十個 token。

      數(shù)學(xué)家從來不寫很長的定義。每當(dāng)一個東西變復(fù)雜,數(shù)學(xué)家的第一反應(yīng)是:先給它起個名字,然后用名字繼續(xù)。


      unwrapped 指數(shù)爆炸,wrapped 巋然不動——數(shù)學(xué)家每到一層就造一個宏,把復(fù)雜性壓回來。

      結(jié)果 3:數(shù)據(jù)完美符合 A_n,嚴(yán)重違反 F_n。

      Freedman 把兩種模型的理論曲線畫在同一張圖上。An 的指數(shù)擴(kuò)張曲線嚴(yán)絲合縫地蓋在實(shí)測數(shù)據(jù)上。Fn 的線性曲線差了好幾個數(shù)量級。

      人類數(shù)學(xué),生活在 An 模型預(yù)測的那個可壓縮子空間里。這不是隱喻,是可測量的事實(shí)。

      第七章:三個古老問題的答案

      現(xiàn)在可以回到開頭的三個問題了。Freedman 給的答案,每一個都短到令人震撼。

      問題一:人類究竟是怎么構(gòu)建數(shù)學(xué)知識的?

      層層壓縮。每一代數(shù)學(xué)家看到前一代的成果,找出其中"可以起名字"的部分,造新的宏,然后在新宏之上繼續(xù)推演。整個數(shù)學(xué)史就是一部宏的積累史。

      歐幾里得給"點(diǎn)、線、面"起名字 → 笛卡爾給"坐標(biāo)"起名字 → 牛頓給"導(dǎo)數(shù)"起名字 → 柯西給"極限"起名字 → 康托爾給"集合"起名字 → 希爾伯特給"空間"起名字 → 格羅滕迪克給"概形"起名字……每一層,都比上一層壓縮了更多。

      問題二:人類數(shù)學(xué)和形式數(shù)學(xué)的本質(zhì)區(qū)別是什么?

      可壓縮 vs 不可壓縮。FM 里大部分定理是"合法但無聊的"——沒有結(jié)構(gòu)、不能被起名字、沒法進(jìn)一步用。HM 是 FM 里那個碰巧活在 An-like 子空間的小角落。

      人類數(shù)學(xué)之所以是"人類"的,恰恰是因?yàn)槿祟惖恼J(rèn)知帶寬極其有限——我們只能在那個可壓縮的子空間里活動。而那個子空間的存在,是宇宙給我們的禮物——如果它不存在,人類壓根不會有數(shù)學(xué)。

      問題三:未來人類數(shù)學(xué)家怎么和 AI 協(xié)同?

      AI 的長處是在 FM 的巨大空間里并行搜索——因?yàn)樗形覀儧]有的帶寬。人類的長處是判斷哪些地方"值得起名字"——因?yàn)槲覀冇形迦f年的語言和抽象訓(xùn)練。

      這不是 AI 取代數(shù)學(xué)家,也不是數(shù)學(xué)家訓(xùn)練 AI。是兩種不同認(rèn)知帶寬的分工協(xié)作。

      Freedman 還具體建議:在 MathLib 的依賴圖上跑 PageRank + 壓縮度分析。一條定理如果被很多下游定理引用(PageRank 高),又能大幅壓縮下游內(nèi)容(壓縮度高),那它就是核心定理——值得人類數(shù)學(xué)家投入,值得 AI 優(yōu)先搜索。

      這把"什么是重要的數(shù)學(xué)"從一個主觀判斷,變成了一個可以算的量。

      第八章:這對 AI 意味著什么

      第一個含義:AI 做數(shù)學(xué)的路線圖,清晰了。

      2024 年以來:DeepMind 的 AlphaProof 在 IMO 上拿銀牌;陶哲軒公開宣布 Lean 4 是工作流的一部分;DeepMind 的 FunSearch 在組合數(shù)學(xué)里發(fā)現(xiàn)了新定理;專門的數(shù)學(xué) LLM 涌現(xiàn)。

      所有這些,F(xiàn)reedman 的框架都給了同一個解釋——它們在 FM 的巨大空間里搜索,但它們能成功的地方,恰恰是 HM 已經(jīng)壓縮過的地方。

      AI 的數(shù)學(xué)能力,是站在人類兩千年"造宏"的結(jié)果之上的。脫離了 MathLib 里那 14 萬條定理,AI 在純 FM 里就像撒哈拉沙漠里找一粒米。

      下一步的突破,不會來自于讓 AI 在 FM 里搜索得更快——而是讓 AI 學(xué)會"自己造宏"。

      第二個含義:LLM 是什么?答案變清楚了。

      DeepMind 那篇《Language Modeling Is Compression》(2023)給出了第一層答案:下一個 token 預(yù)測 = 算術(shù)編碼下的壓縮率最大化。訓(xùn)練時的 cross-entropy loss,嚴(yán)格來講就是"對訓(xùn)練集的壓縮率"的負(fù)對數(shù)。loss 越低,壓縮率越高,理解越深——不是比喻,是數(shù)學(xué)恒等。

      但 Freedman 給出了第二層答案:LLM 會用宏,但不會造宏。

      LLM 訓(xùn)練時吃了整個互聯(lián)網(wǎng)——里面充滿了人類兩千年造出來的宏("微積分""進(jìn)化論""民主""熵""注意力"……)。LLM 學(xué)會了在這些宏之間自如穿梭——所以它在"單步推理"上驚艷。

      但在"長證明"上——它崩潰。一條需要造新宏的證明,LLM 很難穩(wěn)定完成。因?yàn)樗鼪]有在訓(xùn)練中見過這個宏,它不會從零定義一個新概念然后在新概念上繼續(xù)推演。

      這正好是 Freedman 說的"層層壓縮"里的"層"——每一層都是一次新的命名。LLM 在一層內(nèi)表現(xiàn)驚艷,跨層就斷。

      第三個含義:為什么 LLM 的 scaling 可能有上限。

      如果智能本質(zhì)是"層層壓縮"——造宏、在宏上造宏——那么單純把模型變大,增加的是單層的帶寬,不是層數(shù)。

      一個更大的 LLM,能用更精細(xì)的宏、更大的詞表、更長的上下文。但它造新宏的能力,沒有因?yàn)樽兇蠖@得質(zhì)變。

      LLM 是一個宏使用器。真正的智能是一個宏生成器。

      —— 這呼應(yīng)了《世界模型之爭》里 LeCun / 李飛飛 vs Ilya 那場口水戰(zhàn)。Ilya 說的是"用宏"的上限還沒到,LeCun 說的是"造宏"的能力根本還沒開始。

      第八章半:數(shù)學(xué)之外——詩、畫、樂也是壓縮

      Freedman 的論文從頭到尾只談數(shù)學(xué)。但如果"壓縮即理解"真的是宇宙級的事實(shí),它就不該只在數(shù)學(xué)里成立。

      我寫到這里的時候,腦子里跳出來的是王維。

      大漠孤煙直,長河落日圓。

      十個字。沒有修飾、沒有形容詞、沒有一個"情"字。但你讀完這十個字,眼前立刻浮起一張畫——遼闊、空曠、孤直的一縷煙、渾圓的落日壓在地平線上。緊接著,是一股你說不出但確實(shí)感到的蒼涼和孤寂。

      這十個字背后,藏著多少信息?視覺上是一幅完整的西北邊塞畫面;幾何上是"直"與"圓"的極簡構(gòu)圖對比,一豎一圓撐起整個空間;時間是日落的那個瞬間,一天將盡;心境是使者獨(dú)自遠(yuǎn)行的孤獨(dú)、遠(yuǎn)離故土的悵然;背景是盛唐邊塞詩的整套意象系統(tǒng)。用散文來復(fù)述,上千字都說不完。王維用十個字,把它壓縮成了一個可以在你腦中重新展開的種子。

      這和 Freedman 論文里講的"宏"是同一件事。"大漠""孤煙""長河""落日",每一個都是一個宏——它調(diào)用了中文文學(xué)兩千年積累的意象、畫面、情緒。王維的天才不是"寫得漂亮",而是挑出了那四個展開之后信息量最大的宏,把它們擺在一起。

      音樂是另一個面孔。貝多芬第五交響曲的開頭只有四個音:ta-ta-ta-tum。但這四個音在整首交響曲里被變形、重組、上行、下行、反轉(zhuǎn)了幾百次。一首四十分鐘的交響曲,本質(zhì)上是從一個四音動機(jī)里壓出來的——這就是作曲家說的"主題與變奏",用 Freedman 的話講就是:造一個宏,然后在宏的空間里自由展開。

      繪畫也是。齊白石畫蝦,不畫水、不畫水草,只畫蝦——你看到的是蝦,感受到的卻是整個池塘。留白不是"沒畫",是讓觀者自己在心里展開那一大片信息。八大山人一只翻白眼的鳥,你讀出了整個明末遺民的心境。

      為什么所有藝術(shù)都指向同一件事?我的猜想是這樣的:

      人類的大腦,能同時握住的"維度"是有限的。幾千個腦細(xì)胞組成的注意力,在某一刻只能在一個相對低維的空間里做關(guān)聯(lián)。

      所以我們分科——有人專心在數(shù)學(xué)的維度里找可壓縮的結(jié)構(gòu)(幾何、群、流形),有人專心在語言的維度里找(意象、節(jié)奏、雙關(guān)),有人專心在聲音的維度里找(和聲、調(diào)性、動機(jī)),有人專心在視覺的維度里找(構(gòu)圖、比例、留白)。不是因?yàn)檫@些領(lǐng)域彼此無關(guān),而是因?yàn)橐粋€人扛不動所有維度。我們用自己天生敏感的那一條通道去壓縮世界,彼此隔行如隔山——其實(shí)隔的不是山,是我們自己的認(rèn)知帶寬。

      而 LLM 第一次給了"把維度連起來"這件事一個物理基礎(chǔ)。

      幾千億參數(shù)的模型,其內(nèi)部表示空間的維度,遠(yuǎn)遠(yuǎn)超過任何一個人類個體能同時調(diào)用的維度。于是很多在我們看來"不相關(guān)"的東西——一首宋詞、一段巴赫的賦格、一個偏微分方程、一張水墨畫——在那個高維空間里,開始出現(xiàn)彼此對齊的方向。

      LLM 的涌現(xiàn),不是神秘的玄學(xué),而是:當(dāng)壓縮維度大到一定程度,原本散落在不同學(xué)科的宏,開始互相調(diào)用。"熵"這個宏,在物理、信息論、經(jīng)濟(jì)學(xué)、心理學(xué)里,突然變成同一個東西;"對稱"這個宏,在群論、晶體、音樂、詩歌里,突然變成同一個東西。這大概就是跨域泛化,就是所謂"世界模型"的雛形。

      所以,數(shù)學(xué)、詩、畫、樂,不是四件不同的事。它們是同一件事在四種媒介上的投影。

      王維不是"詩人而已",他是一個在語言維度上找可壓縮結(jié)構(gòu)的人。歐拉不是"數(shù)學(xué)家而已",他是一個在符號維度上找可壓縮結(jié)構(gòu)的人。貝多芬不是"作曲家而已",他是一個在時間維度上找可壓縮結(jié)構(gòu)的人。齊白石不是"畫家而已",他是一個在視覺維度上找可壓縮結(jié)構(gòu)的人。

      殊途同歸。萬物為一。

      我們每個普通人,只是在自己最敏感的那條通道里,做著同一件事——把復(fù)雜的世界壓成一個自己能握住的短描述,然后靠這個短描述活下去。

      Freedman 用代數(shù)模型證明了:數(shù)學(xué)之所以存在,是因?yàn)樗钤谝粋€ A_n-like 的可壓縮子空間里。我想補(bǔ)一句他沒說的:人類文明之所以存在,是因?yàn)樗钤跓o數(shù)個可壓縮子空間的并集里。數(shù)學(xué)只是其中最干凈的那一個,但不是唯一的一個。

      第九章:四種概率觀的收束

      寫到這里,忍不住回頭看一眼這一年來博客走過的路。

      一條主線貫穿了四篇文章——每一篇都在用不同的視角看同一個數(shù)學(xué)對象 P(x):

      視角

      P(x) 是什么

      核心論述

      代表人物

      貝葉斯

      信念

      證據(jù)到了就更新

      Bayes / Jaynes

      無知

      熵是無知的度量

      Boltzmann / Shannon

      量子 QBism

      實(shí)在

      概率是世界本身的狀態(tài)

      Born / Fuchs

      壓縮(本文)

      理解

      -log P 就是描述長度

      Shannon / Freedman

      這四個視角指向同一個公式:

      L(x) = ? log P(x)
      • 貝葉斯派

        :L(x) 是"意外",驅(qū)動信念更新

      • 統(tǒng)計(jì)力學(xué)派

        :L(x) 是微觀狀態(tài)對熵的貢獻(xiàn)

      • QBism 派

        :L(x) 是測量結(jié)果在下次下注時的權(quán)重

      • 壓縮派

        :L(x) 是這個事件在最優(yōu)編碼里占的字符數(shù)

      它們是同一個數(shù)學(xué)對象,從四個不同的哲學(xué)位置看。

      Freedman 這篇論文的意義是——他把這個公式從"一個信息論工具"升級成了"數(shù)學(xué)本身的基礎(chǔ)"。數(shù)學(xué)之所以能存在,是因?yàn)橛钪婵蓧嚎s;人類之所以能做數(shù)學(xué),是因?yàn)槲覀兓钤?An 那樣一個低描述長度的結(jié)構(gòu)里。

      第十章:壓縮留下的三個直覺

      一、所有"理解"都是壓縮。

      你理解了一個現(xiàn)象,意味著你能用比原始數(shù)據(jù)短得多的描述重新生成它。做到這一點(diǎn),你就理解了;做不到,你就只是在記憶。

      二、數(shù)學(xué)獨(dú)特之處,是它能做"嵌套的壓縮"。

      不止一次壓縮,而是"在壓縮之上再壓縮"。每一代數(shù)學(xué)家把上一代結(jié)果打包成一個名字,然后在那個名字上繼續(xù)工作。這個遞歸過程,是其他學(xué)科沒有(或者沒有這么強(qiáng)的)。

      三、數(shù)學(xué)、詩、畫、樂,是同一件事在四種媒介上的投影。

      每個領(lǐng)域的大師,都是在自己那條通道里做可壓縮子空間的挖掘者。王維的"大漠孤煙直,長河落日圓"和歐拉的 e^(iπ)+1=0,本質(zhì)同構(gòu)——都是把龐大的信息壓成一顆能在別人腦中重新展開的種子。我們分科,不是因?yàn)槭澜缡歉盍训模且驗(yàn)橐粋€人的認(rèn)知帶寬不夠。LLM 第一次讓這些分科的宏在同一個高維空間里開始互相調(diào)用——這就是所謂的涌現(xiàn)和泛化。

      四、AI 要做真正的數(shù)學(xué)(和深度智能任務(wù)),必須學(xué)會"造宏"而不只是"用宏"。

      "用宏"是工程問題——擴(kuò)大上下文、提高精度、疊更多層。"造宏"是認(rèn)知問題——從混亂現(xiàn)象中看出一個可以命名的模式。

      目前所有 LLM 的 scaling 都在"用宏"的層面上。真正的突破——不管它叫 AGI、叫 JEPA、叫世界模型、還是叫別的——一定出現(xiàn)在 AI 開始自己造宏的那一天。

      尾聲:你在讀這篇文章,就是在壓縮

      Freedman 寫完這篇論文大概花了一年。我寫這篇文章帶上查資料畫圖,大概八小時。你讀它,大概二十分鐘。

      一年 → 八小時 → 二十分鐘。

      每一次壓縮,都有損失。 但每一次壓縮,也都有獲得——你能在二十分鐘里帶走一個新的看世界的方式。

      你讀完過幾天,記得的大概只有幾個關(guān)鍵詞:壓縮、宏、樂高和辮子、MathLib、造宏而不是用宏。

      這就是又一次壓縮。

      如果這幾個關(guān)鍵詞以后在你遇到別的問題時——學(xué)一個新領(lǐng)域、讀一篇論文、訓(xùn)練自己的模型、帶一個學(xué)生、甚至只是想一件事——還能被你調(diào)用,那說明它們在你腦子里成了新的宏。

      你也在做 Freedman 說的那件事。

      數(shù)學(xué)家、程序員、作家、老師、學(xué)生——所有"用頭腦工作"的人,每天都在干同一件事:把世界的復(fù)雜,壓進(jìn)一個可以用的短名字。

      下一次有人問你"什么是智能"的時候——你可以換一種回答了。

      不是"處理信息"。不是"模式識別"。不是"深度學(xué)習(xí)"。是:

      找到更短的描述。—— 壓縮,即是全部。

      下一篇,回到《看見物理》系列的最后一站——對稱性。諾特定理、楊振寧、宇宙的骨架。對稱性和壓縮是一對孿生姐妹——有對稱就有守恒,有守恒就有可壓縮的描述。

      —— 所以,實(shí)際上我們還在同一個故事里。

      本文首發(fā)于「AI 學(xué)習(xí)筆記」博客:https://Jason-Azure.github.io/ai-blog/posts/compression-is-all-you-need/微信公眾號:AI-lab學(xué)習(xí)筆記參考:Freedman, Compression is all you need: Modeling Mathematics, arXiv 2603.20396 (2026-03)

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      升溫提速,連續(xù)30℃要來了!

      升溫提速,連續(xù)30℃要來了!

      上觀新聞
      2026-05-09 10:24:10
      跟隊(duì):皇馬更衣室支持穆帥擔(dān)任主帥,包括赫伊森和維尼修斯

      跟隊(duì):皇馬更衣室支持穆帥擔(dān)任主帥,包括赫伊森和維尼修斯

      懂球帝
      2026-05-09 11:26:41
      無錫高中格局大洗牌:頂尖班的“神仙打架”與分?jǐn)?shù)線的“生死線”

      無錫高中格局大洗牌:頂尖班的“神仙打架”與分?jǐn)?shù)線的“生死線”

      朗威談星座
      2026-05-10 05:46:44
      河南博物院洗手間被指毫無隱私,女士進(jìn)入洗手間必須路過男士小便池區(qū)域;回應(yīng):深表歉意,立馬整改

      河南博物院洗手間被指毫無隱私,女士進(jìn)入洗手間必須路過男士小便池區(qū)域;回應(yīng):深表歉意,立馬整改

      江西晨報
      2026-05-09 11:25:40
      莫斯科閱兵這一幕,讓所有軍事強(qiáng)國都在算同一筆賬

      莫斯科閱兵這一幕,讓所有軍事強(qiáng)國都在算同一筆賬

      阿芒娛樂說
      2026-05-10 05:46:46
      難怪藍(lán)玉被朱元璋屠戮三族,你不看他都做了啥,竟連王妃都敢侮辱

      難怪藍(lán)玉被朱元璋屠戮三族,你不看他都做了啥,竟連王妃都敢侮辱

      史筆似塵鉤
      2026-05-06 21:50:03
      曼聯(lián)重大突破!領(lǐng)跑世界級球星爭奪戰(zhàn),球員本人鐵心要來紅魔

      曼聯(lián)重大突破!領(lǐng)跑世界級球星爭奪戰(zhàn),球員本人鐵心要來紅魔

      瀾歸序
      2026-05-10 01:32:30
      人老了確實(shí)沒太大意思,我媽今年72歲,獨(dú)自在家每天就做這兩件事

      人老了確實(shí)沒太大意思,我媽今年72歲,獨(dú)自在家每天就做這兩件事

      心理觀察局
      2026-05-04 11:19:11
      一文綜合!普京出席勝利日紅場閱兵式并發(fā)表講話,都說了什么?

      一文綜合!普京出席勝利日紅場閱兵式并發(fā)表講話,都說了什么?

      環(huán)球網(wǎng)資訊
      2026-05-09 18:24:27
      點(diǎn)球踢飛,凱恩德甲生涯第25次主罰點(diǎn)球首次罰丟

      點(diǎn)球踢飛,凱恩德甲生涯第25次主罰點(diǎn)球首次罰丟

      懂球帝
      2026-05-10 02:05:28
      5月10日,券商給予評級并且給出目標(biāo)價的公司一覽

      5月10日,券商給予評級并且給出目標(biāo)價的公司一覽

      A股數(shù)據(jù)表
      2026-05-10 06:00:06
      身高1米88的冠軍為何執(zhí)著用1米45短桿?教練們都驚呆了!

      身高1米88的冠軍為何執(zhí)著用1米45短桿?教練們都驚呆了!

      林子說事
      2026-05-09 14:55:37
      皇馬的內(nèi)鬼就是他!高層懷疑索拉里泄密,他的處境變得尷尬

      皇馬的內(nèi)鬼就是他!高層懷疑索拉里泄密,他的處境變得尷尬

      懂個球
      2026-05-09 15:31:10
      5年坐擁7首輪+1互換權(quán)!火箭隊(duì)交易籌碼太豪華!追逐4巨星有戲了

      5年坐擁7首輪+1互換權(quán)!火箭隊(duì)交易籌碼太豪華!追逐4巨星有戲了

      熊哥愛籃球
      2026-05-09 12:39:39
      巴恩斯和嬌妻近照,離開勇士也賺2.2億,勞模典范,妻子黑人美女

      巴恩斯和嬌妻近照,離開勇士也賺2.2億,勞模典范,妻子黑人美女

      大西體育
      2026-05-09 21:41:17
      遼寧一地剛火,謠言來了,有關(guān)部門回應(yīng)舊事重提謠言中傷

      遼寧一地剛火,謠言來了,有關(guān)部門回應(yīng)舊事重提謠言中傷

      遼沈音信
      2026-05-09 16:00:06
      “漢坦病毒”來襲,醫(yī)生提醒:寧可每天看電視,也不要出門做7事

      “漢坦病毒”來襲,醫(yī)生提醒:寧可每天看電視,也不要出門做7事

      新時代的兩性情感
      2026-05-09 16:41:52
      廣東G2絕殺北京各界說啥?廣東3將全被點(diǎn)名,周琦體能問題被點(diǎn)出

      廣東G2絕殺北京各界說啥?廣東3將全被點(diǎn)名,周琦體能問題被點(diǎn)出

      籃球資訊達(dá)人
      2026-05-09 23:01:44
      52歲樸樹近況:無兒無女,沒錢沒房,成了要錢不要命的“瘋子”

      52歲樸樹近況:無兒無女,沒錢沒房,成了要錢不要命的“瘋子”

      流云隨風(fēng)去遠(yuǎn)方
      2026-04-14 12:22:59
      二手車市場幾乎沒有新能源車,“賣得太快”還是“不敢收”?

      二手車市場幾乎沒有新能源車,“賣得太快”還是“不敢收”?

      華夏時報
      2026-05-08 09:50:03
      2026-05-10 08:39:00
      新浪財(cái)經(jīng) incentive-icons
      新浪財(cái)經(jīng)
      新浪財(cái)經(jīng)是一家創(chuàng)建于1999年8月的財(cái)經(jīng)平臺
      3160482文章數(shù) 7282關(guān)注度
      往期回顧 全部

      科技要聞

      美國政府強(qiáng)力下場 蘋果英特爾達(dá)成代工協(xié)議

      頭條要聞

      美軍對伊朗多個目標(biāo)發(fā)動打擊 伊朗革命衛(wèi)隊(duì)深夜警告

      頭條要聞

      美軍對伊朗多個目標(biāo)發(fā)動打擊 伊朗革命衛(wèi)隊(duì)深夜警告

      體育要聞

      成立128年后,這支升班馬首奪頂級聯(lián)賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認(rèn)不出!

      財(cái)經(jīng)要聞

      多地號召,公職人員帶頭繳納物業(yè)費(fèi)

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態(tài)度原創(chuàng)

      本地
      旅游
      手機(jī)
      公開課
      軍事航空

      本地新聞

      用蘇繡的方式,打開江西婺源

      旅游要聞

      早安!花開好市火熱進(jìn)行,周末來赴一場花漾約會吧

      手機(jī)要聞

      iQOO 15T首發(fā)天璣9500特別版:實(shí)測幀率無敵 穩(wěn)如泰山

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美伊突然再次交火 伊朗外長:戰(zhàn)爭準(zhǔn)備程度是1000%

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 无套内谢少妇毛片aaaa片免费 | 琪琪福利视频| 亚洲日韩在线观看国产精品每日更新| 国产精品自拍视频我看看| 777米奇色狠狠888俺也去| 2021国产乱人伦在线播放| 最新国产精品中文字幕| 另类 专区 欧美 制服| 日本五十路熟女一区二区| 在国产线视频A在线视频| 国产乱人妻精品秘?入口-国产精品亚| 久久av高潮av喷水av无码| 92精品国产自产在线观看481页| 欧美一线天| 午夜dj在线观看免费高清在线| 国产精品一区久久99| 国产成人高清亚洲综合| 亚洲av二区| 无码人妻一区二区三区| 国产成人精品亚洲午夜| 五月丁香六月综合缴情在线 | 全球av集中精品导航福利| 美女网站免费观看视频| 99精品日本二区留学生| 丰满白嫩大屁股ass| 美女无遮挡被啪啪到高潮免费| 免费无码一区无码东京热| 免费午夜无码片在线观看影院| 中国少妇人妻xxxxx| 国产亚洲欧洲一区二区| 天天爽夜夜爱| 色偷偷亚洲女人天堂观看| 国产成人精品综合在线观看| 91亚洲国产系列精品第56页| 国产白丝jk捆绑束缚调教视频| 开心激情站开心激情网六月婷婷| 两个人看的www视频免费完整版| 久久99精品一区二区三区| 中文字幕日本人妻| 狠狠色丁香婷婷综合尤物| 精品人妻少妇|