手傷眼疾尚未修復,手進入恢復階段反而更酸痛了;眼科看完了,等明兒看完中醫,再談談體會,總的來說,小鎮覺得這次眼疾是大好事。寫這篇時只能每寫20分鐘休息5分鐘,公號就先緩緩了。
本文發在星球,對個人、企業、城市或地區都挺重要的,也有助于進一步理解未來AI的發展方向,全文5000字,慣例發前50%。
如果只想記住結論也行,小鎮一直覺得結論的價值最多占三成,如何論證并得出這個結論,才是最關鍵的。
結論是:未來Token也就是“詞元”的消耗量,不僅適用于企業內部考核個人,還可以成為AI相關企業橫向對比、地區GDP和社會經濟指標完成情況乃至中美等國家間橫向對比的核心指標,其重要性將隨著AI發展,越來越重。
總之,Token消耗量,就是AI時代的用電量指標。大家覺得十年增速多少比較可能?百倍、千倍、萬倍?還是十萬、百萬倍?
星球文章題目為:《Token詞元,很可能成為國家關注的核心考核指標》,配套輔助閱讀文章為《》一文重點介紹的2020年中國統計方式的全面改革,也就是“下算一級”。
以下正文前50%:
開始本篇之前,小鎮先提兩個問題:
問題一:為什么國家會優先命名Token為“詞元”?而不是其他AI相關英文詞語?
問題二:在傳統情境下,美國絕無可能在算力上追上中國,馬斯克的“太空算力”能否成為美國彎道超車的可能途徑?
由這兩個問題,幫助理解“Token”這個新事物的重要性。小鎮判斷:詞元消耗量或者說調用量,在不久的將來,很可能成為中美AI競爭、國內地區和企業競爭乃至GDP核算的關鍵指標,借助中國完善的規劃執行體系,持久的加速推進中國AI進程。
為什么這么說呢?這就是今天要談的。
因為手傷眼疾已經耽擱了好幾天,今天開始要好好談談“十五五”規劃,不過大家也不用太著急,因為目前只公布了最核心的國家“十五五”規劃綱要,還有幾十個國家層面的專項配套規劃未公布。
地方層面,還有10萬級數量的各類配套規劃,就算只統計到省級和較發達城市,也以千計,整個2026年都是“十五五”規劃體系快速完善的一年,尤其2026年3月12日起,發展規劃法正式施行。
任何規劃,最核心的就是考核指標。
國家“十五五”規劃綱要中分為約束性和預期性兩類指標。
約束性就是強制需要完成的,一般是生態環境和民生類,但并不意味著一定能完成,比如“十四五”規劃綱要確定的節能降碳約束性指標就沒有完成。
預期性主要是經濟指標,考慮為實際執行留下更多靈活空間,所以預期性指標一般制定的比較穩妥、保守。比如“十四五”數字經濟核心產業占比,目標是從7.8%提高到10%,目標提高2.2個百分點,實際超過10.5%,提高了2.7個百分點;然而在這一背景下,“十五五”目標卻只是從10.5%提高到12.5%,增幅僅為2個百分點,這就體現了預期性目標的穩妥性。
可能有朋友好奇為啥“十五五”期間增幅目標比“十四五”少了0.2個百分點,有什么復雜考量?
這就想得太復雜啦,不過是在保守穩妥的基礎上湊整罷了。“十四五”制定目標的時候,數字經濟核心產業占比是7.8%,要湊整無非以0或者5結尾,也就是在9.5%、10%、10.5%之間選一個,9.5%太保守、10.5%感覺太激進,于是就選了10%;而“十五五”目標從10.5%提高到12.5%也是同樣的道理,無非12%、12.5%、13%選一個,而考慮到之前基數比較高,自然就選擇了12.5%。
這就是預期性目標設置有意思的地方,多少有點湊整。類似的人均預期壽命目標從79.25歲提高到80歲,常住人口城鎮化率從67.9%提高到71%。
不過除了在綱要最開頭經濟社會發展主要指標列表標明的指標,綱要正文中還分散了明確了其他指標。
分散在正文中的指標,有的比開頭列表里的還重要。“十四五”規劃綱要,開頭列表共20個指標,后面正文還提出了20個其他指標,“十五五”仍然如此,小鎮還沒來得及細數,目前看起碼額外有十幾個指標。
比如農作物耕種收綜合機械化率提高到80%,大陸自然岸線保有率不低于35%;學前教育毛入園率提高到95%,高中階段教育完成率達到88%,高等教育毛入學率達到65%;重大慢性病過早死亡率下降到13%以下,經常參加體育鍛煉人數比例達到40%左右;單位GDP能耗下降10%左右,氮氧化物、揮發性有機物排放量分別下降8%以上,化學需氧量、總磷排放量分別下降6%;單位GDP用水量下降10%,農田灌溉水有效利用系數提高到0.6,等等。
上述這些指標看起來都要比數字經濟核心產業占比這個預期性指標更剛性,剛性就在于目標明確、責任明確、統計口徑明確,不像數字經濟核心產業占比還是有一定的操作空間。
以上簡單梳理了下五年規劃綱要的目標設置,作為背景。
“十五五”規劃綱要已經確定,但并不意味著接下來五年沒有任何調整,實際工作中,也會隨著現實需要,進行靈活調整,這些調整未必通過官方文件進行明確,而是以“白皮書”等更加靈活的準官方形式,但千萬不要低估這種非正式途徑的權威性。
舉個例子,小鎮剛才說數字經濟核心產業占比統計有一定操作空間。當年這個指標到底應該怎么核算,就費了很大工夫,直到目標公布之后兩年多,才確定到底應該如何核算,并下文到各地進行統計,實際統計過程中也有很多模糊的地方。
這兩年一直有聲音建議調整統計口徑,尤其AI備受關注后,就建議將“數字經濟”修改為“數智經濟”,一些在人工智能發展上占據領先位置的省份和城市呼聲尤為強烈。
但想要調整難度還是挺大的,一個關鍵原因是統計口徑就是權力,如果調整統計口徑,很可能意味著原本管理這塊的部門丟了管理權,至少要把部分管理權轉移出去。所以更加務實的做法,就是通過白皮書的形式進行完善,提供新的統計口徑,但是名字還是不變。
這個做法并非罕見,比如“十五五”規劃綱要第四篇,還是“數字中國”的老提法,但是仔細看內容,跟“十四五”內涵大不一樣。
在“十五五”規劃制定中,也有人提議是不是把“數字中國”改為“數智中國”,但考慮來考慮去還是覺得不改為好,起碼“數字中國”更加順口,但注意,“十五五”規劃綱要中,具體內容大量出現“數智”,一共26處,而“數字”才25處,而且相對更加具體化。
鋪墊有點久,說了些規劃編制的閑談,方便理解,接下來就得進入正題了。
小鎮之前寫過好幾篇文章,如果按照目前既定模式,也就是基于電力、芯片等基礎上在地球大規模興建算力設施,美國沒有半分取勝的可能,一定在算力競爭中被中國壓在下面,中國領先優勢還會非常大,兩會期間王堅院士就非常自信的表達了這一點。
但美國真的完全沒有彎道超車的可能嗎?雖然概率很小,但也不至于為零,馬斯克的“太空算力”就是一種可能。
小鎮之前也說過,馬斯克放著更容易的地面算力不搞,非要在更難以散熱的太空搞算力,這個邏輯不對。但小鎮的否定觀點,是基于傳統算力擴張的主流模式,如果不從純粹算力角度,而是AI整體角度,那就不一樣了,關鍵是Token詞元的調用量。
AI有三大基座:算法、算力、數據。
中國AI大模型研發,頂著一軟一硬兩大負面壓力。一硬就是算力不足,一軟是公開可訓練數據不足。
中國AI大模型研發在數據上很吃虧,并非中國數據少,更不是所謂謠傳的“中國互聯網數據只占全球的1%”,關鍵在于中國快速進入移動互聯網時代,海量數據被封閉在大小APP中,數據私有化極為嚴重,缺乏開放的優質訓練用公共數據集。這就導致中國AI公司不得不使用英文訓練數據集,就出現了對英文提示詞更加敏感的現象,以至于有不少人以為是套殼抄襲國外AI大模型。
不過有利有弊,算力和可訓練公共數據的不足,也促使中國AI公司更加注重算法的提升,典型就是催生了DeepSeek。
但未來AI的發展,肯定是三者協同,任何一個短板都會卡住AI的發展進程。
做個類比,就好理解了。
對比汽車,算法就好比發動機,算力好比燃料,數據好比打磨一輛好車的經驗積累。
無論單體方面如何優秀,一輛車歸根到底就是要以更低成本、更高效、更安全的把人和物從A點帶到B點,而這個里程就是Token詞元。
總之,無論一家汽車公司說自己的造車經驗多么豐富、發動機打磨的多好、使用的燃油多么充足,在一場拉力賽中,還是要看最終實現的里程有多少,而這個里程數體現了方方面面的綜合成績。
Token是一個絕妙的指標。
......(省略1638字)。
面對如此令人心動的未來,所以為AI發展確定一個便于綜合評估的核心指標很有必要;也更需要一個強大的政府進行相應的社會改革,最大限度彌合AI爆發發展對社會帶來的沖擊。
這就是小鎮說的,中美AI競爭最關鍵的不是技術,而是政府治理能力。
其他文章推薦
(中篇)
(上篇)
如果喜歡,還請點贊、“在看”和關注吧
歡迎分享,讓更多人發現“大樹鄉談”
備用:大樹鄉談2022、大樹鄉談2023
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.