在印度東北部的阿薩姆邦,西爾查爾鎮(zhèn),一位開發(fā)者正用安卓手機上的Termux終端寫代碼。沒有筆記本電腦,沒有GPU,沒有辦公室。他的用戶是周邊地區(qū)的農(nóng)民——那些SaaS產(chǎn)品永遠不會服務(wù)的人。
這些農(nóng)民問的問題很具體:稻葉邊緣的褐斑是什么病?博羅稻該何時播種、哪個品種耐寒?從12月開始的三個月種植計劃怎么做?他們沒有穩(wěn)定網(wǎng)絡(luò),沒有ChatGPT訂閱,沒有電腦。只有安卓手機、時斷時續(xù)的4G信號,以及等不起服務(wù)器響應(yīng)的莊稼。
![]()
Google發(fā)布新一代輕量開源模型時,開發(fā)者注意到一句話:2B和4B參數(shù)版本專為超移動和邊緣部署設(shè)計——能在手機上運行。這讓他放下了其他所有事。
這不是單一模型,而是三種架構(gòu)的家族。小型版(2B和4B)面向手機、樹莓派和瀏覽器部署,原生多模態(tài)輸入,128K上下文窗口。密集版(31B)是服務(wù)器級,在單機上追求最大能力。混合專家版(26B MoE)高效高吞吐,每token只激活部分參數(shù),比同規(guī)模密集模型更快更省。
2B參數(shù)版本的存在是這次發(fā)布最重要的事。不是因為它最強,而是因為它最具主權(quán)性。
在農(nóng)村印度,選模型不只是技術(shù)決定,更是主權(quán)決定。依賴云的模型意味著:農(nóng)民的查詢要發(fā)到國外服務(wù)器;需要收獲季可能不存在的網(wǎng)絡(luò)連接;需要自給農(nóng)民付不起的錢;隨時可能被關(guān)閉、限流或設(shè)付費墻。本地運行的2B參數(shù)版本則意味著:查詢不出設(shè)備;沒信號的地里也能離線工作;下載后零成本;沒人能拿走它。
這個2B參數(shù)版本能在Pixel手機上跑,能在樹莓派5上跑——開發(fā)者測試過,也能在安卓手機的Termux里通過llama.cpp在ARM64上跑。這不是功能,是哲學(xué)。
印度正論派哲學(xué)中,最可靠的知識形式是Pratyaksha:直接感知,來自自身感官、無中介的知識。云端AI模型在認(rèn)識論上恰是Pratyaksha的反面:查詢穿越多層基礎(chǔ)設(shè)施,經(jīng)他人服務(wù)器,受他人條款約束,在他人土地上被記錄和分析。本地模型才是Pratyaksha:農(nóng)民的問題、農(nóng)民的莊稼、農(nóng)民的手機、農(nóng)民的答案。無中介,無外部依賴,無提取性數(shù)據(jù)經(jīng)濟。
開發(fā)者正在構(gòu)建的東西很簡單:一個農(nóng)民能離線使用的農(nóng)業(yè)助手。拍照識別稻病,查詢種植日歷,生成季節(jié)性計劃——全部在手機上完成,無需網(wǎng)絡(luò)。
這背后是更廣泛的現(xiàn)實。全球7000種語言中,AI能翻譯的不到200種。印度有22種官方語言、數(shù)百種方言,阿薩姆語、博多語、米辛語——這些語言沒有足夠訓(xùn)練數(shù)據(jù)支撐云端大模型,但2B參數(shù)版本可以被微調(diào)、被蒸餾、被適配到本地語境。
技術(shù)圈常討論"AI民主化",但真正的民主化不是讓孟買和班加羅爾的開發(fā)者用上GPT-4,而是讓巴拉克谷的農(nóng)民在沒網(wǎng)的地里也能用上AI。128K上下文窗口意味著它能消化整本農(nóng)業(yè)手冊、整個地區(qū)的種植歷史、完整的病蟲害數(shù)據(jù)庫——全部塞進一部普通安卓手機。
開發(fā)者提到他正在處理的約束:間歇性4G、無筆記本電腦、無GPU、無辦公室。這些不是邊緣情況,是全球大部分地區(qū)的默認(rèn)狀態(tài)。據(jù)國際電信聯(lián)盟數(shù)據(jù),全球仍有約26億人未接入互聯(lián)網(wǎng)。云優(yōu)先的AI設(shè)計對他們而言是缺席的設(shè)計。
這次發(fā)布的時機因此具有特殊意義。當(dāng)美國科技公司競相建造更大、更集中的模型時,Google釋放了一個能在樹莓派上運行的開源權(quán)重模型。這不是技術(shù)倒退,是戰(zhàn)略分叉:一條路徑追求通用人工智能的集中化,另一條追求特定情境下的主權(quán)化。
對農(nóng)業(yè)AI而言,后者更緊迫。作物病蟲害不等待API響應(yīng),季風(fēng)季節(jié)不遷就服務(wù)器維護窗口,農(nóng)民的現(xiàn)金流不支撐訂閱費用。本地模型的延遲以毫秒計,云模型的延遲以網(wǎng)絡(luò)狀況計——在雨季的稻田邊,這是生與死的差別。
開發(fā)者的工作也揭示了開源權(quán)重模型的真實價值。不是讓業(yè)余愛好者免費玩AI,而是讓專業(yè)開發(fā)者能為被商業(yè)忽視的人群構(gòu)建系統(tǒng)。沒有開源許可,他無法合法地微調(diào)、部署、分發(fā)一個農(nóng)業(yè)助手;沒有2B參數(shù)版本的體積,他無法在目標(biāo)硬件上運行它。
這引出一個被低估的問題:模型尺寸的政治經(jīng)濟學(xué)。參數(shù)計數(shù)不只是技術(shù)規(guī)格,是訪問控制的機制。175B模型需要數(shù)據(jù)中心,7B模型需要高端消費級GPU,2B參數(shù)版本需要2019年的中端手機。每一數(shù)量級的縮減,都是一扇門的打開。
三種架構(gòu)因此可理解為三種主權(quán)層級。MoE版面向能負(fù)擔(dān)推理集群的機構(gòu),密集版面向能負(fù)擔(dān)工作站的開發(fā)者,小型版面向能負(fù)擔(dān)手機的個人。這種分層不是缺陷,是刻意的包容性設(shè)計——讓同一技術(shù)家族能同時服務(wù)云數(shù)據(jù)中心和邊緣田野。
開發(fā)者的測試環(huán)境本身即是論證:Termux是安卓上的Linux環(huán)境,無需root權(quán)限即可運行完整開發(fā)工具鏈。llama.cpp是跨平臺推理引擎,用C++編寫,針對ARM NEON指令集優(yōu)化。開源權(quán)重模型是法律基礎(chǔ),允許商業(yè)使用和修改。三者疊加,一部普通手機成為完整的AI開發(fā)平臺。
這指向一個被主流敘事遮蔽的事實:技術(shù)棧的"低端"往往是創(chuàng)新的高壓區(qū)。不是 despite 約束,而是 because of 約束——開發(fā)者被迫尋找最高效、最便攜、最獨立的解決方案。
農(nóng)民的反饋正在塑造產(chǎn)品。一位種植博羅稻的用戶指出,模型建議的播種時間比當(dāng)?shù)亓?xí)慣晚兩周,但更準(zhǔn)確對應(yīng)寒潮窗口。另一位發(fā)現(xiàn),拍照識別稻瘟病的準(zhǔn)確率超過90%,前提是光線充足、葉片在畫面中央——這些細(xì)節(jié)被寫進使用指南。這是參與式設(shè)計,由使用情境而非產(chǎn)品經(jīng)理驅(qū)動。
更大的圖景是全球南方的主權(quán)技術(shù)運動。從巴西的社區(qū)網(wǎng)絡(luò)到肯尼亞的離線地圖,從印尼的漁民數(shù)據(jù)庫到這里的農(nóng)業(yè)助手,核心邏輯一致:基礎(chǔ)設(shè)施不可靠的人群,需要不依賴基礎(chǔ)設(shè)施的技術(shù)。不是等待連接,而是假設(shè)斷連;不是乞求訪問,而是奪取控制。
2B參數(shù)版本的128K上下文窗口在此顯現(xiàn)深層意義。它不僅支持長文檔,更支持完整的本地知識庫——一個村莊的種植歷史、一個合作社的交易記錄、一個地區(qū)的病蟲害周期。這些數(shù)據(jù)從未進入互聯(lián)網(wǎng),因此從未被云端模型訓(xùn)練。本地部署是唯一的訪問方式。
開發(fā)者提到他正在實驗的微調(diào)策略:用公開農(nóng)業(yè)數(shù)據(jù)預(yù)訓(xùn)練,用阿薩姆語對話數(shù)據(jù)對齊,用具體農(nóng)場的反饋強化。這需要計算資源,但不需要云——租一臺服務(wù)器幾小時,生成適配后的權(quán)重,分發(fā)到手機。主權(quán)不是拒絕所有外部性,而是控制關(guān)鍵依賴的節(jié)點。
雨季將至。開發(fā)者的測試機是一部2019年的小米,4GB內(nèi)存,64GB存儲。2B參數(shù)版本的量化版本占用約1.5GB,推理速度每秒幾個token——對農(nóng)業(yè)問答足夠。農(nóng)民不需要寫詩,需要知道稻飛虱的防治窗口。
這部手機的價值不在硬件,而在它所證明的事:最被低估的計算設(shè)備,加上最被低估的模型尺寸,可以服務(wù)最被低估的用戶群體。這不是技術(shù)樂觀主義,是技術(shù)現(xiàn)實主義——承認(rèn)約束,在約束內(nèi)工作,讓約束成為篩選器,濾除所有不必要的復(fù)雜。
當(dāng)行業(yè)討論"下一個萬億參數(shù)模型"時,這里的開發(fā)者關(guān)心另一件事:如何讓2B參數(shù)版本在更老的芯片上跑得更快,如何用更少的數(shù)據(jù)微調(diào)出可用的阿薩姆語能力,如何讓農(nóng)民在完全離線時也能更新本地知識庫。這些問題不登上會議議程,但決定技術(shù)是否真正抵達需要它的人。
最終,這是關(guān)于技術(shù)主權(quán)的樸素命題:農(nóng)民的問題,應(yīng)該在農(nóng)民的設(shè)備上,用農(nóng)民能理解的語言,在農(nóng)民需要的時間得到回答。不經(jīng)過硅谷的數(shù)據(jù)中心,不經(jīng)過新加坡的CDN節(jié)點,不經(jīng)過任何可能中斷、漲價或關(guān)閉的外部依賴。2B參數(shù)版本讓這個命題成為可運行的代碼。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.