想像一下,在東非烏干達(dá)的一片玉米田里,一位農(nóng)民正因作物歉收而愁眉不展。他打開手機(jī),在WhatsApp上收到了一條由烏干達(dá)農(nóng)業(yè)部發(fā)送的種植建議——而這條信息正是由我國大語言模型Qwen(通義千問)生成。這個看似超現(xiàn)實的場景,正在成為這個東非國家土地上的常態(tài)。在擁有4800萬人口的烏干達(dá),雖然英語是官方語言,但僅有約30%的受教育人口能熟練使用,其余絕大多數(shù)人使用著40多種本土方言。
![]()
被矽谷遺忘的“低資源語言”
一家來自烏干達(dá)的非政府機(jī)構(gòu)Sunbird AI自2024年起開始測試幾個開源大語言模型,包括Google的Gemma、Meta的Llama和阿里巴巴的Qwen(通義千問),Sunbird AI執(zhí)行總裁Ernest Mwebaze發(fā)現(xiàn),盡管美國大模型在英語方面表現(xiàn)優(yōu)越,但在面對非洲本土那些(Low-resource languages)時,其優(yōu)勢便蕩然無存。
由于小語種語料庫匱乏、商業(yè)回報率低,西方科技巨頭往往不愿投入資源。相比之下,阿里的Qwen系列支持多達(dá)119種語言,覆蓋了印尼的爪哇語(Javanese)、菲律賓的宿霧語(Cebuano)、海地克里奧爾語(Haitian Creole)、斯瓦希里語(Swahili)等大量被主流模型邊緣化的地方語系。Sunbird AI基于Qwen打造的Sunflower模型,則將適用于當(dāng)?shù)氐恼Z言從6種一舉擴(kuò)展到了31種。
![]()
成本是使用中國模型的另一個決定性因素。
根據(jù)最新市場定價,DeepSeek V3系列模型調(diào)用API的成本極低:每百萬輸入Token(即用于處理輸入指令Token)約0.28美元,輸出token約0.42美元。相比之下,與之同級別的GPT-4o百萬輸入token成本則高達(dá)2.5美元左右,輸出則高達(dá)10美元,相當(dāng)于DeepSeek V3的十到二十倍。對于缺乏龐大資金支持的AI企業(yè)或組織而言,投入高昂成本使用西方模型根本是不現(xiàn)實的選擇。Mwebaze表示,中國的開源模型讓他們向烏干達(dá)民眾提供免費的AI服務(wù),并在各個領(lǐng)域進(jìn)行靈活部署。目前,Sunbird AI已與烏干達(dá)政府合作,協(xié)助各政府部門推動數(shù)碼減貧、進(jìn)行人口普查,以及為使用不同語言的人口提供農(nóng)業(yè)資訊、教育材料等,努力讓那70%曾被數(shù)碼經(jīng)濟(jì)排除在外的人群重新參與進(jìn)來。
在肯尼亞,一家從事AI研發(fā)、為非洲各國政府和企業(yè)提供AI政策建議和解決方案的Qhala同樣在使用我國的大語言模型。Qhala的AI工程師Wenslous Egesa表示,盡管Open AI的頂級模型非常強(qiáng)大,但對一些企業(yè)來說,在選擇模型時最重要的還是成本考量,尤其是當(dāng)企業(yè)只是需要使用模型來“快速瀏覽和檢查內(nèi)部文件”,使用頂級模型就顯得沒有必要了。
![]()
2025年7月的世界人工智能大會(WAIC)期間,我國提出最新版倡議性文件《人工智能全球治理行動計劃》,試圖為這個全球議題提出“中國方案”,當(dāng)中就包括幫助全球南方國家真正接觸和應(yīng)用人工智能”、支持這些國家發(fā)展AI技術(shù)和服務(wù)。
盡管西方輿論對中國模型的數(shù)據(jù)私隱與合規(guī)性充滿疑慮,但對于全球南方國家而言,實用主義勝過了一切。全球開源社區(qū)風(fēng)向標(biāo)Hugging Face的最新報告顯示,中國模型已占據(jù)Hugging Face月度模型下載總量的41%,首次超越美國模型。在2025年推出的新模型中,超過63%的熱門微調(diào)模型是基于中國開源底座(如DeepSeek-R1或Qwen系列)開發(fā)的。全球最大AI模型API聚合平臺OpenRouter3月發(fā)布的數(shù)據(jù)則顯示,自2026年2月起,中國AI模型在該平臺的Token消耗量首次超過美國競爭對手,在3月16至22日這一周內(nèi),全球前10大熱門模型共消耗8.7兆token,當(dāng)中中國模型占比達(dá)到約61%(約5.3兆Token)。
不僅在非洲,在東南亞,馬來西亞研究機(jī)構(gòu)利用DeepSeek微調(diào)出了全球首個符合伊斯蘭教法的AI模型“NurAI”。該模型不僅支持馬來語、印尼語,更確保輸出內(nèi)容符合穆斯林市場的宗教與文化標(biāo)準(zhǔn)。在日本,當(dāng)?shù)仄髽I(yè)開發(fā)的前10大模型中,有6個是基于DeepSeek和Qwen構(gòu)建的。從印尼的數(shù)字身份系統(tǒng)到肯尼亞的斯瓦希里語醫(yī)療問答,中國技術(shù)正在滲透進(jìn)這些國家的社會底層架構(gòu)。正如Mwebaze所言:“如果一位農(nóng)民無法獲取資訊,而這個模型能提供她能理解的準(zhǔn)確信息,我們就會認(rèn)為這是非常好的......如果你來自一個根本沒有模型可用的地方,你首要的任務(wù)就是讓技術(shù)先運作起來。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.