“說3句家鄉(xiāng)話給1塊錢,日賺40元!”
聽到這句話,估計(jì)不少人都會(huì)覺得又是什么電詐新手段。然而,背后悄悄搞事情的,卻是最重視用戶體驗(yàn)的微信。
這個(gè)月初,微信悄悄上線了一項(xiàng)名為“方言采集”的返紅包活動(dòng)。受邀用戶只需用方言朗讀幾句日常用語,每錄滿3句就能拿到約1元的現(xiàn)金獎(jiǎng)勵(lì),每天最多可以錄制200句,單日收益最高約40元。語音通過審核后,30天內(nèi)發(fā)放到微信零錢。
![]()
說實(shí)話,得知消息后,我的第一反應(yīng)是困惑。要知道,張小龍治下的微信,向來以克制著稱。紅包大戰(zhàn)時(shí)代過后,微信幾乎再也沒有搞過這種“拿錢換用戶行為”的活動(dòng)。
這一次驚人之舉的背后,微信到底有什么企圖?
1.微信企圖
表面上看,微信是在花錢買數(shù)據(jù)。但如果你把這個(gè)動(dòng)作,放到微信近期的整個(gè)產(chǎn)品迭代圖譜里看,邏輯就清晰了:微信正在加速布局語音識(shí)別領(lǐng)域。
早在2025年7月,騰訊混元ASR(語音識(shí)別)大模型就已經(jīng)接入IMA平臺(tái),首次在手機(jī)端實(shí)現(xiàn)了語音輸入,產(chǎn)品單日調(diào)用量達(dá)到百億次。12月,微信輸入法iOS版3.0發(fā)布,一口氣支持了15種方言識(shí)別,包括粵語、四川話、河南話、陜西話、上海話、蘇州話等。
再往前看,微信PC版4.1.7也上線了全局語音輸入,不僅支持普通話、多種方言及中英文混合識(shí)別,還新增了“整理文字”功能,能自動(dòng)過濾“嗯”“啊”“然后”等冗余語氣詞,智能添加標(biāo)點(diǎn)符號(hào)和分段排版。
除此之外,騰訊云在2025年底還推出了“普方英大模型”,一個(gè)引擎同時(shí)支持中文普通話、英語和27種方言的混合識(shí)別。
這一連串動(dòng)作勾勒出一條清晰的戰(zhàn)略線:騰訊正試圖讓AI“聽懂中國(guó)”。而這個(gè)目標(biāo)的實(shí)現(xiàn),前提就是“喂飽”AI。
眼下這場(chǎng)方言采集活動(dòng),就是最直接的“喂食”方式。用用戶自己的聲音訓(xùn)練AI,再用更聰明的AI服務(wù)用戶——這是一套完整的商業(yè)閉環(huán)。
2.語料難題
人工智能領(lǐng)域有一條鐵律,算法的上限取決于數(shù)據(jù)的質(zhì)量。
語音識(shí)別這東西,本質(zhì)上是個(gè)吃數(shù)據(jù)的怪獸。一個(gè)AI模型要準(zhǔn)確識(shí)別一句話,需要海量的語音樣本作為教材。普通話的教材足夠多,全國(guó)14億人每天都在說,AI學(xué)得滾瓜爛熟。但方言,卻是個(gè)完全不同的故事。
以潮汕話為例。微信語音轉(zhuǎn)文字功能從2019年上線普通話,2020年支持粵語,直到2025年11月才拿下潮汕話,前后花了整整6年。
之所以這么慢,是因?yàn)槌鄙窃拰儆陂}南語一支,有8個(gè)聲調(diào),口音差異巨大,在AI領(lǐng)域被歸類為“低資源語言”——簡(jiǎn)單說就是數(shù)據(jù)太少,機(jī)器沒法學(xué)。
這并非孤例。公開數(shù)據(jù)顯示,我國(guó)現(xiàn)存130多種語言及各類方言中,68種使用人口不足1萬人,48種不足5000人,還有25種已不足1000人。漢語方言體系通常劃分為七至十個(gè)主要方言區(qū),其中不乏瀕危甚至已經(jīng)消亡的語種。
沒有數(shù)據(jù),再聰明的大模型也白搭。微信這次玩的,本質(zhì)上是用紅包撬動(dòng)用戶主動(dòng)貢獻(xiàn)方言語料。
日賺40元的收益水平,對(duì)那些方言流利的用戶來說,相當(dāng)于把“會(huì)說家鄉(xiāng)話”這個(gè)存量技能變現(xiàn)了。參與者像日常聊天一樣讀出語句,用詞和語序不必和提示文本完全一致,意思傳達(dá)到位即可,這種自然語感恰是訓(xùn)練AI最珍貴的素材。
對(duì)于微信來說,這是在為未來數(shù)億用戶的語音交互體驗(yàn)買單,每一條方言錄音都是AI訓(xùn)練的一粒米,積少成多就是一座語料金山。
3.AI棋局
把視野拉高一點(diǎn)看,方言采集只是微信AI棋局中的一枚棋子。
3月18日,騰訊發(fā)布了2025年財(cái)報(bào),全年?duì)I收7518億元,同比增長(zhǎng)14%,微信及WeChat的合并月活躍賬戶達(dá)到14.18億。
這個(gè)體量放在全球互聯(lián)網(wǎng)領(lǐng)域都找不到第二個(gè)對(duì)標(biāo)物。但真正值得關(guān)注的,是騰訊在AI賽道的排兵布陣。
騰訊總裁劉熾平在業(yè)績(jī)會(huì)上披露,騰訊已經(jīng)制定了清晰的AI戰(zhàn)略規(guī)劃,未來兩到三個(gè)季度將落地多項(xiàng)關(guān)鍵動(dòng)作,大模型層面也完成了團(tuán)隊(duì)調(diào)整升級(jí)和基礎(chǔ)設(shè)施重構(gòu)。
據(jù)The Information報(bào)道,騰訊正為微信秘密開發(fā)一款A(yù)I智能體,項(xiàng)目自2025年起在內(nèi)部絕密推進(jìn),計(jì)劃于2026年年中啟動(dòng)灰度測(cè)試,第三季度向全體用戶開放。
這款A(yù)I智能體的核心賣點(diǎn)是什么?它不是一個(gè)獨(dú)立的AI應(yīng)用,而是深度嵌入微信生態(tài)的“數(shù)字管家”。它將擁有調(diào)用小程序、微信支付和全局搜索的權(quán)限,用戶只需要用語音或文字下指令,就能在一個(gè)對(duì)話框里完成從搜索攻略、預(yù)訂餐廳到結(jié)賬的全流程,徹底告別在不同小程序之間跳來跳去的煩惱。
理解了這一點(diǎn),方言采集的戰(zhàn)略價(jià)值就更加清晰了:如果未來的微信AI智能體只能聽懂標(biāo)準(zhǔn)普通話,它將失去數(shù)億使用方言的用戶的心。
4.跑馬圈地
這不是危言聳聽。站在財(cái)經(jīng)分析的立場(chǎng)來看這個(gè)事件,我想講一個(gè)詞:數(shù)據(jù)資產(chǎn)化。
在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)是石油,是礦石,是最重要的生產(chǎn)要素。微信這次用現(xiàn)金獎(jiǎng)勵(lì)的形式采集方言語音數(shù)據(jù),本質(zhì)上是在用真金白銀交換用戶的聲音數(shù)據(jù),而這些數(shù)據(jù)經(jīng)過標(biāo)注、訓(xùn)練和模型優(yōu)化之后,將轉(zhuǎn)化為微信的核心技術(shù)資產(chǎn)。
不妨算一筆簡(jiǎn)單的賬。假設(shè)每個(gè)參與者平均錄入200條方言語音,微信每條獎(jiǎng)勵(lì)約0.33元,那么每條語音數(shù)據(jù)的采集成本就是幾毛錢。而在商業(yè)語音數(shù)據(jù)市場(chǎng)上,高質(zhì)量的方言語音標(biāo)注數(shù)據(jù),每條價(jià)格遠(yuǎn)不止這個(gè)數(shù)。更何況,微信采集到的還是真實(shí)場(chǎng)景下、由母語使用者自然發(fā)聲的高質(zhì)量語料,這種數(shù)據(jù)的價(jià)值遠(yuǎn)遠(yuǎn)高于實(shí)驗(yàn)室環(huán)境下合成的語音數(shù)據(jù)。
更值得關(guān)注的是,這次活動(dòng)是邀請(qǐng)制,不是全員開放。 為什么?
因?yàn)槲⑿旁谶x擇樣本——他們?cè)诟鶕?jù)用戶的地域分布、方言背景等因素,進(jìn)行定向的數(shù)據(jù)采集。這不是一場(chǎng)普惠性的紅包活動(dòng),而是一次精準(zhǔn)的數(shù)據(jù)“靶向采集”。
中國(guó)有超過70%的人口在日常生活中有使用方言的習(xí)慣,其中相當(dāng)一部分中老年用戶對(duì)普通話輸入感到吃力。微信要想讓AI智能體真正成為“全民助手”,就必須先攻克方言識(shí)別這座大山。
如果你以為只有微信在做這件事,那就太天真了。
阿里通義百聆只需3秒錄音就能讓用戶的聲音無縫切換9種通用語言和18種方言;華為云實(shí)時(shí)語音識(shí)別支持四川話、粵語和上海話;網(wǎng)易有道同聲傳譯支持71種語言、125種口音……
整個(gè)AI語音賽道的軍備競(jìng)賽早已全面開打。
從商業(yè)競(jìng)爭(zhēng)的角度來看,誰先建立起覆蓋全國(guó)主要方言區(qū)的語音數(shù)據(jù)庫,誰就掌握了下一代語音AI的“原材料”,這本質(zhì)上是一場(chǎng)關(guān)于聲音數(shù)據(jù)資產(chǎn)的“圈地運(yùn)動(dòng)” 。
但微信有所有競(jìng)爭(zhēng)對(duì)手都不具備的優(yōu)勢(shì)——它是唯一一個(gè)幾乎覆蓋了全中國(guó)人日常交流場(chǎng)景的超級(jí)應(yīng)用。
在這場(chǎng)數(shù)據(jù)暗戰(zhàn)中,微信正試圖通過“紅包換語音”的方式,建立方言語音數(shù)據(jù)的最大樣本庫。一旦建成,未來任何想在語音交互領(lǐng)域分一杯羹的玩家,都將面對(duì)一個(gè)巨大的數(shù)據(jù)壁壘。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.