![]()
奔跑財經(jīng)3月18日消息,全球最大穩(wěn)定幣發(fā)行商Tether,其AI部門近日悄然發(fā)布了一項可能顛覆行業(yè)格局的“黑科技”——QVAC Fabric。
該框架能將百億參數(shù)級別的大型語言模型(如3.8B、13B)直接部署到旗艦手機和消費級顯卡上運行,讓此前只能在云端運行的“龐然大物”真正走進個人設(shè)備。
手機GPU推理快11倍,內(nèi)存占用暴降90%
根據(jù)官方披露,QVAC Fabric集成了自研的BitNet LoRA微調(diào)與推理框架,可跨平臺支持AMD、Intel顯卡、蘋果Metal生態(tài)及各類移動GPU。實測數(shù)據(jù)顯示,在旗艦設(shè)備上,基于GPU的推理速度比傳統(tǒng)CPU方案快2到11倍,同時內(nèi)存占用相比全精度模型暴降90%。
這意味著,用戶可以在不更換手機、不增加散熱負擔(dān)的前提下,在本地運行更復(fù)雜的AI模型,或同時處理更多任務(wù),徹底突破手機等移動設(shè)備在散熱和內(nèi)存上的天然瓶頸。
目前,Tether團隊已成功在iPhone 16上完成對130億參數(shù)模型的微調(diào),并在Pixel 9、Galaxy S25等旗艦機型上實現(xiàn)了38億參數(shù)模型的本地運行與微調(diào)。這標(biāo)志著“端側(cè)AI”正式從營銷噱頭或簡單演示,邁入了可處理復(fù)雜任務(wù)、實現(xiàn)真正個性化與領(lǐng)域適應(yīng)的實用階段。
Tether轉(zhuǎn)向基建,代碼已開源
此舉是Tether從單一穩(wěn)定幣發(fā)行商向更廣泛數(shù)字基礎(chǔ)設(shè)施運營商轉(zhuǎn)型的關(guān)鍵一步。該公司已向能源、比特幣挖礦、媒體等領(lǐng)域投入數(shù)十億美元,如今將“邊緣AI工具鏈”納入版圖。
值得注意的是,相關(guān)QVAC與BitNet LoRA代碼已在GitHub上開源。一旦QVAC成為開發(fā)者和中小實驗室將大模型部署到消費硬件的主流選擇,Tether將在受銀行監(jiān)管影響較小的技術(shù)棧中,建立起強大的生態(tài)影響力和技術(shù)話語權(quán)。
短期內(nèi),這更多是敘事而非盈利層面的影響。但宏觀趨勢已清晰:隨著更多AI工作負載向邊緣設(shè)備遷移,基礎(chǔ)設(shè)施的主導(dǎo)權(quán)正從集中化的超大規(guī)模云廠商(如AWS、谷歌云),向控制關(guān)鍵工具鏈和硬件抽象層的玩家轉(zhuǎn)移。
Tether正發(fā)出明確信號:它希望成為這樣的關(guān)鍵玩家,并利用其雄厚資金實力,打造降低對單一云服務(wù)商或司法管轄區(qū)依賴的基礎(chǔ)設(shè)施。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.