蘋果在首個(gè)iOS 27開(kāi)發(fā)者測(cè)試版中,為iPhone 17 Pro和iPhone Air準(zhǔn)備的新一代AI聽(tīng)寫功能,目前并未默認(rèn)開(kāi)啟。用戶需要手動(dòng)進(jìn)入系統(tǒng)設(shè)置才能激活這項(xiàng)被蘋果稱為“聽(tīng)寫體驗(yàn)大幅改善”的能力。
蘋果方面表示,這套全新的AI聽(tīng)寫系統(tǒng)在語(yǔ)音識(shí)別準(zhǔn)確性上有顯著提升,在實(shí)時(shí)大小寫處理、標(biāo)點(diǎn)符號(hào)自動(dòng)添加方面,比現(xiàn)有的聽(tīng)寫系統(tǒng)更可靠。這項(xiàng)功能的底層驅(qū)動(dòng)力來(lái)自蘋果最新的AFM 3 Core Advanced模型——一個(gè)參數(shù)規(guī)模達(dá)到200億的多模態(tài)系統(tǒng)。它采用動(dòng)態(tài)稀疏激活機(jī)制,會(huì)根據(jù)具體請(qǐng)求在任意時(shí)刻僅激活約100億至400億個(gè)參數(shù),在性能和功耗之間尋求平衡。
為了讓這樣規(guī)模的模型能在移動(dòng)設(shè)備上運(yùn)行,蘋果將完整模型存儲(chǔ)在閃存(DRAM)中,并通過(guò)一個(gè)輕量級(jí)路由模型在初始處理階段篩選出一組“專家”子網(wǎng)絡(luò),在推理過(guò)程中動(dòng)態(tài)重新選擇。蘋果將這項(xiàng)技術(shù)命名為“指令遵循剪枝”。
在蘋果內(nèi)部進(jìn)行的并行人工評(píng)估中,AFM 3 Core Advanced與此前生產(chǎn)的聽(tīng)寫系統(tǒng)在九個(gè)質(zhì)量維度上進(jìn)行對(duì)比,結(jié)果顯示:在整體質(zhì)量維度上,新模型以44.7%對(duì)17.6%的比例獲得好評(píng)優(yōu)勢(shì)。這一優(yōu)勢(shì)在標(biāo)點(diǎn)、大小寫、重音、語(yǔ)義停連、口語(yǔ)語(yǔ)氣處理以及風(fēng)格等其他八個(gè)維度上也基本保持一致。
但這項(xiàng)能力有明確的硬件門檻。由于模型體積和運(yùn)算資源需求較高,高階AI聽(tīng)寫功能僅面向少數(shù)幾款設(shè)備開(kāi)放:包括iPhone 17 Pro、iPhone 17 Pro Max、iPhone Air,搭載M5芯片的Apple Vision Pro,配備M4及以上芯片且至少12GB運(yùn)行內(nèi)存的iPad,以及配備M3及以上芯片且至少12GB運(yùn)行內(nèi)存的Mac。標(biāo)準(zhǔn)版iPhone 17被排除在支持列表之外,原因在于它僅配備8GB運(yùn)行內(nèi)存,未達(dá)到蘋果為這一功能設(shè)定的12GB門檻。
與此同時(shí),蘋果推出的新一代可自定義表達(dá)風(fēng)格的Siri語(yǔ)音合成同樣基于這套AFM Core Advanced模型,目前也以可選預(yù)覽功能的形式提供,需要用戶主動(dòng)開(kāi)啟。蘋果強(qiáng)調(diào),新的聽(tīng)寫模型完全在本地設(shè)備上運(yùn)行,無(wú)論iPhone是否接入網(wǎng)絡(luò),轉(zhuǎn)錄質(zhì)量都保持一致。這意味用戶的語(yǔ)音數(shù)據(jù)不會(huì)上傳至云端,有助于加強(qiáng)隱私保護(hù)。
至于在iOS 27正式版發(fā)布時(shí),這項(xiàng)高階AI聽(tīng)寫功能是繼續(xù)保持默認(rèn)關(guān)閉狀態(tài),還是在后續(xù)測(cè)試周期內(nèi)轉(zhuǎn)為自動(dòng)可用,蘋果目前尚未給出明確說(shuō)明。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.