“當(dāng)前家電行業(yè)的人機語音交互,正向大模型方向發(fā)展,模型參數(shù)量與交互效果呈正相關(guān)。我們研發(fā)的下一代語音鏈路TeachableAI,借助定制的領(lǐng)域大模型與業(yè)務(wù)智能體(Agent),已實現(xiàn)接近人際溝通的交互體驗。”
在美的集團第30屆科技月開放日活動上,美的AI研究院AI算法專家牟小峰博士向媒體披露了美的在AI基礎(chǔ)設(shè)施建設(shè)領(lǐng)域的突破性進展。依托大模型和智能體等技術(shù)研發(fā)的創(chuàng)新,美的在產(chǎn)品智能化、工廠智能化和員工辦公增效方面全面應(yīng)用AI技術(shù),取得了不錯的業(yè)務(wù)價值和收益。
![]()
攻堅核心痛點,重塑人機交互生態(tài)
在人機交互領(lǐng)域,美的集團多年前就開啟了技術(shù)研發(fā)工作,于2019年發(fā)布家電語音交互服務(wù),為家電用戶提供便捷的人機交互控制能力。到2022年之前,行業(yè)內(nèi)語音交互服務(wù)以傳統(tǒng)AI方法為主,用戶體驗不完善,整個市場進展緩慢。直到ChatGPT出現(xiàn),行業(yè)開始更多地采用基于大模型的AI方法,用于人機交互的科技創(chuàng)新。
將人機交互應(yīng)用于家電上,全球企業(yè)都面臨著諸多共同挑戰(zhàn)。牟小峰透露,“挑戰(zhàn)主要有三個:一是在家居場景中,語音識別面臨環(huán)境噪音干擾會影響識別準(zhǔn)確率;二是用戶隱私保護需求,部分用戶不希望語音信息上傳到云端,在低功耗家電設(shè)備上實現(xiàn)語音能力難度較大;三是語言理解,如何理解用戶的意圖并與家電功能關(guān)聯(lián),不同人不同表達方式會增加交互難度”。
面對挑戰(zhàn),美的AI研究院團隊展開正面突破。一是聚焦離線語音識別,通過將語音交互模型內(nèi)置到家電產(chǎn)品中,為用戶提供基礎(chǔ)的離線語音識別能力。在資源非常受限的家電設(shè)備上,支持6000萬個指令詞識別,處在行業(yè)頂尖水平;二是在線語音識別上,我們一方面利用外部廠商的通用在線語音識別能力解決通用識別需求,另一方面根據(jù)美的業(yè)務(wù)場景的特點,自主研發(fā)了定制的領(lǐng)域在線語音識別,比如客服ASR。經(jīng)過對比發(fā)現(xiàn),經(jīng)過領(lǐng)域強化后的在線識別能力,其準(zhǔn)確率比通用ASR高出五到十個點,識別率提升較為明顯。
![]()
自然語言理解是一項通用能力,但美的空調(diào)、冰箱、洗衣機等產(chǎn)品的功能、說法以及知識問答等都有其特殊之處,我們花費了大量時間構(gòu)建知識庫、問答引擎和人機交互能力,并發(fā)布了業(yè)內(nèi)首個家電家居領(lǐng)域大模型-美言,以解決人機交互中遇到的泛化性和語義理解等各種挑戰(zhàn)。目前,人機交互能力已經(jīng)在美的多個家電品類中得到應(yīng)用,如空調(diào)、冰箱、洗衣機等。從統(tǒng)計數(shù)據(jù)來看,帶語音功能的空調(diào)出貨量增長迅猛,2024和2025年分別增長了超過100%。從目前的情況來看,帶語音功能的家電越來越受到年輕用戶的喜愛,它能幫助用戶解放雙手,帶來更好的產(chǎn)品體驗。
聚焦人機交互,美的AI研究院團隊完成了從“功能實現(xiàn)”到“體驗革新”的跨越,并構(gòu)建了全鏈條技術(shù)自研的能力。同時,隨著下一代TeachableAI架構(gòu)的推進,有望實現(xiàn)接近于人際溝通的交互效果,這將為美的家電主動智慧服務(wù)的生活場景落地奠定堅實基礎(chǔ)。
夯實技術(shù)底座,推動AI價值落地
對于企業(yè)而言,只有當(dāng)人工智能成為一項基礎(chǔ)設(shè)施,且企業(yè)員工與產(chǎn)品每天都會與其接觸時,AI的業(yè)務(wù)價值才能得以基本確定。牟小峰博士認為,在美的開展人工智能技術(shù)研究與創(chuàng)新的最深刻體會在于業(yè)務(wù)場景的多樣化以及注重業(yè)務(wù)價值的落地。美的AI研究院并非僅僅是研究機構(gòu),其更注重探索和推動人工智能技術(shù)在產(chǎn)品中的應(yīng)用,并且對業(yè)務(wù)評價極為重視。
研究院最具代表性的產(chǎn)品是美言大模型。2022年11月,ChatGPT發(fā)布一周后,美的AI研發(fā)團隊對其進行了詳細的功能和體驗測試。之后團隊確定自然語言處理和人機交互的發(fā)展方向?qū)⒕劢褂诖竽P汀?023年4月,美的正式啟動美言大模型的研發(fā)工作,并于當(dāng)年9月正式對外發(fā)布。
牟小峰表示,”美言大模型的推出及應(yīng)用,能夠顯著提升用戶體驗,并與此前的傳統(tǒng)AI技術(shù)服務(wù)形成明顯的代際差距。美言大模型推出后,將其應(yīng)用于語音交互中,可以更好地理解用戶的對話。”
![]()
目前,美言大模型的應(yīng)用正在快速提升人機交互的體驗。首先,它實現(xiàn)了多輪對話。傳統(tǒng)多輪對話需構(gòu)建對話圖或?qū)υ捘0澹狈Ψ夯郧衣?lián)想能力。美言大模型使多輪對話變得流暢且自然。其次,它具備深度語義理解能力。傳統(tǒng)語義理解實現(xiàn)難度較大,而美言大模型能夠深入理解并準(zhǔn)確把握用戶意圖,無論是短句還是長句。最后,它支持智能知識問答。傳統(tǒng)知識問答只能處理有限的任務(wù),而美言大模型使問答過程更加流暢,即使面對超出常規(guī)范圍的問題,也能保持較高的準(zhǔn)確率。
在美的推動人工智能技術(shù)研發(fā)與應(yīng)用的過程中,其業(yè)務(wù)場景的豐富性是顯著特點之一。牟小峰博士介紹,美的產(chǎn)品種類繁多,涵蓋智能化家電等眾多品類,這些品類之間存在較大差異。此外,美的的業(yè)務(wù)還涉及樓宇、電梯、機器人以及醫(yī)療設(shè)備等多個領(lǐng)域。在這些不同的業(yè)務(wù)方向中,大量設(shè)備需要智能化及人工智能能力的支持,例如人機交互、圖像識別等,因此業(yè)務(wù)的應(yīng)用場景十分廣泛。
在全球范圍內(nèi),無論是中國還是海外市場,在制造行業(yè)中,美的在數(shù)字化以及人工智能技術(shù)應(yīng)用方面已經(jīng)處于行業(yè)前沿。牟小峰博士表示,接下來團隊將聚焦領(lǐng)域模型和業(yè)務(wù)智能體開發(fā)。除了現(xiàn)有的美言大模型之外,還將推動智能體的建設(shè),以實現(xiàn)更多AI基礎(chǔ)能力的突破和落地。最終目標(biāo)是將人工智能能力內(nèi)嵌于內(nèi)部系統(tǒng)和平臺中,使其能夠更加自動化地完成諸多工作。
以“用戶價值”為導(dǎo)向,持續(xù)驗證AI基礎(chǔ)設(shè)施的業(yè)務(wù)成效,美的希望實現(xiàn)全球制造業(yè)“AI領(lǐng)跑者”的突破,定義在AI時代的行業(yè)新標(biāo)準(zhǔn)!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.