作者 | 喬鈺杰
編輯 | 袁斯來
硬氪獲悉,北京微面科技有限公司(以下簡稱“微面科技”)近日完成數百萬美元融資,由順為資本投資。
微面科技聚焦自研人類感知理解基座模型,打造新一代人機交互范式,創始團隊主要來自清華大學,具備大模型、人機交互、軟件工程與醫學復合背景。
當前,AI交互存在一個隱形天花板:極度依賴用戶顯性輸入,缺乏對隱性非語言信息的感知。研究表明,人類表達中非語言信息高達55%,但現有的機器視覺只看見動作,卻無法穿透皮膚洞察情緒波動或生理疲勞。
無論是物理世界的具身機器人還是數字世界的語言大模型,由于缺乏高精度多模態人類狀態數據的輸入,都只能做機械的被動響應,缺乏主動共情的閉環能力,無法執行更加泛化的任務。
針對這些痛點,微面科技基于 rPPG(遠程光電容積描記)核心技術,全棧自研面部基座模型 FacePhys,可實時輸出超過120項指標,覆蓋心率、心率變異性(HRV)、呼吸率、面部動作單元、眼動特征、情緒維度及語音特征等多個方向。配合HRV情緒生理晴雨表綁定心率與急劇情緒,模型可識別假笑和壓抑情緒,獲取無法偽裝的客觀生理真相,為大模型提供生理情緒數據入口。
此前,光照變化、頭部運動等噪聲,一直是 rPPG 生理感知技術落地中的關鍵難題。為解決這一問題,微面科技構建了萬人級臨床標注數據集,包含數千萬測量采樣點,覆蓋不同膚色及復雜場景,并在安貞醫院臨床實驗中完成驗證,將復雜生理狀態建模能力融入基座模型。
進一步,微面科技還將“狀態空間模型”引入生理信號建模。
創始人唐健凱介紹稱,這一邏輯與大語言模型“預測下一個 Token”類似:大模型預測的是下一個詞,而狀態空間模型預測的是人體下一時刻的生理行為狀態,從而持續追蹤心跳、呼吸等生命體征的動態變化,“本質上,是把心跳建模成一個連續物理過程,而不是離散視頻幀的拼接。”
這一突破使系統能夠更準確地捕捉心臟搏動的時間動態特征,無接觸實現望聞問切。核心指標上,其心率檢測精度≤2 BPM,達到醫療級標準;端側推理延遲≤10ms,可實現實時響應;同時,端側小模型參數規模僅為0.2M,可直接運行于普通手機和攝像頭設備,無需依賴云端算力。
在生理理解基礎上,微面科技還進一步構建了多模態“人類理解系統”。
通過融合動作、姿態、眼動等空間特征,配合HRV情緒生理晴雨表綁定心率與急劇情緒,模型不僅能夠識別用戶情緒,還能夠進一步理解行為背后的需求與動機,甚至預測用戶的交互意圖和動作軌跡,實現察言觀色和知行先覺,為大模型提供生理情緒數據入口。
基于這一生理感知基座模型,微面科技也在同步推進軟硬件一體化布局。
![]()
圖源企業
軟件層面,公司通過 SDK/API 向機器人、智能座艙、健康設備廠商輸出算法能力,目前已在三大場景實現規模化落地:家庭機器人領域,與海爾機器人等客戶達成量產合作;康養機器人領域,為養老院和社區提供快速健康篩查;仿生機器人領域,實現毫秒級低延時的自然交互體驗。在車載方向,公司正與某頭部 Tier 1 供應商聯合推進駕駛員疲勞監測方案的技術驗證及量產準備。
硬件層面,公司則推出搭載 FacePhys 模型的嵌入式攝像頭模組。其中,核心產品 Findings 科研數據采集系統,主要面向科研機構與醫院提供高精度數據采集終端,已進入批量采購階段。
以下為硬氪與唐健凱的交流節選(略經編輯):
硬氪:國內外還有其他公司在用rPPG路線做生理和情緒識別嗎?
唐健凱:國外已經有一些公司在做相關方向。比如 FaceHeart,主要聚焦心臟健康監測,并已經獲得 FDA 認證,目前更多服務于遠程醫療場景。但我們的方向不只是心率監測,還會進一步覆蓋情緒、壓力、眼動行為等更豐富的維度。從能力邊界來看,我們是在生理感知的基礎上,繼續向“人的狀態理解”延伸。
國內也有團隊在做 rPPG,但大多數方案還是“錄制視頻+云端分析”的模式。通常需要先錄制30秒以上的視頻,再上傳到云端統一計算,整個分析過程可能還需要幾十秒,很難做到實時響應。一旦用戶中途出現運動、光照變化或者姿態波動,整體魯棒性就會明顯下降。
硬氪:為什么微面科技能夠把基于 rPPG 的生理感知做得更精準?
唐健凱:模型層面,我們做了大量優化。核心思路是用“狀態空間模型”去預測人體下一時刻的生理狀態。人的生理狀態并不會突然從心率60跳到100,它本身具有連續性和周期性。我們的狀態空間模型會捕捉這種穩定變化規律,再結合醫學上的周期波動特征,持續預測人體當前狀態。
此外,數據質量也很關鍵。我們的訓練數據并不是靠大模型“虛擬打標”,而是來自醫院合作與醫療級設備采集。目前已經建立了萬人級臨床數據庫,因此數據客觀性和準確性會更高。
在情緒理解上,我們也有一套完整邏輯。比如,心理學研究已經證明,高 HRV 往往對應更積極、放松或者興趣更高的狀態;而劇烈運動時心率升高,則未必意味著情緒波動。因此,我們不僅會看生理指標本身,還會結合動作、姿態、眼動等空間特征,一起理解人的真實狀態。
簡單來說,我們是在把“時間維度上的生理連續性”和“空間維度上的視覺感知能力”融合到一個統一模型中,讓 AI 同時理解人的生理、情緒和行為。
硬氪:為什么會進一步做硬件模組?
唐健凱:視頻和語言不一樣,它的信息量非常大。如果所有數據都上傳到云端處理,不僅延遲高,也會影響實時交互體驗。因此,我們更傾向于端側處理,讓感知和推理直接發生在設備本地,這樣響應會更及時,交互也會更流暢。
另一個重要原因是隱私。我們處理的是生理和情緒相關數據,本身屬于較為敏感的信息。尤其在醫療、健康管理等場景里,用戶會更希望數據留在本地設備,而不是全部上傳到云端API。
投資人觀點
順為資本:公司研發的實時生理與情緒理解基座模型,在技術路線和底層架構上具備全球唯一性。該技術可快速落地智能座艙、機器人和智能硬件等多元場景,應用空間廣闊。順為高度認可團隊的技術與產品化能力,愿與微面科技在人、車、家全場景深度協同、長期陪伴,共同開拓下一代人機交互與具身智能賽道的商業前景。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.