網易首頁 > 網易號 > 正文申請入駐

36氪首發 | 清華團隊做出全球首個實時理解生理與情緒的基座模型，進一步布局硬件

2026-06-10 11:26:16　來源: 36氪

北京舉報

分享至

作者 | 喬鈺杰

編輯 | 袁斯來

硬氪獲悉，北京微面科技有限公司（以下簡稱“微面科技”）近日完成數百萬美元融資，由順為資本投資。

微面科技聚焦自研人類感知理解基座模型，打造新一代人機交互范式，創始團隊主要來自清華大學，具備大模型、人機交互、軟件工程與醫學復合背景。

當前，AI交互存在一個隱形天花板：極度依賴用戶顯性輸入，缺乏對隱性非語言信息的感知。研究表明，人類表達中非語言信息高達55%，但現有的機器視覺只看見動作，卻無法穿透皮膚洞察情緒波動或生理疲勞。

無論是物理世界的具身機器人還是數字世界的語言大模型，由于缺乏高精度多模態人類狀態數據的輸入，都只能做機械的被動響應，缺乏主動共情的閉環能力，無法執行更加泛化的任務。

針對這些痛點，微面科技基于 rPPG（遠程光電容積描記）核心技術，全棧自研面部基座模型 FacePhys，可實時輸出超過120項指標，覆蓋心率、心率變異性（HRV）、呼吸率、面部動作單元、眼動特征、情緒維度及語音特征等多個方向。配合HRV情緒生理晴雨表綁定心率與急劇情緒，模型可識別假笑和壓抑情緒，獲取無法偽裝的客觀生理真相，為大模型提供生理情緒數據入口。

此前，光照變化、頭部運動等噪聲，一直是 rPPG 生理感知技術落地中的關鍵難題。為解決這一問題，微面科技構建了萬人級臨床標注數據集，包含數千萬測量采樣點，覆蓋不同膚色及復雜場景，并在安貞醫院臨床實驗中完成驗證，將復雜生理狀態建模能力融入基座模型。

進一步，微面科技還將“狀態空間模型”引入生理信號建模。

創始人唐健凱介紹稱，這一邏輯與大語言模型“預測下一個 Token”類似：大模型預測的是下一個詞，而狀態空間模型預測的是人體下一時刻的生理行為狀態，從而持續追蹤心跳、呼吸等生命體征的動態變化，“本質上，是把心跳建模成一個連續物理過程，而不是離散視頻幀的拼接。”

這一突破使系統能夠更準確地捕捉心臟搏動的時間動態特征，無接觸實現望聞問切。核心指標上，其心率檢測精度≤2 BPM，達到醫療級標準；端側推理延遲≤10ms，可實現實時響應；同時，端側小模型參數規模僅為0.2M，可直接運行于普通手機和攝像頭設備，無需依賴云端算力。

在生理理解基礎上，微面科技還進一步構建了多模態“人類理解系統”。

通過融合動作、姿態、眼動等空間特征，配合HRV情緒生理晴雨表綁定心率與急劇情緒，模型不僅能夠識別用戶情緒，還能夠進一步理解行為背后的需求與動機，甚至預測用戶的交互意圖和動作軌跡，實現察言觀色和知行先覺，為大模型提供生理情緒數據入口。

基于這一生理感知基座模型，微面科技也在同步推進軟硬件一體化布局。

圖源企業

軟件層面，公司通過 SDK/API 向機器人、智能座艙、健康設備廠商輸出算法能力，目前已在三大場景實現規模化落地：家庭機器人領域，與海爾機器人等客戶達成量產合作；康養機器人領域，為養老院和社區提供快速健康篩查；仿生機器人領域，實現毫秒級低延時的自然交互體驗。在車載方向，公司正與某頭部 Tier 1 供應商聯合推進駕駛員疲勞監測方案的技術驗證及量產準備。

硬件層面，公司則推出搭載 FacePhys 模型的嵌入式攝像頭模組。其中，核心產品 Findings 科研數據采集系統，主要面向科研機構與醫院提供高精度數據采集終端，已進入批量采購階段。

以下為硬氪與唐健凱的交流節選（略經編輯）：

硬氪：國內外還有其他公司在用rPPG路線做生理和情緒識別嗎？

唐健凱：國外已經有一些公司在做相關方向。比如 FaceHeart，主要聚焦心臟健康監測，并已經獲得 FDA 認證，目前更多服務于遠程醫療場景。但我們的方向不只是心率監測，還會進一步覆蓋情緒、壓力、眼動行為等更豐富的維度。從能力邊界來看，我們是在生理感知的基礎上，繼續向“人的狀態理解”延伸。

國內也有團隊在做 rPPG，但大多數方案還是“錄制視頻+云端分析”的模式。通常需要先錄制30秒以上的視頻，再上傳到云端統一計算，整個分析過程可能還需要幾十秒，很難做到實時響應。一旦用戶中途出現運動、光照變化或者姿態波動，整體魯棒性就會明顯下降。

硬氪：為什么微面科技能夠把基于 rPPG 的生理感知做得更精準？

唐健凱：模型層面，我們做了大量優化。核心思路是用“狀態空間模型”去預測人體下一時刻的生理狀態。人的生理狀態并不會突然從心率60跳到100，它本身具有連續性和周期性。我們的狀態空間模型會捕捉這種穩定變化規律，再結合醫學上的周期波動特征，持續預測人體當前狀態。

此外，數據質量也很關鍵。我們的訓練數據并不是靠大模型“虛擬打標”，而是來自醫院合作與醫療級設備采集。目前已經建立了萬人級臨床數據庫，因此數據客觀性和準確性會更高。

在情緒理解上，我們也有一套完整邏輯。比如，心理學研究已經證明，高 HRV 往往對應更積極、放松或者興趣更高的狀態；而劇烈運動時心率升高，則未必意味著情緒波動。因此，我們不僅會看生理指標本身，還會結合動作、姿態、眼動等空間特征，一起理解人的真實狀態。

簡單來說，我們是在把“時間維度上的生理連續性”和“空間維度上的視覺感知能力”融合到一個統一模型中，讓 AI 同時理解人的生理、情緒和行為。

硬氪：為什么會進一步做硬件模組？

唐健凱：視頻和語言不一樣，它的信息量非常大。如果所有數據都上傳到云端處理，不僅延遲高，也會影響實時交互體驗。因此，我們更傾向于端側處理，讓感知和推理直接發生在設備本地，這樣響應會更及時，交互也會更流暢。

另一個重要原因是隱私。我們處理的是生理和情緒相關數據，本身屬于較為敏感的信息。尤其在醫療、健康管理等場景里，用戶會更希望數據留在本地設備，而不是全部上傳到云端API。

投資人觀點

順為資本：公司研發的實時生理與情緒理解基座模型，在技術路線和底層架構上具備全球唯一性。該技術可快速落地智能座艙、機器人和智能硬件等多元場景，應用空間廣闊。順為高度認可團隊的技術與產品化能力，愿與微面科技在人、車、家全場景深度協同、長期陪伴，共同開拓下一代人機交互與具身智能賽道的商業前景。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.