![]()
編輯丨%
在醫(yī)院康復室,一位截肢患者正在適應他的新胳膊——他的大腦在適應設備,而設備也在適應他的信號。兩者都在實時學習,彼此響應——這是一個典型的「雙學習器」系統(tǒng)。
這種有關(guān)腦機接口、具身智能等當下最熱門的科技潮流的發(fā)展已經(jīng)提上了日程,但現(xiàn)在人們還無法預測這個系統(tǒng)會走向何方。是穩(wěn)定、高效的控制,還是混亂、低效的掙扎?長期以來,神經(jīng)接口的設計大多依賴經(jīng)驗試錯,缺乏有原則的方法來建模和優(yōu)化共適應接口中出現(xiàn)的復雜雙學習者動態(tài)。
美國華盛頓大學等將控制理論與博弈論引入這一領(lǐng)域,建立了一個能夠預測和塑造人機協(xié)同適應結(jié)果的計算框架。他們不僅在理論上推導了用戶與解碼器之間的「博弈」如何收斂,更通過一個包含14名健康受試者的肌電接口實驗,驗證了模型的關(guān)鍵預測。
相關(guān)的研究以「Computational framework to predict and shape human–machine interactions in closed-loop, co-adaptive neural interfaces」為題,于 2026 年 3 月 23 日發(fā)布在《Nature Machine Intelligence》。
![]()
論文鏈接:https://www.nature.com/articles/s42256-026-01194-z
人與機器的雙端學習
在神經(jīng)接口中,用戶的信號通過解碼算法被翻譯以控制設備。在這個過程中,引入自適應算法,就會創(chuàng)造一個共適應系統(tǒng),提升性能的同時還能針對用戶進行個性化適配。但這種系統(tǒng)在設計上頗具挑戰(zhàn)性,因為它們涉及動態(tài)的雙學習者互動:用戶和解碼器可能同時適應并相互響應。
現(xiàn)有研究要么假設用戶適應一個固定的最優(yōu)解碼器,要么假設解碼器被動跟隨用戶。真正的協(xié)同適應——用戶和設備在「領(lǐng)導」與「跟隨」角色間動態(tài)轉(zhuǎn)換——缺乏系統(tǒng)的分析和設計工具。這導致接口參數(shù)(如學習速率)往往通過「試錯」來調(diào)整,效率低下且難以優(yōu)化。
研究團隊所開發(fā)的肌電接口平臺,能夠構(gòu)建經(jīng)過實驗驗證的共適應神經(jīng)接口框架。這個實驗平臺和分析工具包使該團隊能夠測試基于將用戶和解碼器視為游戲中的兩個代理的模型,對用戶-機器行為的分析預測。
![]()
圖 1:共適應肌電界面。
該實驗平臺能夠從實驗數(shù)據(jù)中估計用戶的編碼器模型;預測不同解碼器參數(shù)對系統(tǒng)收斂性的影響;通過調(diào)整算法目標來「塑造」用戶的行為。
在研究中,14 名健康受試者用前臂肌電信號控制屏幕光標,追蹤一個隨機生成的二維軌跡。解碼器每 20 秒更新一次,更新規(guī)則由研究者操控。這種設計既模擬了神經(jīng)接口的基本特征,又讓研究團隊能夠系統(tǒng)性地操縱解碼器參數(shù)。
![]()
圖 2:控制理論分析允許用戶編碼器估計和編碼器-解碼器分析。
博弈論模型與影響
在建立了共適應接口的實驗平臺和經(jīng)過驗證的分析用戶-解碼器適應工具后,團隊采用博弈論模擬這預測用戶與解碼器這兩個代理之間出現(xiàn)的共適應交互,這個雙目標優(yōu)化問題構(gòu)成了一個勢博弈——即存在一個共同的勢函數(shù),兩個智能體的局部優(yōu)化都會降低這個勢函數(shù),從而保證系統(tǒng)收斂。
![]()
圖 3:共適應用戶-機器系統(tǒng)的博弈論模型。
博弈論模型分析顯示,解碼器學習速率與系統(tǒng)收斂的關(guān)系取決于用戶學習速率。如果用戶學得慢,過快的學習速率會破壞系統(tǒng)穩(wěn)定性。當增加解碼器努力的懲罰時,解碼器會變得「懶惰」,而用戶則會相應地「更努力」,以此來維持性能。
![]()
圖 4:解碼器懲罰影響用戶工作量和光標速度,但不影響性能。
總體來看,博弈論模型生成了以下關(guān)于用戶-解碼器共適應的預測:
- 整體系統(tǒng)的收斂性和性能受用戶和譯碼器學習率的影響。
- 解碼器懲罰項影響整個系統(tǒng)中固定點的位置,從而決定用戶的工作量。這一發(fā)現(xiàn)預測用戶和解碼器實際上是在「權(quán)衡」維護系統(tǒng)性能的努力。
- 由于存在多個靜止點,每個學習者的初始化都會影響系統(tǒng)最終到達的靜止點。這預測解碼器初始化會影響用戶最終學習到的編碼器。
共適應的人機協(xié)同
研究團隊將人類行為建模為在「控制誤差與能量成本」之間權(quán)衡的優(yōu)化過程,同時將機器解碼器視為在「預測誤差與正則約束」之間調(diào)整的學習器。兩者共同構(gòu)成一個潛在博弈系統(tǒng),其演化可以通過離散時間動力學方程描述。
在這一框架下,人機協(xié)同不再是模糊的適應過程,而是一個可以求解的數(shù)學系統(tǒng)。這一結(jié)果意味著,人機系統(tǒng)并不會無序漂移,而是趨向一個可預測的平衡點。
盡管研究以腦機接口為背景,其理論適用范圍遠不止于此。任何涉及雙向?qū)W習的人機系統(tǒng)——無論是自適應輸入設備、外骨骼控制,還是智能輔助系統(tǒng)——本質(zhì)上都符合這一協(xié)同動力學結(jié)構(gòu)。尤其在 AI 系統(tǒng)逐漸具備在線學習能力的今天,人類與模型之間的關(guān)系正從「使用工具」轉(zhuǎn)變?yōu)椤腹餐瑢W習體」,這一理論提供了一個統(tǒng)一描述框架。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.