網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

人機(jī)共生視角下：人機(jī)交互與AI的演進(jìn)與融合

2026-05-14 16:32:19　來源: 科技導(dǎo)報(bào)

北京舉報(bào)

分享至

原文發(fā)表于《科技導(dǎo)報(bào)》 2026年第7期《人機(jī)交互與人工智能的關(guān)系》

以人為研究對(duì)象的人機(jī)交互（HCI）和人工智能（AI）是新一代信息技術(shù)的典型代表。作為密切相關(guān)的學(xué)科，二者必須協(xié)同發(fā)展。《科技導(dǎo)報(bào)》邀請(qǐng)中國(guó)科學(xué)院軟件研究所戴國(guó)忠、康文惠、田豐老師撰寫文章，從“人機(jī)共生”的視角出發(fā)，分析了歷史和當(dāng)下AI和HCI發(fā)展中存在的問題，并提出了新用戶界面（New UI）的技術(shù)設(shè)想。

2020年為信息技術(shù)發(fā)展的分水嶺。第一代信息技術(shù)高潮被稱為“數(shù)字化1.0時(shí)代”，其核心是將辦公自動(dòng)化和數(shù)字技術(shù)引入桌面工作場(chǎng)景。21世紀(jì)后，學(xué)術(shù)界圍繞新舊信息技術(shù)展開深入討論，焦點(diǎn)逐漸從以機(jī)器為中心轉(zhuǎn)向以人為本。數(shù)字化2.0時(shí)代的目標(biāo)是實(shí)現(xiàn)計(jì)算的普適化與智能化，使計(jì)算更貼近人的需求與能力。

在這一歷史脈絡(luò)下，新一代信息技術(shù)的典型代表逐漸顯現(xiàn)，即以人為研究對(duì)象的人機(jī)交互（HCI）和人工智能（AI）。作為密切相關(guān)的姐妹學(xué)科，二者必須協(xié)同發(fā)展，攜手推動(dòng)以人為本的技術(shù)創(chuàng)新進(jìn)程。正因如此，當(dāng)下亟需在更系統(tǒng)的框架下審視二者的協(xié)同邏輯，即人機(jī)交互與人工智能的關(guān)系（“2I”關(guān)系）。當(dāng)前面臨2大關(guān)鍵挑戰(zhàn)：一是如何有效推進(jìn)數(shù)字化2.0時(shí)代的轉(zhuǎn)型升級(jí)；二是如何構(gòu)建符合人本理念的交互范式，實(shí)現(xiàn)以大模型為核心的智能技術(shù)的落地應(yīng)用。為了應(yīng)對(duì)這一挑戰(zhàn)，新一代信息技術(shù)必須關(guān)注“用戶想做什么”，遵循技術(shù)發(fā)展必須緊密契合用戶需求，實(shí)現(xiàn)真正的人機(jī)協(xié)同，確保技術(shù)普惠而非成為少數(shù)人的特權(quán)。我們提出并強(qiáng)調(diào)“2I”關(guān)系健康發(fā)展的核心，為下一代信息技術(shù)的發(fā)展提供思考框架。

1 對(duì)新計(jì)算環(huán)境下人機(jī)交互的新認(rèn)識(shí)

自1960年“人機(jī)共生”概念被提出以來，人機(jī)交互始終以“人與計(jì)算機(jī)協(xié)作完成任務(wù)”為核心，聚焦于人與系統(tǒng)在行為、認(rèn)知和社會(huì)性層面的交互機(jī)制研究。然而，隨著新一代信息技術(shù)的快速迭代發(fā)展，人機(jī)交互的核心驅(qū)動(dòng)力正由單一的技術(shù)驅(qū)動(dòng)轉(zhuǎn)向由社會(huì)生產(chǎn)需求、技術(shù)綜合進(jìn)步與個(gè)人社交需求等多元因素共同推動(dòng)的復(fù)雜機(jī)制。

盡管人機(jī)交互近年來隨著新興技術(shù)不斷拓展其研究深度與應(yīng)用邊界，但其發(fā)展基礎(chǔ)仍深受傳統(tǒng)基礎(chǔ)模型的影響。圖靈機(jī)和馮·諾依曼體系為現(xiàn)代計(jì)算奠定了堅(jiān)實(shí)的理論與結(jié)構(gòu)基礎(chǔ)。然而，這些基礎(chǔ)模型在設(shè)計(jì)之初主要關(guān)注計(jì)算的可行性與邏輯實(shí)現(xiàn)，較少考慮人與系統(tǒng)間的實(shí)時(shí)交互需求。

人機(jī)交互的發(fā)展離不開交互范式的演進(jìn)。技術(shù)革新推動(dòng)交互范式的變遷，而范式的演化又反過來促進(jìn)技術(shù)的發(fā)展，二者相輔相成、相互驅(qū)動(dòng)。在這一過程中，關(guān)鍵的人物、事件與思想也發(fā)揮了重要作用，能夠深刻影響交互范式的演進(jìn)。將交互范式用于具體應(yīng)用時(shí)，必須充分關(guān)注人的心理與認(rèn)知特性。因此，應(yīng)用系統(tǒng)的輸入設(shè)計(jì)應(yīng)該符合人的習(xí)慣，而輸出應(yīng)以降低人的認(rèn)知成本和學(xué)習(xí)成本為目標(biāo)，盡可能貼合人的認(rèn)知機(jī)制。

21世紀(jì)以來，新的信息技術(shù)迅速發(fā)展，計(jì)算環(huán)境從單一的桌面計(jì)算，發(fā)展成多種計(jì)算環(huán)境。在這一發(fā)展與演進(jìn)過程中，新范式和界面平臺(tái)應(yīng)在保證原有性能的基礎(chǔ)上，呈現(xiàn)系統(tǒng)的決策邏輯與行為機(jī)制，通過增強(qiáng)可解釋性推動(dòng)人機(jī)協(xié)同，并促進(jìn)人機(jī)能力的共生發(fā)展。

與此同時(shí)，人機(jī)交互的內(nèi)涵已超越傳統(tǒng)意義上人對(duì)桌面計(jì)算機(jī)的命令操作，逐漸拓展為具有人類意圖表達(dá)和感知能力的“智能機(jī)器人”與能夠同計(jì)算機(jī)實(shí)現(xiàn)自然交互的“交互人”之間的協(xié)同交互。在這一過程中，交互人和智能機(jī)器人應(yīng)在感知、認(rèn)知與行為3個(gè)層面實(shí)現(xiàn)協(xié)同與互相促進(jìn)，構(gòu)建起物理世界（自然界）與數(shù)字空間（互聯(lián)網(wǎng)、物聯(lián)網(wǎng)）之間的無縫交互橋梁。

2 對(duì)人工智能的若干認(rèn)識(shí)

人工智能自1956年達(dá)特茅斯夏季研討會(huì)首次提出以來，經(jīng)歷了2次高峰與2次低谷的發(fā)展周期。從理論演進(jìn)來看，人工智能最初源于圖靈對(duì)“具有獨(dú)立思維能力的機(jī)器”的設(shè)想，逐步演變?yōu)橐婚T以圖靈理論為基礎(chǔ)的系統(tǒng)性學(xué)科。

迄今為止，人們?nèi)詿o法充分理解人類在解決問題過程中大腦的運(yùn)行原理、認(rèn)知過程，乃至心理發(fā)展，以及它們之間的相互影響機(jī)制。這種未知不僅使得“計(jì)算機(jī)如何模擬人類思維”成為人工智能研究的核心難題，也使得理清“腦?心靈?計(jì)算機(jī)”三元關(guān)系面臨前所未有的復(fù)雜性挑戰(zhàn)。

隨著深度學(xué)習(xí)與大語言模型的發(fā)展，人工智能研究與認(rèn)知科學(xué)之間的關(guān)系受到廣泛關(guān)注。當(dāng)代AI的若干核心機(jī)制在功能與方法論層面上，與認(rèn)知科學(xué)關(guān)于注意、學(xué)習(xí)、預(yù)測(cè)與表征等問題的理論討論呈現(xiàn)出一定的呼應(yīng)關(guān)系。

盡管對(duì)人類大腦的理解仍處于初級(jí)階段，但基于對(duì)大腦與人工智能的持續(xù)探索，學(xué)者已提出了諸多認(rèn)知計(jì)算理論與模型。早在1937年，丘奇與圖靈就分別提出了人的思維能力與遞歸函數(shù)計(jì)算能力等價(jià)的假說。與此相對(duì)，哲學(xué)家德雷福斯等則堅(jiān)決反對(duì)這一觀點(diǎn)，認(rèn)為基于圖靈機(jī)的計(jì)算模型無法模擬人類智能。

圍繞上述問題，學(xué)界逐漸將討論進(jìn)一步引向?qū)π问较到y(tǒng)內(nèi)在局限性的反思。哥德爾在20世紀(jì)初提出的不完備性定理正是這一反思的邏輯起點(diǎn)。從哲學(xué)和認(rèn)知科學(xué)的角度來看，哥德爾不完備性定理不僅揭示了形式系統(tǒng)的內(nèi)在局限，也促使人們重新審視“計(jì)算”與“智能”的邊界問題，并成為人工智能哲學(xué)討論中不可回避的重要命題。

3 人機(jī)交互和人工智能的關(guān)系

人工智能與人機(jī)交互為計(jì)算機(jī)科學(xué)中2個(gè)密切關(guān)聯(lián)，但側(cè)重點(diǎn)在不同的子領(lǐng)域。人工智能側(cè)重于從算法和模型層面解決認(rèn)知計(jì)算問題，試圖模擬或重建人的智能過程；而人機(jī)交互則強(qiáng)調(diào)以人為中心的交互設(shè)計(jì)，著眼于人的感知、認(rèn)知與行為特征，致力于通過理論與實(shí)踐融合，構(gòu)建自然、高效的人機(jī)協(xié)同體系。盡管兩者在實(shí)現(xiàn)路徑與方法論上各有側(cè)重，協(xié)同構(gòu)成了從智能建模到交互設(shè)計(jì)的系統(tǒng)性研究框架，但在目標(biāo)層面具有高度一致性，即理解和服務(wù)于“人”的認(rèn)知與行為需求。

基于這一認(rèn)識(shí)，我們將AI與HCI的關(guān)系概括為“2I”關(guān)系，用于刻畫智能系統(tǒng)從內(nèi)部認(rèn)知建模到外部人機(jī)協(xié)同實(shí)現(xiàn)的技術(shù)鏈條。

作為推動(dòng)下一代信息時(shí)代發(fā)展的關(guān)鍵技術(shù)，“2I”關(guān)系對(duì)計(jì)算機(jī)科學(xué)領(lǐng)域的健康發(fā)展具有深遠(yuǎn)影響。然而，歷史上這2個(gè)領(lǐng)域長(zhǎng)期被獨(dú)立關(guān)注，導(dǎo)致資源配置上的競(jìng)爭(zhēng)與不平衡：在人工智能發(fā)展相對(duì)緩慢的時(shí)期，人機(jī)交互迅速發(fā)展；而在人工智能進(jìn)入高速發(fā)展階段后，人機(jī)交互的發(fā)展則顯得滯后，最終造成前2次人工智能浪潮均因應(yīng)用落地不足而告一段落。

2022年ChatGPT的問世加速了生成式人工智能的發(fā)展進(jìn)程，并被視為第3次人工智能浪潮中的重要階段性節(jié)點(diǎn)。有學(xué)者認(rèn)為，以ChatGPT為代表的大語言模型標(biāo)志著一種全新人機(jī)交互范式的形成，并在一定程度上推動(dòng)了計(jì)算模式、認(rèn)知協(xié)作方式與人機(jī)交互形態(tài)的協(xié)同變革。在人機(jī)交互領(lǐng)域，這一進(jìn)程分別對(duì)應(yīng)著交互范式的變革、多模態(tài)交互機(jī)制的形成、認(rèn)知模型的構(gòu)建，以及具身環(huán)境中的交互設(shè)計(jì)探索。

大語言模型是一種新的交互范式，而多通道交互和多模態(tài)大模型、具身交互和具身智能，體現(xiàn)了人機(jī)交互和人工智能在學(xué)術(shù)上的緊密關(guān)系和階段分工。這一技術(shù)軌跡反映出2個(gè)核心趨勢(shì)：一是，人們正在努力尋找實(shí)現(xiàn)大模型實(shí)際落地的關(guān)鍵路徑；二是，這一演化清晰地揭示了人工智能與人機(jī)交互的內(nèi)在學(xué)術(shù)關(guān)系。這是一個(gè)極具潛力的開端，顯示出人工智能正在從封閉式智能向交互式智能演進(jìn)的趨勢(shì)。

早在21世紀(jì)初，人機(jī)交互領(lǐng)域就提出了“自然人機(jī)交互”概念，作為機(jī)器智能演進(jìn)的重要起點(diǎn)和第1個(gè)奇點(diǎn)，強(qiáng)調(diào)如何讓機(jī)器更準(zhǔn)確地理解人類意圖，更自然地輔助人類完成任務(wù)，乃至于讓人類在使用過程中“忘記”機(jī)器的存在。

隨著AI的高速發(fā)展，AI與HCI的關(guān)系正經(jīng)歷從割裂對(duì)立到融合協(xié)同的演化。AI在機(jī)器學(xué)習(xí)、自然語言處理與多模態(tài)理解等方面取得突破，推動(dòng)HCI從傳統(tǒng)的“響應(yīng)式交互”轉(zhuǎn)向“預(yù)測(cè)與引導(dǎo)式交互”。在此基礎(chǔ)上，機(jī)器開始具備與人類共同感知、推理和決策的能力，形成人–AI協(xié)同或人智組隊(duì)的交互模式。

在這一演化過程中，AI已由后臺(tái)算力轉(zhuǎn)變?yōu)橹厮芙换シ妒降暮诵尿?qū)動(dòng)力。因此，當(dāng)前的關(guān)鍵在于如何推動(dòng)人工智能快速轉(zhuǎn)化為顯性的科技能力，并進(jìn)一步融合人機(jī)交互的發(fā)展路徑，共同催生下一代用戶界面（即新交互范式）。“AI+HCI = New UI”正成為一個(gè)重要命題，期待新一代的用戶界面出現(xiàn)，以真正契合人類認(rèn)知和行為習(xí)慣。而在即將到來的“意圖交互”新界面時(shí)代，必然也需要更契合這一范式的交互工具。筆式交互將會(huì)是新界面時(shí)代的核心交互工具之一。這一判斷也在筆式用戶界面平臺(tái)中得到了具體體現(xiàn)。該平臺(tái)體現(xiàn)了“2I”關(guān)系協(xié)同發(fā)展的應(yīng)用實(shí)踐。

從更長(zhǎng)遠(yuǎn)的視角看，人工智能的目標(biāo)不應(yīng)局限于（或主要是）替代人類勞動(dòng)，更應(yīng)聚焦于讓人回歸到“人的腦力勞動(dòng)”。因此，人機(jī)交互與人工智能不僅是學(xué)術(shù)上的并行學(xué)科，更在技術(shù)落地與應(yīng)用推廣中互為支撐。它們的關(guān)系與協(xié)同程度，直接影響整個(gè)計(jì)算機(jī)科學(xué)領(lǐng)域的健康發(fā)展。

4 AI+HCI=New UI

伴隨AI在感知、理解、推理與可視化等技術(shù)的突破，HCI的核心理念由“工具性”向“智能協(xié)同性”轉(zhuǎn)型。這一變革不僅重塑了UI的功能定位，也對(duì)其設(shè)計(jì)原則與認(rèn)知邏輯提出了全新要求——以智能融合、認(rèn)知共構(gòu)與動(dòng)態(tài)演化為核心。因此，“AI+HCI=New UI”的“New”不僅關(guān)乎視覺與交互形式的革新，更體現(xiàn)在設(shè)計(jì)理念、交互范式、智能屬性與認(rèn)知結(jié)構(gòu)的系統(tǒng)性變革，標(biāo)志著UI從“界面”向“認(rèn)知模型”和“智能體”的躍遷。相較于以操作可視化、交互自然化或單一模型驅(qū)動(dòng)為核心的既有界面范式，“New UI”更強(qiáng)調(diào)人工智能能力與交互機(jī)制在系統(tǒng)層面的協(xié)同演化。

這一范式轉(zhuǎn)變?cè)诮换用嫔象w現(xiàn)為從顯式指令邏輯向意圖導(dǎo)向交互的過渡。這種新型交互突破了傳統(tǒng)操作層的邊界，通過自然語言、多模態(tài)輸入及語境建模，重構(gòu)了人機(jī)理解鏈條。UI由“被動(dòng)響應(yīng)”的容器轉(zhuǎn)變?yōu)榫邆淅斫馀c共感能力的交互主體，在語義、情境與認(rèn)知層面實(shí)現(xiàn)智能協(xié)同。

從設(shè)計(jì)哲學(xué)層面看，“New UI”的理論根基已由“以人為中心”轉(zhuǎn)向“以人機(jī)共智為中心”。界面不再是單向服務(wù)對(duì)象，而是用戶認(rèn)知的參與者與外化體。借助AI畫像、動(dòng)態(tài)建模與持續(xù)學(xué)習(xí)等技術(shù)，系統(tǒng)可根據(jù)用戶特征與任務(wù)語境動(dòng)態(tài)演化，實(shí)現(xiàn)“千人千界”的自適應(yīng)交互，從而構(gòu)建認(rèn)知增強(qiáng)型共智體系。

在技術(shù)路徑上，AI的深度介入推動(dòng)了UI從“人工設(shè)計(jì)”邁向“自主演化”。這一能力使UI由“靜態(tài)產(chǎn)品”轉(zhuǎn)為“可持續(xù)演化的交互生態(tài)”，實(shí)現(xiàn)“在使用中學(xué)習(xí)、在交互中進(jìn)化”的邏輯，標(biāo)志著軟件生命周期的范式躍遷。

從研究脈絡(luò)上看，“New UI”并非孤立提出，而是延續(xù)了合作式認(rèn)知界面、混合主動(dòng)界面與意圖感知界面等研究方向中關(guān)于界面主動(dòng)參與認(rèn)知分工與決策支持的思想。由此，“AI+HCI=New UI”并非技術(shù)要素的簡(jiǎn)單疊加，而是對(duì)智能能力與交互機(jī)制協(xié)同重塑界面角色的概念性概括。

在認(rèn)知理論層面，“New UI”的認(rèn)知內(nèi)涵正從傳統(tǒng)的“信息加工”范式，邁向以擴(kuò)充心智與分布式認(rèn)知為理論支撐的認(rèn)知共構(gòu)框架。

“New UI”的終極形態(tài)體現(xiàn)為混合智能驅(qū)動(dòng)的共智界面。它以“共智邏輯”為核心，推動(dòng)人機(jī)關(guān)系由“主客體”走向“共生體”，由“操作邏輯”邁向“認(rèn)知共構(gòu)”的智能邏輯。

5 迎接人機(jī)共生新時(shí)代

人機(jī)關(guān)系的理解與實(shí)踐不斷深化。從早期以文字為工具的“字符式交互”，到GUI實(shí)現(xiàn)的人機(jī)命令式操作，再到當(dāng)下由人工智能驅(qū)動(dòng)的“協(xié)同交互”與“智能代理”，人機(jī)交互逐漸從“命令界面”轉(zhuǎn)向“認(rèn)知伙伴”。然而，進(jìn)入21世紀(jì)以來，盡管人機(jī)交互在產(chǎn)業(yè)與應(yīng)用層取得了顯著成就，但在思想創(chuàng)新、理論體系、范式建構(gòu)等方面仍顯薄弱。基于“HCI+AI=New UI”的理念，推動(dòng)界面從靜態(tài)的視覺窗口轉(zhuǎn)變?yōu)橹悄艽砼c用戶之間的動(dòng)態(tài)對(duì)話空間，進(jìn)而實(shí)現(xiàn)“人機(jī)共生”。這不僅是技術(shù)層面的突破，更是對(duì)人與技術(shù)、人與社會(huì)關(guān)系的系統(tǒng)性再定義。人機(jī)交互研究應(yīng)跳脫狹義技術(shù)視角，從人類文明是否存亡的角度去思考和理解。同時(shí)，站在技術(shù)與人文的交匯點(diǎn)上，更應(yīng)以全球視野看待人機(jī)交互的未來發(fā)展。唯有在人文與技術(shù)、東西方智慧、科學(xué)與藝術(shù)之間建立對(duì)話機(jī)制，才能真正走向一個(gè)人與技術(shù)共融共生的未來世界。

本文作者：戴國(guó)忠，康文惠，田豐

作者簡(jiǎn)介：戴國(guó)忠，中國(guó)科學(xué)院軟件研究所，研究員，研究方向?yàn)槿藱C(jī)交互、計(jì)算機(jī)圖形學(xué)。

文章來源：戴國(guó)忠, 康文惠, 田豐. 人機(jī)交互與人工智能的關(guān)系[J]. 科技導(dǎo)報(bào), 2026, 44(7): 44?51.

本文有刪改，

內(nèi)容為【科技導(dǎo)報(bào)】公眾號(hào)原創(chuàng)，歡迎轉(zhuǎn)載
白名單回復(fù)后臺(tái)「轉(zhuǎn)載」

《科技導(dǎo)報(bào)》創(chuàng)刊于1980年，中國(guó)科協(xié)學(xué)術(shù)會(huì)刊，主要刊登科學(xué)前沿和技術(shù)熱點(diǎn)領(lǐng)域突破性的研究成果、權(quán)威性的科學(xué)評(píng)論、引領(lǐng)性的高端綜述，發(fā)表促進(jìn)經(jīng)濟(jì)社會(huì)發(fā)展、完善科技管理、優(yōu)化科研環(huán)境、培育科學(xué)文化、促進(jìn)科技創(chuàng)新和科技成果轉(zhuǎn)化的決策咨詢建議。常設(shè)欄目有院士卷首語、科技新聞、科技評(píng)論、本刊專稿、特色專題、研究論文、政策建議、科技人文等。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.