原文發(fā)表于《科技導(dǎo)報(bào)》 2026年第7期《人機(jī)交互與人工智能的關(guān)系》
以人為研究對(duì)象的人機(jī)交互(HCI)和人工智能(AI)是新一代信息技術(shù)的典型代表。作為密切相關(guān)的學(xué)科,二者必須協(xié)同發(fā)展。《科技導(dǎo)報(bào)》邀請(qǐng)中國(guó)科學(xué)院軟件研究所戴國(guó)忠、康文惠、田豐老師撰寫文章,從“人機(jī)共生”的視角出發(fā),分析了歷史和當(dāng)下AI和HCI發(fā)展中存在的問題,并提出了新用戶界面(New UI)的技術(shù)設(shè)想。
2020年為信息技術(shù)發(fā)展的分水嶺。第一代信息技術(shù)高潮被稱為“數(shù)字化1.0時(shí)代”,其核心是將辦公自動(dòng)化和數(shù)字技術(shù)引入桌面工作場(chǎng)景。21世紀(jì)后,學(xué)術(shù)界圍繞新舊信息技術(shù)展開深入討論,焦點(diǎn)逐漸從以機(jī)器為中心轉(zhuǎn)向以人為本。數(shù)字化2.0時(shí)代的目標(biāo)是實(shí)現(xiàn)計(jì)算的普適化與智能化,使計(jì)算更貼近人的需求與能力。
在這一歷史脈絡(luò)下,新一代信息技術(shù)的典型代表逐漸顯現(xiàn),即以人為研究對(duì)象的人機(jī)交互(HCI)和人工智能(AI)。作為密切相關(guān)的姐妹學(xué)科,二者必須協(xié)同發(fā)展,攜手推動(dòng)以人為本的技術(shù)創(chuàng)新進(jìn)程。正因如此,當(dāng)下亟需在更系統(tǒng)的框架下審視二者的協(xié)同邏輯,即人機(jī)交互與人工智能的關(guān)系(“2I”關(guān)系)。當(dāng)前面臨2大關(guān)鍵挑戰(zhàn):一是如何有效推進(jìn)數(shù)字化2.0時(shí)代的轉(zhuǎn)型升級(jí);二是如何構(gòu)建符合人本理念的交互范式,實(shí)現(xiàn)以大模型為核心的智能技術(shù)的落地應(yīng)用。為了應(yīng)對(duì)這一挑戰(zhàn),新一代信息技術(shù)必須關(guān)注“用戶想做什么”,遵循技術(shù)發(fā)展必須緊密契合用戶需求,實(shí)現(xiàn)真正的人機(jī)協(xié)同,確保技術(shù)普惠而非成為少數(shù)人的特權(quán)。我們提出并強(qiáng)調(diào)“2I”關(guān)系健康發(fā)展的核心,為下一代信息技術(shù)的發(fā)展提供思考框架。
1 對(duì)新計(jì)算環(huán)境下人機(jī)交互的新認(rèn)識(shí)
自1960年“人機(jī)共生”概念被提出以來,人機(jī)交互始終以“人與計(jì)算機(jī)協(xié)作完成任務(wù)”為核心,聚焦于人與系統(tǒng)在行為、認(rèn)知和社會(huì)性層面的交互機(jī)制研究。然而,隨著新一代信息技術(shù)的快速迭代發(fā)展,人機(jī)交互的核心驅(qū)動(dòng)力正由單一的技術(shù)驅(qū)動(dòng)轉(zhuǎn)向由社會(huì)生產(chǎn)需求、技術(shù)綜合進(jìn)步與個(gè)人社交需求等多元因素共同推動(dòng)的復(fù)雜機(jī)制。
盡管人機(jī)交互近年來隨著新興技術(shù)不斷拓展其研究深度與應(yīng)用邊界,但其發(fā)展基礎(chǔ)仍深受傳統(tǒng)基礎(chǔ)模型的影響。圖靈機(jī)和馮·諾依曼體系為現(xiàn)代計(jì)算奠定了堅(jiān)實(shí)的理論與結(jié)構(gòu)基礎(chǔ)。然而,這些基礎(chǔ)模型在設(shè)計(jì)之初主要關(guān)注計(jì)算的可行性與邏輯實(shí)現(xiàn),較少考慮人與系統(tǒng)間的實(shí)時(shí)交互需求。
人機(jī)交互的發(fā)展離不開交互范式的演進(jìn)。技術(shù)革新推動(dòng)交互范式的變遷,而范式的演化又反過來促進(jìn)技術(shù)的發(fā)展,二者相輔相成、相互驅(qū)動(dòng)。在這一過程中,關(guān)鍵的人物、事件與思想也發(fā)揮了重要作用,能夠深刻影響交互范式的演進(jìn)。將交互范式用于具體應(yīng)用時(shí),必須充分關(guān)注人的心理與認(rèn)知特性。因此,應(yīng)用系統(tǒng)的輸入設(shè)計(jì)應(yīng)該符合人的習(xí)慣,而輸出應(yīng)以降低人的認(rèn)知成本和學(xué)習(xí)成本為目標(biāo),盡可能貼合人的認(rèn)知機(jī)制。
21世紀(jì)以來,新的信息技術(shù)迅速發(fā)展,計(jì)算環(huán)境從單一的桌面計(jì)算,發(fā)展成多種計(jì)算環(huán)境。在這一發(fā)展與演進(jìn)過程中,新范式和界面平臺(tái)應(yīng)在保證原有性能的基礎(chǔ)上,呈現(xiàn)系統(tǒng)的決策邏輯與行為機(jī)制,通過增強(qiáng)可解釋性推動(dòng)人機(jī)協(xié)同,并促進(jìn)人機(jī)能力的共生發(fā)展。
與此同時(shí),人機(jī)交互的內(nèi)涵已超越傳統(tǒng)意義上人對(duì)桌面計(jì)算機(jī)的命令操作,逐漸拓展為具有人類意圖表達(dá)和感知能力的“智能機(jī)器人”與能夠同計(jì)算機(jī)實(shí)現(xiàn)自然交互的“交互人”之間的協(xié)同交互。在這一過程中,交互人和智能機(jī)器人應(yīng)在感知、認(rèn)知與行為3個(gè)層面實(shí)現(xiàn)協(xié)同與互相促進(jìn),構(gòu)建起物理世界(自然界)與數(shù)字空間(互聯(lián)網(wǎng)、物聯(lián)網(wǎng))之間的無縫交互橋梁。
2 對(duì)人工智能的若干認(rèn)識(shí)
人工智能自1956年達(dá)特茅斯夏季研討會(huì)首次提出以來,經(jīng)歷了2次高峰與2次低谷的發(fā)展周期。從理論演進(jìn)來看,人工智能最初源于圖靈對(duì)“具有獨(dú)立思維能力的機(jī)器”的設(shè)想,逐步演變?yōu)橐婚T以圖靈理論為基礎(chǔ)的系統(tǒng)性學(xué)科。
迄今為止,人們?nèi)詿o法充分理解人類在解決問題過程中大腦的運(yùn)行原理、認(rèn)知過程,乃至心理發(fā)展,以及它們之間的相互影響機(jī)制。這種未知不僅使得“計(jì)算機(jī)如何模擬人類思維”成為人工智能研究的核心難題,也使得理清“腦?心靈?計(jì)算機(jī)”三元關(guān)系面臨前所未有的復(fù)雜性挑戰(zhàn)。
隨著深度學(xué)習(xí)與大語言模型的發(fā)展,人工智能研究與認(rèn)知科學(xué)之間的關(guān)系受到廣泛關(guān)注。當(dāng)代AI的若干核心機(jī)制在功能與方法論層面上,與認(rèn)知科學(xué)關(guān)于注意、學(xué)習(xí)、預(yù)測(cè)與表征等問題的理論討論呈現(xiàn)出一定的呼應(yīng)關(guān)系。
盡管對(duì)人類大腦的理解仍處于初級(jí)階段,但基于對(duì)大腦與人工智能的持續(xù)探索,學(xué)者已提出了諸多認(rèn)知計(jì)算理論與模型。早在1937年,丘奇與圖靈就分別提出了人的思維能力與遞歸函數(shù)計(jì)算能力等價(jià)的假說。與此相對(duì),哲學(xué)家德雷福斯等則堅(jiān)決反對(duì)這一觀點(diǎn),認(rèn)為基于圖靈機(jī)的計(jì)算模型無法模擬人類智能。
圍繞上述問題,學(xué)界逐漸將討論進(jìn)一步引向?qū)π问较到y(tǒng)內(nèi)在局限性的反思。哥德爾在20世紀(jì)初提出的不完備性定理正是這一反思的邏輯起點(diǎn)。從哲學(xué)和認(rèn)知科學(xué)的角度來看,哥德爾不完備性定理不僅揭示了形式系統(tǒng)的內(nèi)在局限,也促使人們重新審視“計(jì)算”與“智能”的邊界問題,并成為人工智能哲學(xué)討論中不可回避的重要命題。
3 人機(jī)交互和人工智能的關(guān)系
人工智能與人機(jī)交互為計(jì)算機(jī)科學(xué)中2個(gè)密切關(guān)聯(lián),但側(cè)重點(diǎn)在不同的子領(lǐng)域。人工智能側(cè)重于從算法和模型層面解決認(rèn)知計(jì)算問題,試圖模擬或重建人的智能過程;而人機(jī)交互則強(qiáng)調(diào)以人為中心的交互設(shè)計(jì),著眼于人的感知、認(rèn)知與行為特征,致力于通過理論與實(shí)踐融合,構(gòu)建自然、高效的人機(jī)協(xié)同體系。盡管兩者在實(shí)現(xiàn)路徑與方法論上各有側(cè)重,協(xié)同構(gòu)成了從智能建模到交互設(shè)計(jì)的系統(tǒng)性研究框架,但在目標(biāo)層面具有高度一致性,即理解和服務(wù)于“人”的認(rèn)知與行為需求。
基于這一認(rèn)識(shí),我們將AI與HCI的關(guān)系概括為“2I”關(guān)系,用于刻畫智能系統(tǒng)從內(nèi)部認(rèn)知建模到外部人機(jī)協(xié)同實(shí)現(xiàn)的技術(shù)鏈條。
作為推動(dòng)下一代信息時(shí)代發(fā)展的關(guān)鍵技術(shù),“2I”關(guān)系對(duì)計(jì)算機(jī)科學(xué)領(lǐng)域的健康發(fā)展具有深遠(yuǎn)影響。然而,歷史上這2個(gè)領(lǐng)域長(zhǎng)期被獨(dú)立關(guān)注,導(dǎo)致資源配置上的競(jìng)爭(zhēng)與不平衡:在人工智能發(fā)展相對(duì)緩慢的時(shí)期,人機(jī)交互迅速發(fā)展;而在人工智能進(jìn)入高速發(fā)展階段后,人機(jī)交互的發(fā)展則顯得滯后,最終造成前2次人工智能浪潮均因應(yīng)用落地不足而告一段落。
2022年ChatGPT的問世加速了生成式人工智能的發(fā)展進(jìn)程,并被視為第3次人工智能浪潮中的重要階段性節(jié)點(diǎn)。有學(xué)者認(rèn)為,以ChatGPT為代表的大語言模型標(biāo)志著一種全新人機(jī)交互范式的形成,并在一定程度上推動(dòng)了計(jì)算模式、認(rèn)知協(xié)作方式與人機(jī)交互形態(tài)的協(xié)同變革。在人機(jī)交互領(lǐng)域,這一進(jìn)程分別對(duì)應(yīng)著交互范式的變革、多模態(tài)交互機(jī)制的形成、認(rèn)知模型的構(gòu)建,以及具身環(huán)境中的交互設(shè)計(jì)探索。
大語言模型是一種新的交互范式,而多通道交互和多模態(tài)大模型、具身交互和具身智能,體現(xiàn)了人機(jī)交互和人工智能在學(xué)術(shù)上的緊密關(guān)系和階段分工。這一技術(shù)軌跡反映出2個(gè)核心趨勢(shì):一是,人們正在努力尋找實(shí)現(xiàn)大模型實(shí)際落地的關(guān)鍵路徑;二是,這一演化清晰地揭示了人工智能與人機(jī)交互的內(nèi)在學(xué)術(shù)關(guān)系。這是一個(gè)極具潛力的開端,顯示出人工智能正在從封閉式智能向交互式智能演進(jìn)的趨勢(shì)。
早在21世紀(jì)初,人機(jī)交互領(lǐng)域就提出了“自然人機(jī)交互”概念,作為機(jī)器智能演進(jìn)的重要起點(diǎn)和第1個(gè)奇點(diǎn),強(qiáng)調(diào)如何讓機(jī)器更準(zhǔn)確地理解人類意圖,更自然地輔助人類完成任務(wù),乃至于讓人類在使用過程中“忘記”機(jī)器的存在。
隨著AI的高速發(fā)展,AI與HCI的關(guān)系正經(jīng)歷從割裂對(duì)立到融合協(xié)同的演化。AI在機(jī)器學(xué)習(xí)、自然語言處理與多模態(tài)理解等方面取得突破,推動(dòng)HCI從傳統(tǒng)的“響應(yīng)式交互”轉(zhuǎn)向“預(yù)測(cè)與引導(dǎo)式交互”。在此基礎(chǔ)上,機(jī)器開始具備與人類共同感知、推理和決策的能力,形成人–AI協(xié)同或人智組隊(duì)的交互模式。
在這一演化過程中,AI已由后臺(tái)算力轉(zhuǎn)變?yōu)橹厮芙换シ妒降暮诵尿?qū)動(dòng)力。因此,當(dāng)前的關(guān)鍵在于如何推動(dòng)人工智能快速轉(zhuǎn)化為顯性的科技能力,并進(jìn)一步融合人機(jī)交互的發(fā)展路徑,共同催生下一代用戶界面(即新交互范式)。“AI+HCI = New UI”正成為一個(gè)重要命題,期待新一代的用戶界面出現(xiàn),以真正契合人類認(rèn)知和行為習(xí)慣。而在即將到來的“意圖交互”新界面時(shí)代,必然也需要更契合這一范式的交互工具。筆式交互將會(huì)是新界面時(shí)代的核心交互工具之一。這一判斷也在筆式用戶界面平臺(tái)中得到了具體體現(xiàn)。該平臺(tái)體現(xiàn)了“2I”關(guān)系協(xié)同發(fā)展的應(yīng)用實(shí)踐。
從更長(zhǎng)遠(yuǎn)的視角看,人工智能的目標(biāo)不應(yīng)局限于(或主要是)替代人類勞動(dòng),更應(yīng)聚焦于讓人回歸到“人的腦力勞動(dòng)”。因此,人機(jī)交互與人工智能不僅是學(xué)術(shù)上的并行學(xué)科,更在技術(shù)落地與應(yīng)用推廣中互為支撐。它們的關(guān)系與協(xié)同程度,直接影響整個(gè)計(jì)算機(jī)科學(xué)領(lǐng)域的健康發(fā)展。
4 AI+HCI=New UI
伴隨AI在感知、理解、推理與可視化等技術(shù)的突破,HCI的核心理念由“工具性”向“智能協(xié)同性”轉(zhuǎn)型。這一變革不僅重塑了UI的功能定位,也對(duì)其設(shè)計(jì)原則與認(rèn)知邏輯提出了全新要求——以智能融合、認(rèn)知共構(gòu)與動(dòng)態(tài)演化為核心。因此,“AI+HCI=New UI”的“New”不僅關(guān)乎視覺與交互形式的革新,更體現(xiàn)在設(shè)計(jì)理念、交互范式、智能屬性與認(rèn)知結(jié)構(gòu)的系統(tǒng)性變革,標(biāo)志著UI從“界面”向“認(rèn)知模型”和“智能體”的躍遷。相較于以操作可視化、交互自然化或單一模型驅(qū)動(dòng)為核心的既有界面范式,“New UI”更強(qiáng)調(diào)人工智能能力與交互機(jī)制在系統(tǒng)層面的協(xié)同演化。
這一范式轉(zhuǎn)變?cè)诮换用嫔象w現(xiàn)為從顯式指令邏輯向意圖導(dǎo)向交互的過渡。這種新型交互突破了傳統(tǒng)操作層的邊界,通過自然語言、多模態(tài)輸入及語境建模,重構(gòu)了人機(jī)理解鏈條。UI由“被動(dòng)響應(yīng)”的容器轉(zhuǎn)變?yōu)榫邆淅斫馀c共感能力的交互主體,在語義、情境與認(rèn)知層面實(shí)現(xiàn)智能協(xié)同。
從設(shè)計(jì)哲學(xué)層面看,“New UI”的理論根基已由“以人為中心”轉(zhuǎn)向“以人機(jī)共智為中心”。界面不再是單向服務(wù)對(duì)象,而是用戶認(rèn)知的參與者與外化體。借助AI畫像、動(dòng)態(tài)建模與持續(xù)學(xué)習(xí)等技術(shù),系統(tǒng)可根據(jù)用戶特征與任務(wù)語境動(dòng)態(tài)演化,實(shí)現(xiàn)“千人千界”的自適應(yīng)交互,從而構(gòu)建認(rèn)知增強(qiáng)型共智體系。
在技術(shù)路徑上,AI的深度介入推動(dòng)了UI從“人工設(shè)計(jì)”邁向“自主演化”。這一能力使UI由“靜態(tài)產(chǎn)品”轉(zhuǎn)為“可持續(xù)演化的交互生態(tài)”,實(shí)現(xiàn)“在使用中學(xué)習(xí)、在交互中進(jìn)化”的邏輯,標(biāo)志著軟件生命周期的范式躍遷。
從研究脈絡(luò)上看,“New UI”并非孤立提出,而是延續(xù)了合作式認(rèn)知界面、混合主動(dòng)界面與意圖感知界面等研究方向中關(guān)于界面主動(dòng)參與認(rèn)知分工與決策支持的思想。由此,“AI+HCI=New UI”并非技術(shù)要素的簡(jiǎn)單疊加,而是對(duì)智能能力與交互機(jī)制協(xié)同重塑界面角色的概念性概括。
在認(rèn)知理論層面,“New UI”的認(rèn)知內(nèi)涵正從傳統(tǒng)的“信息加工”范式,邁向以擴(kuò)充心智與分布式認(rèn)知為理論支撐的認(rèn)知共構(gòu)框架。
“New UI”的終極形態(tài)體現(xiàn)為混合智能驅(qū)動(dòng)的共智界面。它以“共智邏輯”為核心,推動(dòng)人機(jī)關(guān)系由“主客體”走向“共生體”,由“操作邏輯”邁向“認(rèn)知共構(gòu)”的智能邏輯。
5 迎接人機(jī)共生新時(shí)代
人機(jī)關(guān)系的理解與實(shí)踐不斷深化。從早期以文字為工具的“字符式交互”,到GUI實(shí)現(xiàn)的人機(jī)命令式操作,再到當(dāng)下由人工智能驅(qū)動(dòng)的“協(xié)同交互”與“智能代理”,人機(jī)交互逐漸從“命令界面”轉(zhuǎn)向“認(rèn)知伙伴”。然而,進(jìn)入21世紀(jì)以來,盡管人機(jī)交互在產(chǎn)業(yè)與應(yīng)用層取得了顯著成就,但在思想創(chuàng)新、理論體系、范式建構(gòu)等方面仍顯薄弱。基于“HCI+AI=New UI”的理念,推動(dòng)界面從靜態(tài)的視覺窗口轉(zhuǎn)變?yōu)橹悄艽砼c用戶之間的動(dòng)態(tài)對(duì)話空間,進(jìn)而實(shí)現(xiàn)“人機(jī)共生”。這不僅是技術(shù)層面的突破,更是對(duì)人與技術(shù)、人與社會(huì)關(guān)系的系統(tǒng)性再定義。人機(jī)交互研究應(yīng)跳脫狹義技術(shù)視角,從人類文明是否存亡的角度去思考和理解。同時(shí),站在技術(shù)與人文的交匯點(diǎn)上,更應(yīng)以全球視野看待人機(jī)交互的未來發(fā)展。唯有在人文與技術(shù)、東西方智慧、科學(xué)與藝術(shù)之間建立對(duì)話機(jī)制,才能真正走向一個(gè)人與技術(shù)共融共生的未來世界。
本文作者:戴國(guó)忠,康文惠,田豐
作者簡(jiǎn)介:戴國(guó)忠,中國(guó)科學(xué)院軟件研究所,研究員,研究方向?yàn)槿藱C(jī)交互、計(jì)算機(jī)圖形學(xué)。
文章來 源 : 戴國(guó)忠, 康文惠, 田豐. 人機(jī)交互與人工智能的關(guān)系[J]. 科技導(dǎo)報(bào), 2026, 44(7): 44?51.
本文有刪改,
![]()
內(nèi)容為【科技導(dǎo)報(bào)】公眾號(hào)原創(chuàng),歡迎轉(zhuǎn)載
白名單回復(fù)后臺(tái)「轉(zhuǎn)載」
《科技導(dǎo)報(bào)》創(chuàng)刊于1980年,中國(guó)科協(xié)學(xué)術(shù)會(huì)刊,主要刊登科學(xué)前沿和技術(shù)熱點(diǎn)領(lǐng)域突破性的研究成果、權(quán)威性的科學(xué)評(píng)論、引領(lǐng)性的高端綜述,發(fā)表促進(jìn)經(jīng)濟(jì)社會(huì)發(fā)展、完善科技管理、優(yōu)化科研環(huán)境、培育科學(xué)文化、促進(jìn)科技創(chuàng)新和科技成果轉(zhuǎn)化的決策咨詢建議。常設(shè)欄目有院士卷首語、科技新聞、科技評(píng)論、本刊專稿、特色專題、研究論文、政策建議、科技人文等。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.