![]()
近來,一款名為“OpenClaw”(別稱“龍蝦”)的開源AI智能體火了。這款產品革新了人機交互的模式,其潛在風險也引發了安全焦慮。2026年政府工作報告提出,要深化拓展“人工智能+”行動,加快推動新一代智能終端與智能體的規模化應用,并完善人工智能治理體系。AI智能體是我們共創未來的伙伴,需要我們積極推進與之相匹配的安全治理變革。
![]()
原文 :《自主智能體的潛在風險與安全治理》
作者 |之江實驗室智能社會治理實驗室 裴冠雄
圖片 |網絡
2026年初,以OpenClaw為代表的自主智能體進入規模化部署與應用階段,被視為人工智能從“生成內容”走向“執行任務”的關鍵轉折。與過往依賴即時指令的聊天式AI不同,自主智能體具備操作系統級權限,能夠在個人數字設備上獨立執行長程、多類別任務,實現從指令理解到操作完成的全天候閉環服務。例如,用戶僅需向智能體發出“處理會議紀要和財務報表”的指令,系統即可自動接管電腦,完成日歷安排、文件分類歸檔、數據圖表生成、應用程序信息發送乃至郵件回復等一系列操作。這種人機交互模式的革新正在重新定義數字社會中人與機器的協作邊界。
然而,更大的能力有時意味著更大的風險,發展必須與安全同步推進。2026年政府工作報告明確提出,要深化拓展“人工智能+”行動,加快推動新一代智能終端與智能體的規模化應用,并完善人工智能治理體系。作為具備自主執行、長期記憶、跨工具協同及全天候響應能力的“數字員工”,智能體的應用深度與廣度已遠超傳統人工智能的功能邊界,由此催生了前所未有的治理挑戰。國際頂級學術期刊《自然》近日以“running amok”(失控)為題刊發報道,直言學界對自主智能體的隱憂。特別是在權限控制、責任界定、個人隱私及物理世界交互等領域,風險敞口持續擴大,迫切需要一場與智能體能力相匹配的安全治理變革。
![]()
一是監管模式需從“節點式介入”轉向“全周期追蹤”。傳統監管通常聚焦于上線審批、事中抽查、問題查處等關鍵節點,只能覆蓋智能體運行周期的某個瞬間,對其演化過程與后臺行為存在明顯的監管盲區。而智能體可能因意圖對齊失敗在運行中產生意外行為,例如某科技公司部署的辦公智能體,因上下文窗口限制遺忘安全指令,擅自刪除了200多封重要工作郵件。對此,監管思路需從點狀介入升級為全程追蹤,通過回溯決策過程判斷智能體是否按規則思考,通過監測行為軌跡識別潛在風險,通過識別異常耗能及時強制中斷運行,將治理觸角延伸至智能體運行的全生命周期。
二是責任認定需從“個體歸因”轉向“多頭溯源”。隨著多主體開發、集群化協同的智能體應用日益普及,因果關系模糊、責任主體難以界定的“責任黑洞”問題日益凸顯。以金融領域為例,多家機構的交易智能體協同操作時出現誤判,共同完成一筆錯誤投資,導致用戶蒙受經濟損失,目前尚無明確標準界定各方責任。傳統的單點追責機制,既無法在多智能體協作條件下追溯故障源頭,也難以對交互產生的整體性損害進行歸責。對此,應建立全程留痕、不可篡改的操作日志,確保智能體每一次跨系統指令皆有據可查;同時推動產業鏈各環節,包括底層模型、應用層、第三方插件,建立責任劃分機制,并以協議形式明確復雜協同中的責任邊界,為多自主智能體時代的治理提供制度基礎。
三是防護策略需從“虛擬安全”轉向“接口管控”。智能體通過調用操作系統接口,能夠直接控制物理設備、干預現實世界,使風險從虛擬內容誤導延伸到實體操作損害。例如,在智慧倉儲場景中,調度智能體如果因計算路徑指令出錯,通過控制接口向自動化叉車下達了錯誤的貨架舉升指令,就可能造成數百件貨物損毀。對此,應建立面向物理操作的API安全網關,對涉及高危作業、異常規劃、財務轉賬等高風險接口實施強制隔離測試與風險評級;同時落實“高危操作人工確權”制度,在智能體執行不可逆操作前,必須通過指紋或人臉識別等二次身份驗證,確保關鍵決策始終保留在人類手中。
![]()
四是權利保障需從“數據管控”轉向“信息自決”。智能體的長期記憶功能使其能夠持續學習并存儲用戶的性格特征、表達習慣、行為偏好等深層隱私數據,形成高度擬真的數字化人格畫像。一旦這些記憶數據被竊取或濫用,風險將不再局限于數據泄露,而可能升級為用戶“數字人格”的被操控與冒用。據報道,海外智能體平臺ClawHub上曾出現惡意技能,通過后臺隱蔽上傳用戶長期記憶數據。犯罪分子可利用此類數據訓練出受害者的數字分身,模仿其語言風格與思維邏輯,對親友實施精準詐騙。對此,人格特征類數據應存儲于用戶本地并加密,或在傳輸存儲全程進行匿名化脫敏,確保用戶的數字化復制品由本人掌控。同時完善“數字遺忘權”執行細則,賦予用戶對特定記憶片段的一鍵擦除權限,從源頭切斷人格數據被濫用的可能。
自主智能體熱潮的背后,更需注入理性的審視。唯有將規制深度嵌入技術運行的全流程,推動治理范式的適應性變革,才能在技術創新與風險防范之間找到動態平衡,真正造福民生、賦能社會發展。
文章為社會科學報“思想工坊”融媒體原創出品,原載于社會科學報第1994期第4版,未經允許禁止轉載,文中內容僅代表作者觀點,不代表本報立場。
本期責編:程鑫云
![]()
《社會科學報》2026年征訂
點擊下方圖片網上訂報↓↓↓
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.