五角大樓遇到了一個靠火力解決不了的問題。
AI代理正在進入殺傷鏈。它們在毫秒之間完成情報分析、目標推薦,甚至自主決策。這門能加速戰爭進程的技術,同時制造了一個合規噩夢:AI代理出錯了,誰來擔責?指揮鏈怎么證明這次決策合法?審計記錄在哪兒?
美國國防部追問這些問題已經好幾年了。2026年1月,美國戰爭部發布AI戰略,明確要求“人類判斷、推理與問責”以及“在大型語言模型工作流中嵌入定制審計層”。2026財年《國防授權法》草案提出,采用業界認可框架對AI治理、測試、審計和監控進行規范。國防創新單元還專門發布了“興趣領域”征集,想要一個能審計AI代理的標準化評估“夾具”。
但要求歸要求,方案歸方案。五角大樓下令建立審計追蹤,可一直沒人真的做出來——直到現在。
一個沒人填得上的缺口
傳統國防承包商按規格交付,他們造武器,不造合規層。硅谷的創業公司鉆研自主性,不管審計記錄。結果出現了一個尷尬的缺口:自主系統一路部署,卻拿不出任何辦法證明它們的決策正確。
美國國防部自己的戰略文件承認了這個困境。文件寫到要有“AI決策信任基礎”,要“在LLM工作流中嵌入定制審計層”,要進行“AI模型獨立審計”。但怎么建,文件沒說,只說“必須有”。
產業界也沒補上這個缺口。針對自主決策,仍然沒有出現一個確定性的、可復現的、能映射到行業框架的審計追蹤機制。
國防部到底要什么
國防部花了數年寫下需求清單。而真正動手把方案做出來,只用了幾個月。
來看看一個自主目標推薦場景怎么運作。輸入信息包括:場景描述為自主目標推薦,觀測信號有“AI置信度92%”“目標被判定為敵對”“附帶損傷風險低”,已知上下文包括“交戰規則4.2版”“實施動能行動需經人類批準”。
系統輸出的決策姿態是“轉為人工審核”,置信度92%,合規引用直接把“國防部AI戰略-人類問責”“網絡安全成熟度模型認證2.0-審計追蹤”“NIST 800-171-受控非密信息保護”“國防授權法-AI治理指令”全部列了出來。決策理由寫得清楚:“AI建議實施動能行動。置信度高,附帶損傷風險低。按交戰規則,需經人類批準。”沒有需要澄清的疑問。
人工審核者能看到決策理由、置信度、合規引用和授權鏈條。決策被記錄在案,審計記錄不可篡改,指揮鏈保持完整。
這已經不是理論框架。它是一個活的API端點。
接下來會發生什么
這套引擎此前服務的是醫療器械合規、保險核保和自動駕駛審計。現在,它同樣服務美國國防部。一次API調用,覆蓋多個合規框架。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.