<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      Harness破圈:模型之外,落地土壤成企業AI選型“第一標準”

      0
      分享至



      從當前趨勢來看,Harness更像是一個“不可逆的中間層”。

      就像操作系統之于硬件,數據庫之于應用,Harness正在成為AI與現實世界之間的那一層“接口”。當AI從“會說話”走向“能干活”,Harness,就是那根決定它能跑多遠的韁繩。

      作者|斗斗

      編輯|皮爺

      出品|產業家

      2026年,全球企業級AI市場已經悄然進入“深水區”。

      過去三年,大模型的能力以近乎失控的速度躍遷,從對話助手到代碼生成,從內容創作到復雜推理,模型本身的“智力上限”不斷被刷新。如今,通用大模型已經成為像電力和自來水一樣的基礎設施。

      不過,這并未讓企業感到輕松。一個與技術進步形成鮮明反差的現實正在浮現,那就是AI越強,企業反而越用不好、不敢用。一份由德勤發布的《2026年企業AI現狀》報告顯示,盡管80%的受訪企業聲稱已經部署了AI工具,但真正能夠實現規模化應用、并產生顯著商業價值的企業僅占15%。

      就在行業陷入迷茫時,風向變了。

      2026年1月期間,OpenAl內部一個最初只有3人的工程師團隊,從一個空的Git倉庫開始,在5個月內構建出了一個包含超過100萬行代碼的完整Beta產品。整個過程中,沒有一行代碼是人類手動鍵入的。值得注意的是,這個團隊后來擴展到7人,期間合并了約1500個拉取請求,平均每位工程師每天能推進3.5個PR。隨著流程成熟,生產效率還在持續提升。OpenAI估計,這種方式比傳統手寫代碼開發節省了約10倍的時間。

      這不僅僅是效率的提升,更是對"軟件工程"定義的一次顛覆。OpenAI將這套全新的方法論命名為:“駕馭工程”(Harness Engineering)。

      這一變革迅速在頂尖技術圈層引發了共振。從LangChain到OpenAI,再到Anthropic,一批最核心的技術玩家不約而同地將重心從“模型能力”轉向“系統工程”,并逐漸收斂到一個新的共識公式:Agent=Model+Harness。



      在這一背景下,一些問題也隨之而來,那就是當所有頭部廠商開始押注Harness,其究竟只是大模型走向成熟之前的“過渡方案”,還是正在成為企業落地AI的第一道工序?

      一、不智能、不可控:行業開始尋找Agent“韁繩”

      為什么所有頭部廠商都在押注Harness?

      先來看一組來自Gartner的調研數據,數據顯示全球企業AI項目中,僅有不到15%真正實現了規模化業務落地,而“智能體在復雜任務中的穩定性不足”,被78%的企業AI負責人列為落地的第一大障礙。

      這一落地困境,在頭部廠商的技術反饋中得到了反復證實。

      微軟直言不諱地指出,目前的Agent開發缺乏有效的trace(追蹤)機制,一旦任務失敗,開發者幾乎只能靠“猜”來調試;

      Anthropic則在技術文檔中揭示了兩個深層缺陷:一是上下文焦慮,模型在處理長任務時會逐漸喪失連貫性,甚至因為接近上下文上限而產生草草收尾的“厭工”情緒;二是盲目樂觀,模型極度不擅長自我質量判定,對其產出的結果往往表現出過度的自信。

      與此同時,OpenAI也發出預警,在多Agent協作和工具調用日益頻繁的今天,PromptInjection(提示詞注入)和私密數據泄露等安全風險正被無限放大。

      這些問題疊加,最終在企業側形成四個直接后果,那就是效果不穩定、風險不可控、問題無法追責、ROI無法證明。而這背后,其實不是“模型不夠聰明”,而是企業缺少一套能讓AI持續、可靠、大規模運行的“操作系統”。



      回看過去三年,AI的形態已經發生了本質變化。2022到2024年的AI,更像是一個高級問答機器人。而到了2026年,AI第一次真正具備了連續工作的能力,其可以拆解任務、調用工具、跨系統執行流程,甚至在一定程度上自主決策。

      這是一種質變,但也正是在這一刻,問題暴露得更加徹底。AI不再是“關在籠子里的倉鼠”,而是變成了一匹可以自己狂奔的烈馬。別人騎它,可以縱橫馳騁;但企業一旦上馬,卻往往直接“摔斷腿”。

      于是整個行業開始意識到一個殘酷的現實,那就是AI的上限,不再由模型決定,而是由“你能不能駕馭它”決定。

      2026年2月,一個關鍵轉折點出現。LangChain團隊的一項實驗中發現,研究人員使用相同的模型(GPT-5.2-Codex),在不改變參數的情況下,僅通過優化Harness,就使該模型在Terminal Bench2.0測試中的分數從52.8飆升至66.5,排名從Top30直接沖入Top5。

      可以發現,模型沒有變,能力卻發生了躍遷。

      這成為一個強烈信號,即行業真正缺的,從來不是“更聰明的AI”,而是一套能馴服AI,讓AI平穩著陸的工程體系。也正是在這一背景下,Harness Engineering(駕馭工程)被正式提出,成為一個能讓AI持續、可靠、大規模工作的“韁繩”,推動AI落地的一個新希望。

      二、Harness,一個讓企業AI平穩著陸的土壤體系

      如果AI難落地的本質是AI失控,那么Harness真正要做的,就是把一個概率性的系統,變成一個工程化系統。

      從底層原理上看,大模型本質是“概率分布生成器”,而不是確定性系統。一項2026年的研究指出,即使在高分benchmark上表現優秀的Agent,在多次重復執行中成功率會從60%下降到25%,穩定性遠低于企業級系統要求。這意味著模型的“平均正確”,在企業場景里等于“不可用”。

      這就引出第一個核心問題:企業無法判斷AI為什么出錯。

      傳統Agent運行像個黑盒,報錯了不知道是模型推理失誤,還是工具調用異常,還是外部系統超時。而在企業系統中,“不可解釋”本身就是不可接受的。也正因為缺乏可觀測性,大量AI項目卡在調試階段無法推進,行業普遍將“可追溯性缺失”視為無法進入生產環境的核心障礙。



      因此,Harness的第一步,不是優化模型,而是讓過程可見。

      其可以記錄Agent的每一步思考軌跡、工具調用參數及上下文,并在檢測到“邏輯死循環”或“異常路徑”時觸發回滾或人工接管,把黑盒行為變成可調試系統。

      但問題并不止于“看不見”,更嚴重的是即使看見了,其也會越來越亂。在長任務中,模型會產生“上下文焦慮”,任務越長,系統越不穩定,且模型容易產生非法指令或數據泄露。

      也就是說,失控并不是偶發,而是隨復雜度指數級放大。因此,Harness的第二個作用,便是限制模型的“認知負載”。其不會把所有數據一次性塞給模型,而是基于任務節點,精準喂送“必要知識”,保持模型的清醒度。

      不過,即便控制了過程長度,還有一個更隱蔽的問題,那就是模型不知道自己錯了。

      現實中,大量企業AI項目之所以不敢上線,是因為模型自評往往“盲目樂觀”,企業不敢直接把AI產出的結果發給客戶。

      因此,Harness的第三層能力,是會調用另一個專門負責“審計”的模型,對主Agent的輸出進行糾錯。從“自評系統”升級為“外部評價系統”,建立結果的可信度。

      但到這里,問題還沒有結束。

      要知道,當AI真正進入企業環境時,其面對的已經不是單一任務,而是一個復雜系統,例如ERP、CRM、數據倉庫、低代碼平臺、API網關等等。

      而AI需要調動ERP、CRM、低代碼平臺等上百個接口,單純的Function Call極易崩盤。數據顯示,超過60%的AI失敗,來自任務范圍失控與數據問題,本質上都是“系統復雜度超出承載能力”。也就是說,前面包括黑盒、失控、幻覺所有問題,在“系統集成”這一層會被進一步放大。

      因此,Harness的最后一層作用,便是充當了萬能適配器,將企業內部陳舊、非標的數據接口轉化為AI可讀的標準化協議,使得企業可以統一管理調用路徑、權限與狀態。

      總的來說,Harness解決的不是AI“能不能”做的問題,而是讓AI可以被設計、可以被控制、可以被評估、可以被放進真實業務流程。將原本靠概率輸出的AI能力,封裝進了標準化、可預測、可審計的工業流程中,實現AI真正落地企業業務。

      三、后Agent時代:AI落地不再只是技術命題

      Harness真的會成為Agent能否落地的新內核嗎?

      其實,業內對于這一定論早有爭議。

      以OpenAI、Anthropic為代表的大模型派認為,隨著模型推理能力、長上下文能力不斷提升,未來的Agent會越來越“自洽”,Harness只是一個階段性“腳手架”。

      換句話說,大模型派認為,只要馬足夠強,它自己就能拉著貨跑。現在的馬還需要套復雜的挽具,是因為馬還不夠聰明。等以后馬進化成“神馬”,這些復雜的木架子和繩子都是累贅,只會阻礙馬的發揮。

      但另一派,則來自更偏工程和落地的一側。

      LangChain創始人Harrison Chase公開強調:性能提升往往來自“外部系統優化,而非模型升級”;Microsoft的Satya Nadella多次提到,AI要進入企業核心系統,必須具備“可觀測性、可控性和安全邊界”。

      這背后的判斷是模型再強,也只是“能力單元”,而不是“生產系統”。即馬再強也是畜力,沒有車廂和輪子,貨沒地方放。沒有韁繩,馬會亂跑。在企業里,貨物就是“業務數據”,目的地就是“完成任務”。沒有這套精密的工程結構,AI永遠無法安全、準確地落地。

      換句話說,模型決定“能做到什么”,但Harness決定“能不能穩定做到”。

      從這個角度看,兩派的分歧,其實對應著兩個不同的問題:一個在回答“AI的上限在哪里”,另一個在回答“AI能不能被用”。

      不過就目前而言,大家不再爭論誰取代誰,而是開始搞“組合拳”。



      一方面,模型廠商開始主動向Harness層延伸。OpenAI推出Agents SDK、Codex,將模型能力直接嵌入執行環境;Anthropic推出MCP和Agent Skills,把上下文管理與流程能力產品化。這說明一個趨勢:即使是最堅定的“模型派”,也開始補齊系統層能力,因為單靠模型已經無法支撐復雜任務執行。

      另一方面,工程框架也在持續“吃模型紅利”。畢竟LangChain、AutoGen、CrewAI等框架,本質上還是依賴更強模型來提升能力上限。

      于是,一個交叉融合的格局逐漸形成。模型廠商開始做系統,系統廠商依賴模型,雙方都在向對方的能力邊界滲透。

      這種融合也進一步催生了更細分的產業形態。有的公司專注“翻譯層”,把企業內部復雜、非結構化的數據(PDF、Excel、數據庫)轉化為模型可理解的上下文;有的公司做“行業化Harness”,例如在法律、金融等場景中,將任務流程固化為模板,用戶只需輸入材料,系統即可自動執行分析;還有一類則在做多模型協作,讓Harness成為“指揮官”,根據任務類型調度不同模型,例如讓GPT負責生成內容,讓Claude負責代碼,讓本地模型處理敏感數據。

      這些形態的共同點是不再把模型當作“產品”,而是當作“組件”。但如果再往深一層看,這場爭論其實也帶有明顯的“立場色彩”。模型公司更強調模型的重要性,因為那是其核心資產;

      框架公司強調Harness,因為那是其價值所在;而企業側,則更關注“數據與流程”,因為那才是最終決定ROI的因素。

      換句話說,這不僅是技術路徑之爭,也是一種商業利益的投射。某種程度上,每一方都在強化“對自己最有利的那一層”。

      因此,回到最初的問題,Harness是過渡方案,還是新內核?

      從當前趨勢來看,它更像是一個“不可逆的中間層”。就像操作系統之于硬件,數據庫之于應用,Harness正在成為AI與現實世界之間的那一層“接口”。當AI從“會說話”走向“能干活”,Harness,就是那根決定它能跑多遠的韁繩。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      越南準備成為下一個烏克蘭?一旦中越開戰,中國不會再次手下留情

      越南準備成為下一個烏克蘭?一旦中越開戰,中國不會再次手下留情

      阿萔影視評論
      2026-05-22 17:40:02
      愛運動的美女更迷人

      愛運動的美女更迷人

      藍色海洋009
      2026-05-15 21:03:09
      大S年輕時房間曝光,太過詭異引人不適,難怪有人曾說活不過50歲

      大S年輕時房間曝光,太過詭異引人不適,難怪有人曾說活不過50歲

      草莓解說體育
      2026-05-11 20:49:33
      暗諷老東家!坎塞洛祝賀利雅得勝利奪冠,直言守諾的人才有好結局

      暗諷老東家!坎塞洛祝賀利雅得勝利奪冠,直言守諾的人才有好結局

      星耀國際足壇
      2026-05-23 15:40:25
      梟龍剛摔完,教練機又墜毀!巴基斯坦緊急表態,把鍋甩給了誰

      梟龍剛摔完,教練機又墜毀!巴基斯坦緊急表態,把鍋甩給了誰

      書紀文譚
      2026-05-23 14:22:42
      哈曼:德國隊不該帶穆西亞拉,他現在根本幫助不了球隊

      哈曼:德國隊不該帶穆西亞拉,他現在根本幫助不了球隊

      懂球帝
      2026-05-23 12:07:23
      偷情過后,男人和女人誰更想“再來一次”?答案很真實

      偷情過后,男人和女人誰更想“再來一次”?答案很真實

      心理觀察局
      2026-05-20 07:40:06
      何穗這些年變化也太大了,今昔對比,簡直不敢相信竟是同一個人

      何穗這些年變化也太大了,今昔對比,簡直不敢相信竟是同一個人

      草莓信箱
      2026-05-14 10:04:37
      連續14個跌停板!股民:壯士一去不復返!

      連續14個跌停板!股民:壯士一去不復返!

      數據挖掘分析
      2026-05-23 14:40:40
      為什么都討厭阿森納?|顏強專欄

      為什么都討厭阿森納?|顏強專欄

      顏強
      2026-05-22 13:30:35
      男人搞定50歲女人最好方法,喂飽了她兩個需求,她就會主動依你

      男人搞定50歲女人最好方法,喂飽了她兩個需求,她就會主動依你

      心理觀察局
      2026-05-04 08:20:08
      生育大局已定:不出意外的話,26年起中國人口將迎來3大明顯變化

      生育大局已定:不出意外的話,26年起中國人口將迎來3大明顯變化

      阿鳧愛吐槽
      2026-05-23 04:14:26
      新婚15天,就爆不倫!人妻私訊:穿最色內褲求歡,床照全網瘋傳!

      新婚15天,就爆不倫!人妻私訊:穿最色內褲求歡,床照全網瘋傳!

      川渝視覺
      2026-05-18 08:58:21
      印度“空手套白狼”徹底翻車!中國這一記“回馬槍”,斬斷了莫迪的野心

      印度“空手套白狼”徹底翻車!中國這一記“回馬槍”,斬斷了莫迪的野心

      華山穹劍
      2026-05-23 18:57:17
      菲律賓美女部長,身材曼妙高挑挺拔,曾穿裙子去機場接中國游客

      菲律賓美女部長,身材曼妙高挑挺拔,曾穿裙子去機場接中國游客

      人間無味啊
      2026-05-10 03:46:25
      16年基業10多天崩塌,匈牙利的大變局已經無法阻擋!

      16年基業10多天崩塌,匈牙利的大變局已經無法阻擋!

      寰球經緯所
      2026-05-23 14:22:16
      好萊塢種馬查理:瘋狂的和陌生人發生關系,連男人都不放過

      好萊塢種馬查理:瘋狂的和陌生人發生關系,連男人都不放過

      七阿姨愛八卦
      2026-05-16 16:05:36
      東京西部山區驚現“半截遺體”,恐是近十年首起熊襲致死事件:上半身已缺失

      東京西部山區驚現“半截遺體”,恐是近十年首起熊襲致死事件:上半身已缺失

      紅星新聞
      2026-05-22 16:18:14
      當美國人讓印度人滾回印度去,印度人的回答徹底讓美國人破防了!

      當美國人讓印度人滾回印度去,印度人的回答徹底讓美國人破防了!

      賤議你讀史
      2026-05-23 15:55:03
      萬項——2026年U17亞洲杯中國隊MVP

      萬項——2026年U17亞洲杯中國隊MVP

      中場陰謀家
      2026-05-23 21:44:26
      2026-05-24 01:52:49
      產業家
      產業家
      產業互聯網第一媒體
      1149文章數 1339關注度
      往期回顧 全部

      科技要聞

      爆炸聲中又邁一步!拆解馬斯克“十二飛”

      頭條要聞

      媒體:針對兩岸關系 鄭麗文最新表態說了句很直白的話

      頭條要聞

      媒體:針對兩岸關系 鄭麗文最新表態說了句很直白的話

      體育要聞

      少年意氣,正在改變中國足球

      娛樂要聞

      《浪姐7》三公,王濛贏麻了,張月實慘

      財經要聞

      股價暴跌!富途老虎是什么來頭?

      汽車要聞

      2027款星途瑤光上市 把"全球車"標準卷進13萬級市場

      態度原創

      健康
      房產
      游戲
      教育
      公開課

      外泌體 ≠ 生長因子!它們之間究竟有何區別?

      房產要聞

      瘋搶511輪!今年海南最魔幻的地塊,被福建能源企業搶了!

      硬剛PS6和新Xbox:數毛社篤定NS2力戰至2030年!

      教育要聞

      當下英國留學生的困境!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 真人作爱免费视频| 丰满人妻无码∧v区视频| 亚洲8888| 99re66| 欧美国产日韩在线三区| 亚洲欧洲av| 久久天天躁夜夜躁狠狠820175| 国产91麻豆精品成人区| 亚洲欧洲一区二区三区久久| 亚洲一区中文字幕在线观看| 樱桃熟了a级毛片| 无码久久久| 青草视频在线观看免费| 国产成人av乱码在线观看| 免费看成人欧美片爱潮app| 内射极品少妇xxxxxhd| 九九热九九| 欧美不卡无线在线一二三区观| 日韩乱码人妻无码超清蜜桃| 久久人人爽人人爽人人片aV东京热 | 尤物tv.2722| 亚洲中文字幕在线精品一区| 精品视频不卡免费观看| 国产免费永久精品无码| 欧洲中文字幕一区二区 | 五月婷丁香| 国产一区日韩二区三区| 69avav?cn| 图片| 色五月丁香五月| 五月天婷婷在在线视频| 99热精品毛片全部国产无缓冲| 久人人爽人人爽人人片av| 国产精品成人一区二区不卡| 黄页网址大全免费观看美女| 国产综合AV| 美女人妻激情乱人伦| 亚洲国产超清无码专区| 久久精品国产精品青草app | 国产成人91色精品免费网站 | 日韩欧美的偷拍?一区二区|