<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      AI 寫代碼太快,人類測試跟不上了,Meta 用新方法把 bug 檢出率提升 4 倍

      0
      分享至


      作者 | Leela Kumili

      譯者 | 田橙

      Meta 報告稱,通過一種 即時(Just-in-Time,JiT)測試方法 提升了軟件質(zhì)量。該方法在代碼評審期間動態(tài)生成測試,而不是依賴長期存在、需要人工維護的測試套件。根據(jù) Meta 的工程博客及相關研究,這一方法在 AI 輔助開發(fā)環(huán)境中將缺陷檢測能力提升了約 4 倍。

      這一轉(zhuǎn)變源于代理式工作流的興起,在這種工作流中,AI 系統(tǒng)越來越多地生成或修改大段代碼。在這種環(huán)境下,傳統(tǒng)測試套件面臨更高的維護開銷且效果下降,因為脆弱的斷言和過時的覆蓋率難以及時跟上快速變化。

      正如 ICT 系統(tǒng)測試工程師 Ankit K. 所 觀察到的:

      AI 生成代碼和測試的速度已經(jīng)超過了人類的維護能力,JiT 測試因此幾乎成了必然選擇。

      JiT 測試通過在拉取請求階段基于具體代碼差異生成測試來解決這一問題。與靜態(tài)驗證不同,該系統(tǒng)會推斷開發(fā)者意圖,識別潛在的失效模式,并構建有針對性的測試,在存在回歸問題時使其失敗。它專注于捕獲回歸的測試——這些測試在提議的更改上失敗,但在父版本上通過。這是通過一個結合大語言模型、程序分析和變異測試的流水線實現(xiàn)的,其中會注入合成缺陷以驗證生成的測試是否能夠檢測到它們。

      正如 Meta 研究科學家 Mark Harman 所 指出 的:

      這項工作體現(xiàn)了一種根本性的轉(zhuǎn)變:不再只是讓現(xiàn)有測試更穩(wěn),而是轉(zhuǎn)向去發(fā)現(xiàn)未來可能出現(xiàn)的問題。

      一個關鍵組件是 Dodgy Diff 與意圖感知工作流架構,它將代碼變更重新定義為語義信號,而非文本差異。系統(tǒng)會分析 diff,以提取行為意圖和風險區(qū)域,然后執(zhí)行意圖重建和變更風險建模,以理解哪些內(nèi)容可能因此而出錯。這些信號被輸入到變異引擎中,生成“可疑”的代碼變體,用以模擬真實的失敗場景。隨后,一個基于 LLM 的測試合成層會生成與推斷意圖一致的測試,并通過過濾去除噪聲或低價值測試,最終在拉取請求中呈現(xiàn)結果。

      Meta 報告稱,通過一種 即時(Just-in-Time,JiT)測試方法 提升了軟件質(zhì)量。該方法在代碼評審期間動態(tài)生成測試,而不是依賴長期存在、需要人工維護的測試套件。根據(jù) Meta 的工程博客及相關研究,這一方法在 AI 輔助開發(fā)環(huán)境中將缺陷檢測能力提升了約 4 倍。

      這一轉(zhuǎn)變源于代理式工作流的興起,在這種工作流中,AI 系統(tǒng)越來越多地生成或修改大段代碼。在這種環(huán)境下,傳統(tǒng)測試套件面臨更高的維護開銷且效果下降,因為脆弱的斷言和過時的覆蓋率難以及時跟上快速變化。

      正如 ICT 系統(tǒng)測試工程師 Ankit K. 所 觀察到的:

      AI 生成代碼和測試的速度已經(jīng)超過了人類的維護能力,JiT 測試因此幾乎成了必然選擇。

      JiT 測試通過在拉取請求階段基于具體代碼差異生成測試來解決這一問題。與靜態(tài)驗證不同,該系統(tǒng)會推斷開發(fā)者意圖,識別潛在的失效模式,并構建有針對性的測試,在存在回歸問題時使其失敗。它專注于捕獲回歸的測試——這些測試在提議的更改上失敗,但在父版本上通過。這是通過一個結合大語言模型、程序分析和變異測試的流水線實現(xiàn)的,其中會注入合成缺陷以驗證生成的測試是否能夠檢測到它們。

      正如 Meta 研究科學家 Mark Harman 所 指出 的:

      這項工作體現(xiàn)了一種根本性的轉(zhuǎn)變:不再只是讓現(xiàn)有測試更穩(wěn),而是轉(zhuǎn)向去發(fā)現(xiàn)未來可能出現(xiàn)的問題。

      一個關鍵組件是 Dodgy Diff 與意圖感知工作流架構,它將代碼變更重新定義為語義信號,而非文本差異。系統(tǒng)會分析 diff,以提取行為意圖和風險區(qū)域,然后執(zhí)行意圖重建和變更風險建模,以理解哪些內(nèi)容可能因此而出錯。這些信號被輸入到變異引擎中,生成“可疑”的代碼變體,用以模擬真實的失敗場景。隨后,一個基于 LLM 的測試合成層會生成與推斷意圖一致的測試,并通過過濾去除噪聲或低價值測試,最終在拉取請求中呈現(xiàn)結果。


      Dodgy diff 和意圖感知工作流用于生成即時捕獲(Just-in-Time Catches)的架構

      Meta 表示,該系統(tǒng)在超過 22,000 個生成測試上進行了評估。結果顯示,與基線生成測試相比,缺陷檢測能力提升了 4 倍;與偶然結果相比,在檢測有意義失敗方面最高提升達 20 倍。在一個評估子集中,共識別出 41 個問題,其中 8 個被確認是真實缺陷,包括若干可能影響生產(chǎn)環(huán)境的問題。

      Mark Harman 在另一篇 LinkedIn 帖子 中強調(diào):

      變異測試在學術圈沉寂了幾十年之后,終于開始走向工業(yè)界,并正在重塑實用且可擴展的軟件測試 2.0。

      捕獲型 JiT 測試專為 AI 驅(qū)動的開發(fā)設計,按每次變更生成,用于在無需持續(xù)維護的情況下檢測嚴重且意外的缺陷。它們通過隨著代碼演進自動適配并將工作從人類轉(zhuǎn)移到機器,從而減少脆弱的測試套件。只有在發(fā)現(xiàn)有意義的問題時才需要人工審查。這將測試從靜態(tài)正確性驗證重新定義為面向特定變更的故障檢測。

      https://www.infoq.com/news/2026/04/meta-jit-testing-ai-detection/

      聲明:本文由 InfoQ 翻譯,未經(jīng)許可禁止轉(zhuǎn)載。

      會議推薦

      世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構,還能撐多久?

      AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態(tài)智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業(yè)級研發(fā)體系重構。14 個專題全面開放征稿。

      誠摯邀請你登臺分享實戰(zhàn)經(jīng)驗。AICon 2026,期待與你同行。

      今日薦文

      你也「在看」嗎?

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      破防!阿森納奪冠夜現(xiàn)悲情一幕,3 人陪跑無獎牌

      破防!阿森納奪冠夜現(xiàn)悲情一幕,3 人陪跑無獎牌

      一隅非生
      2026-05-20 07:06:11
      吉利新車官宣:5月19日,正式上市!

      吉利新車官宣:5月19日,正式上市!

      科技堡壘
      2026-05-19 09:50:17
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      健康科普365
      2026-05-09 21:05:04
      廣州常住人口首破1900萬背后:白云番禺領漲,三區(qū)負增長

      廣州常住人口首破1900萬背后:白云番禺領漲,三區(qū)負增長

      南方都市報
      2026-05-19 16:50:51
      一聲槍響,全球震動!特朗普高調(diào)宣布:斬首成功,我們擊斃了他!

      一聲槍響,全球震動!特朗普高調(diào)宣布:斬首成功,我們擊斃了他!

      鐵血江湖人
      2026-05-20 02:58:29
      京東官宣今年618從5月30日晚8點開始,未來有望實現(xiàn)包裹全流程無人配送直達用戶手中

      京東官宣今年618從5月30日晚8點開始,未來有望實現(xiàn)包裹全流程無人配送直達用戶手中

      極目新聞
      2026-05-18 16:25:23
      侵犯公民人身自由國家賠償金,最新標準公布

      侵犯公民人身自由國家賠償金,最新標準公布

      南方都市報
      2026-05-19 14:45:00
      特斯拉放棄印度建廠

      特斯拉放棄印度建廠

      新浪財經(jīng)
      2026-05-19 16:29:08
      塔帥擊碎質(zhì)疑 執(zhí)教7年終登頂英超 復制溫格足跡 44歲奪冠緊追穆帥

      塔帥擊碎質(zhì)疑 執(zhí)教7年終登頂英超 復制溫格足跡 44歲奪冠緊追穆帥

      我愛英超
      2026-05-20 05:55:30
      就她了!神舟二十三號三人組預測,港產(chǎn)女載荷專家首秀將打破紀錄

      就她了!神舟二十三號三人組預測,港產(chǎn)女載荷專家首秀將打破紀錄

      日不西沉
      2026-05-20 03:26:27
      《主角》黃正經(jīng)升局長,米蘭嫁人,才懂楚嘉禾示好易青娥多憋屈

      《主角》黃正經(jīng)升局長,米蘭嫁人,才懂楚嘉禾示好易青娥多憋屈

      八斗小先生
      2026-05-19 11:13:46
      母子同床15年?狄鶯終于將寶貝兒子送進了監(jiān)獄!

      母子同床15年?狄鶯終于將寶貝兒子送進了監(jiān)獄!

      新民周刊
      2026-05-18 14:05:28
      圓夢時刻,漢密爾頓轉(zhuǎn)發(fā)球隊海報祝賀阿森納奪冠:COYG!

      圓夢時刻,漢密爾頓轉(zhuǎn)發(fā)球隊海報祝賀阿森納奪冠:COYG!

      懂球帝
      2026-05-20 06:57:10
      1996年16歲的柳巖,在廣州一所中專學校就讀護理專業(yè)期間拍的照片

      1996年16歲的柳巖,在廣州一所中專學校就讀護理專業(yè)期間拍的照片

      戶外阿毽
      2026-05-19 13:00:42
      韓媒:朝鮮女足粗魯無禮!她們和中國隊擊掌問候,卻拒與日韓握手

      韓媒:朝鮮女足粗魯無禮!她們和中國隊擊掌問候,卻拒與日韓握手

      劉哥談體育
      2026-05-19 13:00:15
      烏克蘭打擊莫斯科,魏德爾嚇壞了,她怒斥烏克蘭襲擊俄羅斯本土!

      烏克蘭打擊莫斯科,魏德爾嚇壞了,她怒斥烏克蘭襲擊俄羅斯本土!

      開著車去流浪
      2026-05-20 00:40:17
      年僅54歲!武漢協(xié)和冷松因病醫(yī)治無效去世

      年僅54歲!武漢協(xié)和冷松因病醫(yī)治無效去世

      華醫(yī)網(wǎng)
      2026-05-19 15:21:37
      勇士隊傳聞:內(nèi)部人士承認今夏補強陣容對抗雷霆和馬刺“不現(xiàn)實”

      勇士隊傳聞:內(nèi)部人士承認今夏補強陣容對抗雷霆和馬刺“不現(xiàn)實”

      好火子
      2026-05-20 05:00:02
      西方媒體證實:中國飛弩-16現(xiàn)身俄烏戰(zhàn)場,攔截成功率70%

      西方媒體證實:中國飛弩-16現(xiàn)身俄烏戰(zhàn)場,攔截成功率70%

      流年顛簸
      2026-05-20 02:55:43
      丑人多作怪?被“網(wǎng)暴”多年后傅首爾終于急了,怪不得網(wǎng)友嘴太毒

      丑人多作怪?被“網(wǎng)暴”多年后傅首爾終于急了,怪不得網(wǎng)友嘴太毒

      琴琴有氧運動
      2026-05-19 04:47:56
      2026-05-20 07:40:49
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發(fā)者和科學家,提供AI領域技術資訊。
      1509文章數(shù) 149關注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      伊朗最新和平方案披露 濃縮鈾只能運往俄羅斯

      頭條要聞

      伊朗最新和平方案披露 濃縮鈾只能運往俄羅斯

      體育要聞

      文班亞馬:沒拿到MVP,就證明自己是MVP

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經(jīng)要聞

      白酒榜|汾酒營收凈利雙增 口子窖"造富"

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態(tài)度原創(chuàng)

      房產(chǎn)
      教育
      健康
      數(shù)碼
      公開課

      房產(chǎn)要聞

      7516元/㎡,161套一次全甩!海口住宅最低價出現(xiàn)了!

      教育要聞

      我談“ 轉(zhuǎn)作風提能力”

      專家揭秘干細胞回輸?shù)陌踩L險

      數(shù)碼要聞

      谷歌Google TV整合Gemini,提升內(nèi)容發(fā)現(xiàn)、改善瀏覽交互

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产欧美日韩一区二区三区| 【_undefined?-?P站免费版?-?永久免费的福利视频平台】 | 一区二区三区免费观看| 天天狠狠操| 欧美日本国产亚洲网站免费一区二区 | 四平市| 久久久www成人免费无遮挡大片| 日韩熟妇中文色在线视频| 越南毛茸茸的少妇| 无码精品人妻一区二区三区影院| 美女扒开奶罩露出奶头视频网站 | 免费国产午夜理论片不卡| 熟女丝袜逼| 高雄县| 亚洲日日噜噜噜夜夜爽爽| 性欧美VIDEOFREE高清大喷水| 国产最新AV在线播放不卡| 国产成人精品无码免费看| 免费精品国产一区二区三区 | 婷婷综合缴情亚洲狠狠| 国产精品久久露脸蜜臀| 亚洲无码18禁| 亚洲成人a√| caopor在线| 报价| 在线播放无码高潮的视频| 亚洲色大成永久WW网站| 亚洲综合在线视频| 99国精产品自偷自偷综合| 中文字幕亚洲欧美专区| 亚洲欧美人成人让影院| 日韩深夜视频在线观看| 日本丰满熟妇videossex8k| 青草碰人人澡人人澡| 日韩大片一区二区三区| 99在线观看视频只有精品| 中文字幕日本人妻| 精品视频在线观看免费无码| 好男人视频在线播放| 欧洲免费一区二区三区视频| 精品国产三级a∨在线观看|