<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      ICML 2026|OFA-TAD邁向one-for-all通用異常檢測新范式

      0
      分享至



      表格異常檢測(Tabular Anomaly Detection,TAD)旨在從結構化數據中精準識別顯著偏離正常分布的稀有樣本,其在醫療診斷、金融風控及網絡安全等關鍵領域的數據挖掘與安全保障任務中發揮著核心作用。

      然而,當前大多數 TAD 方法仍然遵循一種one-for-one(OFO)范式:每來一個新數據集,就要重新訓練一個專屬檢測器,甚至重新調參、重新選擇預處理方式。這不僅帶來高昂的計算和運維成本,也讓模型難以泛化到未知領域。

      那么,表格異常檢測能否像大模型一樣,訓練一次,就能遷移到不同領域的數據表上,實現真正的one-for-all(OFA)

      近期,來自 Griffith University 和 Tongji University 的團隊提出了 OFA-TAD,邁出了通用表格異常檢測的重要一步。該方法將 TAD 從傳統的 one-for-one(OFO)推進到 one-for-all(OFA)范式:模型只需在多個源數據集上訓練一次,便可直接遷移到未見過的目標數據集,無需目標域微調或重新訓練。



      圖注:傳統 OFO 范式與 OFA-TAD 所追求的 OFA 范式對比。



      • 論文標題:Towards One-for-All Anomaly Detection for Tabular Data
      • 作者:Shiyuan Li,Yixin Liu,Yu Zheng,Xiaofeng Cao,Shirui Pan,Heng Tao Shen
      • 論文地址:https://arxiv.org/abs/2603.14407
      • 代碼地址:https://github.com/Shiy-Li/OFA-TAD

      從 one-for-one 到 one-for-all:

      表格異常檢測的新問題

      傳統 TAD 方法通常在單個數據集內訓練和測試。無論是經典的 Isolation Forest、LOF、KNN,還是近年來的 AutoEncoder、DeepSVDD、MCM、DRL、DisentAD 等深度方法,它們大多默認每個數據集都有自己的訓練流程。

      這種范式在單一數據集上可能表現不錯,但在真實部署中會遇到兩個核心問題:

      • 訓練成本高:每個新場景都需要重新訓練檢測器,往往還伴隨超參數搜索和預處理選擇。
      • 泛化能力弱:模型容易依賴某個數據集的局部模式,一旦遷移到新領域,性能可能明顯下降。

      OFA-TAD 試圖回答一個更具挑戰性的問題:能否訓練一個通用的表格異常檢測器,在面對來自醫療、金融、圖像特征、網絡安全等不同領域的新數據表時,仍然能夠即插即用地發現異常?

      這一問題并不簡單。表格數據天然存在「語義鴻溝」:不同數據集的特征維度、特征含義和數值分布都可能完全不同。醫療數據中的異常可能是異常血壓或心率,金融數據中的異常則可能是異常交易金額或賬戶行為。直接對齊原始特征語義,幾乎不可行。

      關鍵洞見:異常的共性

      不在特征語義,而在鄰域距離

      OFA-TAD 的核心洞見是:跨領域可遷移的異常信號,不應依賴具體特征含義,而應來自更通用的鄰域結構。

      無論是異常病人記錄、欺詐交易,還是異常網絡行為,它們往往都有一個共同點:相對于正常樣本,它們更「孤立」,也就是與局部鄰居的距離模式更不尋常。

      因此,OFA-TAD 不直接學習原始表格特征,而是將每個樣本表示為其 Top-K 近鄰距離序列,即「鄰居距離畫像」。這種表示具有兩個優勢:

      • 語義無關:不依賴具體列名或領域含義,不同維度的數據表也能被轉化為固定長度的距離序列。
      • 異常敏感:異常樣本通常會在近鄰距離曲線上表現出更明顯的跳變、長尾或孤立特征。

      換句話說,OFA-TAD 將不同領域的數據表,統一轉化為一種可比較的「距離語言」。

      多視角距離編碼:

      讓模型自動適應不同數據變換

      僅使用一種距離空間仍然不夠。表格數據對預處理方式高度敏感:標準化、歸一化、分位數變換等操作,都會改變樣本之間的鄰域關系。某些異常在標準化空間中更明顯,另一些異??赡茉?MinMax 或 Quantile 空間中更容易被發現。



      圖注:不同特征變換會顯著改變近鄰結構與異??煞中浴:Raw,S:Standardized,and Q:Quantile。

      為了解決這一問題,OFA-TAD 構建了多個由不同特征變換誘導的度量空間,例如 Raw、Standardized、MinMax、Quantile 等。對于同一個樣本,模型會在每個視角下提取 Top-K 鄰居距離序列,并通過分位數歸一化將不同數據集中的距離尺度映射到統一范圍。

      這樣,OFA-TAD 既避免了對某一種預處理方式的依賴,也能捕獲互補的異常證據。

      MoE 自適應融合:

      讓每個樣本選擇最可靠的距離視角

      不同視角并非同等可靠。如果簡單拼接或平均多個距離視角,反而可能讓強信號被弱視角稀釋。

      為此,OFA-TAD 進一步引入了 Mixture-of-Experts(MoE)評分網絡:

      • 視角專家:每個專家負責一個特定距離視角,利用位置編碼和注意力池化建模 Top-K 鄰居距離序列,并輸出該視角下的異常分數。
      • 門控網絡:根據不同視角的表征,動態預測每個專家的權重。
      • 加權融合:模型根據樣本自身特點,自適應強調最有用的視角,抑制噪聲視角,得到最終異常分數。



      圖注:OFA-TAD 的整體框架:多視角距離編碼、MoE 自適應評分,以及多策略偽異常合成。

      這種設計使得 OFA-TAD 不需要提前知道某個目標數據集最適合哪種預處理方式,而是能在推理時自動選擇更可靠的距離證據。

      沒有真實異常標簽怎么辦?

      多策略合成偽異常

      表格異常檢測通常處于 one-class setting:訓練階段只有正常樣本,真實異常極少甚至完全不可見。為了在不破壞這一設定的前提下提供監督信號,OFA-TAD 設計了多策略偽異常合成機制。

      具體而言,模型通過四類方式生成多樣化的偽異常:

      • 流形外推:模擬遠離正常數據流形的全局異常。
      • 簇間插值:模擬落在低密度區域的局部異常。
      • 噪聲注入:模擬測量誤差或隨機擾動。
      • 特征遮蔽:模擬數據缺失或特征損壞。

      這些偽異常與正常樣本共同構成訓練信號,幫助模型學習更穩健、可遷移的異常決策邊界。

      實驗結果:34 個數據集、

      14 個領域上的通用檢測能力

      實驗中,OFA-TAD 在 7 個源數據集上訓練一次,并在 34 個來自 14 個領域的數據集上進行評測。與之對比的 9 個代表性基線方法,包括經典方法 IForest、LOF、KNN,以及深度方法 AE、DeepSVDD、LUNAR、MCM、DRL、DisentAD。

      值得注意的是,對比方法按照傳統 OFO 范式在每個目標數據集上分別訓練,而 OFA-TAD 不在目標數據集上重新訓練或微調,僅使用目標數據集的正常訓練樣本作為推理時的上下文,用于近鄰檢索和距離歸一化,并且使用固定的相同一組超參數在所有目標數據集上進行測試。

      1)整體性能:一次訓練,跨 34 個數據集穩定領先

      在這一更嚴格的設置下,OFA-TAD 仍然取得了最優的整體表現。如下圖所示,它在 AUROC、AUPRC 等指標上的平均排名均保持領先。



      2)消融實驗:多視角、MoE 與注意力缺一不可

      消融實驗進一步驗證了各模塊的重要性。如下圖所示,去掉門控融合、MoE 專家、注意力池化或位置編碼都會帶來性能下降,其中注意力池化的影響尤為明顯,說明對鄰居距離證據進行自適應加權,是捕獲稀疏異常信號的關鍵。

      同時,多策略偽異常合成也提供了互補監督信號。移除任意一種合成策略都會造成性能下降,說明真實異常的形態復雜多樣,需要通過多種偽異常模式共同刻畫。



      3)上下文魯棒性:少量正常樣本也能支持即時推理

      OFA-TAD 還展現出良好的上下文魯棒性。即使目標數據集中只有一小部分正常樣本可作為上下文,模型仍能進行穩定的即時推理;隨著上下文樣本增多,性能進一步提升并逐漸趨于飽和。

      這表明 OFA-TAD 可以在有限的正常樣本下快速建立目標域鄰域結構,從而完成 on-the-fly 異常檢測。



      4)dataset-specific scaling

      更進一步,隨著源數據集數量增加,OFA-TAD 的遷移性能呈現穩定提升趨勢。這說明通用表格異常檢測具備類似「dataset-specific scaling」的潛力:預訓練數據越豐富,模型越可能學到跨領域的異常檢測規律。



      總結:邁向通用表格異常檢測器

      OFA-TAD 為表格異常檢測從 one-for-one 向 one-for-all 范式轉變提供了一個初步的嘗試,并在無需目標域微調的跨域遷移場景下展現出了極具潛力的性能。

      未來,通用表格異常檢測仍有廣闊的探索空間。通過引入更大規模的預訓練數據集、設計更先進的訓練方法,以及更深度的上下文信息利用,通用 TAD 模型有望進一步降低工業部署成本,為醫療、金融、安全等高價值場景提供更加靈活可靠的異常檢測基礎設施。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      為什么日本少女總是夾著胸跑步?

      為什么日本少女總是夾著胸跑步?

      馬拉松跑步健身
      2026-05-19 06:30:07
      張本智和連夜搬空日本豪宅,21歲世界第三為何甘愿“逃跑”?

      張本智和連夜搬空日本豪宅,21歲世界第三為何甘愿“逃跑”?

      南宗歷史
      2026-05-20 00:53:41
      韓國年輕人不上班了,去股市賭命了

      韓國年輕人不上班了,去股市賭命了

      熱辣茉莉說
      2026-05-19 21:52:30
      中國男籃VS日本票價出爐:分七檔,最少380元,最高2280元

      中國男籃VS日本票價出爐:分七檔,最少380元,最高2280元

      體育哲人
      2026-05-20 18:32:59
      深圳隊傷病不斷,廣廈隊躺進總決賽;孫悅、劉煒解說京滬大戰G3

      深圳隊傷病不斷,廣廈隊躺進總決賽;孫悅、劉煒解說京滬大戰G3

      孤影來客
      2026-05-20 18:44:06
      嫪毐赴死之際,未作一聲乞求,只給嬴政看了眼他身上的半塊玉佩

      嫪毐赴死之際,未作一聲乞求,只給嬴政看了眼他身上的半塊玉佩

      卡西莫多的故事
      2025-12-24 10:00:50
      日本萬人集會抗議高市政府,現場民眾手舉“中國對不起”標牌

      日本萬人集會抗議高市政府,現場民眾手舉“中國對不起”標牌

      鳳凰衛視
      2026-05-20 16:21:32
      蒙古新總理上任不到兩月!先拿親美派開刀立威,當街免掉首都市長

      蒙古新總理上任不到兩月!先拿親美派開刀立威,當街免掉首都市長

      和??慈粘?/span>
      2026-05-19 16:15:34
      叫板解放軍?臺島公布鎖定殲16戰機照片,為F16戰斗機吊艙所拍攝

      叫板解放軍?臺島公布鎖定殲16戰機照片,為F16戰斗機吊艙所拍攝

      荷蘭豆愛健康
      2026-05-20 17:37:00
      財政部:1—4月證券交易印花稅935億元,同比增長74.8%

      財政部:1—4月證券交易印花稅935億元,同比增長74.8%

      每日經濟新聞
      2026-05-20 16:53:11
      “童顏巨乳”小姐姐來襲!

      “童顏巨乳”小姐姐來襲!

      文刀萬
      2026-05-17 17:06:53
      向佑開通賬號,曬一家四口合影,稱媽媽辛苦了,評論區很暖心!

      向佑開通賬號,曬一家四口合影,稱媽媽辛苦了,評論區很暖心!

      老琴才是我的外號
      2026-05-20 11:49:14
      獨行俠為什么裁掉基德?不怪烏杰里,還剩4年合同,獲賠多少錢?

      獨行俠為什么裁掉基德?不怪烏杰里,還剩4年合同,獲賠多少錢?

      萌蘭聊個球
      2026-05-20 09:52:44
      國乒戀情徹底曝光?陳幸同終于不避嫌,公開稱贊周啟豪,浮想聯翩

      國乒戀情徹底曝光?陳幸同終于不避嫌,公開稱贊周啟豪,浮想聯翩

      草莓解說體育
      2026-05-20 11:46:42
      快訊!張雪機車立大功了!

      快訊!張雪機車立大功了!

      故事終將光明磊落
      2026-05-20 10:01:08
      國企央企加速清退勞務派遣!2026年底前必須整改完,千萬打工人面臨大變動

      國企央企加速清退勞務派遣!2026年底前必須整改完,千萬打工人面臨大變動

      一口娛樂
      2026-05-17 05:59:22
      特朗普才剛回國就干了件大事,推翻對華承諾,絕不讓伊朗好過

      特朗普才剛回國就干了件大事,推翻對華承諾,絕不讓伊朗好過

      黑鷹觀軍事
      2026-05-20 18:41:47
      日本羽毛球女神無緣亞運會 韓媒:中國運動品牌天價合約瞬間不香了

      日本羽毛球女神無緣亞運會 韓媒:中國運動品牌天價合約瞬間不香了

      林子說事
      2026-05-20 16:01:08
      牌局終了:王石,潘石屹和許加印

      牌局終了:王石,潘石屹和許加印

      藍鉆故事
      2026-04-22 01:33:24
      她自爆最近開始和人同居?

      她自爆最近開始和人同居?

      奮斗在韓國
      2026-05-19 19:47:06
      2026-05-20 19:43:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13045文章數 142651關注度
      往期回顧 全部

      科技要聞

      一文看懂谷歌I/O2026:谷歌打響智能體大戰

      頭條要聞

      楊梅被"一刀切"禁入 福建楊梅協會會長懇求給果農生路

      頭條要聞

      楊梅被"一刀切"禁入 福建楊梅協會會長懇求給果農生路

      體育要聞

      不再美麗的阿森納,終于成為英超冠軍

      娛樂要聞

      王菲“沒事兒”,成年人學不來的松弛

      財經要聞

      白酒榜|汾酒營收凈利雙增 口子窖"造富"

      汽車要聞

      煥新極氪009上市41.38萬起 齊家版讓MPV回歸家庭

      態度原創

      家居
      手機
      藝術
      數碼
      公開課

      家居要聞

      日常印記 靜謐溫馨

      手機要聞

      明天發布!小米17 Max跑分出爐:第五代驍龍8至尊版+16GB內存

      藝術要聞

      18幅 玫瑰花與女子畫作

      數碼要聞

      華為舉辦鴻蒙辦公新品技術溝通會,推出自研音樂編創軟件音悅家App

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 波多野结衣av一区二区三区中文| 日韩av每日免费观看| 毛片无码免费无码播放| 国产成人午夜精品影院| 日本va欧美va国产激情| 无码精品视频一区二区三区| 国产亚洲国产亚洲国产亚洲| 99在线热视频只有精品免费| 日韩av在线不卡一区| 国产欧美日韩va另类在线播放| 亚洲欧美在线一区中文字幕| 成人欧美一区二区三区在线观看| 中文字幕亚洲欧美在线不卡| 国产精品久久久久精品日日| 人妻少妇偷人作爱av| 一区二区三区无效卡| 中文字幕中文字幕亚洲| 任你躁国产自任一区二区三区| 精品国产99久久久久久www| 涡阳县| 久热这里只精品99国产6-99RE视… | 精品人妻大屁股白浆无码| 国产乱色熟女一二三四区| 国产视频一区二区| 亚洲中文字幕在线资源第1页 | 日本污视频在线观看| 欧美va天堂在线电影| 久久婷婷五月综合色首页| 成人精品区| 日韩中文字幕免费在线观看| 国产精品无码素人福利不卡| 五月丁香天堂网| 欧美深度肠交惨叫| 98久久人妻少妇激情啪啪| 国产高清在线a视频大全| 久久精品人妻无码一区二区三| 国产精品久久久久久妇女| 亚洲一线二线三线品牌精华液久久久| 国产aV熟妇人震精品| 国产在亚洲线视频观看| 午夜福利影视|