<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      五位作者全部是華人背景,OpenAI參與,重卷ImageNet:終于把FID做成訓練

      0
      分享至

      統治AI圖像生成近10年的黃金標準,第一次被拉下場當了教練。

      我說的是FID(Frechet Inception Distance)。

      這個指標從2017年沿用至今,一直無法無法投入日常訓練使用。

      現在有人打破了這個窘境——

      來自USC、CMU、CUHK和OpenAI的全華陣容研究團隊,提出了一種叫FD-loss的方法,把“算統計的樣本池”和“算梯度的batch”徹底解耦。

      依靠數萬張圖像組成的大容量緩存隊列或指數移動平均機制,穩定完成分布估算,僅針對當下小批量數據開展梯度回傳。

      僅憑這一個idea,長期受限的FID終于能夠作為訓練損失函數,參與模型的直接優化。

      實驗帶來了多項出人意料的結果:

      • 一個已有的單步生成器,后訓練后直接刷出FID 0.72(ImageNet 256×256),而且推理成本零增加。

      • 一個訓練了50步的多步擴散模型,被他們直接repurposing成1步生成器,無需教師蒸餾、無需對抗訓練,效果還能打。

      • 其中最違背固有認知的發現在于,FID數值最優的模型,視覺觀感未必出眾。依托DINOv2、MAE、SigLIP等前沿視覺表征訓練的模型,FID表現不如基于Inception架構優化的版本,但畫面物體結構完整性與細節還原度都會明顯更好。


      業內長期扎堆優化FID分數,可這項沿用近十年的評價標準早已達到性能瓶頸,甚至會引導模型走入錯誤的優化方向。

      對6種表征空間的歸一化弗雷歇特距離(Fréchet Distance,FD)比值取平均,得到更魯棒的綜合指標FDrk。

      按照這套新標準測算,真實驗證集基準數值為1.0,現階段頂尖生成模型的數值依舊高達1.89。

      這足以說明ImageNet圖像生成領域,距離技術成熟還有很遠的距離。

      解耦統計量與梯度計算

      FID是所有生成模型性能測評的核心評判標準。

      這個歌值越小,意味著生成圖越真實、分布越接近真實。

      它的計算方式是把真實圖和生成圖用Inception-v3提特征,各算一個高斯分布,再求兩個分布之間的距離。

      不過過去,FID只能當評測指標。

      因為測算一次FID需要50000張圖片的統計數據,而GPU每步訓練能塞下的batch撐死也就1024張。

      如果強行把5萬樣本全部參與反向傳播,顯存多半當場爆炸。

      新研究的破局思路是“徹底解耦”。

      簡單來說,研究團隊用數萬張圖組成的大窗口(隊列或 EMA)穩定估算真實與生成分布的均值、協方差,保證FD計算準確;梯度只回傳當前小批量數據,不增加訓練算力負擔。

      研究者設計了兩種工程實現。

      第一種叫隊列法(Queue)。

      這種方法維護一個超大特征隊列(比如5萬條),每次生成新batch就enqueue,同時把最老的batch踢出去。

      算FD時,用整個隊列的均值和協方差;反向傳播時,只給當前這1024條特征開梯度流,歷史特征不參與梯度回傳,保證統計穩健性的同時不增加訓練開銷。

      第二種叫EMA法。

      這種方法干脆不存儲任何特征數據,僅通過指數移動平均實時更新生成樣本特征的一階矩與二階矩,每一步使用當前批次的統計量平滑更新全局均值與協方差估計,梯度同樣只作用于當前批次。

      這種方式無需占用大量顯存,統計結果更平滑穩定,還能輕松適配多表征空間聯合優化,在實驗中表現更優,也成為論文默認的實現方案。


      為了驗證這套解耦機制是否真的有效,研究者在最小的pMF-B/16(118M)上做了兩組消融實驗。

      (注:論文在實驗中使用了明確的模型規模分級,其中B代表Base小模型,參數規模約89M到131M。)

      第一組對比隊列長度。

      不用隊列(N=0)時,FID反而從3.31劣化到3.84。

      隊列加到5萬時,FID驟降至0.89;但狂堆到50萬后,因歷史特征嚴重stale,FDr6直接崩回17.67。

      第二組對比EMA衰減率。

      β=0.999時,FID刷到0.81,比隊列版更優,且顯著好于過短的0.9(0.98)和過長的0.9999(0.98)。

      因此后續所有實驗——無論pixel/latent空間、多步轉單步、還是2.5B參數的文本模型——均默認采用EMA方案。

      三個“反常識”的實驗發現

      新提出的FD-loss本質上是一個后訓練的分布對齊目標。

      研究者從已經訓練好的生成器出發,只用FD-loss做輕量微調。

      真實圖像只在離線階段出現一次——預先把訓練集的均值和協方差算好存盤,之后模型再也不見真圖,只對著自己生成的樣本做自我修正。

      這意味著它不需要修改原有架構,不需要從頭訓練,也不需要教師蒸餾或對抗學習,像插件一樣直接嵌入現有流程。

      而且無論像素空間還是隱空間、單步還是多步模型,都能即插即用。

      有了這個輕量框架,研究團隊才得以系統性地測試當FID真的變成損失函數,生成模型會發生什么。

      FD-loss帶來了三個重要的實驗發現。

      發現一,FD-loss讓單步生成模型首次實現畫質與速度的新高度。

      研究者拿了一個已經訓練好的單步生成器 pMF-H,直接上FD-loss微調100輪。

      結果在ImageNet 256×256上,FID從2.29干到了0.77,同時依然保持 1-NFE(單步生成)。

      這一分數大幅超越過往多步擴散模型的最好水平,打破了 “高質量必須多步、單步只能低畫質” 的固有枷鎖。

      換句話說,推理成本一分錢沒多花,畫質直接躍升。

      同樣的操作放到latent-space的iMF-XL上,FID也從1.82壓到0.76。

      更關鍵的是,這種提升不是刷分。在論文圖4的定性對比里,后訓練的鸚鵡羽毛更分明,雪豹的斑點也更清晰。


      發現二,FD-loss可以直接將成熟的多步擴散模型改造為高性能單步生成器。

      研究者把原本訓練來跑50步的多步模型JiT-L,強行拉到單步模式,也就是直接輸入純噪聲,模型只跑一次,輸出就當最終圖像。

      結果就是FID直接崩到291.59,畫面糊成一鍋粥。

      然后,他們什么都不改,就用FD-loss繼續微調這個的單步模式。

      整個過程無需教師蒸餾,無需對抗訓練,無需逐樣本監督信號。

      50輪后,FID從291驟降到 0.77,生成質量與原多步模型相當甚至更優,而且推理速度提升數十倍。


      發現三,FID最低的,未必是最好的。

      這也是該試驗最具行業反思價值的一點。

      當研究者把FD-loss放到不同的表征空間里優化時,事情變得詭異起來(驚恐.jpg)。

      實驗清晰表明,FID最低的模型,在人眼主觀評價中并非最優。

      基于Inception特征優化的模型能獲得最低FID,卻在物體結構、細節紋理、整體感知上弱于使用DINOv2、MAE、SigLIP等現代視覺表征訓練的模型。

      后者FID數值更高,但人眼看更銳利、物體結構更完整,視覺質量顯著更優。

      這說明長期被奉為金標準的FID可能會誤導研究方向……

      團隊提出新標準

      那么,如果FID已經靠不住了,我們拿什么來相信生成模型的進步?

      研究團隊提出跨6種表征空間的歸一化平均指標FDrk

      該指標通過對Inception-v3、ConvNeXtv2、DINOv2、MAE、SigLIP2、CLIP共6種不同維度的表征空間計算歸一化FD比值并取平均,得到綜合評估結果FDr6。

      按照這一標準,真實驗證集的基準值為1.0,而當前最強生成模型的FDr6仍高達1.89,直觀揭示 ImageNet生成任務遠未被解決。

      此外,在人類盲選偏好實驗中,即便最優的pMF-H模型,得票率也只有37.4%,真實圖片依舊以62.6%的勝率占優。


      值得一提的是,FD?loss具備極低的使用門檻與極強的泛化能力,可作為輕量化后訓練插件直接嵌入現有訓練流程,無需從零搭建模型,也不依賴復雜的訓練策略與工程調優。

      該方法同時兼容像素空間與隱空間生成模型,適配單步生成器與多步擴散模型,支持類別條件生成與文生圖等多種任務模式。

      在整個優化過程中,FD?loss無需修改原有主干網絡結構,不引入復雜的架構改動和從頭訓練的巨大開銷,依托隊列或EMA統計更新即可穩定收斂,具備優秀的復現性與落地可行性。

      憑借簡潔通用的設計,它大幅降低了高質量極速生成模型的工程實現門檻,讓各類生成架構都能快速獲得顯著的質量提升。

      低成本、高回報,這正是FD-loss之于工業界的誘惑力所在。

      團隊介紹

      公開信息顯示,五位作者全部是華人背景。

      一作Jiawei Yang,USC計算機系博士生,師從Yue Wang教授,目前的研究聚焦于以視覺為中心的多模態模型的統一生成與理解。

      他碩士畢業于UCLA,曾獲NVIDIA Graduate Fellowship。


      Zhengyang Geng本科畢業于四川大學計算金融專業,現為CMU計算機科學博士生,導師為Zico Kolter。

      他長期專注單步生成、動態系統與模型高效化,是MeanFlow、pMF等系列工作核心作者。

      他的個人主頁寫道“與Kaiming He有緊密合作”,兩人曾連續合作多篇單步生成領域核心論文。


      Xuan Ju是香港中文大學博士生,師從徐強教授,主攻圖像與視頻生成、高效多模態模型。

      她在ICCV、SIGGRAP 等頂會發表多篇成果。


      Yonglong Tian博士畢業于MIT計算機科學專業,現為OpenAI研究員。

      他是監督對比學習SupContrast等表征學習標志性工作的作者,曾任職于Google DeepMind。


      通訊作者Yue Wang,USC助理教授,同時兼任英偉達研究科學家。

      他本科畢業于浙江大學,碩士畢業于UCSD,博士畢業于MIT,研究橫跨3D視覺、生成模型與機器人。


      論文arXiv:
      https://arxiv.org/abs/2604.28190

      文章來源:量子位。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      5244人全扒完!黑龍江26年公務員錄取名單曝光,發現三個讓家長失眠真相

      5244人全扒完!黑龍江26年公務員錄取名單曝光,發現三個讓家長失眠真相

      老滿說高考
      2026-05-18 20:54:36
      太炸了!李冰冰戛納紅毯封神,53歲水墨高定禮服驚艷老外

      太炸了!李冰冰戛納紅毯封神,53歲水墨高定禮服驚艷老外

      調侃國際觀點
      2026-05-16 19:42:22
      夫妻倆退休后跟朋友一起自駕游,最后一人獨自回來:再也不去了

      夫妻倆退休后跟朋友一起自駕游,最后一人獨自回來:再也不去了

      青青會講故事
      2025-01-11 14:12:36
      手機號迎來重大變革!移動全面推行無卡化,老用戶務必留意

      手機號迎來重大變革!移動全面推行無卡化,老用戶務必留意

      Thurman在昆明
      2026-05-18 03:31:07
      楊鳴給弗格出主意!鞍山雙子星合體!吳昌澤大婚,付豪新身份曝光

      楊鳴給弗格出主意!鞍山雙子星合體!吳昌澤大婚,付豪新身份曝光

      君馬體育
      2026-05-19 01:40:56
      浙江楊梅能不能放心吃?5個重點產區完成首輪巡查,未發現類似違規添加

      浙江楊梅能不能放心吃?5個重點產區完成首輪巡查,未發現類似違規添加

      吃貨的分享
      2026-05-19 02:41:26
      梅根赴歐前曬女兒新照,紅裙莉莉貝特好暖心充當媽媽的“小能手”

      梅根赴歐前曬女兒新照,紅裙莉莉貝特好暖心充當媽媽的“小能手”

      看盡落塵花q
      2026-05-19 03:50:13
      世乒賽表彰名單公出爐:9人上榜,1人落榜,孫穎莎、王楚欽在列

      世乒賽表彰名單公出爐:9人上榜,1人落榜,孫穎莎、王楚欽在列

      樂天閑聊
      2026-05-19 04:18:04
      穆里尼奧大清洗!皇馬三大功勛集體離隊,姆巴佩命運徹底定了

      穆里尼奧大清洗!皇馬三大功勛集體離隊,姆巴佩命運徹底定了

      瀾歸序
      2026-05-19 04:31:21
      空歡喜啊!18萬彩禮被老丈人如數退回,女婿抱怨女方無額外陪嫁

      空歡喜啊!18萬彩禮被老丈人如數退回,女婿抱怨女方無額外陪嫁

      火山詩話
      2026-05-16 10:44:29
      利雅得青年主帥:C羅比賽中曾問我,為什么踢勝利的時候那么賣力

      利雅得青年主帥:C羅比賽中曾問我,為什么踢勝利的時候那么賣力

      懂球帝
      2026-05-18 12:17:29
      美媒集體震驚:這次訪華,才真正見識到中國溫度!

      美媒集體震驚:這次訪華,才真正見識到中國溫度!

      福建睿平
      2026-05-18 11:56:20
      毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

      毛主席83歲給華國鋒的珍貴書法,練字真的有意義嗎?

      書畫相約
      2026-05-11 10:09:02
      油價要漲破天了!5月18日油價迎來大幅暴漲,調價后全國油價價格

      油價要漲破天了!5月18日油價迎來大幅暴漲,調價后全國油價價格

      沙雕小琳琳
      2026-05-19 00:12:00
      大家怎么看待人體藝術?

      大家怎么看待人體藝術?

      文一史二
      2026-05-18 07:35:12
      德國“大神”來華手術,被中國病歷嚇到:“我的天...”

      德國“大神”來華手術,被中國病歷嚇到:“我的天...”

      醫脈圈
      2026-05-18 22:32:12
      白酒最怕的解藥,不是茶水,而是常見的它,三分鐘快速解酒!

      白酒最怕的解藥,不是茶水,而是常見的它,三分鐘快速解酒!

      展望云霄
      2026-05-18 22:30:18
      別傻信“只做熱愛的事”!黃仁勛:90%工作都很苦,強者先謀生

      別傻信“只做熱愛的事”!黃仁勛:90%工作都很苦,強者先謀生

      眼界看視野
      2026-05-17 11:01:27
      李英愛問:張凌赫很有名嗎?

      李英愛問:張凌赫很有名嗎?

      秋別離
      2026-05-18 15:35:26
      特朗普剛走,又有4國爭先恐后訪華,名單公開,全都是中國好兄弟

      特朗普剛走,又有4國爭先恐后訪華,名單公開,全都是中國好兄弟

      瞻史
      2026-05-19 02:33:35
      2026-05-19 05:12:49
      算法與數學之美 incentive-icons
      算法與數學之美
      分享知識,交流思想
      5547文章數 64624關注度
      往期回顧 全部

      科技要聞

      蘋果WWDC26定檔6月9日凌晨:iOS27將亮相

      頭條要聞

      前CIA資助研究員:美國從飛碟里撈出4種外星人

      頭條要聞

      前CIA資助研究員:美國從飛碟里撈出4種外星人

      體育要聞

      58順位的保羅,最強第三中鋒

      娛樂要聞

      票房會破14億!口碑第一電影出現了

      財經要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      40.98萬起!充電5分鐘純電續航420km 騰勢N9閃充版勝算有多少?

      態度原創

      數碼
      旅游
      藝術
      房產
      健康

      數碼要聞

      聯想拯救者自帶線移動電源P5發售,169元

      旅游要聞

      紅色文旅升級 沉浸式表達獲年輕人點贊

      藝術要聞

      總投資11億!王老吉新總部,三個“大蛋殼”立在廣州

      房產要聞

      突發!海口重磅調規!碧桂園要解套;新埠島要起飛了!

      專家揭秘干細胞回輸的安全風險

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 性爱免费视频| 亚州欧美中文日韩| 亚洲av一区二区在线看| 亚洲一区二区三区av在线| 伊人精品无码av一区二区三区| 亚洲色欲在线播放一区二区三区| 国产精品你懂的在线播放调教| 国产亚洲精品成人aa片新蒲金| 久久精品熟妇丰满人妻99| 彰化县| 久久aⅴ无码av高潮AV喷 | 人妻无码AⅤ中文字幕视频| 欧美孕妇性草在线| 在线日韩欧美一区二区三区| 97视频精品全国免费观看| 色一情一交一乱一区二区| 亚洲av片在线免费观看| 亚洲欧洲一区二区精品| 精品无码专区久久久水蜜桃| 国产成人无码av大片大片在线观看| 妖精视频yjsp毛片永久| 亚洲91天堂在线无码| 免费人成在线观看网站| 日韩中文字幕有码av| 国产乱色国产精品播放视频| 国产精品偷伦一区二区| 黑人巨大精品欧美| 亚洲大尺度无码无码专线| 国产系列丝袜熟女精品视频| 少妇精品亚洲一区二区三区| 久久人人蜜桃97精品蜜臀| 中文字幕一区二区三区网| 国产精品亚洲二区在线播放| 国产超碰人人爽人人做人人添| jizz麻豆| 亚洲免费网站观看视频 | 久久做受www| 国产一区二区三区在线看| 国产V精品成人免费视频| 亚洲资源在线视频| 成人免费无码a毛片|