<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSpeed v0.18.8 發布:穩定性、Evoformer、多架構構建與ZeRO優化全面升級詳解

      0
      分享至




      DeepSpeed v0.18.8 于2026 年 3 月 13 日正式發布,這是一次以“修復問題 + 提升穩定性 + 改善開發與構建體驗”為核心目標的補丁版本。
      該版本共包含9 次提交、16 個文件變更、260 行新增代碼、84 行刪除代碼,覆蓋訓練穩定性、日志控制、Evoformer 多架構支持、ZeRO Stage1/2/3、FP16 精度配置、NPU 構建、Async IO、測試與文檔等多個關鍵模塊。

      本文將完全基于官方更新內容,對 DeepSpeed v0.18.8 的所有變更進行逐條拆解與系統化解讀,幫助你快速理解本次版本升級帶來的實際價值。

      一、版本概覽與更新重點 1. 基本信息

      • ?版本號:v0.18.8

      • ?發布時間:2026 年 3 月 13 日

      • ?版本類型:Patch Release(補丁版本)

      2. 核心更新方向總結

      本次 v0.18.8 主要聚焦以下幾個方面:

      • ?日志與內存監控優化:減少無意義的日志噪音

      • ?Evoformer Attention 多架構構建修復:解決編譯與調度根因

      • ?FP16 loss_scale 校驗增強:避免隱性訓練錯誤

      • ?ZeRO Stage1/2/3 穩定性改進:CUDA stream 與日志行為修復

      • ?Bloom 模型推理測試修復

      • ?華為 Ascend NPU Async IO 構建問題修復

      • ?AI 編碼代理項目規范新增

      • ?測試覆蓋增強

      • ?版本號更新

      二、日志與內存使用輸出優化 Suppress see_memory_usage logs

      多個 ZeRO 相關模塊中,see_memory_usage的日志調用被統一優化:

      • ? 同一位置同時調用force=Trueforce=False

      • ? 在 rank0 或非必要場景下避免重復打印

      涉及模塊包括:

      • ? ZeRO Offload

      • ? ZeRO Stage3

      • ? ZeRO Stage1 & Stage2

      • ? 參數分區與卸載流程

      優化效果
      • ?顯著減少控制臺日志噪音

      • ?在大規模分布式訓練中提升可讀性

      • ? 不影響原有內存調試能力

      三、Bloom 推理測試卡死問題修復 Fix hangs of bloom test

      Bloom 推理容器在特定 Transformers 版本檢測邏輯中存在異常行為。

      修復點

      • ? 原邏輯在檢測到 Transformers 版本超過 4.43.4 時,使用了sys.exit

      • ? 修復為直接拋出 RuntimeError

      影響
      • ? 測試環境不再直接退出 Python 進程

      • ? 錯誤提示更加友好、可捕獲

      • ? CI 與自動化測試穩定性提升

      四、FP16 loss_scale 校驗全面增強 Validate fp16.loss_scale is finite and non-negative

      DeepSpeedFP16Config中,新增了對loss_scale的嚴格校驗邏輯。

      新增校驗規則

      • ? 不允許為bool

      • ? 必須可轉換為數值

      • ? 必須是有限值(禁止 inf / -inf / nan)

      • ? 必須≥ 0

        • ?0表示啟用動態 loss scaling

      對應測試用例新增
      • ? 覆蓋非法值:-1infnanTrue

      • ? 覆蓋合法值:012.0、字符串數值

      • ? 錯誤類型時,錯誤信息清晰明確

      實際價值
      • ? 避免訓練過程中出現難以排查的數值異常

      • ? 在配置階段即阻斷錯誤輸入

      • ? 提升 FP16 訓練的安全性與可維護性

      五、Evoformer Attention:多架構構建與調度根因修復

      這是v0.18.8 中技術含量最高、影響最深遠的更新之一

      1. 多架構 dispatch 根因修復 核心變化

      • ? 移除CheckArch中對__CUDA_ARCH__的依賴

      • ? 修復多架構構建時的邏輯沖突

      • ? 明確不同架構對 fp16 / bf16 的支持范圍

      架構支持矩陣

      架構

      fp16

      bf16

      Sm70

      支持

      不支持

      Sm75

      支持

      不支持

      Sm80+

      支持

      支持


      2. DISPATCH_ARCHTAG 宏邏輯重構

      • ? 不再依賴編譯期 GPU_ARCH 條件嵌套

      • ? 運行期根據 CC 直接選擇 Sm70 / Sm75 / Sm80

      • ? 不滿足 Tensor Core 條件直接報錯

      好處
      • ? 多架構 CUDA slice 行為更一致

      • ? 解決 Evoformer 在混合 GPU 環境下的異常構建問題

      3. DS_EVOFORMER_GPU_ARCH 正式廢棄 變化說明
      • ? 構建邏輯中不再讀取該環境變量

      • ? 設置該變量時僅發出警告

      • ?真正生效的構建控制方式為TORCH_CUDA_ARCH_LIST

      新推薦方式

      TORCH_CUDA_ARCH_LIST='7.0;8.0'
      4. Evoformer 構建文檔全面更新

      文檔明確說明:

      • ? Evoformer 僅支持 SM ≥ 70

      • ? Tensor Core 為必要條件

      • ? 多架構構建完全依賴TORCH_CUDA_ARCH_LIST

      • ? 低于 SM70 的目標會被自動裁剪

      5. Evoformer Builder 測試新增

      新增單元測試覆蓋:

      • ? 低于 7.0 的 CC 被過濾

      • ? +PTX 后綴正確保留

      • ? 不再生成-DGPU_ARCH編譯參數

      • ?CheckArch中不再包含__CUDA_ARCH__

      六、Async IO:華為 Ascend NPU 構建問題修復 Fix async_io ops building error on Huawei Ascend NPU 修復內容
      • ? 修正源文件列表中缺失的逗號

      • ? 修復 CPU op 中對 NPU 判斷邏輯

      • ? 避免 torch_npu 未聲明導致的構建失敗

      影響
      • ? Ascend NPU 環境下 Async IO 可正常編譯

      • ? 提升 DeepSpeed 在非 CUDA 平臺的可用性

      七、ZeRO 系列模塊關鍵修復 1. ZeRO-3 CUDA stream 修復 修復點
      • ? 使用current_stream()替代default_stream()

      • ? 避免梯度歸約時的數據依賴問題

      效果
      • ? CUDA Stream 同步更安全

      • ? 減少潛在死鎖與性能異常

      2. ZeRO 參數卸載與分區日志修正
      • ? 多處print_rank_0重復 force 參數修復

      • ? see_memory_usage 行為統一

      • ? 提升多卡訓練日志一致性

      3. ZeRO Stage1 & Stage2 穩定性增強
      • ? 優化 optimizer state 初始化前后的內存日志

      • ? 保持與 Stage3 行為一致

      八、AI 編碼代理項目規則正式加入 新增 AGENTS.md 與 CLAUDE.md

      兩份文件內容完全一致,作為DeepSpeed 工作區級 AI 編碼規范

      核心規則包括:

      • ? 提交必須帶 Signed-off-by

      • ? 強制 yapf + flake8

      • ? 禁止無意義格式化提交

      • ? 新文件必須包含 Apache-2.0 License Header

      • ? 不允許直接 import torch.distributed

      • ? 刪除無運行時價值的死代碼

      • ? 注釋強調“為什么”,而非“做什么”

      意義
      • ? 明確 AI 編碼參與項目的行為邊界

      • ? 降低 Review 成本

      • ? 提升長期代碼質量與一致性

      九、版本號更新
      • ?version.txt0.18.7 → 0.18.8

      • ? 正式標志該補丁版本發布完成

      十、總結:為什么推薦升級到 v0.18.8

      代碼地址:github.com/deepspeedai/DeepSpeed

      DeepSpeed v0.18.8 雖然是一個 Patch 級別更新,但從實際改動內容來看,v0.18.8 已經遠遠超出了“簡單修 Bug”的范疇,而是一次針對穩定性、可維護性與未來演進方向的系統性修正版本

      我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      河南三縣(市、區)政府主要領導調整

      河南三縣(市、區)政府主要領導調整

      汲古知新
      2026-05-13 10:22:10
      壞消息!67歲生娃的田新菊病倒了,6歲小天賜踮腳給73歲媽媽喂奶

      壞消息!67歲生娃的田新菊病倒了,6歲小天賜踮腳給73歲媽媽喂奶

      未曾青梅
      2026-05-11 22:20:21
      父親病危后女子請假陪護屢遭拒,父親去世當天她因“曠工”被公司辭退,此前公司還向其發送曠工催告函;法院:公司于期限內支付70000元

      父親病危后女子請假陪護屢遭拒,父親去世當天她因“曠工”被公司辭退,此前公司還向其發送曠工催告函;法院:公司于期限內支付70000元

      極目新聞
      2026-05-13 07:57:10
      網紅水果黑幕曝光!全是添加劑泡的,很多人天天買給孩子吃

      網紅水果黑幕曝光!全是添加劑泡的,很多人天天買給孩子吃

      泠泠說史
      2026-05-12 19:57:36
      5月13日俄烏:烏克蘭正向美國傳授戰爭之道

      5月13日俄烏:烏克蘭正向美國傳授戰爭之道

      山河路口
      2026-05-13 18:51:46
      印尼媒體:一把好牌打成稀巴爛,尤利安托下課,印尼隊解散

      印尼媒體:一把好牌打成稀巴爛,尤利安托下課,印尼隊解散

      劉剮說體壇
      2026-05-13 14:12:25
      劉嘉玲曬法國度假照,依偎梁朝偉身旁,滿臉幸福藏不住

      劉嘉玲曬法國度假照,依偎梁朝偉身旁,滿臉幸福藏不住

      人間煙火記事本
      2026-05-13 08:37:19
      《主角》直到花彩香生娃,才知她為何不跟張光榮離婚,放棄胡三元

      《主角》直到花彩香生娃,才知她為何不跟張光榮離婚,放棄胡三元

      八斗小先生
      2026-05-12 11:34:38
      皇馬主席放飛自我了!弗洛倫蒂諾:讓那個女孩提問,你們其他人都太丑了

      皇馬主席放飛自我了!弗洛倫蒂諾:讓那個女孩提問,你們其他人都太丑了

      懂個球
      2026-05-13 14:17:43
      “4只皮皮蝦1035元”當事顧客稱被網暴,涉事司機已被開除

      “4只皮皮蝦1035元”當事顧客稱被網暴,涉事司機已被開除

      澎湃新聞
      2026-05-13 14:56:06
      熱巴五一裹成“養蜂人”?這波反季穿搭才是頂流的松弛感

      熱巴五一裹成“養蜂人”?這波反季穿搭才是頂流的松弛感

      影視泡泡堂
      2026-05-13 21:10:27
      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      水谷隼徹底揭穿張本宇一家在日本受尊重的謊言!

      生活新鮮市
      2026-05-13 02:38:57
      趙心童、艾倫入選名人堂引質疑,羅伯遜、馬叔:入選門檻太低了!

      趙心童、艾倫入選名人堂引質疑,羅伯遜、馬叔:入選門檻太低了!

      余憁搞笑段子
      2026-05-13 10:35:20
      奉勸大家:這6樣東西千萬“別用紙巾擦”,一擦就壞,很難修復

      奉勸大家:這6樣東西千萬“別用紙巾擦”,一擦就壞,很難修復

      室內設計師有料兒
      2026-05-06 12:09:03
      國乒美女錢天一:26歲退役,不選編制選安置費,嫁世界冠軍很幸福

      國乒美女錢天一:26歲退役,不選編制選安置費,嫁世界冠軍很幸福

      以茶帶書
      2026-05-08 15:40:11
      俄專機提前12小時降落北京:在“空軍一號”抵達前,普京要完成戰略卡位

      俄專機提前12小時降落北京:在“空軍一號”抵達前,普京要完成戰略卡位

      荷蘭豆愛健康
      2026-05-13 18:43:30
      高考落幕少女誕下女嬰,父母追問生父身份后,竟對親生女兒下毒手

      高考落幕少女誕下女嬰,父母追問生父身份后,竟對親生女兒下毒手

      罪案洞察者
      2025-08-14 15:00:53
      特朗普訪華名單上的黑石帝王施瓦茨曼:他用李世民給自己命名

      特朗普訪華名單上的黑石帝王施瓦茨曼:他用李世民給自己命名

      人間像素
      2026-05-13 13:17:48
      1500萬潮汕人移民東南亞,當年究竟有多慘烈?| 地球知識局

      1500萬潮汕人移民東南亞,當年究竟有多慘烈?| 地球知識局

      地球知識局
      2026-05-13 07:30:17
      “老鳳詳”所售足金戒指被指“金包銀”拒三倍賠償,店鋪已被淘寶關閉

      “老鳳詳”所售足金戒指被指“金包銀”拒三倍賠償,店鋪已被淘寶關閉

      澎湃新聞
      2026-05-13 08:18:27
      2026-05-13 21:47:00
      moonfdd incentive-icons
      moonfdd
      福大大架構師每日一題
      1223文章數 68關注度
      往期回顧 全部

      科技要聞

      騰訊一季度營收1964.6億元 同比增9%

      頭條要聞

      媒體:黃仁勛絕非"順路同行" 而是美方刻意納入的籌碼

      頭條要聞

      媒體:黃仁勛絕非"順路同行" 而是美方刻意納入的籌碼

      體育要聞

      14年半,74萬,何冰嬌沒選那條更安穩的路

      娛樂要聞

      白鹿掉20萬粉,網友為李晨鳴不平

      財經要聞

      美國總統特朗普抵達北京

      汽車要聞

      C級純電轎跑 吉利銀河"TT"申報圖來了

      態度原創

      教育
      藝術
      親子
      本地
      公開課

      教育要聞

      長檢匠心:融智聚力護成長 長沙未檢共探協同保護新路徑

      藝術要聞

      乾隆 “翻車” 名畫刷屏!

      親子要聞

      見義勇為的小工程車

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 少妇bbbbb撒尿视频| 亚洲日韩性欧美中文字幕| 国产精品剧情亚洲二区| 国产拍第6页| AV成人电影一区| 99在线观看免费视频| 欧美福利导航| 亚洲一区二区偷拍精品| 99国精品午夜福利视频不卡99| 亚洲色大成网站WWW永久男同| 九九精品在线看| 日韩高清无码一区| 国产成人无码A区在线观| 无码av少妇| 日韩无码网站| 欧美日韩综合精品一区二区| 狠狠躁夜夜躁人人爽天天5| 久久精品无码鲁网中文电影| 久久亚洲美女精品国产精品 | 亚洲午夜性猛春交XXXX | 在办公室被c到呻吟的动态图| 四季亚洲AV永久无码精品尤物app| 国产精品久线在线播放| 国产三级三级三级看三级日本| 秋霞AV鲁丝片一区二区| 日本丰满人妻xxxxxhd| 亚洲视频在线观看一区二区三| 精品人妻伦九区久久69| 日韩午夜| 国产jizzjizzjizz| 亚洲成av人无码| 欧美日韩亚洲国产一区二区综合| 亚洲午夜无码AV不卡| 暖暖 在线 日本 免费 中文| 亚洲 日韩 欧美 成人 在线 | 亚洲免费人妻| 国产精品欧美日韩视频一区| 亚洲性夜夜天天天| 久爱www人成免费网站| AV最新高清无码专区| 美女无遮挡被啪啪到高潮免费|