快科技5月6日消息,NVIDIA宣布旗下開源大模型Nemotron 3 Super登上EnterpriseOps-Gym排行榜開源類別首位,以平均27.3分的成績擊敗Kimi-K2.5、DeepSeek v3.2、MiniMax m2.7及GPT-OSS-120B等眾多競爭對手。
具體排名顯示,Kimi-K2.5以26.2分位列第二,DeepSeek v3.2以23.8分排在第三,MiniMax m2.7以23.0分緊隨其后,GPT-OSS-120B以17.1分位列第五。
![]()
Nemotron 3 Super是NVIDIA在今年3月GTC大會上發布的混合專家模型,總參數量達到1200億,但每次推理僅激活其中120億參數,在保持模型知識密度的同時大幅降低推理開銷。
該模型采用了多項關鍵技術。潛在混合專家架構通過壓縮輸入數據,能夠在相同推理成本下激活并調用多達四倍數量的"專家子網絡"(專業化的神經網絡模塊)來處理任務。
Nemotron 3 Super還原生支持100萬token上下文窗口,在長時間任務中可保持長期記憶,有效避免目標偏移問題。其吞吐量較上一代Nemotron Super提升超過五倍。
在硬件適配方面,該模型針對NVIDIA Blackwell架構進行原生NVFP4預訓練,在B200上的推理速度比H100使用FP8格式快四倍,同時保持模型精度。
此外,借助NVIDIA NeMo Gym與NeMo RL框架,該模型在21種環境配置下完成了多環境強化學習后訓練,總計部署了超過120萬次訓練環境。
NVIDIA Nemotron 3系列開源模型覆蓋Nano、Super和Ultra三條產品線。NVIDIA還同步推出了Nemotron 3 Nano Omni,宣稱可將AI吞吐量提升九倍。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.