NVIDIA 在 KubeCon Europe 大會上宣布推出適用于 GPU 加速工作負載的機密容器解決方案、NVIDIA KAI Scheduler 更新,以及用于實現大規模 AI 工作負載的全新開源項目。
對于絕大多數企業來說,AI 工作負載在 Kubernetes 上運行——一個可實現容器化應用的部署、擴縮容與管理自動化的開源平臺。
為了使全球開發者社區能夠更高效透明地管理高性能 AI 基礎設施,NVIDIA 將向云原生計算基金會 (Cloud Native Computing Foundation, CNCF) 捐贈關鍵軟件—— NVIDIA 動態資源分配 (DRA) GPU 驅動程序。CNCF 是一個供應商中立組織,致力于促進和維護云原生生態系統。
![]()
- 簡化 AI 基礎設施:在過去,管理數據中心內為 AI 提供動力的強大 GPU 需要付出巨大努力。
這一貢獻旨在使高性能計算更易于使用。開發者的受益點包括:
- 提高效率:該驅動程序支持 NVIDIA Multi-Process Service 和 NVIDIA Multi-Instance GPU 技術,可實現更智能的 GPU 資源共享,從而有效利用計算能力。
- 大規模擴展:提供原生支持,可將系統連接在一起,兼容 NVIDIA 多節點 NVLink 互聯技術。這對于在 NVIDIA Grace Blackwell 系統和下一代 AI 基礎設施上訓練大型 AI 模型至關重要
- 靈活性:開發者可以根據需要動態重新配置硬件,隨時更改資源分配方式。
- 精度:該軟件支持微調請求,允許用戶根據其應用需求指定特定的算力、顯存設置或互連配置。
- 全行業協作:NVIDIA 正在與行業領導者合作,包括亞馬遜云科技、博通、Canonical、Google Cloud、微軟、Nutanix、紅帽和 SUSE,共同推動這些功能的發展,造福整個云原生生態系統。
- 擴展開源視野:這一項捐贈只是 NVIDIA 支持開源社區的更廣泛舉措的一部分。其他舉措還包括在 GTC 大會上發布的 NVSentinel(GPU 故障修復系統)以及 AI Cluster Runtime(智能體 AI 框架)。
以上為摘要內容,點擊鏈接閱讀完整內容:NVIDIA 向 Kubernetes 社區捐贈動態資源分配 GPU 驅動程序,推動開源 AI 發展 | NVIDIA 英偉達博客
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.