整理 | 夢依丹
出品 | CSDN(ID:CSDNnews)
你花了數千萬美金買回最頂級的 H100 集群,指望它們跑出驚人的 Agent 響應速度。但現實是:每塊價值 4 萬美金的算力怪獸,大部分時間竟都在閑置,只為了等那該死的磁盤 I/O。
在 ASPLOS 2026 上,Eunomia-BPF 團隊對 144 個 SWE-bench 任務的全鏈路 Profiling 揭露了一個被忽視的真相:
在復雜 Agent 任務中,大家死磕的大模型推理僅占耗時的 30%-40%。剩下的 60%-70%,全被虛耗在了操作系統的執行環節——環境初始化、文件讀寫、多步驟切換帶來的系統級開銷。
![]()
論文地址: https://os-for-agent.github.io/papers/AgenticOS_2026_paper_10.pdf
Profiling 數據進一步揭示了“算力自相矛盾”的尷尬現狀:
Agent 運行時,平均 CPU 利用率甚至不到 12.8%,處于嚴重的“出工不出力”狀態;但在執行復雜指令(如安裝環境、跑測試)的瞬間,內存和網絡帶寬的峰值消耗能飆升至平均值的 15 倍以上。
![]()
這種“極低均值”與“極高瞬時脈沖”的劇烈撕裂,證明了傳統的靜態資源分配模式在 Agent 時代已經失效。
Agent 的性能瓶頸則是在執行任務時,基礎設施層的“手腳”配合,而非推理速度。
面對這場架構級的范式轉移,由 CSDN 與奇點智能研究院聯合主辦的 「2026 奇點智能技術大會」,特別設立了「AI Infra 基礎設施與運維」專題,邀請了來自 NVIDIA、華為、智源、無問芯穹、清程極智、啟元實驗室、昆侖芯、清微智能等 8 位一線“基建專家”,為大家帶來 Agent 時代的基建實戰。
![]()
既然人腦無法實時響應 Agent 這種毫秒級的資源跳變,那就用 Agent 來管理集群。
無問芯穹技術副總裁吳保東將帶來《基于 Agentic Infra 的 AIOps 智能體系統》。他將拆解如何利用專項智能體實現跨集群的感知與自動治理,將平均故障修復時間(MTTR)降低 90% 以上,讓運維從“被動響應”轉向“主動進化”。
清程極智副總裁何萬青帶來《Agentic AI Infra:以智能體為中心的八卦爐智能軟件棧》,深度探討如何構建一套真正適配長程 Agent 任務流、而非單純適配模型推理的底層架構。
針對“大模型推理僅占 30%”的尷尬現狀,我們需要在剩下的 70% 里硬搶效率,為此我們邀請到:
昆侖芯推理框架架構師馬陽,他將復盤《大規模 LLM 推理優化》,分享支撐文心一言背后,如何解決顯存墻與帶寬墻、實現極致吞吐的真實心得。
華為研發工程師、OmnInfer 負責人何斌將帶來《Omni-infer 性能極致優化實踐》,從底層指令集到上層算子融合,演示如何通過硬核手段榨干每一比特的算力紅利。
不同芯片、不同軟件棧導致的適配成本高昂,是每一個開發者最頭疼的阻礙。
北京智源 AI 框架研發負責人敖玉龍將分享《基于 FlagOS 技術棧的大模型框架多芯片統一高效插件體系》他將演示如何以低侵入方式,將統一算子接入 Megatron-LM、vLLM 等主流框架,讓同一套代碼在不同國產芯片上零成本遷徙,實現“一次開發,多芯運行”。
啟元實驗室數據智能團隊負責人馬少楠則聚焦“九源智能基礎軟件棧”,分享《面向大模型時代的軟硬協同計算架構與數智融合實踐》通過統一加速平臺屏蔽異構芯片差異,打通從底層數據處理、知識庫構建到智能化分析的全鏈路技術脈絡。
AI 時代的 Infra 不再是簡單的硬件堆砌,而是一個復雜的軟件定義系統。
NVIDIA 產品管理高級總監 Han Vanholder將帶來全球視角的《開源 AI 工廠軟件:NVIDIA 云合作伙伴如何構建與規模化運營 GPU 基礎設施》。他將介紹 NVIDIA 如何通過 NCX(NVIDIA Cloud Accelerator) 將大規模運營經驗轉化為可部署的模塊化組件,幫助云廠商構建真正的生產級 AI 基礎設施。
清微智能技術專家樓群芳將探討《可重構計算超節點的理論探索和實踐》。她將解析如何通過硬件可重構性與智能資源動態編排,構建像“變形金剛”一樣能動態適應多變算法需求的智能計算系統。
此外,沐曦高級副總裁孫國梁也將現身專題圓桌,與多位技術決策者共同探討國產算力在智能體時代的生態突圍之路。
本場專題聽眾收益:
這是一場屬于 Infra 架構師與集群負責人的“全景實戰復盤”。你將帶走的不僅是幾頁 PPT,而是一套應對 2026 版算力焦慮的系統解法:
掌握適配標準:了解如何通過插件化體系實現多芯片的高效運行;
獲取壓榨心法:學習在大廠國民級業務中驗證過的推理加速策略;
對齊全球趨勢:看清 NVIDIA 與國內頂尖實驗室對“AI 工廠”與“可重構計算”的最新定義。
4 月 17-18 日,上海。
來現場,和最懂底層工程的一線專家們一起,給你的 AI 系統換上一套“強壯的底盤”。
席位有限,立即掃碼鎖定早鳥票,搶占 2026 AI 基建紅利!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.