網易首頁 > 網易號 > 正文申請入駐

讓80只“龍蝦”并排干活，AI工作站需要什么樣的芯片？

2026-04-29 16:24:38　來源: 芯東西

北京舉報

分享至

芯東西（公眾號：aichip001）
作者 ZeR0
編輯漠影

隨著各類智能體應用需求爆發，本地工作站成為比云端部署速度更快、成本更低、靈活高效、安全可控的選擇。

對于云邊端如何協同支撐算力需求，英特爾提出了企業AI三層部署架構：

（1）中央級AI服務器集群：提供規模化算力底座，支撐多智能體高效協同與全尺寸大模型推理規模化推理。

（2）個人級AI PC：支撐端側小模型及輕量化智能體運行。

（3）部門級/邊緣域AI工作站/服務器：承載靠近業務一線的智能體應用與大模型推理，兼顧性能、成本與易用性。

IDC數據顯示，AI驅動工作站呈現端側AI算力快速增強、多元專業場景全面適配、端云協同高效聯動、本地數據安全持續強化四大趨勢，預計2026年中國AI工作站出貨量同比增長65.2%，占整體工作站市場51.7%。

工作站如何既支撐科學計算、金融分析、影像渲染等傳統重負載工作流運轉，又能滿足大模型推理、智能體部署、內容創作及專業圖形處理的需求？

近日，英特爾給出了它的答案——面向新一代AI工作站的至強600工作站處理器和銳炫Pro B70、B65 GPU顯卡。

現場演示了基于1顆至強698X處理器，接入云端大模型，容器化部署80只“龍蝦”智能體，幫助企業實現本地高密度智能體的中心化托管。這些“龍蝦”能并行運行多輪問答任務，共同完成一個復雜的智能體任務。

如果在至強698X的基礎上，額外引入4張銳炫Pro B70顯卡，容器化部署高密度智能體及擁有800億參數的本地大模型，可以讓24只“龍蝦”智能體通過本地“蝦腦”并行監控24只個股，每隔10秒完成一輪迭代，這樣只需小時級別的時間，就能分析完所有個股。

至此，英特爾銳炫Pro B系列已集齊4款產品：半高單槽的B50（16GB）、主力B60（24GB）、進階B65（32GB/20 Xe核心）和旗艦B70（32GB/32 Xe核心）。

英特爾市場營銷集團副總裁、中國區總經理郭威談道，AI落地路徑正走向多元，不再局限于云端服務等單一模式，大量高算力、重負載的AI生產力工作發生在企業部門的一線場景，高性能工作站正是這類用戶的理想平臺，讓AI從概念走向桌面生產力。

英特爾中國區技術部總經理高宇分享說，工作站市場是一個持續成長的藍海，英特爾看到近兩年工作站市場呈現爆發式成長的勢頭。至強600HR和銳炫Pro B70共同為新一代AI工作站構筑了更完整、更穩固的底座。

▲英特爾中國區技術部總經理高宇展示新品

一、至強600：性能、擴展、AI、管理四管齊下

通過至強600系列，英特爾將數據中心級至強6家族的架構能力完整下放至工作站平臺。

英特爾至強600工作站處理器采用模塊化Chiplet架構，兩個IO Chiplet和多個計算Die組成一個完整CPU，主要特點包括：

（1）性能：最高配備86個性能核，最高支持4TB內存，相比上一代旗艦處理器，多線程性能較上代提升高達61%，單線程性能提升9%，睿頻最高可達4.8GHz。

（2）擴展：支持128條PCIe 5.0通道，配合W890芯片組，提供豐富靈活的擴展能力；8通道DDR5內存，支持6400MT/s DDR5RDIMM、8000MT/sMRDIMM內存；首次將CXL 2.0服務器技術引入工作站，可快擴CXL內存池，實現更高效的KV cache的off loading，加速AI推理。

（3）AI：每核內置英特爾AMX引擎，新增FP16原生支持，AI與機器學習性能提升最高達17%，圖像降噪等典型影像處理場景速度提升高達4至5倍，可有效降低企業本地AI部署的門檻與TCO。

（4）管理：依托英特爾vPro技術體系，支持多種管理特性、多密鑰內存加密與一鍵恢復等企業級功能，適配塔式、機架式及邊緣等多種部署形態，滿足企業靈活運維的需求。

該平臺還繼承了英特爾高可用的基因，通過4大類48項RAS功能加固了平臺的穩定性，為關鍵任務保駕護航。

據英特爾披露，對比上一代至強W3595X工作站，新一代至強698X工作站在運行中尺度氣象研究和預測模型WRF時加速87%，運行AlphaFold 3蛋白質預測時加速44%，運行由英特爾開源的AI圖像降噪庫Open Image Denoise（OIDN）時加速400%。

“得益于AMX和AVX512指令集加持，以及英特爾提供的OpenVINO和OneAPI工具套件，可以實現CPU對AI的直接推理加速，再配合上這個平臺可以直接支持8張PCIe 5.0 x16的GPU的能力，至強600平臺是目前AI工作站的最佳選擇。”高宇說。

他在會后的媒體采訪期間透露，后續至強還將支持數據傳輸速率達到12800MT/s的MRDIMM，這對AI及HPC（高性能計算）工作負載都很重要。

英特爾中國區顯卡和AI高級產品總監徐金平補充說，銳炫Pro B70的價格也很有競爭力，同時英特爾正持續加大對新模型、新生態的投入。

二、銳炫Pro B70：大顯存、長窗口、高并發

英特爾銳炫Pro B70顯卡基于第二代Xe2架構，配備32GB顯存，AI算力峰值高達367TOPS，對圖形渲染、通用并行計算與AI加速計算等專業工作負載都進行了專項優化。

銳炫Pro B65同樣搭載32GB顯存，提供197TOPS算力，價格更親民，面向對顯存敏感但算力需求適中的用戶群。

銳炫Pro B70的架構設計有如下重點：

搭載32個Xe核心，每個Xe核心有8個向量處理核心（XVE）和8個矩陣計算核心（XMX），延續了Xe架構在通用并行計算上的能力，并對數據吞吐和執行效率做了提升。
32個光線追蹤單元，通過物理引擎處理實時光追計算。
強大的視頻編解碼和后處理單元，對很多最新視頻格式都實現了硬編硬解。

面向AI推理需求，銳炫Pro B70在AI推理場景中支持更大規模的AI模型與更長的上下文窗口，可在多用戶并發場景下支持高吞吐量與快速響應。

面向多樣化部署需求，該顯卡支持SR-IOV虛擬化與50余家ISV軟件認證，可靈活擴展多卡配置，配合完整的Linux軟件棧（含vLLM、oneAPI、PyTorch）。

銳炫Pro B70運行11款專業GPU應用上的表現如下圖所示，對比B60提升顯著，并完成了針對這些專業軟件的適配和認證，確保長期跑得穩、結果可信、功能完整且與實際工作流高度兼容。

現場演示了基于銳炫Pro B70的多項本地AI應用效果：

（1）文生圖：一臺本地筆記本連接到Demo區的一臺4卡銳炫Pro B70工作站，在ComfyUI工作區上，僅用3.9秒，就生成了一張1024×1024的高清圖片。單張銳炫Pro B70顯卡僅需不到30秒，就能生成一張4K分辨率的高清圖。

（2）圖生圖：基于單卡銳炫Pro B70，亦心科技AI閃繪應用能將手繪草圖近乎實時地繪制成高清設計大作。

（3）圖生視頻：使用單張銳炫Pro B70，在本地運行Wan 2.2 I2V-18B FP8開源模型，92秒生成一段5秒480P視頻。

（4）“龍蝦”智能體：基于酷睿Ultra加單張銳炫Pro B70的個人龍蝦工作站方案，運行本地Qwen 3.5-35B A3B量化模型，去模擬小說續寫場景，可輕松支撐128K或256K滿上下文推理。

知名車評人、旅行家韓路重點夸了銳炫Pro B70的視頻編解碼性能。對于重型視頻節目，大概有10-20軌4K 60的素材并行，如果顯卡解碼能力不行，拖拽時會特別慢，使用銳炫Pro B70后提效顯著，剪輯同事反饋說拖拽很流暢。

還有一些面向企業級應用場景的案例：

（1）多路視頻會議：聯想智能會議系統Lenovo SCH-900S搭載銳炫Pro B70，可實現20路多會議室并發接入與實時AI會議紀要的生成，顯著提升溝通效率與執行落地速度。

（2）長上下文RAG解決方案：借助英特爾銳炫Pro B70多卡并發能力，飛致云面向企業級場景的長上下文RAG解決方案可支持LLM/VLM高效多卡并發推理。飛致云展示了基于MaxKB平臺的測試數據，2卡銳炫Pro B70運行14B模型可支持24路并發，8卡運行32B模型可支持60路并發，且每路響應速度保持在15TPS及以上。

（3）電子病歷智能體方案：東華醫為在8卡B70服務器上部署電子病歷智能體，病歷輔助生成性能較B60提升至8倍，病歷內涵質控提升67%，2-3臺8卡B70可滿足一家中等規模三甲醫院的需求，可助力醫療機構提升診療質量和效率。

此外，英特爾與火山引擎共同打造了AgentSphere一體機聯合方案。借助英特爾至強600與銳炫Pro B70，AgentSphere具備了更高并發、更低時延、更少抖動的多智能體協同能力，同時開箱即用的標準一體機方案降低了AI落地企業的使用門檻與維護成本，能夠更便捷地幫助企業打造AI員工管理平臺，提升生產效率。

針對工業界AI軟件棧迭代速度快、軟件復雜度高、性能優化繁瑣等問題，英特爾采用了容器化交付全棧軟件的方式，最大程度保證用戶安裝即可用。

英特爾會持續分階段發布和更新組件中的升級包，對全新模型和全新kernel的第一時間支持。

結語：智能體需求爆發，工作站成企業級剛需平臺

作為企業級智能體和大模型推理落地的必要平臺之一，工作站憑借就近部署、靈活高效、高性價比、隱私安全、更加輕量的IT運維要求、服務器級別的性能穩定保證等優勢，正成為AI算力基礎設施中不可或缺的一層。

英特爾AI工作站的核心價值源于開放協同的產業生態。英特爾聯合全體生態伙伴，打造從底層算力到行業場景的完整價值鏈路，既聯動協同軟件與模型合作伙伴，又與行業伙伴共同探索在金融、制造、科研、創意等領域的創新解決方案，以幫助各行各業切實應對大模型部署成本高、數據安全與響應效率等現實挑戰，將技術創新轉化為生產力。

在更宏觀的市場層面，CPU缺貨仍將持續。高宇坦言，受智能體需求爆發影響，內存需求與CPU需求都在上漲，CPU需求增速已超越業內幾乎所有人原來的預判，預計要等大量擴產和需求下滑后才能緩解供需缺口。

在工作站形態方面，英特爾正推動液冷、超靜音和小型化：單卡方案目標機箱做到8L以內、噪音35dB以下，雙卡機箱做到14L以內、噪音40dB以下，4卡機箱做到35L以內。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.