![]()
芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影
隨著各類智能體應用需求爆發,本地工作站成為比云端部署速度更快、成本更低、靈活高效、安全可控的選擇。
對于云邊端如何協同支撐算力需求,英特爾提出了企業AI三層部署架構:
(1)中央級AI服務器集群:提供規模化算力底座,支撐多智能體高效協同與全尺寸大模型推理規模化推理。
(2)個人級AI PC:支撐端側小模型及輕量化智能體運行。
(3)部門級/邊緣域AI工作站/服務器:承載靠近業務一線的智能體應用與大模型推理,兼顧性能、成本與易用性。
IDC數據顯示,AI驅動工作站呈現端側AI算力快速增強、多元專業場景全面適配、端云協同高效聯動、本地數據安全持續強化四大趨勢,預計2026年中國AI工作站出貨量同比增長65.2%,占整體工作站市場51.7%。
工作站如何既支撐科學計算、金融分析、影像渲染等傳統重負載工作流運轉,又能滿足大模型推理、智能體部署、內容創作及專業圖形處理的需求?
近日,英特爾給出了它的答案——面向新一代AI工作站的至強600工作站處理器和銳炫Pro B70、B65 GPU顯卡。
![]()
現場演示了基于1顆至強698X處理器,接入云端大模型,容器化部署80只“龍蝦”智能體,幫助企業實現本地高密度智能體的中心化托管。這些“龍蝦”能并行運行多輪問答任務,共同完成一個復雜的智能體任務。
如果在至強698X的基礎上,額外引入4張銳炫Pro B70顯卡,容器化部署高密度智能體及擁有800億參數的本地大模型,可以讓24只“龍蝦”智能體通過本地“蝦腦”并行監控24只個股,每隔10秒完成一輪迭代,這樣只需小時級別的時間,就能分析完所有個股。
至此,英特爾銳炫Pro B系列已集齊4款產品:半高單槽的B50(16GB)、主力B60(24GB)、進階B65(32GB/20 Xe核心)和旗艦B70(32GB/32 Xe核心)。
![]()
英特爾市場營銷集團副總裁、中國區總經理郭威談道,AI落地路徑正走向多元,不再局限于云端服務等單一模式,大量高算力、重負載的AI生產力工作發生在企業部門的一線場景,高性能工作站正是這類用戶的理想平臺,讓AI從概念走向桌面生產力。
英特爾中國區技術部總經理高宇分享說,工作站市場是一個持續成長的藍海,英特爾看到近兩年工作站市場呈現爆發式成長的勢頭。至強600HR和銳炫Pro B70共同為新一代AI工作站構筑了更完整、更穩固的底座。
![]()
▲英特爾中國區技術部總經理高宇展示新品
一、至強600:性能、擴展、AI、管理四管齊下
通過至強600系列,英特爾將數據中心級至強6家族的架構能力完整下放至工作站平臺。
英特爾至強600工作站處理器采用模塊化Chiplet架構,兩個IO Chiplet和多個計算Die組成一個完整CPU,主要特點包括:
![]()
(1)性能:最高配備86個性能核,最高支持4TB內存,相比上一代旗艦處理器,多線程性能較上代提升高達61%,單線程性能提升9%,睿頻最高可達4.8GHz。
![]()
(2)擴展:支持128條PCIe 5.0通道,配合W890芯片組,提供豐富靈活的擴展能力;8通道DDR5內存,支持6400MT/s DDR5RDIMM、8000MT/sMRDIMM內存;首次將CXL 2.0服務器技術引入工作站,可快擴CXL內存池,實現更高效的KV cache的off loading,加速AI推理。
(3)AI:每核內置英特爾AMX引擎,新增FP16原生支持,AI與機器學習性能提升最高達17%,圖像降噪等典型影像處理場景速度提升高達4至5倍,可有效降低企業本地AI部署的門檻與TCO。
![]()
(4)管理:依托英特爾vPro技術體系,支持多種管理特性、多密鑰內存加密與一鍵恢復等企業級功能,適配塔式、機架式及邊緣等多種部署形態,滿足企業靈活運維的需求。
![]()
該平臺還繼承了英特爾高可用的基因,通過4大類48項RAS功能加固了平臺的穩定性,為關鍵任務保駕護航。
![]()
據英特爾披露,對比上一代至強W3595X工作站,新一代至強698X工作站在運行中尺度氣象研究和預測模型WRF時加速87%,運行AlphaFold 3蛋白質預測時加速44%,運行由英特爾開源的AI圖像降噪庫Open Image Denoise(OIDN)時加速400%。
“得益于AMX和AVX512指令集加持,以及英特爾提供的OpenVINO和OneAPI工具套件,可以實現CPU對AI的直接推理加速,再配合上這個平臺可以直接支持8張PCIe 5.0 x16的GPU的能力,至強600平臺是目前AI工作站的最佳選擇。”高宇說。
他在會后的媒體采訪期間透露,后續至強還將支持數據傳輸速率達到12800MT/s的MRDIMM,這對AI及HPC(高性能計算)工作負載都很重要。
英特爾中國區顯卡和AI高級產品總監徐金平補充說,銳炫Pro B70的價格也很有競爭力,同時英特爾正持續加大對新模型、新生態的投入。
二、銳炫Pro B70:大顯存、長窗口、高并發
英特爾銳炫Pro B70顯卡基于第二代Xe2架構,配備32GB顯存,AI算力峰值高達367TOPS,對圖形渲染、通用并行計算與AI加速計算等專業工作負載都進行了專項優化。
銳炫Pro B65同樣搭載32GB顯存,提供197TOPS算力,價格更親民,面向對顯存敏感但算力需求適中的用戶群。
![]()
銳炫Pro B70的架構設計有如下重點:
- 搭載32個Xe核心,每個Xe核心有8個向量處理核心(XVE)和8個矩陣計算核心(XMX),延續了Xe架構在通用并行計算上的能力,并對數據吞吐和執行效率做了提升。
- 32個光線追蹤單元,通過物理引擎處理實時光追計算。
- 強大的視頻編解碼和后處理單元,對很多最新視頻格式都實現了硬編硬解。
面向AI推理需求,銳炫Pro B70在AI推理場景中支持更大規模的AI模型與更長的上下文窗口,可在多用戶并發場景下支持高吞吐量與快速響應。
![]()
面向多樣化部署需求,該顯卡支持SR-IOV虛擬化與50余家ISV軟件認證,可靈活擴展多卡配置,配合完整的Linux軟件棧(含vLLM、oneAPI、PyTorch)。
銳炫Pro B70運行11款專業GPU應用上的表現如下圖所示,對比B60提升顯著,并完成了針對這些專業軟件的適配和認證,確保長期跑得穩、結果可信、功能完整且與實際工作流高度兼容。
![]()
現場演示了基于銳炫Pro B70的多項本地AI應用效果:
(1)文生圖:一臺本地筆記本連接到Demo區的一臺4卡銳炫Pro B70工作站,在ComfyUI工作區上,僅用3.9秒,就生成了一張1024×1024的高清圖片。單張銳炫Pro B70顯卡僅需不到30秒,就能生成一張4K分辨率的高清圖。
(2)圖生圖:基于單卡銳炫Pro B70,亦心科技AI閃繪應用能將手繪草圖近乎實時地繪制成高清設計大作。
(3)圖生視頻:使用單張銳炫Pro B70,在本地運行Wan 2.2 I2V-18B FP8開源模型,92秒生成一段5秒480P視頻。
(4)“龍蝦”智能體:基于酷睿Ultra加單張銳炫Pro B70的個人龍蝦工作站方案,運行本地Qwen 3.5-35B A3B量化模型,去模擬小說續寫場景,可輕松支撐128K或256K滿上下文推理。
![]()
知名車評人、旅行家韓路重點夸了銳炫Pro B70的視頻編解碼性能。對于重型視頻節目,大概有10-20軌4K 60的素材并行,如果顯卡解碼能力不行,拖拽時會特別慢,使用銳炫Pro B70后提效顯著,剪輯同事反饋說拖拽很流暢。
還有一些面向企業級應用場景的案例:
(1)多路視頻會議:聯想智能會議系統Lenovo SCH-900S搭載銳炫Pro B70,可實現20路多會議室并發接入與實時AI會議紀要的生成,顯著提升溝通效率與執行落地速度。
(2)長上下文RAG解決方案:借助英特爾銳炫Pro B70多卡并發能力,飛致云面向企業級場景的長上下文RAG解決方案可支持LLM/VLM高效多卡并發推理。飛致云展示了基于MaxKB平臺的測試數據,2卡銳炫Pro B70運行14B模型可支持24路并發,8卡運行32B模型可支持60路并發,且每路響應速度保持在15TPS及以上。
![]()
(3)電子病歷智能體方案:東華醫為在8卡B70服務器上部署電子病歷智能體,病歷輔助生成性能較B60提升至8倍,病歷內涵質控提升67%,2-3臺8卡B70可滿足一家中等規模三甲醫院的需求,可助力醫療機構提升診療質量和效率。
此外,英特爾與火山引擎共同打造了AgentSphere一體機聯合方案。借助英特爾至強600與銳炫Pro B70,AgentSphere具備了更高并發、更低時延、更少抖動的多智能體協同能力,同時開箱即用的標準一體機方案降低了AI落地企業的使用門檻與維護成本,能夠更便捷地幫助企業打造AI員工管理平臺,提升生產效率。
![]()
針對工業界AI軟件棧迭代速度快、軟件復雜度高、性能優化繁瑣等問題,英特爾采用了容器化交付全棧軟件的方式,最大程度保證用戶安裝即可用。
![]()
英特爾會持續分階段發布和更新組件中的升級包,對全新模型和全新kernel的第一時間支持。
結語:智能體需求爆發,工作站成企業級剛需平臺
作為企業級智能體和大模型推理落地的必要平臺之一,工作站憑借就近部署、靈活高效、高性價比、隱私安全、更加輕量的IT運維要求、服務器級別的性能穩定保證等優勢,正成為AI算力基礎設施中不可或缺的一層。
英特爾AI工作站的核心價值源于開放協同的產業生態。英特爾聯合全體生態伙伴,打造從底層算力到行業場景的完整價值鏈路,既聯動協同軟件與模型合作伙伴,又與行業伙伴共同探索在金融、制造、科研、創意等領域的創新解決方案,以幫助各行各業切實應對大模型部署成本高、數據安全與響應效率等現實挑戰,將技術創新轉化為生產力。
在更宏觀的市場層面,CPU缺貨仍將持續。高宇坦言,受智能體需求爆發影響,內存需求與CPU需求都在上漲,CPU需求增速已超越業內幾乎所有人原來的預判,預計要等大量擴產和需求下滑后才能緩解供需缺口。
在工作站形態方面,英特爾正推動液冷、超靜音和小型化:單卡方案目標機箱做到8L以內、噪音35dB以下,雙卡機箱做到14L以內、噪音40dB以下,4卡機箱做到35L以內。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.