網易首頁 > 網易號 > 正文申請入駐

這家國產GPU廠商，再獲超10億元融資！

2026-04-20 20:22:25　來源: 芯智訊

廣東舉報

分享至

4月20日，國內全棧自研 AI 推理 GPU 企業——杭州曦望芯科智能科技有限公司（簡稱“曦望”）通過官方微信公眾號宣布，已經完成新一輪超10億元人民幣融資。

而在去年7月初，曦望才剛完成近10億元融資。當時這輪融資由三一集團旗下華胥基金、第四范式、游族網絡、北京利爾、松禾資本、海通開元等多家機構共同參與。

沒想到，時隔僅10個月不到，曦望又完成了新一輪超10億元的融資。

至此，分拆獨立僅一年多的曦望已累計完成七輪融資，總融資額約 40 億元，成為國內首家估值超百億的純推理 GPU 獨角獸。

據介紹，本輪融資資金將主要用于新一代啟望 S3 推理 GPU 的規模化量產交付、全棧軟件生態建設，以及 S4/S5 后續芯片的研發迭代。

曦望在官方新聞稿中指出，2026 年被行業公認為“AI 智能體元年”。隨著大模型從“會聊天”進化為“會思考、會執行”的數字員工，推理需求迎來爆發式增長。英偉達 GTC 2026 大會正式宣告 AI 產業全面邁入“推理落地、智能體普及”的新時代，將“每瓦 Token 吞吐量”定義為 AI 時代的核心競爭力。這與曦望自創立之初就鎖定的核心戰場高度契合。

“AI 算力基建的重心已徹底切換。”曦望董事長徐冰表示，“2026 年 AI 推理計算需求將達到訓練需求的 4-5 倍，推理算力租賃價格半年漲幅近 40%。”

資料顯示，曦望前身是商湯大芯片部門，2024年底分拆獨立運營，專注于高性能GPU及多模態場景AI推理芯片的研發與商業化。公司研發團隊憑借8年技術沉淀、20億研發投入及兩代量產芯片的工程化驗證，已成為國產GPU替代的核心力量。公司致力于為千行百業提供成本降低10倍、能效比突破的智能算力基石，通過技術創新和深度產業協同，推動各行業的智能化發展，并助力實現通用人工智能（AGI）的普惠化目標。

目前，曦望團隊規模已增長至 400 人，研發人員占比超 80%，匯聚了來自英偉達、AMD、華為海思等國內外頂尖芯片企業的核心人才，碩士及以上學歷占比超 80%。團隊融合了芯片設計、高性能計算、AI 算法、軟硬產品的跨行業人才。

在具體產品方面，曦望目前的產品線主要包括已經量產的曦望S1、S2和即將量產的S3。

△從左至右：曦望 S1、曦望 S2-M1模組、曦望 S2-X1加速卡

其中，S1是面向云端和邊緣端視覺推理的專用芯片，主要用于視頻分析模型推理，支撐CV類人工智能應用的計算需求，出貨量已超過2萬片；

S2是面向大模型推理的GPGPU產品，采用采用7nm工藝，兼容主流的英偉達CUDA生態，其性能水平可對標英偉達A100。S2的研發涵蓋指令集、GPGPU IP架構、算子開發及編譯器工具鏈等全部核心技術，實現完全自研。

曦望于2026年1月正式發布了新一代旗艦產品啟望 S3 推理 GPU。這是國內首款搭載 LPDDR6 且兼容 LPDDR5X 內存的推理 GPU，它沒有盲目照搬高端訓練 GPU 的 HBM 顯存路線，而是基于 Agent 推理的本質需求，從 AI Core 計算架構到內存 IO 系統進行了全鏈路重構。

據介紹，啟望 S3 通過計算層的深度定制，解決了通用 GPU“算力用不滿”的核心痛點，推理性能較上一代 S2 提升 5 倍，目標實現 Token 成本下降 90%。

具體來說，啟望 S3 將GEMM 和 Flash Attention 兩項核心算子（在大模型推理中，占總計算量的 90%以上）的利用率分別推至約 99%與 98%，標稱算力幾乎都轉化為有效吞吐，同樣硬件投入可服務更多并發請求。

啟望 S3 采用 128-bit 指令集+支持 3D 指令，指令密度領先傳統 SIMT 架構；獨立線程調度精準匹配智能體復雜控制流，消除條件跳轉帶來的流水線代價；通過 Block cluster 和 Broadcast 等技術實現片上數據復用，減少對外帶寬依賴，大幅提升 Agent 多輪推理效率。

啟望 S3 還原生支持 FP16 至 FP4 全鏈路低精度運算，在 DeepSeek V3/R1 等主流模型上實現接近無損的 FP4 推理，吞吐量較 FP16 提升 3-4 倍，直接轉化為客戶側的毛利空間和價格彈性。

在接口方面，啟望 S3 創新性地集成了LPDDR6內存接口、高速 SerDes+SUE 融合互聯技術、PCIe Gen6接口這三大先進高速接口技術，從內存和 IO 兩個推理時代最核心的瓶頸入手，解決了智能體三大核心瓶頸。

從產業周期看，訓練側格局已相對固化，而推理側正隨 Agentic AI 放量進入指數級增長通道——多家機構預測，未來五年推理算力市場規模將超越訓練側數倍，其中 Agent 類負載將貢獻最主要的增量。

曦望表示，啟望 S3 同時具備三個難以共存的要素：推理原生的架構前瞻性；實現 98-99% 算子利用率的頂尖工程能力；完整的生態適配能力。

“啟望 S3 不是簡單的性能升級，而是一次對 AI 推理成本曲線的重構。”徐冰表示，“我們的目標是將推理成本降至‘百萬 Token 一分錢’，讓 AI 像水電一樣成為普惠基礎設施。”

在本輪融資的助力下，2026 年，曦望將圍繞“落地、兌現、增長”核心原則，將全力推進啟望 S3 芯片量產交付，完成與國內外主流大模型、多模態模型和Agent框架的全面適配。同時，公司已完成啟望 S4 高性能推理 GPU 和啟望 S5 安全可控推理 GPU 的技術路線規劃，持續加碼近存計算、光電共封等前沿技術探索。

編輯：芯智訊-浪客劍

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.