![]()
4月20日,國內全棧自研 AI 推理 GPU 企業——杭州曦望芯科智能科技有限公司(簡稱“曦望”)通過官方微信公眾號宣布,已經完成新一輪超10億元人民幣融資。
而在去年7月初,曦望才剛完成近10億元融資。當時這輪融資由三一集團旗下華胥基金、第四范式、游族網絡、北京利爾、松禾資本、海通開元等多家機構共同參與。
沒想到,時隔僅10個月不到,曦望又完成了新一輪超10億元的融資。
至此,分拆獨立僅一年多的曦望已累計完成七輪融資,總融資額約 40 億元,成為國內首家估值超百億的純推理 GPU 獨角獸。
據介紹,本輪融資資金將主要用于新一代啟望 S3 推理 GPU 的規模化量產交付、全棧軟件生態建設,以及 S4/S5 后續芯片的研發迭代。
曦望在官方新聞稿中指出,2026 年被行業公認為“AI 智能體元年”。隨著大模型從“會聊天”進化為“會思考、會執行”的數字員工,推理需求迎來爆發式增長。英偉達 GTC 2026 大會正式宣告 AI 產業全面邁入“推理落地、智能體普及”的新時代,將“每瓦 Token 吞吐量”定義為 AI 時代的核心競爭力。這與曦望自創立之初就鎖定的核心戰場高度契合。
“AI 算力基建的重心已徹底切換。”曦望董事長徐冰表示,“2026 年 AI 推理計算需求將達到訓練需求的 4-5 倍,推理算力租賃價格半年漲幅近 40%。”
資料顯示,曦望前身是商湯大芯片部門,2024年底分拆獨立運營,專注于高性能GPU及多模態場景AI推理芯片的研發與商業化。公司研發團隊憑借8年技術沉淀、20億研發投入及兩代量產芯片的工程化驗證,已成為國產GPU替代的核心力量。公司致力于為千行百業提供成本降低10倍、能效比突破的智能算力基石,通過技術創新和深度產業協同,推動各行業的智能化發展,并助力實現通用人工智能(AGI)的普惠化目標。
目前,曦望團隊規模已增長至 400 人,研發人員占比超 80%,匯聚了來自英偉達、AMD、華為海思等國內外頂尖芯片企業的核心人才,碩士及以上學歷占比超 80%。團隊融合了芯片設計、高性能計算、AI 算法、軟硬產品的跨行業人才。
在具體產品方面,曦望目前的產品線主要包括已經量產的曦望S1、S2和即將量產的S3。
![]()
△從左至右:曦望 S1、曦望 S2-M1模組、曦望 S2-X1加速卡
其中,S1是面向云端和邊緣端視覺推理的專用芯片,主要用于視頻分析模型推理,支撐CV類人工智能應用的計算需求,出貨量已超過2萬片;
S2是面向大模型推理的GPGPU產品,采用采用7nm工藝,兼容主流的英偉達CUDA生態,其性能水平可對標英偉達A100。S2的研發涵蓋指令集、GPGPU IP架構、算子開發及編譯器工具鏈等全部核心技術,實現完全自研。
曦望于2026年1月正式發布了新一代旗艦產品啟望 S3 推理 GPU。這是國內首款搭載 LPDDR6 且兼容 LPDDR5X 內存的推理 GPU,它沒有盲目照搬高端訓練 GPU 的 HBM 顯存路線,而是基于 Agent 推理的本質需求,從 AI Core 計算架構到內存 IO 系統進行了全鏈路重構。
![]()
據介紹,啟望 S3 通過計算層的深度定制,解決了通用 GPU“算力用不滿”的核心痛點,推理性能較上一代 S2 提升 5 倍,目標實現 Token 成本下降 90%。
具體來說,啟望 S3 將GEMM 和 Flash Attention 兩項核心算子(在大模型推理中,占總計算量的 90%以上)的利用率分別推至約 99%與 98%,標稱算力幾乎都轉化為有效吞吐,同樣硬件投入可服務更多并發請求。
啟望 S3 采用 128-bit 指令集+支持 3D 指令,指令密度領先傳統 SIMT 架構;獨立線程調度精準匹配智能體復雜控制流,消除條件跳轉帶來的流水線代價;通過 Block cluster 和 Broadcast 等技術實現片上數據復用,減少對外帶寬依賴,大幅提升 Agent 多輪推理效率。
啟望 S3 還原生支持 FP16 至 FP4 全鏈路低精度運算,在 DeepSeek V3/R1 等主流模型上實現接近無損的 FP4 推理,吞吐量較 FP16 提升 3-4 倍,直接轉化為客戶側的毛利空間和價格彈性。
在接口方面,啟望 S3 創新性地集成了LPDDR6內存接口、高速 SerDes+SUE 融合互聯技術、PCIe Gen6接口這三大先進高速接口技術,從內存和 IO 兩個推理時代最核心的瓶頸入手,解決了智能體三大核心瓶頸。
從產業周期看,訓練側格局已相對固化,而推理側正隨 Agentic AI 放量進入指數級增長通道——多家機構預測,未來五年推理算力市場規模將超越訓練側數倍,其中 Agent 類負載將貢獻最主要的增量。
曦望表示,啟望 S3 同時具備三個難以共存的要素:推理原生的架構前瞻性;實現 98-99% 算子利用率的頂尖工程能力;完整的生態適配能力。
“啟望 S3 不是簡單的性能升級,而是一次對 AI 推理成本曲線的重構。”徐冰表示,“我們的目標是將推理成本降至‘百萬 Token 一分錢’,讓 AI 像水電一樣成為普惠基礎設施。”
在本輪融資的助力下,2026 年,曦望將圍繞“落地、兌現、增長”核心原則,將全力推進啟望 S3 芯片量產交付,完成與國內外主流大模型、多模態模型和Agent框架的全面適配。同時,公司已完成啟望 S4 高性能推理 GPU 和啟望 S5 安全可控推理 GPU 的技術路線規劃,持續加碼近存計算、光電共封等前沿技術探索。
編輯:芯智訊-浪客劍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.