通常我們見到的電腦芯片只有指甲蓋大小,GPU 也就巴掌大,美國加州一家叫 Cerebras 的公司造出的芯片跟一個大號餐盤差不多,直徑超過 200 毫米,面積 46,225 平方毫米,集成了 4 萬億個晶體管。
這家公司于 2026 年 5 月 14 日在納斯達克上市,發行價 185 美元,開盤價 350 美元,首日大漲 89%,市值沖到 750 億美元。五位聯合創始人有四位來自一家被 AMD 收購的服務器公司 SeaMicro,另一位來自 MIT。他們從 2015 年開始默默干了近十年,如今帶著晶圓級芯片站到了 AI 算力競賽的最前排。
![]()
(來源:https://www.cerebras.ai/)
Cerebras 的核心產品叫晶圓級引擎,目前已經發展到第三代 WSE-3。傳統芯片制造是把一片晶圓切成上百顆小芯片,Cerebras 反其道而行之,不切割,直接把整片晶圓做成一顆芯片。這片晶圓上集成了 84 顆虛擬晶粒,每顆晶粒包含大約 10,700 個核心,整個芯片一共有 90 萬個計算核心。
這些核心通過一個 2D 網格狀的片上網絡連接,每個核心配有一個五端口的路由器,支持四個方向的數據傳輸和本地的讀寫操作。整個芯片的內存帶寬達到每秒 21 拍字節,片上網絡帶寬每秒 214 拍字節。
![]()
(來源:https://www.cerebras.ai/)
WSE-3 芯片采用臺積電 5 納米工藝制造,每個計算核心的面積大約 3.8 萬平方微米,其中一半是 48KB 的本地 SRAM,另一半是邏輯電路。整個芯片的 SRAM 總量達到 44GB。所有內存都分布在各核心旁邊,數據從內存到計算單元的物理距離只有幾十微米,不需要像傳統 GPU 那樣通過外部高帶寬內存 HBM 來獲取數據。Cerebras 聲稱,在同等硅片面積下,他們的內存帶寬是 GPU 的大約 200 倍。
![]()
(來源:https://www.cerebras.ai/)
這種架構特別適合處理神經網絡的非結構化稀疏,傳統 GPU 無論權重是否為 0 都會進行計算,Cerebras 的做法是在發送端就把 0 值過濾掉,只把非 0 數據通過片上網絡傳給對應的計算核心。每個數據包包含 16 位數據和 16 位控制信息,接收端收到數據后自動觸發乘加運算。這種方式避免了大量無效計算,在稀疏度較高的模型上可以獲得明顯加速。
該公司的技術白皮書顯示,對于 BLAS 級別低于通用矩陣乘法的運算,比如矩陣向量乘或向量標量乘,傳統芯片受限于內存帶寬往往無法滿負荷運行,Cerebras 的架構因為內存帶寬足夠高,可以保持高利用率。
![]()
(來源:https://www.cerebras.ai/)
Cerebras 的另一個核心技術叫 Weight Streaming,訓練大模型時模型權重不存儲在芯片上,而是放在一個叫 MemoryX 的外部設備里,按需流式傳輸到 WSE-3 芯片。計算每一層網絡時,權重從外部 DRAM 和閃存中讀取,通過芯片的輸入輸出接口送入計算核心。
每個權重到達核心后,與本地的激活值批量做乘加運算,計算完成后權重就被丟棄,不在芯片上停留。這種方法使得模型大小不受芯片內存容量的限制,可以支持萬億參數級別的超大模型。
![]()
(來源:https://www.cerebras.ai/)
在軟件層面,Cerebras 提供了完整的編譯工具鏈,可以把 PyTorch 或 TensorFlow 編寫的模型自動映射到 90 萬個核心上。對于 Transformer 類模型,激活張量有三個維度,批大小、序列長度和隱藏維度。編譯器會把隱藏維度切分到芯片的 X 方向,把批大小和序列長度切分到 Y 方向。
計算矩陣乘法時,權重按行廣播到對應列的所有核心,觸發乘加運算,然后在列方向上進行部分和歸約,最終結果分布在芯片上準備下一層的計算。所有計算調度都是靜態配置的,指令在運行前一次性加載,執行過程中不再改變。
![]()
(來源:https://www.cerebras.ai/)
Cerebras 的五位聯合創始人均有較深的芯片和系統背景。
CEO Andrew Feldman 畢業于斯坦福大學,此前創辦的微服務器公司 SeaMicro 被 AMD 以 3.57 億美元收購。
CTO Sean Lie 擁有麻省理工學院電子工程與計算機科學學士和碩士學歷,在 SeaMicro 擔任 IO 虛擬化架構師,被 AMD 收購后成為 AMD 院士。
系統架構師 Jean-Philippe Fricker 擁有洛桑聯邦理工學院碩士學歷,曾在 DSSD、SeaMicro、阿爾卡特朗訊和 Riverstone Networks 擔任硬件架構職務。
先進技術首席架構師 Michael James 擁有加州大學伯克利分校分子神經生物學、數學和計算機科學三個學位,在 SeaMicro 負責分布式系統軟件。
已榮譽退休的前 CTO Gary Lauterbach 擁有 50 多項專利,曾是 Sun Microsystems 的杰出工程師,主導了 UltraSPARC III 和 UltraSPARC IV 微處理器的架構設計。
Cerebras 的商業模式以銷售完整的 CS-3 系統為主,CS-3 是圍繞 WSE-3 芯片設計的整機系統,可以部署在數據中心的標準機架上。客戶主要來自科研機構和企業,包括阿聯酋的人工智能公司 G42 和穆罕默德·本·扎耶德人工智能大學。根據上市披露文件,2025 年 Cerebras 營收 5.1 億美元,其中 G42 貢獻了 24%,MBZUAI 貢獻了 62%。公司全年凈利潤 2.38 億美元,相比前一年的虧損 4.82 億美元實現了扭虧為盈。
Cerebras 曾在 2024 年嘗試上市,當時營收高度依賴單一客戶 G42,后者貢獻了 87% 的收入。由于涉及阿聯酋背景的交易需要經過美國外國投資委員會的審查,雖然最終獲得批準,Cerebras 還是撤回了上市申請。這次重新上市,客戶集中度已經有所改善,最大客戶 MBZUAI 占比降到 62%,不過前兩大客戶合計仍然貢獻了 86% 的收入,集中風險依然存在。
Cerebras 的技術路線在 AI 芯片領域獨樹一幟。其他挑戰者大多在架構上模仿 GPU,采用大量小核心配合 HBM 內存,Cerebras 選擇了用一片巨大的晶圓來解決問題。這種方案在稀疏計算和大模型推理上有明顯優勢,不過制造成本和良率也面臨挑戰。
整片晶圓上只要有一個致命缺陷就可能影響整顆芯片,Cerebras 通過在設計中加入冗余鏈路和自動糾錯機制來解決這個問題。晶圓級芯片的功耗和散熱也是工程難題,CS-3 系統為此設計了專門的液冷方案。
隨著 OpenAI、Anthropic、SpaceX 等 AI 公司即將陸續上市,AI 芯片賽道正在成為資本市場的焦點。Cerebras 作為第一家登陸納斯達克的純 AI 芯片新股,首日大漲 89% 給了后續企業一個積極的信號。
不過 AI 芯片市場的競爭也在加劇,除了英偉達,AMD、英特爾以及多家創業公司都在推出新產品。Cerebras 的晶圓級方案能否在主流 AI 訓練市場站穩腳跟,還需要更多客戶和更長時間來檢驗。
參考資料:
https://www.nytimes.com/2026/05/14/technology/cerebras-ipo-ai.html
https://www.linkedin.com/in/sean-lie-4a80097/
https://www.cerebras.ai/company/news
https://www.cerebras.ai/
排版:胡巍巍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.