<ruby id="9ue20"></ruby>

国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线

<sub id="1ajwg"><p id="1ajwg"></p></sub><p id="1ajwg"><li id="1ajwg"></li></p>

<cite id="1ajwg"></cite>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

曝GPT-5.5用上「全球最快芯片」，Claude慌了！

2026-05-18 18:59:42　來源: 新智元

北京舉報

0

分享至

新智元報道

【新智元導讀】120B模型飆到2000 token/秒，CFO更放話已在跑GPT-5.5！Cerebras 560億美元IPO首日暴漲68%，但SemiAnalysis萬字拆解直指死穴。

SemiAnalysis，硅谷最硬核的芯片分析機構，4月份光是AI工具的訂閱費就燒到了年化1000萬美元。

其中80%花在同一個地方，Anthropic的Opus 4.6 fast模式。

它比標準模式貴6倍，但token輸出速度快2.5倍！

然后Opus 4.7來了。更聰明，跑分全面碾壓上一代，但工程師集體拒絕升級。

理由只有一個，4.7沒有fast模式。

他們寧可用更笨的模型，也要更快的token！

而這個趨勢的最大受益者，是一家剛剛以560億美元估值登陸納斯達克的芯片公司，Cerebras。

2000 token/秒，怎么來的

OpenAI今年2月甩出了GPT-5.3-Codex-Spark。

名字掛著GPT-5.3的招牌，但底層是一個從完整版GPT-5.3 Codex蒸餾出來的小模型，參數量只有原版的十分之一，120B。

雖然是用智能換來的，但速度確實夸張到離譜——2000 token/秒。

作為對比，Anthropic最快的Opus 4.6 fast大約70-100 token/秒，GPT-5系列在英偉達GPU上是大約130 token/秒。

而Codex-Spark一腳油門踩到了一個數量級開外。

讓它跑這么快的，正是Cerebras的WSE-3，一塊餐盤大小的晶圓級芯片。

這件事直接引爆了一筆246億美元的合同，也把Cerebras一路推進了納斯達克。5月14日首日暴漲68%，2026年至今最大科技IPO。

但Cerebras CFO Bob Komin說，這還只是開胃菜。

IPO前夜，他在采訪中亮了一張沒人預料到的牌——

我們服務所有模型，對模型大小沒有限制。今天，我們正在跑萬億參數的模型。我們正在跑OpenAI內部的GPT-5.4和GPT-5.5。

如果這是真的，Cerebras就不只是一個「小模型快跑」的玩家了，IPO當天的瘋狂漲幅立刻站得住腳。

但SemiAnalysis偏偏在同一周甩出了一篇兩萬字的技術拆解報告，直接把這個故事撕開了一道口子。

Cerebras公開云上，最大的生產模型是GPT-OSS，總參數120B；預覽模型最大355B。曾經上過的Llama 70B和405B，后來也被悄悄下了架。

2025年最火，但體量也更大的開源模型（比如DeepSeek），從頭到尾就沒出現在Cerebras Cloud上。

CFO口中的那個數字，目前只存在于「OpenAI內部」，外界無法驗證。

要搞清楚這中間的裂縫有多大，得先看看這塊晶圓到底是怎么回事。

一整塊硅的賭注

半導體行業干了50年的事情就是切硅片。

一整塊晶圓刻出幾十顆芯片，切割，封裝，各干各的。英偉達的B300已經把單顆芯片撐到了858平方毫米，基本上是光刻的極限了。

相比之下，Cerebras卻反其道而行——它不切。

整塊晶圓就是一顆芯片。

46,225平方毫米，比英偉達的GPU大58倍，大約一個餐盤的尺寸。上面集成了4萬億個晶體管、90萬個計算核心，和44GB的SRAM內存。

重點來了，SRAM。

GPU用的是HBM（高帶寬內存），容量大但速度相對慢。一塊B300配了288GB的HBM，帶寬在TB/秒級別。

WSE-3只有44GB的SRAM，但內存帶寬高達21PB/秒。

Cerebras速度碾壓的秘密就在這里。

SRAM帶寬大到解碼時幾乎可以把全部計算核心喂飽。GPU的計算核心只能餓著等內存。

而推理的瓶頸，正是解碼。

模型一個token一個token往外吐的時候，每吐一個就要把全部權重從內存里讀一遍。帶寬越高，讀得越快，token出得越快。

SemiAnalysis做了一個很直觀的對比。

同樣只給一個用戶生成token的場景下，GPU能實際利用的算力只有理論峰值的零頭。WSE-3理論上可以把全部15.6 PFLOPS的FP16算力吃滿。

差距不是百分之幾十，而是數量級的。

用他們的原話形容，這就像是公交車和F1的區別。

GPU是公交車，一次拉很多人但每個人都慢。WSE-3是F1賽車，一次只拉一個人但飛快。

想用賽車的客戶，甚至愿意付6倍價格來買速度。Opus 4.6 fast已經證明了這一點。

但這輛「車」有一個致命問題——它的「油箱」只有44升。

對于小模型來說，WSE-3的44GB SRAM綽綽有余，但放到今天的大模型面前根本不夠看。

DeepSeek V4有1.6萬億參數，即使用最激進的壓縮方式（FP8量化），光權重就要490GB。一塊WSE-3裝不下，要切成至少12塊塞進12塊晶圓。

分布就要通信，而這也是Cerebras最致命的短板。

每塊WSE-3對外帶寬只有150GB/秒。

英偉達一塊Blackwell GPU通過NVLink5能跑到900GB/秒，是Cerebras的6倍。被英偉達收購的Groq更夸張，單顆LPU3就有9.6Tb/秒，8倍。

帶寬加不了。這是物理層面的死結。

WSE-3的制造方式決定了一切。整塊晶圓用同一套模板反復曝光，12列7行，84個完全相同的die拼成一顆芯片。

想加高速通信端口（SerDes），就得在每個die里都加。但84個die里只有邊緣的能接到外面，中間的全是擺設，純粹浪費硅面積。

更要命的是，SerDes是模擬電路，面積大，還會干擾旁邊的數字邏輯。在die中間放SerDes，等于在自家的高速公路上挖坑。

所以Cerebras被困在了一個島嶼上。島上的高速公路四通八達，但通往外界的橋只有一座單車道。

如此一來，Cerebras跑大模型只剩一條路，把模型按層切開，每塊晶圓放幾層，晶圓之間只傳中間計算結果（比完整的模型權重小得多）。

但流水線越長，延遲越高。

SemiAnalysis算了一筆賬，12塊晶圓跑DeepSeek V4，光是層間傳輸的固定延遲就要疊加12次，緩存數據的搬運時間高達數毫秒。

所以CFO在CNBC上說的那番話，至少目前更像是路線圖上的故事。

但在120B以下這個區間，Cerebras交出的成績單沒什么好挑的。

代價是什么呢

知名評測機構Artificial Analysis用Llama 4 Maverick做過實測，Cerebras 2400 token/秒，英偉達Blackwell 1040 token/秒，直接碾了一倍多。

AI編程工具Devin背后的Cognition已經把Cerebras接進了產品，快速模式下1000 token/秒。Notion、LiveKit、GSK等也已經在用。

但代價是，公開云跑得動的上限就是GPT-OSS級別，最大上下文只有128K。

根據SemiAnalysis從Claude Code、Cursor等工具中采集的43.2萬條真實請求，其中有將近50%都超過了128K。

而Agent時代的上下文只會越來越長，128K很快就是瓶頸。

速度快，但模型小、上下文短、選擇少。這就是開發者今天拿到手的Cerebras。

但這里藏著一個很多人還沒注意到的細節，足以改變整個競爭格局。

Cerebras與OpenAI的協議里寫著一條排他條款，合同期內不得向「特定OpenAI競爭對手」出售產品。

CEO Feldman沒有點名，但所有人都知道指的是誰，Anthropic。

12%股權、10億美元貸款、246億美元訂單鎖定。Cerebras已經被牢牢綁在了OpenAI的戰車上。

推理戰爭，OpenAI剛剛換了一把槍

如今，AI軍備競賽的主戰場已經變了。

訓練只做一次，推理每天做數十億次。

2026年三分之二的AI算力消耗在推理上，到2027年預計達到80%。

根據OpenAI的計劃，AWS的Trainium負責理解用戶輸入，Cerebras負責生成輸出token，GPU負責訓練和長上下文，三套硬件各管一段。這套組合拳只為一件事，成本打下來，速度拉上去。

對比之下，Opus 4.6 fast的速度已經從100 token/秒退化到了70 token/秒，Cerebras也在合同里把它鎖在了門外。

那么問題來了，Anthropic的極速推理方案在哪里？

參考資料：

https://x.com/dee_bosa/status/2055351401472020949?s=20

https://newsletter.semianalysis.com/p/cerebras-faster-tokens-please

編輯：摩西

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

科技大佬Gavin Baker：亞馬遜芯片是黑馬，太空數據中心快來了，臺積電在幫所有人避泡沫

華爾街見聞官方 2026-05-18 11:04:29
29 跟貼 29
領先于Transformer！

機器之心Pro 2026-05-06 17:01:48
0 跟貼 0

Cerebras 跑贏英偉達 21 倍，老黃還在北京吃吃吃

鈦媒體APP 2026-05-18 08:43:10
1 跟貼 1

內存正在毀掉一切，所有的AI都要算力

愛范兒 2026-05-13 09:43:34
0 跟貼 0
特斯拉用400萬輛車，探索到算力芯片的邊界

新浪財經 2026-05-18 09:08:29
1 跟貼 1

英偉達財報本周重磅來襲！黃仁勛將面臨三大拷問

財聯社 2026-05-18 14:04:19
0 跟貼 0

網申即將收官！NVIDIA 2026 暑期實習最后上車機會

NVIDIA英偉達中國 2026-05-18 18:44:06
0 跟貼 0
硬核玩家逆向索尼PS2游戲機，利用原版芯片手工打造便攜掌機

IT之家 2026-05-18 18:24:19
2 跟貼 2

芯片之王的生存表演！訪華表面逛吃，背后全是算計！#黃仁勛 #燃起來了大國重器 #真財實學計劃 #零距...

財才說 2026-05-18 15:23:41
0 跟貼 0
黃仁勛在北京逛街，端著碗在店門口吃炸醬面，和周圍群眾熱情互動

小璐視界 2026-05-16 12:18:29
5 跟貼 5
從“追逐GPU”到“追逐Gigawatts”--Coatue CIO講述科技投資的“范式轉變”

華爾街見聞官方 2026-05-18 12:01:26
0 跟貼 0
嘴饞小貓就算被拴著繩子，也要爬到餐桌上吃飯

南陽日報 2026-05-17 20:07:30
173 跟貼 173
黃仁勛和他的外國妻子簡直太像了

不多不少 2026-05-18 02:15:53
0 跟貼 0
天壇竟是古代宇宙模型？建筑里藏著千年哲學密碼

開著車去流浪 2026-05-17 00:36:37
7 跟貼 7
樂道L80上市，李斌：首搭自研5納米芯片

貝殼財經 2026-05-16 23:30:39
0 跟貼 0
半年狂賺500億，曾被嘲笑“碎鈔機”的長鑫科技逆襲成“印鈔機”

華爾街見聞官方 2026-05-18 16:42:47
0 跟貼 0
80米！黃仁勛在上海張江租辦公大樓！造型有點特別！

GA環球建筑 2026-05-18 18:09:57
1 跟貼 1
英偉達CEO黃仁勛痛斥將GPU比作核武器；AI假圖“僅退款”成風

IT之家 2026-05-18 07:28:13
9 跟貼 9
黃仁勛全世界穿皮衣，唯獨在中國換上了大花襖

雷科技 2026-01-27 17:19:30
0 跟貼 0
英特爾開始試產蘋果部分低端芯片，打破臺積電18年獨家代工局面

快科技 2026-05-16 05:36:02
0 跟貼 0
“張雪機車”斬獲賽季第五冠

央視新聞客戶端 2026-05-17 20:33:31
24337 跟貼 24337
這個Harness普通人可用！

機器之心Pro 2026-04-21 15:47:04
0 跟貼 0
英偉達下周發布財報，光博會即將舉辦，哪些新主線站上風口？

每日經濟新聞 2026-05-18 00:05:28
0 跟貼 0
在荷花集市碰到了英偉達創始人黃仁勛，這趟沒白來

秋楓未語 2026-05-18 09:22:38
3 跟貼 3
英偉達創始人黃仁勛祖宅，竟然不是在美國，在浙江的一個小縣城！

小汪愛搞笑 2026-05-15 13:01:05
18 跟貼 18
內存太貴搞不定！V社Steam新主機大概率跳票至年底

游民星空 2026-05-18 09:07:21
3 跟貼 3
英偉達黃仁勛曾在臺大狂飆閩南話！

一只小太陽 2026-05-16 04:35:40
1 跟貼 1
Arm正面臨美國反壟斷調查

財聯社 2026-05-18 19:26:16
0 跟貼 0
偶遇世界首富英偉達老板黃仁勛，到陸家嘴菜市場體驗風土人情

搞怪的秋秋 2026-05-14 10:28:47
209 跟貼 209
Memtest86+ v8.10版發布：優化對Panther Lake平臺的支持

宗熙先生 2026-05-18 09:00:23
0 跟貼 0
黃仁勛，最新年薪公布

財聯社 2026-05-16 19:51:11
0 跟貼 0
32MB內存塞進4公里開放世界，R星怎么做到的

碳基打工人 2026-05-18 02:59:11
0 跟貼 0
平億近人的英偉達黃仁勛教主

煙潯渺渺 2026-05-16 02:46:54
19 跟貼 19
7172元拿下iPhone17 Pro！數百人擠進杭州Costco瘋搶降價蘋果手機，門店客服：17系列已賣空，正待補貨

極目新聞 2026-05-17 19:05:00
10720 跟貼 10720
智能手機成本壓力暴增 Q2內存再飆升 LPDDR5X最高漲價83%！至少漲到明年底

快科技 2026-05-17 09:50:38
1 跟貼 1
博威合金：GB300液冷板所用的異型散熱材料的驗證已通過，公司已小批量供貨

每日經濟新聞 2026-05-18 17:26:10
0 跟貼 0
股債雙殺！美國芯片股重挫，英偉達、英特爾跌超4%，白銀狂泄9%

每日經濟新聞 2026-05-16 19:50:15
0 跟貼 0
小米最強Soc來了！盧偉冰劇透玄戒芯片非常強今年就發布

快科技 2026-05-18 14:07:27
0 跟貼 0
中國智駕，撕開了全球頭部車企的供應鏈

嘻哈車 2026-05-16 10:32:29
3 跟貼 3
英偉達 & 普渡大學用agent閉環實現文生3D

機器之心Pro 2026-05-08 17:39:43
0 跟貼 0

用了多年手機號要大變！中國移動率先帶頭，關系每個人

用了多年手機號要大變！中國移動率先帶頭，關系每個人

林子說事

2026-05-16 20:34:24

多地緊急提醒：非必要不外出！上海馬上受影響，本周連續6天雨...

多地緊急提醒：非必要不外出！上海馬上受影響，本周連續6天雨...

上海約飯局

2026-05-18 15:32:46

情緒穩定度最高的三個星座

星座不求人

2026-05-17 21:47:43

原來如此！樊振東決賽兩敗勒布倫兄弟后，國乒長盛不衰原因曝光

原來如此！樊振東決賽兩敗勒布倫兄弟后，國乒長盛不衰原因曝光

林雁飛

2026-05-18 14:20:00

騎車去酒店、跑團演宮斗！這些運動圈子真的很“亂”嗎？

騎車去酒店、跑團演宮斗！這些運動圈子真的很“亂”嗎？

健身迷

2026-05-18 13:18:40

兒童患癌越來越多！多名院士呼吁：這些東西少給孩子吃！危害大！

兒童患癌越來越多！多名院士呼吁：這些東西少給孩子吃！危害大！

蜉蝣說

2026-05-17 21:59:37

4-3！騎士晉級東決，賽后3個好消息和一個壞消息，哈登絕不能拉胯

4-3！騎士晉級東決，賽后3個好消息和一個壞消息，哈登絕不能拉胯

阿纂看事

2026-05-18 18:29:55

楊梅也雙標？出口按歐盟標準，內銷隨意泡藥水，曝光黑幕者遭威脅

楊梅也雙標？出口按歐盟標準，內銷隨意泡藥水，曝光黑幕者遭威脅

垛垛糖

2026-05-17 14:11:26

電力利潤暴降435%，19個電力業績暴雷，僅14個高增長，別踩雷了

電力利潤暴降435%，19個電力業績暴雷，僅14個高增長，別踩雷了

鵬哥投研

2026-05-18 12:31:31

福建漳州楊梅泡藥風波持續發酵，無人收購，果農欲哭無淚，被害慘

福建漳州楊梅泡藥風波持續發酵，無人收購，果農欲哭無淚，被害慘

魔都姐姐雜談

2026-05-17 09:52:03

X：那個在全世界被看了1億次的美女

X：那個在全世界被看了1億次的美女

東京新青年

2026-05-17 16:10:38

沉默96小時后，中方準時反擊，戈蘭高地主權已定，以色列必須撤軍

沉默96小時后，中方準時反擊，戈蘭高地主權已定，以色列必須撤軍

云舟史策

2026-05-18 07:23:03

紀委大數據有多厲害？這幾類行為一查一個準，公職人員別再僥幸

紀委大數據有多厲害？這幾類行為一查一個準，公職人員別再僥幸

細說職場

2026-05-18 09:37:45

亡國滅種，斷子絕孫？歐洲反華先鋒立陶宛，正在從地圖上消失

亡國滅種，斷子絕孫？歐洲反華先鋒立陶宛，正在從地圖上消失

混沌錄

2026-05-18 17:05:26

塞爾維亞總統：將在特朗普和普京之后對中國進行國事訪問

塞爾維亞總統：將在特朗普和普京之后對中國進行國事訪問

俄羅斯衛星通訊社

2026-05-18 15:10:17

3分鐘傾家蕩產？年入千億“精神鴉片”，正精準掏空中國人的錢包

3分鐘傾家蕩產？年入千億“精神鴉片”，正精準掏空中國人的錢包

趣文說娛

2026-05-12 19:53:22

黃三、李四是誰？廣州荔灣多部門回應拆遷公告人名和地址質疑：房屋早已滅失，未實際補償

黃三、李四是誰？廣州荔灣多部門回應拆遷公告人名和地址質疑：房屋早已滅失，未實際補償

澎湃新聞

2026-05-18 14:10:27

項羽舉的鼎是千斤鼎，換算成現在的計算單位，一些運動員能做到嗎

項羽舉的鼎是千斤鼎，換算成現在的計算單位，一些運動員能做到嗎

抽象派大師

2026-05-18 00:10:52

重磅！哈登決定降薪！晉級東決！騎士還是離不開詹姆斯啊！

重磅！哈登決定降薪！晉級東決！騎士還是離不開詹姆斯啊！

慢歌輕步謠

2026-05-18 18:41:48

烏克蘭再攻入俄羅斯領土庫爾斯克！海馬斯摧毀紅軍村據點

烏克蘭再攻入俄羅斯領土庫爾斯克！海馬斯摧毀紅軍村據點

項鵬飛

2026-05-18 19:02:26

AI產業主平臺領航智能+時代

15243文章數 66875關注度

往期回顧全部

科技要聞

同一公司,有人獎金是6年工資,我卻只有半年

頭條要聞

585人村莊62人患癌村民舉報泡花堿工廠4年未得到解決

頭條要聞

585人村莊62人患癌村民舉報泡花堿工廠4年未得到解決

體育要聞

41歲，他還想第5次踢世界杯

娛樂要聞

票房會破14億！口碑第一電影出現了

財經要聞

中國芯片，怎么突然不便宜了？

汽車要聞

二排座椅能躺能轉/三排座椅能收納零跑D99座艙玩法多樣

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

家居

游戲

時尚

軍事航空

藝術要聞

這才是帝王書法“尖子生“，水平完勝宋徽宗

家居要聞

觀山隱秀心靈沉淀

110㎡淡而有致的生活表達
精神奢享對話塔尖需求
內在自敘，無域有方

Xbox性感擦邊廣告瘋傳！大雷美女手捧游戲主機？

夏天褲子不用多買，提前準備幾條休閑的闊腿褲，百搭舒適顯瘦

軍事要聞

莫斯科遭一年多來最大規模無人機襲擊 3死18傷

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板： julia无码中文字幕一区| 日本怡春院欧美一区二区三区| 欧美成人精品三级网站| www.色五月| 欧美亚洲国产一区二区三区| jizzjizz国产| 麻豆AV在线| 亚洲?日韩?中文字幕?色综合| 亚洲中文字幕无码av永久| mm1313亚洲国产电影精品| 亚洲人妖一区二区三区| 亚洲人成电影在线天堂色| 精品女同一区二区三区在线| 中文字幕丰满人妻熟女| 韩国无码一区二区AV| 国产免费看又黄又大又污的胸 | 久久精品成人亚洲另类欧美| 亚洲午夜av一区二区| 日韩精品电影一区亚洲高清| 精品成人国产一区二区| 亚洲人成网站色7799| 一区二区三区欧美| 无码天堂成人| 亚洲国产区最新地址| 国产精品乱一区二区三区| 亚洲AV无码成人精品区日韩密殿| 午夜福利视频一区| 欧美精品福利| 精品一区二区无码免费| 99久久国产宗和精品1上映| 五十路丰满中年熟女中出| 人妻少妇不满足中文字幕| 国产四虎永久免费观看| 国产熟妇搡bbbb搡bbbb| 欧美自拍另类欧美综合图片区| 人妻精品成人| 日韩亚洲国产激情一区二区| 亚洲天堂一区二区三区在线| jizz亚洲AV| 99视频精品全部国产| 国产免费无遮挡吃奶视频|

<sub id="lpxit"></sub>

<cite id="lpxit"></cite>

<blockquote id="lpxit"></blockquote>