<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      曝GPT-5.5用上「全球最快芯片」,Claude慌了!

      0
      分享至


      新智元報道


      【新智元導讀】120B模型飆到2000 token/秒,CFO更放話已在跑GPT-5.5!Cerebras 560億美元IPO首日暴漲68%,但SemiAnalysis萬字拆解直指死穴。

      SemiAnalysis,硅谷最硬核的芯片分析機構,4月份光是AI工具的訂閱費就燒到了年化1000萬美元。

      其中80%花在同一個地方,Anthropic的Opus 4.6 fast模式。

      它比標準模式貴6倍,但token輸出速度快2.5倍!


      然后Opus 4.7來了。更聰明,跑分全面碾壓上一代,但工程師集體拒絕升級。

      理由只有一個,4.7沒有fast模式。

      他們寧可用更笨的模型,也要更快的token!


      而這個趨勢的最大受益者,是一家剛剛以560億美元估值登陸納斯達克的芯片公司,Cerebras。

      2000 token/秒,怎么來的

      OpenAI今年2月甩出了GPT-5.3-Codex-Spark。

      名字掛著GPT-5.3的招牌,但底層是一個從完整版GPT-5.3 Codex蒸餾出來的小模型,參數量只有原版的十分之一,120B。

      雖然是用智能換來的,但速度確實夸張到離譜——2000 token/秒。

      作為對比,Anthropic最快的Opus 4.6 fast大約70-100 token/秒,GPT-5系列在英偉達GPU上是大約130 token/秒。

      而Codex-Spark一腳油門踩到了一個數量級開外。


      讓它跑這么快的,正是Cerebras的WSE-3,一塊餐盤大小的晶圓級芯片。

      這件事直接引爆了一筆246億美元的合同,也把Cerebras一路推進了納斯達克。5月14日首日暴漲68%,2026年至今最大科技IPO。

      但Cerebras CFO Bob Komin說,這還只是開胃菜。

      IPO前夜,他在采訪中亮了一張沒人預料到的牌——

      我們服務所有模型,對模型大小沒有限制。今天,我們正在跑萬億參數的模型。我們正在跑OpenAI內部的GPT-5.4和GPT-5.5。

      如果這是真的,Cerebras就不只是一個「小模型快跑」的玩家了,IPO當天的瘋狂漲幅立刻站得住腳。


      但SemiAnalysis偏偏在同一周甩出了一篇兩萬字的技術拆解報告,直接把這個故事撕開了一道口子。

      Cerebras公開云上,最大的生產模型是GPT-OSS,總參數120B;預覽模型最大355B。曾經上過的Llama 70B和405B,后來也被悄悄下了架。

      2025年最火,但體量也更大的開源模型(比如DeepSeek),從頭到尾就沒出現在Cerebras Cloud上。


      CFO口中的那個數字,目前只存在于「OpenAI內部」,外界無法驗證。

      要搞清楚這中間的裂縫有多大,得先看看這塊晶圓到底是怎么回事。

      一整塊硅的賭注

      半導體行業干了50年的事情就是切硅片。

      一整塊晶圓刻出幾十顆芯片,切割,封裝,各干各的。英偉達的B300已經把單顆芯片撐到了858平方毫米,基本上是光刻的極限了。

      相比之下,Cerebras卻反其道而行——它不切。

      整塊晶圓就是一顆芯片。

      46,225平方毫米,比英偉達的GPU大58倍,大約一個餐盤的尺寸。上面集成了4萬億個晶體管、90萬個計算核心,和44GB的SRAM內存。


      重點來了,SRAM。

      GPU用的是HBM(高帶寬內存),容量大但速度相對慢。一塊B300配了288GB的HBM,帶寬在TB/秒級別。

      WSE-3只有44GB的SRAM,但內存帶寬高達21PB/秒。



      Cerebras速度碾壓的秘密就在這里。

      SRAM帶寬大到解碼時幾乎可以把全部計算核心喂飽。GPU的計算核心只能餓著等內存。

      而推理的瓶頸,正是解碼。

      模型一個token一個token往外吐的時候,每吐一個就要把全部權重從內存里讀一遍。帶寬越高,讀得越快,token出得越快。


      SemiAnalysis做了一個很直觀的對比。

      同樣只給一個用戶生成token的場景下,GPU能實際利用的算力只有理論峰值的零頭。WSE-3理論上可以把全部15.6 PFLOPS的FP16算力吃滿。

      差距不是百分之幾十,而是數量級的。


      用他們的原話形容,這就像是公交車和F1的區別。

      GPU是公交車,一次拉很多人但每個人都慢。WSE-3是F1賽車,一次只拉一個人但飛快。

      想用賽車的客戶,甚至愿意付6倍價格來買速度。Opus 4.6 fast已經證明了這一點。

      但這輛「車」有一個致命問題——它的「油箱」只有44升。


      對于小模型來說,WSE-3的44GB SRAM綽綽有余,但放到今天的大模型面前根本不夠看。

      DeepSeek V4有1.6萬億參數,即使用最激進的壓縮方式(FP8量化),光權重就要490GB。一塊WSE-3裝不下,要切成至少12塊塞進12塊晶圓。

      分布就要通信,而這也是Cerebras最致命的短板。

      每塊WSE-3對外帶寬只有150GB/秒。

      英偉達一塊Blackwell GPU通過NVLink5能跑到900GB/秒,是Cerebras的6倍。被英偉達收購的Groq更夸張,單顆LPU3就有9.6Tb/秒,8倍。


      帶寬加不了。這是物理層面的死結。

      WSE-3的制造方式決定了一切。整塊晶圓用同一套模板反復曝光,12列7行,84個完全相同的die拼成一顆芯片。

      想加高速通信端口(SerDes),就得在每個die里都加。但84個die里只有邊緣的能接到外面,中間的全是擺設,純粹浪費硅面積。

      更要命的是,SerDes是模擬電路,面積大,還會干擾旁邊的數字邏輯。在die中間放SerDes,等于在自家的高速公路上挖坑。


      所以Cerebras被困在了一個島嶼上。島上的高速公路四通八達,但通往外界的橋只有一座單車道。

      如此一來,Cerebras跑大模型只剩一條路,把模型按層切開,每塊晶圓放幾層,晶圓之間只傳中間計算結果(比完整的模型權重小得多)。

      但流水線越長,延遲越高。

      SemiAnalysis算了一筆賬,12塊晶圓跑DeepSeek V4,光是層間傳輸的固定延遲就要疊加12次,緩存數據的搬運時間高達數毫秒。



      所以CFO在CNBC上說的那番話,至少目前更像是路線圖上的故事。

      但在120B以下這個區間,Cerebras交出的成績單沒什么好挑的。

      代價是什么呢

      知名評測機構Artificial Analysis用Llama 4 Maverick做過實測,Cerebras 2400 token/秒,英偉達Blackwell 1040 token/秒,直接碾了一倍多。

      AI編程工具Devin背后的Cognition已經把Cerebras接進了產品,快速模式下1000 token/秒。Notion、LiveKit、GSK等也已經在用。


      但代價是,公開云跑得動的上限就是GPT-OSS級別,最大上下文只有128K。

      根據SemiAnalysis從Claude Code、Cursor等工具中采集的43.2萬條真實請求,其中有將近50%都超過了128K。

      而Agent時代的上下文只會越來越長,128K很快就是瓶頸。


      速度快,但模型小、上下文短、選擇少。這就是開發者今天拿到手的Cerebras。

      但這里藏著一個很多人還沒注意到的細節,足以改變整個競爭格局。

      Cerebras與OpenAI的協議里寫著一條排他條款,合同期內不得向「特定OpenAI競爭對手」出售產品。

      CEO Feldman沒有點名,但所有人都知道指的是誰,Anthropic。

      12%股權、10億美元貸款、246億美元訂單鎖定。Cerebras已經被牢牢綁在了OpenAI的戰車上。

      推理戰爭,OpenAI剛剛換了一把槍

      如今,AI軍備競賽的主戰場已經變了。

      訓練只做一次,推理每天做數十億次。

      2026年三分之二的AI算力消耗在推理上,到2027年預計達到80%。

      根據OpenAI的計劃,AWS的Trainium負責理解用戶輸入,Cerebras負責生成輸出token,GPU負責訓練和長上下文,三套硬件各管一段。這套組合拳只為一件事,成本打下來,速度拉上去。


      對比之下,Opus 4.6 fast的速度已經從100 token/秒退化到了70 token/秒,Cerebras也在合同里把它鎖在了門外。

      那么問題來了,Anthropic的極速推理方案在哪里?

      參考資料:

      https://x.com/dee_bosa/status/2055351401472020949?s=20

      https://newsletter.semianalysis.com/p/cerebras-faster-tokens-please

      編輯:摩西

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      用了多年手機號要大變!中國移動率先帶頭,關系每個人

      用了多年手機號要大變!中國移動率先帶頭,關系每個人

      林子說事
      2026-05-16 20:34:24
      多地緊急提醒:非必要不外出!上海馬上受影響,本周連續6天雨...

      多地緊急提醒:非必要不外出!上海馬上受影響,本周連續6天雨...

      上海約飯局
      2026-05-18 15:32:46
      情緒穩定度最高的三個星座

      情緒穩定度最高的三個星座

      星座不求人
      2026-05-17 21:47:43
      原來如此!樊振東決賽兩敗勒布倫兄弟后,國乒長盛不衰原因曝光

      原來如此!樊振東決賽兩敗勒布倫兄弟后,國乒長盛不衰原因曝光

      林雁飛
      2026-05-18 14:20:00
      騎車去酒店、跑團演宮斗!這些運動圈子真的很“亂”嗎?

      騎車去酒店、跑團演宮斗!這些運動圈子真的很“亂”嗎?

      健身迷
      2026-05-18 13:18:40
      兒童患癌越來越多!多名院士呼吁:這些東西少給孩子吃!危害大!

      兒童患癌越來越多!多名院士呼吁:這些東西少給孩子吃!危害大!

      蜉蝣說
      2026-05-17 21:59:37
      4-3!騎士晉級東決,賽后3個好消息和一個壞消息,哈登絕不能拉胯

      4-3!騎士晉級東決,賽后3個好消息和一個壞消息,哈登絕不能拉胯

      阿纂看事
      2026-05-18 18:29:55
      楊梅也雙標?出口按歐盟標準,內銷隨意泡藥水,曝光黑幕者遭威脅

      楊梅也雙標?出口按歐盟標準,內銷隨意泡藥水,曝光黑幕者遭威脅

      垛垛糖
      2026-05-17 14:11:26
      電力利潤暴降435%,19個電力業績暴雷,僅14個高增長,別踩雷了

      電力利潤暴降435%,19個電力業績暴雷,僅14個高增長,別踩雷了

      鵬哥投研
      2026-05-18 12:31:31
      福建漳州楊梅泡藥風波持續發酵,無人收購,果農欲哭無淚,被害慘

      福建漳州楊梅泡藥風波持續發酵,無人收購,果農欲哭無淚,被害慘

      魔都姐姐雜談
      2026-05-17 09:52:03
      X:那個在全世界被看了1億次的美女

      X:那個在全世界被看了1億次的美女

      東京新青年
      2026-05-17 16:10:38
      沉默96小時后,中方準時反擊,戈蘭高地主權已定,以色列必須撤軍

      沉默96小時后,中方準時反擊,戈蘭高地主權已定,以色列必須撤軍

      云舟史策
      2026-05-18 07:23:03
      紀委大數據有多厲害?這幾類行為一查一個準,公職人員別再僥幸

      紀委大數據有多厲害?這幾類行為一查一個準,公職人員別再僥幸

      細說職場
      2026-05-18 09:37:45
      亡國滅種,斷子絕孫?歐洲反華先鋒立陶宛,正在從地圖上消失

      亡國滅種,斷子絕孫?歐洲反華先鋒立陶宛,正在從地圖上消失

      混沌錄
      2026-05-18 17:05:26
      塞爾維亞總統:將在特朗普和普京之后對中國進行國事訪問

      塞爾維亞總統:將在特朗普和普京之后對中國進行國事訪問

      俄羅斯衛星通訊社
      2026-05-18 15:10:17
      3分鐘傾家蕩產?年入千億“精神鴉片”,正精準掏空中國人的錢包

      3分鐘傾家蕩產?年入千億“精神鴉片”,正精準掏空中國人的錢包

      趣文說娛
      2026-05-12 19:53:22
      黃三、李四是誰?廣州荔灣多部門回應拆遷公告人名和地址質疑:房屋早已滅失,未實際補償

      黃三、李四是誰?廣州荔灣多部門回應拆遷公告人名和地址質疑:房屋早已滅失,未實際補償

      澎湃新聞
      2026-05-18 14:10:27
      項羽舉的鼎是千斤鼎,換算成現在的計算單位,一些運動員能做到嗎

      項羽舉的鼎是千斤鼎,換算成現在的計算單位,一些運動員能做到嗎

      抽象派大師
      2026-05-18 00:10:52
      重磅!哈登決定降薪!晉級東決!騎士還是離不開詹姆斯啊!

      重磅!哈登決定降薪!晉級東決!騎士還是離不開詹姆斯啊!

      慢歌輕步謠
      2026-05-18 18:41:48
      烏克蘭再攻入俄羅斯領土庫爾斯克!海馬斯摧毀紅軍村據點

      烏克蘭再攻入俄羅斯領土庫爾斯克!海馬斯摧毀紅軍村據點

      項鵬飛
      2026-05-18 19:02:26
      2026-05-18 19:55:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15243文章數 66875關注度
      往期回顧 全部

      科技要聞

      同一公司,有人獎金是6年工資,我卻只有半年

      頭條要聞

      585人村莊62人患癌 村民舉報泡花堿工廠4年未得到解決

      頭條要聞

      585人村莊62人患癌 村民舉報泡花堿工廠4年未得到解決

      體育要聞

      41歲,他還想第5次踢世界杯

      娛樂要聞

      票房會破14億!口碑第一電影出現了

      財經要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      二排座椅能躺能轉/三排座椅能收納 零跑D99座艙玩法多樣

      態度原創

      藝術
      家居
      游戲
      時尚
      軍事航空

      藝術要聞

      這才是帝王書法“尖子生“,水平完勝宋徽宗

      家居要聞

      觀山隱秀 心靈沉淀

      Xbox性感擦邊廣告瘋傳!大雷美女手捧游戲主機?

      夏天褲子不用多買,提前準備幾條休閑的闊腿褲,百搭舒適顯瘦

      軍事要聞

      莫斯科遭一年多來最大規模無人機襲擊 3死18傷

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: julia无码中文字幕一区| 日本怡春院欧美一区二区三区| 欧美成人精品三级网站| www.色五月| 欧美亚洲国产一区二区三区| jizzjizz国产| 麻豆AV在线| 亚洲?日韩?中文字幕?色综合| 亚洲中文字幕无码av永久| mm1313亚洲国产电影精品| 亚洲人妖一区二区三区| 亚洲人成电影在线天堂色| 精品女同一区二区三区在线| 中文字幕丰满人妻熟女| 韩国无码一区二区AV| 国产免费看又黄又大又污的胸 | 久久精品成人亚洲另类欧美| 亚洲午夜av一区二区| 日韩精品 电影一区 亚洲高清| 精品成人国产一区二区| 亚洲人成网站色7799| 一区二区三区欧美| 无码天堂成人| 亚洲国产区最新地址| 国产精品乱一区二区三区| 亚洲AV无码成人精品区日韩密殿| 午夜福利视频一区| 欧美精品福利| 精品一区二区无码免费| 99久久国产宗和精品1上映| 五十路丰满中年熟女中出| 人妻少妇不满足中文字幕| 国产四虎永久免费观看| 国产熟妇搡bbbb搡bbbb| 欧美自拍另类欧美综合图片区| 人妻精品成人| 日韩亚洲国产激情一区二区| 亚洲天堂一区二区三区在线| jizz亚洲AV| 99视频精品全部国产| 国产免费无遮挡吃奶视频|