<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      13人初創公司,要顛覆Transformer了!

      0
      分享至


      來源:新智元

      【導讀】Transformer統治地位懸了!一款SubQ模型帶著SAA架構橫空出世,1200萬上下文成本僅Opus的5%,計算量暴減千倍。

      Transformer,王座不保?!

      今天,一款AI模型SubQ橫空出世,震撼了全世界。

      這是全球首個基于完全亞二次方稀疏注意力架構(SSA)的模型,上下文高達1200萬Token。


      SubQ的核心優勢在于,其SSA架構會根據內容「動態選擇」關注點,不會盲目計算所有Token間的關聯。

      相較于Transformer,它的計算量直接暴減1000倍。

      實驗結果顯示,100萬token上下文,SubQ要比FlashAttention快52倍,成本不到Claude Opus的5%。


      而打造出這款架構的背后這家公司,叫Subquadratic,坐標邁阿密,全公司僅13人。

      AI大佬Bindu Reddy辣評道,「若這一切都是真的,Anthropic和OpenAI的估值直接歸0」!


      還有人表示,這才是LLM接下來真正Scaling的方式。


      Transformer「原罪」,九年未解

      2017年,谷歌那篇「Attention is All You Need」奠定了Transformer架構的統治地位。

      此后九年,從GPT到Claude到Gemini,所有前沿大模型都建立在同一個基礎上:密集注意力機制。


      長期以來,Transformer的工作方式非常暴力,即每個token都要和序列中所有其他token做一次比較。

      這種機制讓它深陷「二次方復雜度」的泥潭,上下文每增加一倍,計算成本飆升四倍。

      這意味著,輸入越長,模型越貴、越慢、越容易崩。

      這就解釋了幾乎所有LLM的上下文卡在100萬token左右,不是技術做不到更長,是做到了也用不起。

      這一次,SubQ的誕生,從根本上改變了這個等式。


      SSA架構出世

      不要「更快」只要「更少」

      SubQ的核心突破叫做SSA——亞二次方稀疏注意力(Subquadratic Sparse Attention)。

      它的思路出奇地簡單,不再讓每個token和所有token做比較。

      既然訓練好的模型中,絕大多數注意力權重都接近零0,那為什么還要算它們?

      SSA的做法是,對每一個query,基于「內容」選擇序列中真正值得關注的位置,然后只在這些位置上精確計算注意力。

      它只計算那些真正有意義的交互,跳過其余99%以上的無用計算。


      以下是SSA的三大關鍵特性——

      • 線性擴展

      計算量隨選中的位置數量增長,而不是隨整個序列長度增長。上下文翻倍,成本只翻倍,不再是翻四倍。

      • 內容依賴路由

      模型根據語義決定看哪里,而不是根據位置。關鍵信息在序列第3個token還是第1100萬個token,都能被找到。

      • 精確檢索

      不像循環模型那樣把信息壓縮成固定狀態,SSA保留了從任意位置精確取回信息的能力。

      說白了,SSA不是「把密集注意力算得更快」,而是「讓模型做更少的注意力計算」。


      減少的計算量,直接轉化為速度。

      速度狂飆52.5倍,成本不到Opus 5%

      SubQ放出的數據,每一條都在暴擊:

      在100萬token長度上,SSA比標準密集注意力+FlashAttention-2快52.2倍。


      在12.8萬token上快7.2倍,25.6萬token快13.2倍,51.2萬token快23倍。

      顯而易見,上下文越長,優勢越碾壓。

      這正是SSA線性擴展的直接體現——密集注意力越長越慢,SSA越長越劃算。


      再來看算力消耗,在100萬token下,注意力FLOP減少了62.5倍。在1200萬token下,這個數字飆升到接近1000倍。


      至于成本,Subquadratic給了一個非常直觀的對比——

      在RULER 128K基準測試上,SubQ花費8美元,Opus為2600美元,直接拉出了300倍的成本差距。

      最關鍵的是,這些速度和成本優勢,并沒有以犧牲準確率為代價。

      RULER 128K基準測試: SubQ拿下95%,Opus 4.6是94.8%;


      SWE-Bench Verified(代碼工程): SubQ得分81.8,超過Opus 4.6的80.8。

      MRCR v2(長上下文檢索): SubQ拿到65.9%,雖然低于Opus 4.6的78%,但遠超GPT 5.4(39%)和Gemini 3.1 Pro(23%)。


      這組數字放在一起看,細思極恐——

      一家種子輪公司,用不到Opus 5%的成本,在多項核心基準測試上打平甚至超過了Anthropic和OpenAI的旗艦模型。


      一個提示詞,SubQ即可處理1200萬Token的超長信息:

      無論是整個代碼庫、數月的 PR 記錄,還是長期運行的 AI 智能體狀態,全都游刃有余,而且成本僅需原來的五分之一。


      不得不說,若這一切成真,這將是Transformer問世以來最重要的架構級突破。

      13人初創公司,要顛覆Transformer

      Subquadratic成立于2024年,拿下2900萬美元種子輪,估值5億美元。

      它有兩位聯合創始人:CEO Justin Dangel,CTO Alexander Whedon。


      研究團隊11人,全部是博士,來自Meta、谷歌、牛津大學、劍橋大學、Adobe。

      值得一提的是,這家公司之前叫Aldea,做的是語音模型,后來轉型到了注意力架構研究。

      這一次,產品線三條同時上線:

      • SubQ API:12M token全量上下文接口

      • SubQ Code:命令行編碼Agent,整個代碼庫一次性塞進去

      • SubQ Search:深度研究工具,初期免費

      全網炸鍋:是終結者,還是AI版Theranos?

      SubQ發布后數小時內,AI社區就分裂成了兩個陣營。

      AI大佬Dan McAteer一句話,概括了所有人的心態:

      SubQ要么是Transformer以來最大的突破……

      要么就是AI界的Theranos。


      支持者一方陣容不小。

      有人表示,這是2026年最瘋狂的AI發布之一。

      Subquadratic可能找到了奧特曼所言的另一個架構的重大突破。




      但懷疑派也毫不留情,有人直言這就是一個「騙子公司」,尤其是看完創始人領英介紹后。



      OpenAI前研究員Will Depue更是連發多條,第一時間指出,「SubQ幾乎可以確定是基于Kimi或DeepSeek的稀疏注意力微調」。




      AI圈見過太多「發布即巔峰」的故事,發布會上的PPT和真實世界的部署之間,隔著一整條死亡谷。

      但話說回來,也正因為這個賭注太大,整個行業才不敢不認真對待。

      答案,也許只有等技術報告公開、獨立benchmark復現之后,才會真正揭曉。

      參考資料:

      https://x.com/alex_whedon/status/2051663268704636937?s=20

      https://subq.ai/how-ssa-makes-long-context-practical

      https://x.com/daniel_mac8/status/2051710659822305661?s=20

      為偉大思想而生!

      AI+時代,互聯網思想(wanging0123),

      第一必讀自媒體

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      上海樓市驚現“靜默大撤退”:3月爆賣3萬套背后,67%房東為何突然不賣了?

      上海樓市驚現“靜默大撤退”:3月爆賣3萬套背后,67%房東為何突然不賣了?

      墜入二次元的海洋
      2026-05-09 01:34:16
      70歲之后,來日并不方長,身體再好,也要牢記8句話

      70歲之后,來日并不方長,身體再好,也要牢記8句話

      小談食刻美食
      2026-05-07 07:34:54
      二野四縱,為何能成為四大野戰軍頭號王牌,有四大理由?

      二野四縱,為何能成為四大野戰軍頭號王牌,有四大理由?

      祁州校尉
      2026-05-09 09:00:19
      55比0全票圍剿!菲律賓副總統彈劾案閃擊過關,莎拉真要被拿下?

      55比0全票圍剿!菲律賓副總統彈劾案閃擊過關,莎拉真要被拿下?

      小影的娛樂
      2026-05-09 15:12:46
      把瑜伽褲穿成日常的松弛感美女

      把瑜伽褲穿成日常的松弛感美女

      只要高興就好
      2026-04-13 14:30:30
      火箭報價凱爾特人布朗!烏度卡有合作基礎,史蒂文斯啟動交易評估

      火箭報價凱爾特人布朗!烏度卡有合作基礎,史蒂文斯啟動交易評估

      格斗社
      2026-05-09 13:53:43
      最爽的人,都在縣城400塊的希爾頓里躺著

      最爽的人,都在縣城400塊的希爾頓里躺著

      一刻talks丨硬科技趣思想
      2026-05-07 20:35:15
      租下 22 萬顆英偉達 GPU 的同一天,Anthropic 向谷歌 TPU 承諾了 2000 億美元

      租下 22 萬顆英偉達 GPU 的同一天,Anthropic 向谷歌 TPU 承諾了 2000 億美元

      鈦媒體APP
      2026-05-07 10:00:21
      47歲韓國女演員河智苑在西湖夜跑,全程沒戴口罩帽子,曾出演《黃真伊》《秘密花園》

      47歲韓國女演員河智苑在西湖夜跑,全程沒戴口罩帽子,曾出演《黃真伊》《秘密花園》

      都市快報橙柿互動
      2026-05-09 15:13:16
      5月9日央視乒乓直播調整,世乒賽決賽王楚欽迎終極考驗

      5月9日央視乒乓直播調整,世乒賽決賽王楚欽迎終極考驗

      老牛體育解說
      2026-05-09 11:48:37
      臺灣地區最新民調出爐,鄭麗文支持率倒數,這下讓蔣萬安撿了漏?

      臺灣地區最新民調出爐,鄭麗文支持率倒數,這下讓蔣萬安撿了漏?

      一網打盡全球焦點
      2026-05-08 08:34:58
      日本高層訪華無果

      日本高層訪華無果

      萬物知識圈
      2026-05-09 14:40:09
      華為空調來了,鴻蒙智選全套復刻賽力斯打法:扶持嫡系、結盟龍頭

      華為空調來了,鴻蒙智選全套復刻賽力斯打法:扶持嫡系、結盟龍頭

      電科技網
      2026-05-09 15:36:29
      稀土戰爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

      稀土戰爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

      六子吃涼粉
      2026-05-06 18:14:18
      外交部:英方為反中亂港分子站臺 中方強烈譴責、堅決反對

      外交部:英方為反中亂港分子站臺 中方強烈譴責、堅決反對

      新京報
      2026-05-08 15:57:15
      廣東3消息!胡明軒尿檢結果出爐,陳老板鼓舞球隊,主場嚴陣以待

      廣東3消息!胡明軒尿檢結果出爐,陳老板鼓舞球隊,主場嚴陣以待

      多特體育說
      2026-05-09 10:32:59
      每天一把保健品?專家:盲目服用當心中毒 這三類人尤其小心

      每天一把保健品?專家:盲目服用當心中毒 這三類人尤其小心

      大象新聞
      2026-01-30 21:13:03
      剛剛,比亞迪官宣:新車15.08萬起!

      剛剛,比亞迪官宣:新車15.08萬起!

      手機評測室
      2026-05-09 11:50:48
      特朗普心腹訪華,開口就要中國采購波音,王毅把話挑明

      特朗普心腹訪華,開口就要中國采購波音,王毅把話挑明

      萬物知識圈
      2026-05-09 14:53:02
      6歲男孩為躲母親毆打,離家出走22年,長大后才得知母親悲慘人生

      6歲男孩為躲母親毆打,離家出走22年,長大后才得知母親悲慘人生

      哄動一時啊
      2026-04-19 14:38:19
      2026-05-09 16:27:00
      互聯網思想 incentive-icons
      互聯網思想
      AI時代,互聯網思想觀察
      2447文章數 16909關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      香港富豪孫女被綁架 綁匪拿到2800萬后逃跑8人花11萬

      頭條要聞

      香港富豪孫女被綁架 綁匪拿到2800萬后逃跑8人花11萬

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      Meta瘋狂擁抱人工智能:員工苦不堪言

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      房產
      家居
      教育
      旅游
      軍事航空

      房產要聞

      豪擲6.8億拿地!何猷君大手筆投資三亞!

      家居要聞

      菁英人居 全能豪宅

      教育要聞

      “你管這面相叫聰慧明理?”寶媽寫小作文偏袒小兒子,被網友群嘲

      旅游要聞

      滿目青翠入畫來 棗莊楊峪初夏景致美不勝收

      軍事要聞

      美伊突然再次交火 伊朗外長:戰爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 东方av四虎在线观看| 午夜电影在线观看国产1区| www.久久.com| 明星国产欧美日韩在线观看| 国产在线啪| 亚洲国产在一区二区三区| 亚洲精品人人| 小樱3368776,22905jm17| 粉嫩一区二区三区国产精品| 久久无码中文字幕免费影院蜜桃 | 亚洲av一卡二卡三卡| 韩国日本国产亚洲自拍| 一道本AV免费不卡播放| 中文字幕成熟丰满人妻| 国产精品不卡片视频免费观看| 国产精品午夜av福利| 一出一进一爽一粗一大视频免费的| 久99精品视频免费视频免费观看| 亚洲国产色婷婷久久99精品91| 超碰人人摸| 九九国产在线观看| 69sex久久精品国产麻豆| 欧美成人h亚洲综合在线观看| 丁香激情六月综合五月| 中文字幕乱码高清免费| 扒开女人内裤猛进猛出免费视频| 亚洲二区中文字幕在线| 男女18禁啪啪无遮挡激烈网站| 亚洲天堂免费av在线观看| 国产精品女在线观看| 成年女人免费碰碰视频| 国产人妻人伦精品久久| 久久亚洲AV成人无码电影| 丰满人妻被黑人连续中出| 欧美和黑人xxxx猛交视频| 中文字幕日本人妻| 亚洲欧美丝袜综合精品第一页 | 国产高清自产拍AV在线| 97中文字幕在线观看| 日韩精品中文字幕有码| 亚洲成人久久躁狠狠躁|