<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      B 站連線:硅谷太有錢,所以做不出 DeepSeek

      0
      分享至

      Talk

      DeepSeek V4 發布后的幾天,硅谷那邊一直在發酵,也帶來了幾個更尖銳的問題討論:模型效率芯片格局IPO 時點開源對閉源的擠壓

      而今天,業內的一些朋友也來到 B 站,帶來了高質量的前沿討論,也讓我們看到了更多不同的行業視角:

      • 硅谷:來自硅谷 101 的視頻博客,請到芯片架構師肖志斌和前 OpenAI 研究員 Jenny Xiao,https://www.bilibili.com/video/BV1Kq9SBSE7N/


      • 國內:來自華為昇騰技術專場直播,今晚八點開始:http://bilibili.com/video/BV1Kq9SBSE7N


      接下來,讓我們先看看來自硅谷的判斷判斷:

      → 沒有效率,AGI 只能是個 demo

      → DeepSeek 像一把抵在硅谷模型公司背后的槍

      → 硅谷 AI 公司錢太多,反而沒動力做效率

      → Anthropic 憑專注反超 OpenAI 到 1 萬億

      → 芯片不再是一卡打天下,訓練 / 推理 / 長上下文 / agentic workload 各自分化

      參與直播的兩個朋友,分別是肖老師和 Jenny

      肖志斌ZFLOW AI 創始人兼 CEO,前華美半導體協會主席,資深芯片架構師

      Jenny Xiao前 OpenAI 研究員,Leonis Capital 合伙人,專注 AI 投資

      V4 憑什么這么便宜

      肖志斌做芯片架構起家,是 ZFLOW AI 的創始人兼 CEO。他在讀完 V4 論文后,給出了一個反應:整體方向在意料之內,工程完成度意外

      V4 論文里著重強調三件事:CSA 加 HCA 的混合注意力,mHC 流形約束超連接,Muon 優化器

      CSA 是壓縮稀疏注意力,把多個 token 的 KV cache 壓成一條 compressed entry,再通過稀疏 attention 選出最相關的部分做檢索。HCA 是重度壓縮注意力,把當前 token 之前的上下文做深度壓縮,再做一次 dense attention。然后再通過 Sliding window 是兜住最近 token 的強相關性,把長上下文 attention 的成本從平方關系壓下去,這樣來降低推理成本

      對于 mHC,則是解決的是另一件事,深層模型層與層之間的信息流轉。過去走的是單條 residual link。HC 是去年學術界的方案,把單條通路做成多條高速通路。V4 在多條通路上加了流形約束,保數值穩定,讓深層模型訓練不發散

      Muon 優化器最早是 Kimi 提出來的訓練方法。V4 沒有完全替換 Adam,部分模塊用 Muon,部分模塊還留 Adam,靠兩個優化器疊加把訓練收斂速度往上推

      三件事,有個共同方向:Token Efficiency

      V4 論文里給硬件廠商也提了建議。GPU 之間的帶寬并不是越高越好,超過某個閾值后,更多的芯片面積會被通信占走,留給計算的就少了。這里有一個精確配比

      而在整場 1 個多小時的對話中,Jenny 也在后面用不同角度反復呼應

      沒有效率,AGI 只能是個 demo。有了效率,AGI 才能成為真正的產品和基礎設施

      Chatbot 是一次性問答,token 消耗有限。Agent 時代不一樣,長任務、多工具調用、反思和規劃,token 消耗是 chatbot 的 10 到 100 倍

      每個 token 都貴的話,模型就不能長時間思考,也不能大規模服務用戶。AGI 在這個層面上構建于 token efficiency 之上

      此外,肖老師還給到了另一個判斷:“大模型架構本身的重要性可能被高估了,更重要的是數據”。而 V4 所鉆研的,正是讓模型架構的去匹配硬件架構,讓數據流轉更高效

      DeepSeek 給硅谷畫死亡線

      Jenny Xiao 之前在 OpenAI 做研究員,現在是 Leonis Capital 合伙人。她去年早些時候提出過一個概念叫 kill line,即:開源模型給閉源基礎模型公司畫的死亡線

      AI 領域的商業模式高度二元:核心業務被開源公司超越的那一刻,業務價值基本歸零

      拿 Anthropic 舉例:如果有一天,Claude 不再是編程最好的模型,那么誰還會用 Claude Code 呢?

      回翻一下記錄,會發現 DeepSeek V4 與 GPT-5.5 同一天發布

      但如果看價格,GPT-5.5 比 GPT-5.4 貴了兩倍,長文本版本每百萬 token 180 美元,但 V4 則便宜的多(而且還有折上折)。無論樂意與否,閉源模型公司都被卷入進了一場生存戰

      有意思的是,這波討論里最值得聽的聲音,不約而同出現在了B站

      “DeepSeek 像一把抵在硅谷模型公司背后的槍。這些公司如果跑得不夠快,DeepSeek 會追上來,把它們的業務徹底摧毀”

      -- Jenny

      順著這個話題,從工程角度,肖老師補充道:

      不能說 V4 全面超越。DeepSeek 的整體模型質量,在有些方面有優勢,在有些方面跟硅谷模型還有差距。但 V4 真正帶來的是效率問題。所有模型廠商必須回答,如何提高你的 token 效率

      早在 V3 之前,DeepSeek 在海外就已經很有名了,之前去 OpenAI DevDay 的時候,還專門討論過這個

      會前閑聊時,OAI 的朋友還夸了下 DeepSeek: DeepSeek is really solid(原話) 金色傳說大聰明,公眾號:賽博禪心

      在 V3/R1 之后,當時硅谷有一個 DeepSeek moment,畢竟之前可沒幾個人相信中國能訓出前沿模型,并一致有兩種聲音并存:一種是了不起的工程突破,另一種是 benchmark 灌水

      在這次 V4 發布之后,第二種聲音明顯少了,更多是 congratulatory attitude,這種結構轉變帶來的反思,估摸著會讓硅谷自我審視一段時間

      Anthropic 憑什么反超 OpenAI

      這段時間 Anthropic 持續大火,在投資市場上的估值反超 OpenAI 到 1 萬億美元,Jenny 把原因歸到三件事:Claude Code、企業信任、專注

      第一件事,Claude Code

      Anthropic 之前的模型已經足夠好,但 Claude Code 才是真正驅動收入的那個產品

      第二件事,企業信任

      Jenny 基金的網絡里有大量企業客戶,反復說同一句話:選 Anthropic 的原因是它有安全承諾。加上 Anthropic 起訴五角大樓這件事,企業接受了 Anthropic 傳達的信息

      第三件事,專注

      Anthropic 像房間里更成熟的那一方,OpenAI 在人事上經歷了一年的動蕩,企業客戶因此選 Anthropic

      對于 Jenny 自己,她的 Leonis Capital 基金公司也在用 Anthropic 而不是 ChatGPT,原因是在工作相關任務上 Anthropic 的模型表現更好

      OpenAI 這一年同時在打硬件部門、自研芯片、購物 app 幾條線,核心 ChatGPT 體驗反而沒做好。Jenny 團隊去年夏天寫過一份一萬字深度,得到了這么一個結論:OpenAI 試圖做「一個所有人的所有東西」的平臺

      這種分散,導致 OpenAI 失去了相對于 Anthropic 的技術領先。副線項目從去年底開始被一批批砍掉,Sora 也在其中。Anthropic 一直保持專注,安全、企業、編程

      Anthropic 估值反超的背后還有一個原因:Anthropic 的收入高度集中在企業。對美國投資人來說,就是企業收入優先于消費收入。OpenAI 現在也在反攻企業,Jenny 聽到一批公司收到 OpenAI Frontier 的推銷,但收入結構還沒改過來

      除此之外的就是是編程,這是 Jenny 反復回到的問題。她的判斷是:編程是通向 AGI 最重要的一步,誰拿下編程,誰可能成為 AGI 時代的主導玩家

      一旦你能寫代碼,你就能做大量通用任務。企業里更新 CRM、轉發郵件、總結會議,本質都是通過代碼搭起來的

      OpenClaw 創始人 Peter Steinberger 寫過一篇文章,標題是「Claude Code 就是我的電腦」。Peter 在創立 OpenClaw 之前,已經在用 Claude Code 控制自己的整臺電腦

      編程作為 AGI 第一站,還有幾個具體的優勢:可衡量、數據量充足、工程師是新技術最早的采用者

      Meta 上個月發布了 Muse Spark,市場普遍說這是 Meta 卷土重來的信號。Jenny 拆完模型給的結論相反,Muse Spark 相對其他開源模型沒有差異,相對 OpenAI 和 Anthropic 的二線模型也沒有差異

      Meta 還在跑一項有爭議的內部計劃,把員工的工作過程作為訓練數據。Jenny 說諷刺的是,這可能是 Meta 建立數據護城河的少數路徑之一,主要在編程和 agentic 任務上

      而對于 xAI 這邊,Jenny 用一個詞來形容:混亂。馬斯克脾氣改變頻繁,團隊在不同產品決策之間分散注意力

      她還投了一位被馬斯克解雇的早期 xAI 員工,原因是這位員工頂撞了老板。Grok 的實時數據查詢仍然有用,其他場景她基本不用

      錢多反而拖累硅谷

      硅谷 AI 公司在陷入了一個很奇怪的境地:錢越多,做效率的動力越弱

      “硅谷 AI 公司錢太多,導致沒有動力去思考效率,反而給了 DeepSeek 優勢”

      -- Jenny

      Jenny 基金內部做過一張圖,OpenAI 與 Anthropic 資本效率的對比,同等收入下 Anthropic 的資本效率顯著高于 OpenAI

      當然,其原因可以追溯到公司哲學。Anthropic 從第一天就保持克制,不在 GPU 和基礎設施上過度承諾,怕收入跟不上被采購拖死;而 OpenAI 一直走快路,move fast,break things,從第一天就放開了買,于是乎 OpenAI 最近幾輪融資的姿態,也到有種「出于無奈」

      他們在向沙特財團求錢,向私募股權基金求錢,試圖從每一個能接觸到的池子里搜羅資本

      投資人在 IPO 前可能會對 OpenAI 施壓換 CEO,這是 Jenny 的推測。Sam 不是省錢的人,投資人對他在基礎設施上的支出習慣不滿。畢竟再投一筆 10 億、100 億美元,邊際收益是多少,誰也說不出個所以然

      真正的問題是,這種性能提升能換來多少額外市場和收入

      現在美國投資人的心態,與幾年前完全不同。那時候是「曲線還在指數增長,繼續投錢」。現在的問題變成「就算繼續投,ROI 在哪?」

      對于這個問題,DeepSeek 用模型給出了不同的回答:擴 infra 的 ROI,可能已經不劃算了

      正是因為有計算資源限制,所以必須倒逼,必須去做這種嘗試和創新

      有時候我們自己也會感慨,創新都是給逼出來的,便宜本身就是技術革命的條件之一

      每一次工業革命中,重要的不僅僅是技術有多好,還在于技術有多便宜。能推動變革的技術,是那些便宜到足以讓人們使用的技術

      要做出對大眾有用的 AGI,模型要足夠聰明,也要足夠便宜

      80% 任務跑開源模型

      Jenny 投資組合公司里,80% 的任務跑在中小開源模型上,只有 20% 最復雜的任務跑在閉源模型上,這個比例往前推一年,估摸著沒有人會信

      對于閉源模型的看衰,資本市場也有著對應的信號,在硅谷每天都能刷到類似這樣的信息

      有「我們手里有 1000 萬美元的 OpenAI 股票,你們基金在買嗎,或者認識誰在買嗎?」

      畢竟,AI 公司的估值是二元的,基礎模型公司的存在理由就是模型最強。一旦不再最強,被開源模型超越,估值就歸零,哪怕是 OpenAI

      當然,應用層公司處境一樣。Anthropic 復制某個應用功能把客戶全搶走的那一刻,那個應用層公司的企業價值也歸零

      英偉達,難守推理

      從短期來看,英偉達的位置還說穩定的,整套生態都是它的護城河,包括 CUDA、NVLink、InfiniBand 和成熟的供應鏈,這些東西很難靠單點突破替代

      但從長期來看,英偉達的位置卻開始松動。V4 通過 CSA 加 HCA 把長上下文 attention 的成本壓下來,硬件跑大規模推理的門檻因此降低

      非英偉達芯片因此有了承接推理 workload 的空間。不只國產芯片,AMD、Google TPU、超大規模云廠商自研芯片都在這條線上。比如說 Google 的 TPU 就是一個有力對手,Anthropic 的模型在 Google TPU 集群上訓練,Gemini 也在 TPU 上

      擁有完整軟硬件協同能力的公司,可以降低對英偉達的依賴

      當然,TPU 這條路,也是不易復制的。Google 有自己的模型、cloud、數據中心、compiler、runtime、芯片和系統,能做一體化優化。這也印證了黃仁勛一句原話來

      同樣性能的芯片,價格白送也比不過英偉達

      Google 之后,Amazon、Microsoft、Meta、OpenAI、TikTok 都在評估自研芯片的可能性,主要瞄推理

      國產芯片承接 V4、Kimi 這一類模型,難點在五層

      算子

      V4 論文涉及的算子不只 GEMM,還有 fused MoE attention、Sparse attention、MoE routing、TopK、all-to-all KV cache、FP4 精度,每一個都需要 kernel level 的支持

      通信

      MoE 模型在 dispatch、combine、all-to-all 上的負擔一向重,芯片算力即使做上去,通信跟不上也會被拖垮

      serving runtime

      如果要提供高效服務,vLLM、SGLang 上的 continuous batching、PD 分離、KV cache 管理都要做適配

      訓練穩定性

      大規模訓練需要長時間穩定運行,對 fault tolerance、checkpoint、數值一致性有高要求

      開發者生態

      compiler、debug、profile、通信庫整套工具鏈都要成熟

      在這里,國產芯片要補整套 AI infra 軟件棧,單點突破解決不了問題。但他指出一個加速因素:AI agent 現在能直接幫做 kernel 層優化,更上層的 system orchestration 還需要人為深度協同設計

      最終格局是芯片不再是一卡打天下,訓練、推理、長上下文、agentic workload 各自分化。每一類 workload 對計算、存儲、通信的需求都不同

      等等還有...昇騰專場

      以上內容,就是來自硅谷 101 的精彩分享,而今晚 8 點,B 站獨家直播華為昇騰技術專場

      五位重磅嘉賓,來聊聊:《DeepSeek V4 與國產算力的突圍》


      今晚 8 點 B 站獨家直播

      五位嘉賓

      趙英俊華為昇騰產品規劃專家

      刁瑩煜CANN 社區大模型推理優化專家

      冀元祎小巧靈應用部署專家

      張德鵬CANN 社區大模型訓練優化專家

      Git 源寶B 站 AI 百萬粉 UP 主,主持人

      和硅谷 101 這場剛好湊成一組:硅谷視角看一遍,國產算力視角看一遍

      同一個事件,同一天,同一個平臺,都在 B 站

      今晚 8 點,搜「Git 源寶」即可進直播間

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      不裝老好人了?特斯拉,對國產電動車“貼臉開大”,關鍵沒法反駁

      不裝老好人了?特斯拉,對國產電動車“貼臉開大”,關鍵沒法反駁

      小李車評李建紅
      2026-05-08 08:00:03
      又一狗血新詞!網傳有員工被裁后再遭公司起訴"刻意隱瞞自身價值"

      又一狗血新詞!網傳有員工被裁后再遭公司起訴"刻意隱瞞自身價值"

      火山詩話
      2026-05-08 18:00:57
      16歲女孩景區內墜亡,目擊者發聲,賠償金額曝光,景區運營僅49天

      16歲女孩景區內墜亡,目擊者發聲,賠償金額曝光,景區運營僅49天

      溫柔看世界
      2026-05-06 11:48:44
      吳石被押往刑場,毛人鳳嚴令劊子手:用點射!他決不允許發生奇跡

      吳石被押往刑場,毛人鳳嚴令劊子手:用點射!他決不允許發生奇跡

      云霄紀史觀
      2026-05-10 18:47:15
      退休數學老教師:如今高中數學,真不是多數孩子能學明白的!

      退休數學老教師:如今高中數學,真不是多數孩子能學明白的!

      金哥說新能源車
      2026-05-10 05:51:23
      美媒文章:美國面對的是已然闊步前行的中國

      美媒文章:美國面對的是已然闊步前行的中國

      參考消息
      2026-05-10 15:38:08
      體育總局人力中心發文,親宣陳若琳新身份,戀情傳聞早真相大白

      體育總局人力中心發文,親宣陳若琳新身份,戀情傳聞早真相大白

      汪鏞的創業之路
      2026-05-09 14:40:02
      這么速度?巴將領透露:巴基斯坦今年開始接收40架左右殲-35AE!中國什么態度?

      這么速度?巴將領透露:巴基斯坦今年開始接收40架左右殲-35AE!中國什么態度?

      軍武速遞
      2026-05-09 19:07:23
      今年山茶油為啥賣不動?曾經的“油中黃金”,如今沒人買單了?

      今年山茶油為啥賣不動?曾經的“油中黃金”,如今沒人買單了?

      農夫也瘋狂
      2026-05-09 17:41:51
      補時遭遇爭議點球,青島西海岸1:1武漢三鎮,遭遇7連平 !“我們也不想拿到這么多平局……”

      補時遭遇爭議點球,青島西海岸1:1武漢三鎮,遭遇7連平 !“我們也不想拿到這么多平局……”

      新浪財經
      2026-05-10 21:48:32
      搞垮中國交通的罪魁禍首,并非是車太多?這幾座山不移除就白搭了

      搞垮中國交通的罪魁禍首,并非是車太多?這幾座山不移除就白搭了

      原來仙女不講理
      2026-05-07 23:09:21
      47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個買菜大姐

      47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個買菜大姐

      胖松松與瘦二毛
      2026-05-06 12:40:53
      《愛情沒有神話》大結局:孤煙身敗名裂,范叔破產,趙蘭心被棄,林何和解

      《愛情沒有神話》大結局:孤煙身敗名裂,范叔破產,趙蘭心被棄,林何和解

      TVB的四小花
      2026-05-10 12:01:52
      廣東隊投資人遭薩林杰強制“撤回” 慶祝:賽后擁抱張皓嘉難掩喜悅

      廣東隊投資人遭薩林杰強制“撤回” 慶祝:賽后擁抱張皓嘉難掩喜悅

      狼叔評論
      2026-05-10 11:54:05
      陳翔六點半演員“吳媽”去世!訃告已發,享年68歲,球球留言悼念

      陳翔六點半演員“吳媽”去世!訃告已發,享年68歲,球球留言悼念

      情感大頭說說
      2026-05-10 09:32:54
      兩自媒體編造傳播芯片虛假信息遭重罰

      兩自媒體編造傳播芯片虛假信息遭重罰

      每日經濟新聞
      2026-05-09 20:17:46
      京粵大戰1-1戰平!于嘉賽后犀利點評:差距在氣質,輸贏看硬核!

      京粵大戰1-1戰平!于嘉賽后犀利點評:差距在氣質,輸贏看硬核!

      田先生籃球
      2026-05-09 22:37:18
      “云南14歲少年殺害同班女同學案”,有新消息

      “云南14歲少年殺害同班女同學案”,有新消息

      新京報
      2026-05-10 14:09:30
      倫敦世乒賽女團決賽:孫穎莎兩分救主盡顯世界第一統治力

      倫敦世乒賽女團決賽:孫穎莎兩分救主盡顯世界第一統治力

      老嗮說體育
      2026-05-10 21:45:33
      5月10日 廣東隊傳來3大消息 張皓嘉被查尿檢 奎因或離隊 徐昕拒絕

      5月10日 廣東隊傳來3大消息 張皓嘉被查尿檢 奎因或離隊 徐昕拒絕

      一家說
      2026-05-10 09:49:34
      2026-05-10 22:44:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      429文章數 53關注度
      往期回顧 全部

      科技要聞

      DeepSeek融資,改寫所有人的估值

      頭條要聞

      談判陷僵局 世界杯轉播費報價大幅降低央視仍不接招

      頭條要聞

      談判陷僵局 世界杯轉播費報價大幅降低央視仍不接招

      體育要聞

      那個曾讓詹姆斯抱頭的兄弟,40歲從大學畢業了

      娛樂要聞

      趙露思老實人豁出去了 沒舞蹈天賦硬跳

      財經要聞

      白酒大逃殺

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      家居
      旅游
      親子
      房產
      軍事航空

      家居要聞

      菁英人居 全能豪宅

      旅游要聞

      一路向前,自在騎行!田園社騎行驛站成為慶云打卡新地標

      親子要聞

      “順”還是“剖”?從成為母親的選擇說起

      房產要聞

      低價甩賣!海口這個地標商業,無人接盤!

      軍事要聞

      伊朗革命衛隊深夜警告

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲综合色婷婷七月丁香| 国精品午夜福利视频不卡| 蜜桃久久精品成人无码av| 国产午夜鲁丝片AV无码| 国产精品男人的天堂| 免费播放一区二区三区| 99久久精品国产熟女拳交| 亚洲国产欧美久久香综合| 国产成人在线内射人妻| 亚洲激情图| 男人到天堂在线a无码| 亚洲性美女一区二区三区| Av一区二区三区| 国产亚洲999精品AA片在线爽| 亚洲欧洲国产av综合| 国产欧美亚洲精品第一页在线| 狠狠色婷婷久久综合频道日韩| 人妻无码久久久久久久久久久 | 女人15毛片a级16女人水真多| 久久久久无码精品国产不卡| 国产精品无码免费播放| 精品一区二区三区免费视频| 少妇xxxxx| 国精产品一区一区三区有限在线 | 亚洲AV成人片不卡无码| 五月天乱伦小说| 一本色道久久| 亚洲av在线免费观看| 国产高清大尺度一区二区不卡| 香蕉视频一区| 久久精品无码免费不卡| 伊人久久大香线蕉AV网| 欧美成人综合| 亚洲aⅴ男人的天堂在线观看| 18禁超污无遮挡无码免费游戏| 色婷婷综合视频在线观看视频一区 | 中文字幕 日韩 欧美| 亚洲国产精品成人无码A片软件| 国产超碰无码最新上传| 精品人妻码一区二区三区| 在线中文字幕国产精品|