<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      對話魔形智能CEO徐凌杰:token出海沒考慮算力成本,當下不現實

      0
      分享至



      記者 董溫淑

      編輯 高宇雷

      在AI大模型的市場里,兩年的時間足以重寫一套共識。

      2024年初,壁仞科技聯合創始人徐凌杰離開GPU市場,轉身創辦了魔形智能(Magik Compute),要做“AI Token Factory”。彼時這對大眾還是一個陌生的說法。

      但當時間邁進2026年,伴隨OpenClaw、Seedance等應用走向大眾,“Token經濟學”在極短時間內完成了行業內外的迅速破圈。

      剛剛過去的3月,中國Token日均調用量突破了140萬億。同月,黃仁勛在英偉達年度盛會GTC 2026上預言“未來的數據中心會變成一個生產Token 的工廠”——與魔形的愿景不謀而合。

      3月底,我們在上海見到了徐凌杰,聊了聊魔形智能的目標愿景與業務模式;也試圖借助他“局內人”的視角,一窺Token工廠、Token經濟學,以及電力出海等衍生概念的背后真相。



      從超節點與DeepSeek V2講起,Token如何走入視野中央

      2024年1月18日,徐凌杰最后一次以壁仞科技總裁的身份發出內部信,宣布自己即將離職。信中談及未來,他簡單而神秘地寫道:

      “AGI is calling,江湖再見。”

      徐凌杰曾任職于英偉達、AMD、三星北美研究院從事GPU研發、管理工作,并曾擔任阿里巴巴阿里云智能事業群總監。

      在2019年壁仞科技成立后,徐凌杰作為聯合創始人之一,主要負責產品規劃和市場拓展業務。

      2024年,正是壁仞多款拳頭產品進入規模化量產、營收快速攀升的時間點;同年9月,壁仞還啟動了上市輔導,即將開啟國產GPGPU第一股的沖刺。

      外界難免好奇,徐凌杰為什么會在這個“收獲時節”選擇轉身。

      3月底,在上海漕河涇開發區的漕河涇科創空間里,我們見到了徐凌杰。從地圖上看,魔形智能與位于浦江的壁仞科技大樓相距不到半小時的車程,但兩家公司的使命已經不同。

      對于創業的時間選擇,他簡單講道:“我和我的聯合創始人金琛看到的趨勢是,在AI大模型和芯片之間,會有許多的工作需要做。而2024年我40歲。人生的黃金年齡就這么幾年,既然我們認為Token的大潮馬上要來了,那就要抓住自己精力最好的這幾年,敢于縱身。”

      再具體一些,讓他看清這個趨勢的有兩件事:

      • 第一件是2024年的GTC大會上,英偉達發布了GB200 NVL72。這是一個集成了36個Grace CPU、72 個Blackwell GPU、合計擁有60萬個零件、重達3000磅的“超節點(SuperPod)”機架系統。

      NVL72也是英偉達“超節點”產品路線的代表之作。“超節點”顧名思義,是指通過高速互聯技術將多臺服務器、數十乃至上百塊GPU緊密集成的高性能計算單元,堪稱“算力巨獸”。

      • 第二件事,則是在2024年的5月,開源模型DeepSeek V2發布,憑借MoE(混合專家模型)、MLA(多頭潛注意力)等技術,一舉將模型推理成本降至行業最低。

      數據的直觀對比尤為驚人,DeepSeek V2的每百萬Token成本相比同年發布的GPT-5降低了約96%。



      DeepSeek V2與GPT-5每百萬Token成本對比,圖/網絡

      一端是算力以“超節點”的形式被極致堆疊,另一端是模型通過結構創新不斷壓縮單位Token成本——供給與效率,同時發生了躍遷。

      Token迎來了可以被工業化生產、精細化定價的可能性。這成了徐凌杰自己的aha moment:“當時我們覺得,V2這樣的開源模型模型和超節點將是市場的絕配啊。”



      做軟硬結合的AI Infra,已完成新一輪融資

      在寫給壁仞同事的離職信中,徐凌杰還寫道:“雖然造芯之路告一段落,但還將堅守在智能算力的大賽道上”。

      在2024年,這種表述難免讓外界感到困惑。

      “AI的三要素是算力、算法和數據”。很長一段時間內,這句話都是大眾理解一家AI公司市場定位的坐標系。

      如同“CV四小龍”曾是算法的代名詞,無論國際巨頭英偉達還是壁仞等國產GPU玩家,都被等同于“算力”的代名詞。

      以數據中心、智算中心形式落地的算力租賃生意,只是這個鏈條中偏重資產、運維的一環。

      如果芯片本身占據著算力價值鏈的頂端,一個新玩家在智能算力市場還能做些什么?

      徐凌杰將其表述為“軟硬件協同的AI Infra”。在對魔形智能最初的媒體報道中,有人將其描述為一家“做算力優化”“服務器集群”的公司。在他看來,這并不貼切:

      “算力優化只是我們的能力,但不是我們的mission statement。我們是一家生產高質量Token的公司。”

      他進一步解釋道,單純說算力優化,更接近傳統軟件行業的發展邏輯:相對芯片公司、數據中心、模型廠商而言,算力優化方是乙方,每付出一次優化服務、賣出一個License授權,獲得一次性付費。

      而魔形“不想成為上一代的軟件公司”,而是直接租用、自持服務器等硬件算力資源,進行模型部署、調優等系列工作后,直接向客戶輸出Token。



      魔形智能Token服務頁面,圖/魔形智能

      這種業務模式聚焦于“廣義的AI Infra”,也就是將能源(電力)、芯片(算力)、Infra(推理和訓練框架等技術底座)、大模型封裝在一起,直接對外輸出Token。

      “小龍蝦或是任何一個Agent的用戶,不再需要在意服務器是哪里來的,只要在應用層去調用這個服務就可以了。”他解釋道。

      4月發布的東吳證券研報提供了類似的預判:算力租賃廠商業務模式正從單純的裸算力出租升級為模型服務或Token分成模式,商業模式有望從“賣算力”轉向“賣Token”。

      研報同時寫道,這種商業模式將面對三大壁壘:穩定的拿卡能力;強力的交付、上線和后續運營能力;資金周轉能力。

      徐凌杰講道,在過往能源、芯片、Infra、大模型各自分立的行業結構里,人才是分層的,想要形成軟硬結合Infra的商業閉環就需要跨層次的人才,而“魔形的團隊恰好有這樣的人”。

      據了解,相較于徐凌杰過往深耕芯片硬件的從業經歷,其合伙人金琛曾任Graphcore中國工程副總裁和算法科學家,擁有豐富的模型優化經驗。

      而在資金方面,「電廠」獲悉,魔形智能剛剛于4月完成新一輪融資。

      以下是與徐凌杰的對談:

      從“Token納入薪酬體系”說起,當大模型開始產生經濟效益

      Q:魔形是國內比較早說要做AI Token Factory的公司。在3月落幕的英偉達GTC 2026上,老黃也講道,未來的數據中心會變成一個生產 Token 的工廠。

      你們語境中的“Token工廠”的概念,跟數據中心、智算中心有什么差別?

      A:我們還是借用黃仁勛提出的五層蛋糕理論來看。根據這個理論來分析市場格局的話,Token其實就是把下面四層的能源、芯片、infra、大模型給封裝在一起了。你作為一個小龍蝦或是任何一個Agent的用戶,不再需要在意服務器是哪里來的,只要在應用層去調用這個服務就可以了。

      所以另一個角度,如果談論Token工廠和數據中心有什么不一樣的話。前者的概念是更貼近于生活的。因為可能很多人都不知道AI 芯片、服務器長什么樣子,但Token作為購買智力的一個單元,許多消費者已經有所感知。



      黃仁勛提出了AI的“五層蛋糕”理論,圖/英偉達

      Q:行業的敘事模式出現了變化?因為之前我們講的數據中心、服務器,是以英偉達這樣的芯片設計玩家為中心的,Token工廠的講法更強調系統工程層面的變革、容納了更多環節?

      A:不僅是敘事上的變化,而是整個行業在發展。

      之前我們更多關注到的行業進展,是某地落成算力中心、打造了千卡/萬卡集群。這主要還是因為那時產業正處在模型訓練的階段,也就是說模型還沒有達到被老百姓廣泛使用的階段。

      這種現狀得到改變的一個標志性事件——至少對中國來講的話,是2025年DeepSeek V3的爆發,讓大家突然發現“哎,模型能用了”。在那之后我們又看到了許多應用的爆發,比如今年春節爆火的OpenClaw小龍蝦。

      今天來看,推理inference相比訓練training 來講,未來的成長性會高很多。

      所以說這不只是敘事模式的改變,更是經濟效益的再分配過程。

      可以舉個例子來看,現在很多公司已經在給工程師進行Token的配額,比較常見的是一個月一兩千元價值的Token,所以說模型已經在生產中真正地被用起來了。

      Q:在這個過程里,魔形智能的位置是?

      A:大家對于更快、智力更高、更大規模生產的Token有需求的。而這需要更大的集群。

      今天在中國,包括DeepSeek在內,存在大量的優質開源模型。當模型統一面向所有人開源時,在未來一段時間內,大家要關注的就是怎么把硬件組織得更好、讓模型跑得更好,這就是Infra要做的事情。



      2026年元旦之后,全球頭部模型Token調用量大幅上升,數據/OpenRouter,圖/東吳證券

      Q:您之前在交大的一個采訪里提到,魔形智能對標的是Nebius,但走得更深、全棧自研。該怎么理解這種底層自研?

      (Nebius:美股上市的垂直整合云服務提供商,獲英偉達投資,截至2025年Q2估值為約160億美元)

      A:Nebius和其他很多Infra企業不同的是,它有一部分服務器是自研的。它們把采購來的服務器做了改配、進行統一化的配置,讓服務更穩定。

      這樣帶來的好處是什么呢?按照之前Meta訓練Llama 3的數據,服務器可能每隔一段時間就會面臨故障中斷,為此訓練團隊頻繁地進行Checkpoint 保存訓練數據、等待服務器恢復、再重新reload數據。

      (注:在Llama 3.1訓練的54天里,Meta的1.6萬塊H100集群總共遇到了419次意外中斷,相當于平均每3小時發生一次。)

      但假設用Nebius的服務器來訓練,即便它的單價更高,但是因為穩定性更好、故障中斷率更低,模型也能更快訓練出來。

      今天我們講對標Nebius,更多地是想要強調軟硬件都需要做,而不只是像上一代公司一樣只聚焦軟件、只聚焦芯片資源。但今天從全世界范圍來看,絕大部分Infra企業還都是以軟件的方式去做。

      我們有一個對標的思維慣式。但其實很多選擇并沒有前路可循,再往后走,需要我們去進行第一性原理的判斷,而不是跟隨誰。

      “用多少電,產生多少Token”成為新的坐標系

      Q:之前衡量一個數據中心的性能,我們會講它是萬卡還是千卡、單卡的flops是多少;現在當面對一個Token工廠時,我們應該用什么樣的指標去衡量它?

      A:用多少電,產生了多少Token。

      Q:這可以等同于黃仁勛說的“誰的每瓦Token吞吐量最高,誰的生產成本就最低”?

      A:今天當我們看到一個數據中心,第一個問題往往會去問“你是多少兆瓦的?”。而這個電力決定了你的裝機量上限,進而再去談每天生產了多少Token。

      黃仁勛這句話可以用來評價效率。畢竟不同品牌、卡與卡之間的性能并不均等——英偉達卡和AMD卡即便同樣標稱1萬PFLOPS,也是不能完全等同的,生產效率也并不同。但是電力是能夠直觀去做比較的、最好量化的。

      當然,模型能力不同,產生的Token智力也會非常不一致。大體來講,參數量越大的模型的Token越聰明。同樣的數據中心用來生產7B、13B模型的Token,和用來生產Deepseek 671B模型的Token,生產效率也會非常不同。

      Q:按照現在比較優質的智算工廠,Token的單位電力吞吐量應該在多少?

      黃仁勛說“Vera Rubin在同一座1GW數據中心里,讓將Token的生成速率從2200萬提升到了7億”。這是行業的最佳成績嗎?

      A:具體的數字啊我們可以先放一放。單論產生多少Token的絕對數字,這是和一些限制條件有關系的,比如模型參數量、比如所謂的離線模式和在線模式——在線模式就是延時要很低,問題過來要在一兩秒內回復;離線模式可能30分鐘之后才有結果。

      大廠在發布新的解決方案的時候,也會小字標注發揮最佳性能的各種前提條件。

      總之我覺得我們可以先忽略絕對數字,來看和Token生產效率相關的變量條件。可以關注的點包括芯片本身的性能,比如從Grace Blackwell到Vera Rubin是一個升級;第二個是超節點的升級,從NVL72變成了NVL144;第三個是Format(格式)的不同,關注數據中心是用8bits還是用4bits去做計算。



      黃仁勛于GTC 2026,圖/視覺中國

      Q:在Token工廠的范疇里,英偉達它還是一個天花板的存在嗎?

      A:當然,我在英偉達工作過。所有人到了那里之后,學會的第一個詞叫 speed of light(光速)。

      speed of light代表著極限,考察你的工作是否做得足夠好,就是用speed of light作為一個指標,公司的文化是推動每個人往100% speed of light去走。

      毫無疑問,目前英偉達還是技術極限的追求者和定義者。

      當前市場比拼的一個是絕對性能,第二個就是單位的性價比。我覺得對今天的中國公司來講,更重要的是追求單位的性價比。

      電力出海是偽命題,但Token市場大有可為

      Q:魔形智能的公眾號里有幾篇文章,拆解過建立Token工廠的要素,分別是高壓直流輸電、液冷、高速互聯、超節點架構下的推理優化和軟硬協同。要形成這種高度系統化的解決方案,需要魔形做哪些準備和努力?

      A:長期來看是要往超節點的路去走,它是一個系統化的工程,當前我們肯定還在路上,但在路上也可以“沿途下蛋”。比如目前可以去努力優化運營成本,在能夠獲取到的硬件的基礎上進行優化。

      在現階段,在硬件方面去下功夫是非常有必要的。今天來看Token的成本結構,里面有約80%是和服務器的采購成本相關的。所以一定要搞定硬件、掌握供應鏈的關鍵環節,才有可能達到理想的成本。

      今天在中國市場的每秒鐘產生的Token(TPS,Tokens Per Second)大概是在30到60個,在美國這個數字可能是達到100、200。這都是因為我們還受限于算力的供給。



      英偉達Vera Rubin NVL144 CPX機架,圖/英偉達

      Q:魔形智能會考慮自研芯片嗎?

      A:這個相對還比較遙遠,不在我們的現在的roadmap里面。

      魔形一定是面向提供Token出發,服務器、集群會是這個模式的副產品。

      Q:當前國內還有硅基智能、清程極智這些公司,也在AI Infra的賽道里,那魔形智能的獨特性體現在哪里?

      A:今天的市場還沒有到互相競爭的階段。

      就像當初的芯片市場,假如一家芯片公司在2020年融完資后,就覺得市場的錢都被吸完了、窗口期關閉了,那就錯了;事實證明,2021年又成立了好多芯片公司,很多也成長得不錯。

      AI Infra的市場盤子會比芯片更大,但今天整個賽道的資本投入還遠未達到芯片賽道的程度。大家在這個賽道里,面對的都是百倍千倍的成長機會。

      三年之后,這個賽道里面肯定能跑出千億級別人民幣以上的公司,而且可能不止一家。如果我們今天只從競爭的角度來看市場,格局就小了。

      Q:查資料可以看到,目前AI Infra比較常見的商業模式有兩種,一種是和 IDC 運營商、GPU云服務商、國產芯片廠商共同對外提供Token服務,另一種是為已有自建 GPU 集群算力消納、優化服務。還有別的可能嗎?

      A:這兩種都是潛在的方向,我們現在做的更接近于是第一種,就是和算力中心合作。我們是甲方,他們是乙方,用他們的機器來生產Token。

      這也涉及到一個選擇問題。既然我們認為自己的產品是Token本身,生產高質量的Token、把這件事做到商業閉環就是我們最首要的任務。

      第二種的算力消納模式,可能會是未來我們擴大自己資源的一種方式。

      Q:最近“token出海”“電力出海”的概念很火,強調的是國產能源優勢的系統變現,這在商業模式上可行嗎?

      A:今天講token出海的人,不知道是不是故意忽略了一個點。他只算了電力成本,但電力成本在Token成本里占不到10%,算力成本才是最核心的。但中國的算力現在有優勢嗎?沒優勢。我們自己算力都不夠用。

      未來隨著我們國家的芯片水平提高,這種愿景可能會實現,但顯然不是當下的命題。



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      女生最渴望被刺激的四種生理性欲望,網友稱贊我又學到了

      女生最渴望被刺激的四種生理性欲望,網友稱贊我又學到了

      那年秋天
      2026-04-18 12:30:09
      京滬高鐵宣布漲價!無錫到北京二等座票價約漲115元

      京滬高鐵宣布漲價!無錫到北京二等座票價約漲115元

      江南晚報
      2026-05-12 18:22:27
      震驚!沈陽外賣小哥全款提奧迪A6引爭議,評論炸鍋,觀點爭鋒相對

      震驚!沈陽外賣小哥全款提奧迪A6引爭議,評論炸鍋,觀點爭鋒相對

      火山詩話
      2026-05-10 09:52:37
      張本美和回國后絕口不提0-3孫穎莎:終拿下王曼昱 未來要贏中國隊

      張本美和回國后絕口不提0-3孫穎莎:終拿下王曼昱 未來要贏中國隊

      風過鄉
      2026-05-12 21:07:30
      以色列:伊朗1500枚導彈大部分被攔下,鐵穹99%攔截率

      以色列:伊朗1500枚導彈大部分被攔下,鐵穹99%攔截率

      桂系007
      2026-05-11 23:44:58
      德國工程師:中國人難道不知南水北調的弊端,環保大國稱號何來?

      德國工程師:中國人難道不知南水北調的弊端,環保大國稱號何來?

      心靈得以滋養
      2026-03-13 22:44:44
      離婚后住浙江娘家,親媽和繼父給帶孩子,她卻在娛樂圈闖出一片天

      離婚后住浙江娘家,親媽和繼父給帶孩子,她卻在娛樂圈闖出一片天

      以茶帶書
      2026-05-11 16:28:20
      “瘙癢”,不讀sāo yǎng,你不服氣也沒用!

      “瘙癢”,不讀sāo yǎng,你不服氣也沒用!

      未央看點
      2026-05-12 18:46:49
      佛山一區新任命多名局長

      佛山一區新任命多名局長

      南方都市報
      2026-05-12 20:52:57
      618可能有“神價”的5款手機,等等黨的機會來了

      618可能有“神價”的5款手機,等等黨的機會來了

      小柱解說游戲
      2026-05-12 10:40:35
      15天從確診到離世!顧國寧半生順遂,最后卻雙親離世、婚姻破碎

      15天從確診到離世!顧國寧半生順遂,最后卻雙親離世、婚姻破碎

      秋姐居
      2026-05-12 19:36:45
      尊重歷史,青海馬家軍在陜西山西河南跟日軍血戰八年,是真的嗎?

      尊重歷史,青海馬家軍在陜西山西河南跟日軍血戰八年,是真的嗎?

      鶴羽說個事
      2026-05-12 22:36:35
      奔馳撞人2死6傷后續:女司機正臉曝光,職業反差太大 路人曝猛料

      奔馳撞人2死6傷后續:女司機正臉曝光,職業反差太大 路人曝猛料

      法老不說教
      2026-05-11 18:18:17
      尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

      尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

      詭譎怪談
      2025-04-30 22:17:42
      FCC要實名制買手機號:匿名通話時代終結?

      FCC要實名制買手機號:匿名通話時代終結?

      碼上閑敘
      2026-05-11 11:31:02
      原來林詩棟的姐姐是她,怪不得能成為世界冠軍,日本隊輸得不冤!

      原來林詩棟的姐姐是她,怪不得能成為世界冠軍,日本隊輸得不冤!

      林子說事
      2026-05-12 16:15:13
      陳皮加它一起煮,倒頭就睡還疏肝寧神,我靠這招睡飽覺氣色好

      陳皮加它一起煮,倒頭就睡還疏肝寧神,我靠這招睡飽覺氣色好

      江江食研社
      2026-03-10 14:13:03
      CBA現集體抗議!主場喊黑哨10分鐘,山西27萬罰單引熱議

      CBA現集體抗議!主場喊黑哨10分鐘,山西27萬罰單引熱議

      云隱南山
      2026-05-12 18:19:15
      這6種食物不能“二次加熱”,吃不完就倒掉,別為節省,害了自己

      這6種食物不能“二次加熱”,吃不完就倒掉,別為節省,害了自己

      所食所想
      2026-04-01 10:30:32
      駱家輝警告中國:最好不要自主生產尖端芯片,這不是美國想看到的

      駱家輝警告中國:最好不要自主生產尖端芯片,這不是美國想看到的

      蜉蝣說
      2026-04-14 17:00:37
      2026-05-13 02:47:00
      電廠 incentive-icons
      電廠
      探索科技公司的未知,為你充電
      2132文章數 1059關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      數碼
      親子
      旅游
      健康
      公開課

      數碼要聞

      看電視的人越來越多了 3億臺電視在線 小米第一

      親子要聞

      有點東西。周寧運動空間

      旅游要聞

      故宮擠滿游客,人人撐傘前行:寧愿熱到出汗,也要奔赴紫禁城!

      干細胞能讓人“返老還童”嗎

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 性无码一区二区三区在线观看| 亚洲精品综合久中文字幕| 中日av乱码一区二区三区乱码 | 中文字幕乱码人妻综合二区三区| 日本乱码在线| 一本大道东京热无码| 免费国产黄线在线观看视频| chinese乱子伦xxxx| 精品一区二区三区东京热| 中文字幕乱码熟妇五十中出| 亚州成人| 两个人看的www视频免费完整版| 欧美最猛性xxxxx国产一二区品| 色欲AV无码久久精品有码| 免费又黄又爽1000禁片| 亚洲国产免费图区在线视频| 美女把尿囗扒开让男人添| 美女个护士一级毛片亚洲| 人妻97资源站| 亚洲V欧美V日韩V国产V| 色欲香天天天综合网站| 午夜精品区| 免费一级黄色好看的国产| 丁香五月婷激情综合第九色| 自拍偷自拍亚洲一区二区| 日韩欧美亚洲| 亚洲国产精品人人做人人爱| 国产精品久久露脸蜜臀| 少妇被粗大的猛烈进出69影院一 | 亚洲AV日韩AV高清在线观看| 综合一区亚洲| 四虎永久精品在线视频| 久久精品午夜视频| 日本阿v精品视频在线观看| 九九久久精彩视频| 亚洲综合色区激情自拍| 精品一区二区视频在线观看| 大地资源中文第三页| 国产盗摄xxxx视频xxxx| 内射极品少妇xxxxxhd| 丁香五月天网站|