![]()
■寒武紀(jì)Day 0適配不是孤立技術(shù)響應(yīng)
■國產(chǎn)化適配深度決定市場競爭力距離
■寒武紀(jì)主動(dòng)適配商湯更是對(duì)一種能引領(lǐng)產(chǎn)業(yè)突破系統(tǒng)性瓶頸的生態(tài)力量的戰(zhàn)略選擇
作者|謝涵
編輯|陳秋
另鏡ID:DMS-012
國產(chǎn)AI進(jìn)入了合縱時(shí)刻。
12月15日,商湯科技發(fā)布了多劇集生成智能體Seko 2.0,芯片巨頭寒武紀(jì)在當(dāng)天即宣布完成對(duì)其“日日新”大模型體系的“Day 0”適配。由此,商湯成為寒武紀(jì)在DeepSeek之外,唯一官宣達(dá)成此類深度適配的大模型廠商。
三天后,商湯科技緊接著宣布成功配售新股,募資約31.5億港元,獲得不少于六家機(jī)構(gòu)的積極認(rèn)購。這筆資金將明確用于擴(kuò)大AI大裝置規(guī)模與提升國產(chǎn)化比例,可視為市場對(duì)其生態(tài)路線的真金白銀投票。
再將視線向前推移,12月初國產(chǎn)GPU公司摩爾線程與沐曦相繼登陸資本市場,并上演了單日最高漲幅近744%的驚人走勢(shì),率先點(diǎn)燃了市場對(duì)國產(chǎn)算力的期待。
頭部廠商深度協(xié)同,資本市場狂熱追捧,產(chǎn)業(yè)巨頭重金加碼,這些信號(hào)共同指向一個(gè)正在發(fā)生的深刻轉(zhuǎn)折——國產(chǎn)AI生態(tài),正從一個(gè)受外部環(huán)境驅(qū)動(dòng)的"備用方案",加速演進(jìn)為一個(gè)擁有自驅(qū)力、吸引力和完整性的主流體系。
![]()
而寒武紀(jì)在商湯發(fā)布Seko 2.0當(dāng)天即宣布完成"Day 0"適配,這一動(dòng)作尤為值得深究。它不僅是技術(shù)響應(yīng)速度的體現(xiàn),更是對(duì)商湯在國產(chǎn)AI生態(tài)中獨(dú)特價(jià)值的深度認(rèn)同。寒武紀(jì)選擇的,不是一個(gè)單純的模型合作方,而是一個(gè)能將其硬件潛力轉(zhuǎn)化為廣泛、可驗(yàn)證商業(yè)價(jià)值的系統(tǒng)。
在國產(chǎn)AI從故事走向財(cái)報(bào)的關(guān)鍵階段,商湯代表的是一條更確定的價(jià)值實(shí)現(xiàn)路徑。
長期主義的最硬回報(bào)
在AI國產(chǎn)化進(jìn)程的初期,行業(yè)面臨的不僅是技術(shù)從0到1的突破,更是一場關(guān)于戰(zhàn)略定力的考驗(yàn)。
彼時(shí),“國產(chǎn)算力”在很多人眼中仍是一個(gè)充滿不確定性的替代方案,其商業(yè)化路徑尚不清晰。絕大多數(shù)企業(yè)將資源傾注于算法落地與短期變現(xiàn),鮮少有人愿意在基礎(chǔ)設(shè)施層面進(jìn)行長周期、重投入的布局。
商湯科技的選擇,呈現(xiàn)出截然不同的邏輯。早在2020年,當(dāng)行業(yè)焦點(diǎn)仍集中于垂直場景的算法應(yīng)用時(shí),商湯便已啟動(dòng)對(duì)AI大裝置(SenseCore)的戰(zhàn)略性重投入。這并非簡單的算力堆砌,而是一個(gè)貫穿IaaS(基礎(chǔ)設(shè)施即服務(wù))、PaaS(平臺(tái)即服務(wù))到MaaS(模型即服務(wù))的體系化工程,旨在為AI模型的工業(yè)化生產(chǎn)提供全棧工具鏈。這一前瞻性布局,在當(dāng)時(shí)承受了巨大的成本壓力與市場質(zhì)疑。
![]()
但長期主義的價(jià)值,在隨后幾年的產(chǎn)業(yè)劇變中逐漸顯現(xiàn)。
2022-2023年,大模型浪潮席卷全球,無數(shù)公司匆忙涌入。商湯并未追逐單一模型的熱點(diǎn),而是系統(tǒng)性地推出了“日日新”大模型體系,并持續(xù)深耕多模態(tài)原生架構(gòu)。更具戰(zhàn)略意義的是,在國產(chǎn)芯片性能與生態(tài)均不成熟的階段,商湯便已主動(dòng)推進(jìn)與華為昇騰、寒武紀(jì)、沐曦、摩爾線程等幾乎所有主流國產(chǎn)芯片的適配工作。上海臨港的商湯智算中心(AIDC),不僅成為亞洲最大的超算平臺(tái)之一,更演進(jìn)為一個(gè)多元國產(chǎn)算力的集成驗(yàn)證場與效能優(yōu)化平臺(tái)。
比如,商湯與沐曦在技術(shù)上的適配,實(shí)現(xiàn)了沐曦GPU在商湯大裝置中的高效運(yùn)行,并聯(lián)合開發(fā)了一體機(jī)、聯(lián)合解決方案等產(chǎn)品。而與華為昇騰的合作,則攻堅(jiān)了384超節(jié)點(diǎn)集群的調(diào)度優(yōu)化等難題,有效提升了大模型訓(xùn)練的通信效率與穩(wěn)定性。即便是與摩爾線程的適配,也實(shí)現(xiàn)了國產(chǎn)GPU首次完成千億參數(shù)大模型的訓(xùn)練與推理任務(wù)驗(yàn)證,形成了“需求-供給-優(yōu)化”的良性閉環(huán)。
如今,當(dāng)行業(yè)共識(shí)轉(zhuǎn)向“多模態(tài)是AGI未來”時(shí),商湯憑借長期投入,已開源了行業(yè)首個(gè)實(shí)時(shí)視頻生成框架LightX2V,其NEO架構(gòu)更以1/10的數(shù)據(jù)量達(dá)成頂尖的視覺理解能力,突破了數(shù)據(jù)依賴的瓶頸。
因此,寒武紀(jì)的Day 0適配,不是一次孤立的技術(shù)響應(yīng)。它本質(zhì)上是對(duì)商湯貫穿五年甚至更長時(shí)間的技術(shù)定力與生態(tài)戰(zhàn)略的認(rèn)可。這是一場基于共同理念與長期磨合后形成的自然選擇,寒武紀(jì)看中的,是商湯將技術(shù)布局轉(zhuǎn)化為確定性基礎(chǔ)設(shè)施的能力。
在國產(chǎn)AI從可用走向好用的躍遷中,這種長期主義所積淀的系統(tǒng)性優(yōu)勢(shì),已成為稀缺且關(guān)鍵的產(chǎn)業(yè)基石。
從“能跑”到“領(lǐng)跑”
國產(chǎn)化適配的深度,決定了一項(xiàng)技術(shù)從實(shí)驗(yàn)室成果轉(zhuǎn)化為市場競爭力的距離。當(dāng)前,行業(yè)對(duì)國產(chǎn)算力的適配實(shí)踐,可以劃分為三個(gè)漸進(jìn)的層次:
第一層是“能跑”。核心目標(biāo)是完成基本的功能性驗(yàn)證,確保模型能夠在目標(biāo)芯片上啟動(dòng)并完成推理任務(wù)。這是國產(chǎn)替代的“入場券”,解決了從無到有的問題,但性能、效率與成本往往尚未達(dá)到商業(yè)化要求。
第二層是“好用”。在此階段,通過基礎(chǔ)的算子優(yōu)化、內(nèi)存調(diào)度和框架調(diào)整,使性能效率提升至可滿足實(shí)際業(yè)務(wù)需求的“可用”水平。這標(biāo)志著技術(shù)方案具備了初步的商業(yè)化基礎(chǔ)。
第三層是“極致”。它要求超越通用優(yōu)化,基于特定硬件架構(gòu)的特性進(jìn)行深度的軟硬件協(xié)同設(shè)計(jì),甚至重新思考算法與模型的實(shí)現(xiàn)方式,從而充分釋放芯片潛力,最終實(shí)現(xiàn)在特定場景下的性能表現(xiàn)超越行業(yè)通用基準(zhǔn)。抵達(dá)這一層,意味著國產(chǎn)方案不僅能夠替代,更具備了超越的潛力。
![]()
而商湯與寒武紀(jì)的合作,正朝著第三層邁進(jìn)。這一目標(biāo)的實(shí)現(xiàn),植根于商湯技術(shù)體系兩個(gè)設(shè)計(jì)上的先天優(yōu)勢(shì)。
首先是架構(gòu)級(jí)的硬件友好基因。商湯的LightX2V實(shí)時(shí)視頻生成框架,在架構(gòu)設(shè)計(jì)中預(yù)埋了“國產(chǎn)化適配插件模式”。這并非在技術(shù)棧定型后打上的補(bǔ)丁,而是源于系統(tǒng)級(jí)的設(shè)計(jì)思維,使得針對(duì)不同國產(chǎn)芯片的深度優(yōu)化能夠以模塊化、低耦合的方式高效集成。同樣,其Seko系列模型原生支持低比特量化、稀疏注意力等先進(jìn)的模型壓縮與加速機(jī)制。這些特性使得模型能夠更自然地適配國產(chǎn)芯片的存儲(chǔ)體系和計(jì)算單元,讓國產(chǎn)芯片上的推理性能提升3倍以上成為可能。
從源頭開始的協(xié)同設(shè)計(jì),極大地降低了后期適配的復(fù)雜度與性能損耗。
更深層的優(yōu)勢(shì),在于場景驅(qū)動(dòng)的優(yōu)化閉環(huán)。商湯構(gòu)建了從AI大裝置(算力層)、大模型平臺(tái)(平臺(tái)層)到豐富行業(yè)應(yīng)用(落地層)的完整垂直整合生態(tài)。這一生態(tài)落地通過“1+X”戰(zhàn)略 實(shí)現(xiàn)。
來自金融、工業(yè)、醫(yī)療等一線場景的真實(shí)、高要求需求,自上而下驅(qū)動(dòng)著“日日新”大模型的定向優(yōu)化。而每一次優(yōu)化,又能在商湯底層SenseCore AI大裝置上,與寒武紀(jì)等國產(chǎn)芯片進(jìn)行軟硬協(xié)同的極致調(diào)優(yōu),最終將優(yōu)化成果直接轉(zhuǎn)化為客戶端的時(shí)延降低、吞吐量提升與總擁有成本(TCO)下降。
破解“不可能三角”
國產(chǎn)AI的發(fā)展始終面臨一個(gè)經(jīng)典的“不可能三角”:自主可控、高性能、低成本。
傳統(tǒng)認(rèn)知中,追求極致的自主與性能往往意味著高昂的定制化成本;而若要控制成本,又可能不得不妥協(xié)于性能或供應(yīng)鏈風(fēng)險(xiǎn)。這一三角難題,長期制約著國產(chǎn)方案從“可用”邁向“好用”與“敢用”。
而商湯的實(shí)踐之所以關(guān)鍵,在于它沒有采用二選一的妥協(xié)策略,而是憑借貫穿“算力-平臺(tái)-應(yīng)用”的垂直生態(tài),將系統(tǒng)能力升維為平臺(tái)化的生態(tài)能力,通過協(xié)同創(chuàng)新在三角中尋得動(dòng)態(tài)平衡點(diǎn)。
比如,通過開放生態(tài)與軟硬協(xié)同,系統(tǒng)性壓低全產(chǎn)業(yè)鏈成本。今年7月,商湯聯(lián)合華為、寒武紀(jì)、沐曦等十余家伙伴發(fā)布了“商湯大裝置算力Mall”,將原本分散、封閉的國產(chǎn)算力資源整合為一個(gè)開放的“算力超市”。
![]()
中小企業(yè)無需自建集群或承擔(dān)高昂的適配成本,即可像調(diào)用云服務(wù)一樣,以“即插即用”的方式獲取經(jīng)過預(yù)先驗(yàn)證和調(diào)優(yōu)的國產(chǎn)算力。這種模式,將國產(chǎn)AI的嘗試門檻從重資產(chǎn)的基礎(chǔ)設(shè)施投資,降低為輕量級(jí)的服務(wù)采購,從根本上改變了成本結(jié)構(gòu)。而與華為昇騰攻堅(jiān)384超節(jié)點(diǎn)的調(diào)度優(yōu)化,也提高了大模型訓(xùn)練的通信效率,實(shí)現(xiàn)了運(yùn)營成本的優(yōu)化。
另一方面,商湯在高性能的突破上,繞開了數(shù)據(jù)與算力的線性依賴。其NEO多模態(tài)架構(gòu),能夠以1/10的數(shù)據(jù)量達(dá)成頂尖視覺理解,不是靠算力堆砌的結(jié)果,本質(zhì)上是在算法源頭上的效率革命,突破了多模態(tài)訓(xùn)練的數(shù)據(jù)瓶頸。更重要的是,其“1+X”戰(zhàn)略所構(gòu)建的垂直生態(tài),能將來自一線場景的真實(shí)需求,轉(zhuǎn)化為驅(qū)動(dòng)模型迭代的測試場,確保高性能始終指向解決產(chǎn)業(yè)核心痛點(diǎn),而非優(yōu)化實(shí)驗(yàn)室參數(shù)。
同時(shí),自主可控并非“閉門造車”即可實(shí)現(xiàn),商湯通過廣泛的底層適配與平臺(tái)化整合,不斷地筑牢了自主可控的基石。
目前,商湯AI大裝置已完成與華為昇騰、寒武紀(jì)、沐曦、摩爾線程等幾乎所有主流國產(chǎn)芯片的全面深度適配。這種廣泛連接的能力,構(gòu)建了一個(gè)多元化、可替代、良性競爭的國產(chǎn)算力供應(yīng)鏈體系。企業(yè)通過商湯平臺(tái),可以靈活選擇最優(yōu)或組合的算力方案,從而擺脫對(duì)單一技術(shù)路徑的依賴,保障了長期的產(chǎn)業(yè)安全與創(chuàng)新活力。
所以,寒武紀(jì)主動(dòng)適配商湯,是在“不可能三角”中看到了可實(shí)現(xiàn)的平衡點(diǎn),更是對(duì)一種能引領(lǐng)產(chǎn)業(yè)突破系統(tǒng)性瓶頸的生態(tài)力量的戰(zhàn)略選擇。這一選擇清晰地表明,頭部廠商的共識(shí)已經(jīng)形成,國產(chǎn)AI的進(jìn)階之路,在于合縱連橫下的繁榮共生。
隨著商湯和寒武紀(jì)、摩爾線程等國產(chǎn)芯片的適配更為深入,AI國產(chǎn)化的邏輯將發(fā)生根本性轉(zhuǎn)變。它不再是因?yàn)橥獠凯h(huán)境的“不得不”,而是基于綜合性能、成本、供應(yīng)鏈安全與進(jìn)化能力的審慎比較后,得出的更合適,甚至更優(yōu)越的選擇。
商湯Seko 2.0多劇集生成智能體在寒武紀(jì)芯片上的高效運(yùn)行,以及其SekoTalk技術(shù)實(shí)現(xiàn)消費(fèi)級(jí)顯卡一小時(shí)生成4500秒高質(zhì)量視頻,正是轉(zhuǎn)變的鮮活注腳。
未來,這類深度合作也將超越單一產(chǎn)品的適配,并推動(dòng)一種更具前瞻性的產(chǎn)業(yè)范式——以技術(shù)共研定義下一代架構(gòu),以產(chǎn)品共創(chuàng)定義體驗(yàn)與性能標(biāo)準(zhǔn),最終以生態(tài)共榮定義市場的未來格局。
遵循此邏輯,將吸引更多芯片、算法、應(yīng)用開發(fā)伙伴加入,共同構(gòu)建起一個(gè)以國產(chǎn)算力與模型為堅(jiān)實(shí)底座的“創(chuàng)新應(yīng)用孵化器”。最終,一切努力的匯聚點(diǎn),是為中國乃至全球千行百業(yè)的智能化轉(zhuǎn)型,提供一種在極致性能、合理成本與絕對(duì)安全自主之間取得最優(yōu)解的中國方案 。
而這條路徑的起點(diǎn),正是從每一個(gè)“Day 0”的堅(jiān)定選擇開始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.