![]()
![]()
撰文 | 李信馬
題圖 | AI生圖
當(dāng)全球還在為大模型的“幻覺”頭疼時(shí),另一場(chǎng)更嚴(yán)肅的AI革命正在實(shí)驗(yàn)室里悄然發(fā)生——不只是生成文本和圖片,而是去計(jì)算生命的密碼和材料的極限。
AI4S計(jì)算集群,是為“AI for Science”(科學(xué)智能)設(shè)計(jì)的計(jì)算基礎(chǔ)設(shè)施。
大家一般更熟悉的概念,是“超級(jí)計(jì)算機(jī)”,簡(jiǎn)單解釋下兩者之間的區(qū)別,超級(jí)計(jì)算機(jī)是通過并行計(jì)算來加速已知科學(xué)公式的求解過程,比如氣象預(yù)報(bào)、核模擬、流體力學(xué)等;AI4S計(jì)算集群則不同,不僅要“算得更快”,而且利用AI技術(shù),從海量科學(xué)數(shù)據(jù)(比如分子結(jié)構(gòu)、基因序列、材料性質(zhì))中加速新結(jié)構(gòu)、新規(guī)律的發(fā)現(xiàn)。
因此,兩者在技術(shù)設(shè)計(jì)上有明顯的不同,AI4S不是現(xiàn)有超算的簡(jiǎn)單改造,而是從芯片、互聯(lián)網(wǎng)絡(luò)、存算協(xié)同到調(diào)度系統(tǒng)全棧重新設(shè)計(jì)的新一代基礎(chǔ)設(shè)施。
![]()
伴隨人工智能技術(shù)發(fā)展,AI4S正成為全球科技競(jìng)爭(zhēng)焦點(diǎn)。2025年11月24日,美國正式啟動(dòng)“創(chuàng)世紀(jì)計(jì)劃”,目標(biāo)是用 AI 重塑科學(xué)研究,該計(jì)劃也被白宮稱為“自阿波羅計(jì)劃以來規(guī)模最大的聯(lián)邦科學(xué)任務(wù)”。我國早在2023年4月,就由科技部主導(dǎo)部署了一體化算力服務(wù)平臺(tái)——國家超算互聯(lián)網(wǎng),來整合全國超算中心資源構(gòu)建算力網(wǎng)絡(luò),并在2024年4月正式上線。“十五五”規(guī)劃中,也明確提出要以人工智能引領(lǐng)科研范式變革,搶占人工智能產(chǎn)業(yè)應(yīng)用制高點(diǎn)。
中科曙光是中國核心信息基礎(chǔ)設(shè)施的領(lǐng)軍企業(yè),是我國少數(shù)擁有從硬件、整機(jī)到算力服務(wù)、基礎(chǔ)設(shè)施全棧自研能力的科技公司。2025年12月,中科曙光發(fā)布了scaleX萬卡超集群;2026年2月,3萬卡上線國家超算互聯(lián)網(wǎng)核心節(jié)點(diǎn)。
4月14日,中科曙光提供的6萬卡科學(xué)智能計(jì)算集群系統(tǒng),在位于鄭州的國家超算互聯(lián)網(wǎng)核心節(jié)點(diǎn)投入使用。伴隨著該集群的落地運(yùn)行,國家超算互聯(lián)網(wǎng)平臺(tái)構(gòu)建起了國內(nèi)規(guī)模最大的AI4S計(jì)算基礎(chǔ)設(shè)施,總計(jì)鏈接超300萬CPU核和超20萬GPU卡,并接入全國一體化算網(wǎng)調(diào)度體系,來為全國高校、科研院所和企業(yè)提供普惠化AI4S算力服務(wù)。
當(dāng)天DoNews也受邀參加了發(fā)布會(huì),會(huì)上,中國科學(xué)院院士、河南省科學(xué)院院長(zhǎng)徐紅星表示:“該集群落地,不僅是一次技術(shù)成果展示,更是我國人工智能技術(shù)與科研創(chuàng)新深度融合的里程碑。”
AI4S計(jì)算集群為什么重要?會(huì)后的采訪中,清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)助理教授李琨介紹,AI4S已經(jīng)超越純科研范疇,是新一輪科技革命與產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力。它不僅關(guān)乎著基礎(chǔ)科學(xué)的突破,也直接決定了新材料、新藥物、新能源等未來產(chǎn)業(yè)的主導(dǎo)權(quán)歸屬,深刻影響國家經(jīng)濟(jì)競(jìng)爭(zhēng)力和綜合國力的表現(xiàn)。尤其在當(dāng)今大國之間科技競(jìng)爭(zhēng)日趨激烈背景下,AI4S已經(jīng)成為衡量國家綜合實(shí)力和戰(zhàn)略科技力量的關(guān)鍵指標(biāo)。
在生物、材料等多領(lǐng)域進(jìn)行的大規(guī)模并行計(jì)算測(cè)試中,依托曙光AI4S計(jì)算集群,3萬卡規(guī)模蛋白質(zhì)折疊模擬較傳統(tǒng)算法加速1000倍;4.5萬卡規(guī)模實(shí)現(xiàn)萬億原子液態(tài)水分子動(dòng)力學(xué)模擬,在打破世界模擬規(guī)模紀(jì)錄的同時(shí)效率提升3個(gè)數(shù)量級(jí)以上;湍流直接模擬規(guī)模擴(kuò)展至百萬億網(wǎng)格,大幅提升了科研效率。
![]()
“從原本以超算為代表的超算架構(gòu),慢慢地配上AI加速單元這種混合異構(gòu)的智算架構(gòu),也就是現(xiàn)在說的‘超智融合’。傳統(tǒng)的計(jì)算任務(wù)或者科學(xué)應(yīng)用沒有辦法很好地利用上新型的硬件算力,這是一個(gè)非常大的挑戰(zhàn)。隨著AI不斷地賦能科學(xué)應(yīng)用,未來AI4S解決的問題更多不是加速型的,而是把之前不能解的問題變成能解的,這種情況下如何通過AI把好算力用到刀刃上,也是一個(gè)非常大的挑戰(zhàn)。”李琨說。
中科曙光高級(jí)副總裁李斌表示,把AI方法用在科學(xué)和工程領(lǐng)域一定是正確的,產(chǎn)業(yè)化前景也是無比巨大的,在生物醫(yī)藥、半導(dǎo)體、新材料、電池、清潔能源等領(lǐng)域,一旦有技術(shù)突破都會(huì)帶來更大規(guī)模的市場(chǎng)。但AI4S并不是萬能的,因?yàn)锳I方法有不可解釋性,還有泛化的問題,它需要跟傳統(tǒng)方法相結(jié)合;另一方面,隨著大模型基礎(chǔ)能力的提升,特別是智能體技術(shù)發(fā)展,對(duì)AI4S的發(fā)展也會(huì)有極大的促進(jìn)作用,降低門檻和極大地提高效率。
那怎么評(píng)價(jià)AI4S計(jì)算集群的能力?中科曙光給出的答案是“六大核心要求”。對(duì)應(yīng)剛剛上線的6萬卡科學(xué)智能計(jì)算集群系統(tǒng),就是:
強(qiáng)大算力:實(shí)現(xiàn)6萬卡集群部署。
全面精度:可支持8/16/32/64位寬的全精度計(jì)算,高效處理高維函數(shù)和復(fù)雜科學(xué)問題。
高速互連:通過國內(nèi)首款類InfiniBand無損高速網(wǎng)絡(luò)scaleFabric系列產(chǎn)品,滿足AI4S計(jì)算集群對(duì)高帶寬、低時(shí)延網(wǎng)絡(luò)的極致需求。
存算協(xié)同:通過“超級(jí)隧道”、AI數(shù)據(jù)加速等設(shè)計(jì),實(shí)現(xiàn)從芯片、系統(tǒng)到應(yīng)用的三層傳輸協(xié)同,避免存儲(chǔ)IO瓶頸。
靈活調(diào)度:智能調(diào)度機(jī)制,使系統(tǒng)可根據(jù)任務(wù)需求靈活匹配、調(diào)度集群的計(jì)算存儲(chǔ)網(wǎng)絡(luò)等資源,并發(fā)作業(yè)調(diào)度效率超每秒萬次。
穩(wěn)定可靠:依托智能化運(yùn)維、數(shù)字孿生系統(tǒng)以及浸沒相變液冷技術(shù),讓系統(tǒng)可用性達(dá)到99.99%,保障集群長(zhǎng)周期穩(wěn)定運(yùn)行。
![]()
坦誠講,對(duì)于計(jì)算集群,我們首要關(guān)心的問題一定是芯片,也要正視目前中國與海外之間的差距。李斌表示,國產(chǎn)芯片制程工藝上存在代差,可以一方面在芯片封裝、結(jié)構(gòu)工藝上挖一些潛力,還有就是通過系統(tǒng)端去優(yōu)化,以及工程化能力的優(yōu)化等來彌補(bǔ)差距。此外,由于工藝相對(duì)落后一些,要達(dá)到同樣的性能芯片功耗就會(huì)更高,通過一些技術(shù)來解決芯片的供電和散熱問題,也能縮短差距。
此前在光合組織2025人工智能創(chuàng)新大會(huì)(HAIC2025)上,中科曙光發(fā)布scaleX萬卡超集群時(shí),李斌曾表示該集群在超節(jié)點(diǎn)架構(gòu)、高速互連網(wǎng)絡(luò)、存儲(chǔ)性能優(yōu)化、系統(tǒng)管理調(diào)度等方面實(shí)現(xiàn)了多項(xiàng)創(chuàng)新突破,部分技術(shù)與能力已超越海外同類產(chǎn)品研發(fā)路線圖的2027年NVL576里程節(jié)點(diǎn)。
在當(dāng)天的一個(gè)演示案例中,中科曙光的AI4S計(jì)算集群和英偉達(dá)的A800集群相比,訓(xùn)練Loss下降曲線高度重合,下游測(cè)試中,9項(xiàng)基準(zhǔn)測(cè)試的結(jié)果也高度一致。此外,據(jù)工作人員介紹,公司產(chǎn)品的部分性能指標(biāo)已超越英偉達(dá)集群。
目前,從產(chǎn)業(yè)生態(tài)來看,國內(nèi)AI4S已經(jīng)形成了上游算力與數(shù)據(jù),中游平臺(tái)與模型,下游科研與工業(yè)應(yīng)用的完整鏈條。李斌表示,未來幾年AI4S可能需要更多關(guān)注世界模型和物理AI,世界模型依賴的數(shù)據(jù)需要物理規(guī)律約束,而物理規(guī)律約束的數(shù)據(jù)又需要傳統(tǒng)計(jì)算來產(chǎn)生,這會(huì)進(jìn)一步增強(qiáng)傳統(tǒng)計(jì)算和超算的融合,對(duì)未來的算力結(jié)構(gòu)也會(huì)有一些影響。
隨著國家算力基礎(chǔ)設(shè)施被用互聯(lián)網(wǎng)理念重構(gòu),算力成為“普惠服務(wù)”,將進(jìn)一步支撐中國在全球AI和科技競(jìng)爭(zhēng)中占據(jù)主動(dòng)——這不僅關(guān)乎幾家公司的市值,更關(guān)乎未來科技革命里我們的話語權(quán)。
注:文中演講配圖均來自現(xiàn)場(chǎng)拍攝
![]()
![]()
![]()
![]()
![]()
「創(chuàng)新無邊界」是我們的slogan,我們不局限于對(duì)互聯(lián)網(wǎng)行業(yè)的追蹤與探索,更要向未來、向未知的方向大膽邁進(jìn)。因此,「打造行業(yè)新標(biāo)桿、解讀商業(yè)新動(dòng)向」是我們秉持的方向之一。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.