![]()
芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影
芯東西4月22日報道,近日,深圳感存算一體芯片創(chuàng)企九天睿芯宣布完成B++輪融資,由頭部重要產(chǎn)業(yè)方領(lǐng)投,豪威集團(tuán)、招商致遠(yuǎn)跟投,老股東共達(dá)電聲、英豪資本持續(xù)加碼。芯東西獲悉,融資金額接近2億元。
本輪融資將主要用于推進(jìn)模型-處理器-存儲聯(lián)合創(chuàng)新(MPM,Memory-Processor-Model),圍繞下一代智能系統(tǒng)的核心需求,持續(xù)加強(qiáng)公司在底層技術(shù)、系統(tǒng)架構(gòu)、產(chǎn)品研發(fā)與產(chǎn)業(yè)協(xié)同方面的布局。
九天睿芯成立于2018年,由多名海內(nèi)外頂尖高校博士聯(lián)合創(chuàng)立,基于類腦計算,以模數(shù)混合形式,實現(xiàn)感存算一體芯片的研發(fā)落地。
融資完成后,九天睿芯將繼續(xù)圍繞3個方向加大投入:
第一,強(qiáng)化底層核心技術(shù)研發(fā),持續(xù)推進(jìn)高帶寬存儲、高能效處理器、系統(tǒng)軟件與模型協(xié)同優(yōu)化等關(guān)鍵能力建設(shè);
第二,深化MPM路線下的產(chǎn)品化與工程化落地,推動關(guān)鍵技術(shù)驗證與系統(tǒng)級集成;
第三,聯(lián)合產(chǎn)業(yè)鏈上下游伙伴,加快在云端推理、邊緣智能和智能設(shè)備等場景中的生態(tài)合作與應(yīng)用落地。
九天睿芯認(rèn)為,下一階段AI競爭的關(guān)鍵,是模型、處理器、存儲及系統(tǒng)軟件的協(xié)同優(yōu)化能力。
基于這一判斷,該公司持續(xù)推進(jìn)以MPM為核心的方法論創(chuàng)新,嘗試從系統(tǒng)視角重新定義智能計算的底層路徑。
從“先有模型、再去適配芯片”的傳統(tǒng)研發(fā)鏈路,升級為“模型與芯片協(xié)同定義”的研發(fā)范式,是其持續(xù)推進(jìn)的重要方向。
MPM強(qiáng)調(diào)圍繞真實工作負(fù)載,將存儲、處理器、模型放在同一個問題中協(xié)同設(shè)計,使模型創(chuàng)新、芯片創(chuàng)新、存儲創(chuàng)新與系統(tǒng)軟件創(chuàng)新形成雙向牽引,從而實現(xiàn)整體系統(tǒng)效率的躍遷。
基于此,該公司計劃在模型側(cè)通過合作與自研相結(jié)合的方式,圍繞芯片物理邊界、存儲介質(zhì)特性與系統(tǒng)級約束開展創(chuàng)新,并聯(lián)合存儲產(chǎn)業(yè)伙伴、模型公司及上下游生態(tài),共同推進(jìn)MPM的共生設(shè)計,提升系統(tǒng)級效率與產(chǎn)品落地能力。
九天睿芯聯(lián)同合作伙伴在MPM這個大方向目前的重要布局包括:
(1)存儲層:國際頭部廠商近期已公開推動以HBF為代表的新型高帶寬存儲形態(tài)及其標(biāo)準(zhǔn)化進(jìn)程,面向AI推理工作負(fù)載構(gòu)建“介于HBM與SSD之間”的新層級存儲。
九天睿芯和合作伙伴則在推動一條功耗更低的高密度高帶寬存儲路徑:在承載大部分模型權(quán)重的同時,以更優(yōu)的容量密度、帶寬效率與系統(tǒng)能效支撐大尺寸模型部署,為千億參數(shù)級尤其是MoE模型的落地提供更具工程可行性的底層支撐。
(2)計算層:以SRAM存算一體(CIM)結(jié)合SRAM近存為核心構(gòu)建高能效NPU計算裸片,通過提升片上SRAM容量、增強(qiáng)數(shù)據(jù)駐留與算子融合能力,減少中間激活數(shù)據(jù)的寫回、搬運與重復(fù)訪問,顯著降低系統(tǒng)功耗與熱密度,為3D堆疊形態(tài)下的可靠運行性,提高可堆疊層數(shù),降低散熱與系統(tǒng)能耗成本。
針對MoE模型中的routing、token重排與數(shù)據(jù)流組織等關(guān)鍵環(huán)節(jié),九天睿芯亦進(jìn)行了專門的架構(gòu)優(yōu)化,以提升稀疏計算場景下的系統(tǒng)級效率。
(3)模型層:基于存儲介質(zhì)特性、計算芯片物理邊界與當(dāng)前工藝條件,對模型進(jìn)行面向部署的聯(lián)合創(chuàng)新,包括模型結(jié)構(gòu)設(shè)計、專家組織方式、參數(shù)布局、量化壓縮、稀疏激活與推理流程優(yōu)化等。
其核心是讓模型、存儲和處理器在同一約束條件下協(xié)同演進(jìn),提升權(quán)重承載效率、token生成效率、帶寬利用效率與系統(tǒng)能效,為千億參數(shù)級MoE模型在真實場景中的可部署性打開更現(xiàn)實的路徑。
九天睿芯希望以統(tǒng)一的方法論貫通多類推理場景,逐步形成覆蓋云、邊、端的系統(tǒng)能力體系。
在云端推理與推理基礎(chǔ)設(shè)施場景中,MPM有望提升系統(tǒng)吞吐、單位成本效率與整體資源利用率;在邊緣智能和各類智能設(shè)備場景中,MPM有望推動更強(qiáng)模型以更高能效、更低成本實現(xiàn)部署;在機(jī)器人及其他實時交互場景中,MPM也有望幫助系統(tǒng)在有限資源約束下獲得更好的理解、決策與響應(yīng)能力。
當(dāng)前,AI產(chǎn)業(yè)正從邁向應(yīng)用規(guī)模化落地,產(chǎn)業(yè)競爭焦點轉(zhuǎn)向推理階段的系統(tǒng)效率競爭。
無論是云端推理集群、邊緣計算節(jié)點,還是機(jī)器人、AI手機(jī)、AI PC等智能設(shè)備,推理系統(tǒng)都在面臨同一個核心問題:如何以更高效率計算,高密度存儲支撐更強(qiáng)模型的持續(xù)運行與規(guī)模化部署?
英偉達(dá)聯(lián)合創(chuàng)始人兼CEO黃仁勛在CES演講中曾直言:“The best models today are all mixture of experts(MOE)”,表明MoE正在成為當(dāng)前先進(jìn)模型的重要演進(jìn)方向。英偉達(dá)在CES同期發(fā)布中也將其新一代AI平臺明確面向包括MoE在內(nèi)的下一代模型需求。
九天睿芯認(rèn)為,隨著MoE持續(xù)走向更大規(guī)模與更廣泛部署,系統(tǒng)瓶頸將進(jìn)一步從單點算力轉(zhuǎn)向權(quán)重承載、帶寬效率、功耗控制與系統(tǒng)級協(xié)同,這也使得圍繞存儲密度、處理器與模型聯(lián)合創(chuàng)新的MPM路線具備更加明確的產(chǎn)業(yè)意義。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.