“芯片圈地震了!”當(dāng)寒序科技(ICY Tech)官宣與三星生態(tài)設(shè)計伙伴SEMIFIVE完成亞洲首個8nm嵌入式MRAM(eMRAM)AI芯片流片時,整個科技圈直接炸鍋——這不僅是國產(chǎn)芯片在先進(jìn)存儲領(lǐng)域的一次“史詩級”逆襲,更意味著中國AI算力終于撕開了“內(nèi)存墻”這道困住行業(yè)多年的枷鎖!
![]()
要知道,過去十年,全球AI芯片賽道幾乎被英偉達(dá)、AMD等巨頭壟斷,國產(chǎn)芯片雖在制程工藝上拼命追趕,卻總被“內(nèi)存墻”卡脖子:傳統(tǒng)AI芯片依賴SRAM(靜態(tài)隨機存取存儲器)作為緩存,但SRAM隨著制程微縮,面積效率暴跌、功耗飆升,導(dǎo)致大模型推理時數(shù)據(jù)搬運成本高到離譜,甚至出現(xiàn)“算力還沒耗盡,內(nèi)存先撐不住”的尷尬場面。
而寒序科技這次直接甩出“MRAM+SRAM”混合存儲架構(gòu),用eMRAM替代大部分片上SRAM,相當(dāng)于給AI芯片裝了個“渦輪增壓發(fā)動機”——存儲密度提升3倍,能效比直接碾壓國際頂尖推理芯片,還能讓20億參數(shù)的大模型在端側(cè)跑起來!這波操作,簡直是“降維打擊”!
一、寒序科技是誰?憑什么能撬動三星的8nm工藝?
先說說這次的主角——寒序科技。這家成立僅5年的國產(chǎn)AI芯片企業(yè),堪稱“技術(shù)狂魔”:核心團(tuán)隊來自北京大學(xué)物理學(xué)院應(yīng)用磁學(xué)中心,專攻自旋電子學(xué)與存算一體技術(shù),手握幾十項MRAM(磁性隨機存儲器)核心專利,堪稱“國產(chǎn)MRAM的黃埔軍校”。
![]()
而他們的對手,是三星這種掌握全球最先進(jìn)制程工藝的半導(dǎo)體巨頭——8nm eMRAM工藝,可是三星的“鎮(zhèn)店之寶”,連自家旗艦芯片都未必能用上,寒序科技憑什么能拿到?
答案藏在合作模式里。這次寒序科技與SEMIFIVE的合作,堪稱“技術(shù)+生態(tài)”的完美結(jié)合:寒序科技全程主導(dǎo)底層架構(gòu)設(shè)計,從MRAM比特單元、外圍電路到高帶寬讀出電路,甚至大模型推理算子加速方案,全部自研;而SEMIFIVE則負(fù)責(zé)后端硅實現(xiàn)與MPW流片支持(MPW即多項目晶圓,能大幅降低流片成本)。
這種“底層架構(gòu)自研+國際生態(tài)落地”的模式,徹底擺脫了傳統(tǒng)ASIC項目依賴標(biāo)準(zhǔn)IP調(diào)用的局限——簡單說,就是寒序科技自己畫圖紙,三星負(fù)責(zé)把圖紙變成實物,相當(dāng)于“定制款”芯片!
更關(guān)鍵的是,寒序科技在MRAM領(lǐng)域的積累太硬核了。MRAM作為一種新型非易失存儲器,兼具DRAM的高速讀寫、NAND Flash的非易失性(斷電不丟數(shù)據(jù)),且單元尺寸比SRAM小40%以上,功耗低到離譜。但過去受限于材料與工藝,MRAM一直難以商業(yè)化,尤其是8nm這種先進(jìn)制程,全球能玩的企業(yè)屈指可數(shù)。
寒序科技卻憑借自旋電子學(xué)技術(shù),硬生生把eMRAM的讀寫速度、可靠性拉到了可用級別,甚至能替代片上SRAM——這波操作,直接讓三星都愿意為其開放工藝窗口!
二、技術(shù)亮點:混合存儲架構(gòu)+PNM計算,擊穿“內(nèi)存墻”!
這次寒序科技的芯片,最炸裂的技術(shù)點有兩個:“MRAM+SRAM”混合存儲架構(gòu)和近內(nèi)存處理(PNM)架構(gòu)。咱們一個一個說。
1. 混合存儲架構(gòu):用eMRAM替代SRAM,存儲密度暴漲3倍!
傳統(tǒng)AI芯片的“內(nèi)存墻”問題,本質(zhì)是SRAM的“先天缺陷”:隨著制程微縮(比如從14nm到8nm),SRAM的單元面積縮小速度遠(yuǎn)低于晶體管,導(dǎo)致片上緩存占用的面積比例飆升,甚至能占到芯片總面積的50%以上!更糟的是,SRAM的漏電流問題嚴(yán)重,功耗高到離譜——跑個大模型推理,光是數(shù)據(jù)搬運就能耗掉70%的電量,這誰頂?shù)米。?/strong>
寒序科技的解決方案很粗暴:直接用eMRAM替代大部分片上SRAM!eMRAM作為非易失存儲器,斷電也能保存數(shù)據(jù),且單元尺寸比SRAM小40%以上,這意味著同樣面積下,eMRAM能塞進(jìn)3倍的存儲容量!更關(guān)鍵的是,eMRAM的讀寫功耗極低,數(shù)據(jù)搬運成本大幅降低,直接解決了“內(nèi)存墻”的核心痛點。
當(dāng)然,寒序科技也沒完全拋棄SRAM——畢竟SRAM的讀寫速度更快,適合高頻訪問的臨時數(shù)據(jù)。所以他們采用了“MRAM+SRAM”混合架構(gòu):用eMRAM存儲大模型參數(shù)(長期保存),用少量SRAM作為高速緩存(臨時存儲),既保證了存儲密度,又兼顧了性能。這波操作,堪稱“既要馬兒跑,又要馬兒不吃草”!
![]()
2. PNM計算架構(gòu):把計算單元“塞進(jìn)”存儲里,推理速度起飛!
存儲問題解決了,計算效率也得跟上。寒序科技這次祭出了近內(nèi)存處理(PNM,Processing Near Memory)架構(gòu),簡單說就是把計算單元直接集成到存儲模塊里,讓數(shù)據(jù)“原地計算”,避免反復(fù)搬運。這招有多狠?舉個例子:傳統(tǒng)AI芯片跑Transformer推理時,數(shù)據(jù)需要在存儲和計算單元之間來回搬運,耗時占整個推理過程的60%以上;而PNM架構(gòu)下,數(shù)據(jù)直接在存儲模塊里完成計算,搬運時間幾乎為零,推理速度直接翻倍!
更絕的是,寒序科技還針對Transformer的關(guān)鍵算子(比如GEMV,通用矩陣向量乘法)做了硬件加速優(yōu)化。這意味著,同樣跑20億參數(shù)的大模型,寒序的芯片能比傳統(tǒng)芯片快30%,功耗卻低40%!這性能,已經(jīng)對標(biāo)國際頂尖推理芯片(比如英偉達(dá)的Orin、高通的Cloud AI 100),甚至在存儲密度和能效比上實現(xiàn)了超越——國產(chǎn)芯片,終于能挺直腰板和國際巨頭掰手腕了!
三、應(yīng)用場景:從人形機器人到私有AI Agent,端側(cè)AI的“核彈級”算力!
技術(shù)再牛,最終得落地才有價值。寒序科技這次流片的芯片,主要聚焦三大場景:私有AI Agent、人形機器人、具身智能與云端推理中心。這些場景有個共同點:對功耗、空間、實時性要求極高,傳統(tǒng)芯片根本玩不轉(zhuǎn)!
1. 私有AI Agent:你的“數(shù)字分身”,終于能離線跑了!
現(xiàn)在大火的AI Agent(智能體),比如ChatGPT的“私人定制版”,需要實時處理用戶請求、調(diào)用大模型推理。但問題來了:如果依賴云端推理,不僅延遲高(網(wǎng)絡(luò)傳輸要時間),還涉及隱私泄露風(fēng)險(數(shù)據(jù)得傳到服務(wù)器);如果用端側(cè)推理,傳統(tǒng)芯片又跑不動大模型(存儲和算力不夠)。寒序科技的芯片,直接解決了這個矛盾!
20億參數(shù)的大模型,在端側(cè)就能跑,且功耗低到能用電池供電——這意味著,你的AI Agent可以完全離線運行,數(shù)據(jù)不出設(shè)備,隱私有保障;還能實時響應(yīng),延遲低于10毫秒,體驗絲滑如本地應(yīng)用。未來,你的手機、智能音箱、甚至智能眼鏡,都能裝個“數(shù)字分身”,隨時幫你處理任務(wù),這畫面,想想就酷!
![]()
2. 人形機器人:告別“智障”,終于能“獨立思考”了!
人形機器人為啥一直“智障”?核心瓶頸是算力不夠:傳統(tǒng)機器人芯片,要么用低功耗CPU(算力弱,只能做簡單動作),要么用高功耗GPU(體積大,散熱難,成本高)。而寒序科技的芯片,用eMRAM的高密度存儲,塞進(jìn)了20億參數(shù)的大模型,還能實時處理視覺、語音、運動控制等多模態(tài)數(shù)據(jù)——這意味著,機器人終于能“獨立思考”了!
比如,未來的人形機器人可以邊走邊識別環(huán)境,邊和你對話邊規(guī)劃路徑,甚至能根據(jù)你的情緒調(diào)整互動方式——這哪是機器人?分明是“鋼鐵俠”里的賈維斯!更關(guān)鍵的是,寒序芯片的功耗極低,機器人用電池就能跑一整天,徹底擺脫“充電兩小時,工作五分鐘”的尷尬。
3. 具身智能與云端推理中心:GPU之外的“高能效備胎”!**
除了端側(cè),寒序芯片還能適配具身智能(Embodied AI,即能感知環(huán)境的智能體)和云端推理中心。在云端場景,它雖然比不上英偉達(dá)GPU的“暴力算力”,但勝在能效比高、成本低——同樣性能下,寒序芯片的功耗只有GPU的1/3,成本只有1/2。這對于需要大規(guī)模部署推理服務(wù)的場景(比如智能客服、數(shù)據(jù)標(biāo)注、內(nèi)容生成),簡直是“降本神器”!
四、行業(yè)影響:國產(chǎn)芯片的“里程碑”,AI算力的“新范式”!
寒序科技這次流片成功,影響遠(yuǎn)不止技術(shù)層面——它標(biāo)志著國產(chǎn)芯片在先進(jìn)存儲與存算架構(gòu)領(lǐng)域,終于實現(xiàn)了從“跟跑”到“并跑”甚至“領(lǐng)跑”的跨越!
1. 技術(shù)層面:MRAM商業(yè)化邁出關(guān)鍵一步!
MRAM作為下一代存儲技術(shù),一直被寄予厚望,但商業(yè)化進(jìn)程緩慢。寒序科技這次用8nm eMRAM跑通了AI芯片,證明MRAM在高性能計算領(lǐng)域的可行性——未來,MRAM很可能替代SRAM,成為AI芯片的主流存儲方案!這不僅會重塑芯片設(shè)計邏輯,還可能帶動整個半導(dǎo)體產(chǎn)業(yè)鏈的變革(比如材料、設(shè)備、封裝等環(huán)節(jié))。
2. 產(chǎn)業(yè)層面:國產(chǎn)AI芯片擺脫“卡脖子”!
過去,國產(chǎn)AI芯片總被詬病“制程落后”“架構(gòu)落后”,但寒序科技這次用“混合存儲+PNM計算”的創(chuàng)新架構(gòu),繞開了制程限制,直接在能效比和存儲密度上實現(xiàn)了超越。這意味著,即使未來被限制使用先進(jìn)制程,國產(chǎn)芯片也能通過架構(gòu)創(chuàng)新保持競爭力——這才是真正的“技術(shù)自主”!
3. 生態(tài)層面:國際合作“新模板”!
寒序科技與SEMIFIVE的合作,為國產(chǎn)芯片企業(yè)提供了新思路:與其閉門造車,不如借助國際生態(tài)的力量,快速實現(xiàn)技術(shù)落地。這種“底層自研+生態(tài)合作”的模式,既能保證核心技術(shù)自主可控,又能利用全球資源加速商業(yè)化,未來可能成為國產(chǎn)芯片“出海”的主流路徑。
![]()
五、總結(jié):寒序科技的“一小步”,國產(chǎn)芯片的“一大步”!
寒序科技這次流片成功,看似只是“一顆芯片”的突破,實則是國產(chǎn)芯片在先進(jìn)存儲、存算架構(gòu)、國際合作等多個維度的全面進(jìn)階。它用實力證明:國產(chǎn)芯片不僅能追趕,還能超越;不僅能做“備胎”,還能當(dāng)“主角”!
未來,隨著MRAM技術(shù)的成熟和PNM架構(gòu)的普及,AI芯片的競爭將不再局限于制程工藝,而是轉(zhuǎn)向架構(gòu)創(chuàng)新與能效比——而這,正是國產(chǎn)芯片最擅長的領(lǐng)域!所以,別再說“國產(chǎn)芯片不行”了——寒序科技們,正在用技術(shù)重新定義規(guī)則!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.