AMD最新發(fā)布的Ryzen AI Max 400系列有個數(shù)字相當(dāng)刺眼:192GB統(tǒng)一內(nèi)存,塞進一顆能放進迷你主機的芯片里。
對執(zhí)著于本地跑大模型的人來說,這個數(shù)字意味著一件事——終于不用跟顯存瓶頸死磕了。
![]()
【代號"Gorgon Halo"的芯片,到底變了什么】
架構(gòu)層面幾乎原封不動。Zen 5 CPU、RDNA 3.5核顯、XDNA 2神經(jīng)網(wǎng)絡(luò)引擎,全部沿用上一代設(shè)計。唯一看得見的升級是旗艦款Ryzen AI Max+ Pro 495的頻率:boost上限從5.1 GHz提到5.2 GHz,漲了100 MHz。中低端的Pro 490和Pro 485維持在5 GHz,頻率這塊沒變化。
真正的區(qū)別藏在內(nèi)存控制器里。上一代Strix Halo封頂128GB,Gorgon Halo直接拉到192GB。除此之外,兩顆芯片像是同一個模子刻出來的。
【192GB統(tǒng)一內(nèi)存,誰真的需要】
答案是:本地跑大語言模型的人,而且得是特定場景。
AMD給Gorgon Halo定了一個很具體的賣點——首款能在設(shè)備端獨立運行300B+參數(shù)模型的x86芯片。為了撐住這個說法,192GB內(nèi)存里有160GB可以劃給顯存用。
這個數(shù)字的含金量在于:原本需要云服務(wù)器或者多張高端顯卡才能跑的模型,現(xiàn)在一臺迷你主機就能搞定。AMD算過一筆賬,按token消耗折算,單臺設(shè)備每月能省下約750美元的云API調(diào)用成本。
但"token經(jīng)濟"的算盤有個前提——你得先拿到機器。
【時間線比參數(shù)更殘酷】
華碩、惠普、聯(lián)想的OEM系統(tǒng)要等到2026年第三季度。搭載上一代Strix Halo的Ryzen AI Halo整機倒是快一些,6月開啟預(yù)售,定價3999美元。
Gorgon Halo的整機?目前還沒有確認的發(fā)售日期。
更麻煩的是供應(yīng)鏈。全球內(nèi)存供應(yīng)緊張已經(jīng)迫使蘋果撤下了高配置版Mac Studio的訂單,AMD的192GB野心能否大規(guī)模交付,要打上一個問號。
對急需本地算力的研究團隊或小企業(yè)來說,這份等待清單可能比參數(shù)表更難消化。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.