在大多數(shù)人的認(rèn)知里,本地跑大模型和服務(wù)器機(jī)柜是鎖死的CP——想要千億參數(shù),就得接受U位占用和散熱噪音。所以當(dāng)技嘉AI TOP ATOM這種150mm見方、能直接塞進(jìn)顯示器底下的迷你主機(jī)出現(xiàn)在視野里時(shí),很難不讓人多看兩眼規(guī)格表確認(rèn)是不是標(biāo)錯(cuò)了定位。然而技嘉這次帶來(lái)的AI TOP ATOM,不僅僅是將體積縮小了,它更像是給AI硬件領(lǐng)域投下的一枚深水炸彈,重新定義了個(gè)人算力的邊界。
![]()
先看外觀,它的機(jī)身控制在了150mm見方,也就是大約一個(gè)手掌能托起的尺寸。這種緊湊布局對(duì)于桌面空間常年被各種外設(shè)、開發(fā)板侵占的用戶來(lái)說(shuō),確實(shí)是福音。機(jī)身采用銀灰色金屬外殼,表面啞光細(xì)磨砂處理,既減少指紋殘留,也提升了專業(yè)質(zhì)感。整機(jī)設(shè)計(jì)非常克制,沒(méi)有夸張的RGB燈效,散熱出風(fēng)口采用橫柵格設(shè)計(jì),內(nèi)側(cè)輔以強(qiáng)化筋條保證穩(wěn)固性。這種隱蔽式進(jìn)出風(fēng)設(shè)計(jì)在保證散熱的同時(shí),也把運(yùn)行噪音控制在了幾乎可以忽略的水平,對(duì)于需要在安靜環(huán)境下調(diào)試代碼或進(jìn)行內(nèi)容創(chuàng)作的用戶來(lái)說(shuō),這一點(diǎn)非常重要。
![]()
當(dāng)然,外觀只是前菜,扒開外殼看內(nèi)核才是重頭戲。AI TOP ATOM的核心競(jìng)爭(zhēng)力,源自它內(nèi)部那顆NVIDIA GB10 Grace Blackwell芯片。這不是簡(jiǎn)單的CPU+GPU拼湊,而是采用了先進(jìn)的CoWoS封裝技術(shù),將ARM架構(gòu)的Grace CPU和Blackwell GPU在物理層面上深度集成,并通過(guò)NVLink-C2C進(jìn)行互聯(lián)。用游戲圈的話來(lái)說(shuō),這就像把原本需要通過(guò)PCIe通道“交流”的獨(dú)立顯卡和處理器直接做進(jìn)同一顆芯片里,而且?guī)挿藬?shù)倍。
![]()
這對(duì)于大模型玩家來(lái)說(shuō),是一個(gè)實(shí)實(shí)在在的“破壁”時(shí)刻。AI TOP ATOM通過(guò)128GB統(tǒng)一內(nèi)存架構(gòu),徹底推倒了CPU內(nèi)存與GPU顯存之間的那堵墻,讓兩者像訪問(wèn)本地緩存一樣直接調(diào)用。我嘗試運(yùn)行了智譜的GLM-4.5-Air 106B大模型(NVFP4精度),任務(wù)管理器里顯示顯存占用穩(wěn)定在68GB左右,運(yùn)行流暢。你不需要昂貴的服務(wù)器,就能在桌面端流暢運(yùn)行高達(dá)2000億參數(shù)的模型。
這顆Blackwell GPU集成了6144個(gè)CUDA核心,在FP4精度下能釋放出高達(dá)1000 AI TOPS的算力。在我們針對(duì)不同長(zhǎng)度提示詞的文本生成測(cè)試中,面對(duì)106B的大模型,即便是500字的長(zhǎng)提示詞,它的文本生成速度依然能穩(wěn)定在20 Tokens/s以上。這種吞吐量,對(duì)于需要頻繁進(jìn)行數(shù)據(jù)預(yù)處理、模型微調(diào)和推理驗(yàn)證的開發(fā)者來(lái)說(shuō),意味著等待時(shí)間的縮短,也意味著試錯(cuò)成本的降低。
![]()
硬件是骨架,軟件才是靈魂。技嘉這次很聰明,與趨境科技深度合作,內(nèi)置了趨境智問(wèn)應(yīng)用系統(tǒng)和AMaaS管理平臺(tái),真正做到了“開箱即用”。開機(jī)進(jìn)入基于Ubuntu底層優(yōu)化的圖形化界面,在瀏覽器輸入本機(jī)IP加端口,就能直接登錄AMaaS后臺(tái)。這個(gè)界面對(duì)于玩過(guò)NAS或者熟悉圖形化運(yùn)維的朋友來(lái)說(shuō),幾乎沒(méi)什么學(xué)習(xí)成本。數(shù)據(jù)概覽儀表盤直觀地展示了GPU負(fù)載、顯存占用、Tokens消耗量。如果你是小團(tuán)隊(duì)的管理員,可以通過(guò)“使用量排行榜”來(lái)分配算力資源,這可比在命令行里敲代碼監(jiān)控要直觀得多。
![]()
而對(duì)于最終的使用者來(lái)說(shuō),趨境智問(wèn)平臺(tái)才是真正的核心。它不再是一個(gè)簡(jiǎn)單的對(duì)話窗口,而是一個(gè)集合了本地知識(shí)庫(kù)、辦公助手、閱讀工具和會(huì)議助手的完整工作臺(tái)。它內(nèi)置了GLM-4.5等多款主流模型,如果你想嘗鮮,也可以通過(guò)私有模型導(dǎo)入功能,一鍵加載自己下載的Qwen或者其他模型。
![]()
在實(shí)際的并發(fā)測(cè)試中,我同時(shí)啟動(dòng)了GLM-4.5-Air對(duì)話、Embedding向量化和Rerank重排序三個(gè)實(shí)例,系統(tǒng)自動(dòng)分配資源,互不干擾。這意味著,一臺(tái)AI TOP ATOM就能搭建起完整的檢索增強(qiáng)生成鏈路,這在以前至少需要幾臺(tái)服務(wù)器才能實(shí)現(xiàn)。在不高于4并發(fā)處理線程時(shí),平均推理速度依然能維持在10 Tokens/s以上,這樣的性能表現(xiàn),作為一個(gè)小型工作室的共享AI服務(wù)器也綽綽有余了。
![]()
而且,它還有一個(gè)隱藏的“大招”——NVIDIA ConnectX-7接口。如果你覺得單機(jī)算力還不夠,可以通過(guò)這個(gè)接口像“搭樂(lè)高”一樣,將兩臺(tái)AI TOP ATOM連接起來(lái),實(shí)現(xiàn)顯存和算力的池化,從而支撐起4000億參數(shù)以上的超大模型。這種模塊化的擴(kuò)展思路,給未來(lái)的升級(jí)留下了足夠的想象空間。
![]()
對(duì)于數(shù)據(jù)隱私日益敏感的今天,將數(shù)據(jù)上傳云端公有模型存在泄露風(fēng)險(xiǎn)。AI TOP ATOM的全本地化部署模式,在物理層面實(shí)現(xiàn)數(shù)據(jù)隔離,從根源上解決信息安全顧慮。它讓那些因成本高昂而對(duì)AI望而卻步的中小企業(yè)、科研小組,甚至是資深發(fā)燒友,都能擁有屬于自己的、安全可控的私有AI基礎(chǔ)設(shè)施。技嘉AI TOP ATOM讓原本屬于專業(yè)人士的AI技能,變得像打開瀏覽器搜索一樣簡(jiǎn)單,哪怕你是個(gè)剛?cè)腴T的新手,也能通過(guò)這套圖形化系統(tǒng),在愜意環(huán)境下暢游AI世界。
回到最初的問(wèn)題:如果你正在尋找一臺(tái)真正能打的本地AI工作站,或者你是一個(gè)希望將AI能力落地到工作流中的開發(fā)者、科研人員,甚至只是對(duì)數(shù)據(jù)隱私有極高要求的資深玩家,技嘉AI TOP ATOM都是目前桌面上最值得入手的選擇。它把原本需要占用半個(gè)機(jī)柜的算力,塞進(jìn)了這個(gè)150mm的小盒子里,還貼心地配好了開箱即用的軟件生態(tài)。在這個(gè)AI本地化部署需求爆發(fā)的節(jié)點(diǎn)上,這款產(chǎn)品確實(shí)給出了一個(gè)相當(dāng)完整的解決方案。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.