![]()
一天燒掉3400美元,只因為讓AI干了點“正經活”。這不是科幻片,而是一家企業真實收到的云賬單。當某IT公司的一位開發人員在24小時內消耗了10億個Token、單日云端支出高達3400美元時,無數企業管理者終于意識到一個扎心的事實:用AI,比想象中貴得多,而且越來越貴。
更令人不安的是,這種“按Token計費”的模式,正在隨著智能體技術的爆發而加速失控。以OpenClaw為代表的智能體,單任務Token消耗可達傳統AI的10到50倍——處理越復雜的問題,燒錢越快。
而在這場從“訓練”到“推理”的延伸中,企業亟需一種能夠承接AI應用落地的“新硬件”,它既不像消費級AI PC那樣算力單薄,也無需像數據中心級AI服務器那樣動輒百萬級的投入。一種介于兩者之間的計算形態,正在成為AI時代的“第三種答案”,這個“答案”就是智能體工作站。
推理成主角推動企業級工作站發展
算力缺口還是存在,但已經不是‘訓練大模型缺高端GPU’的缺口,而是‘各行各業用AI推理缺便宜、好用、隨用隨取的算力’的缺口。”這是行業在進入2026年后形成的普遍共識。
根據TrendForce的最新預測,2026年全球AI算力市場規模將突破1.2萬億美元,其中推理算力占比將從2023年的約30%躍升至60%以上。德勤的預測同樣印證了這一趨勢:全球推理負載占AI算力比例將從2023年的約1/3提升至2026年的約2/3,長期有望超過80%。
推理時代的到來,不僅改變了算力需求的內部結構,更關鍵的是,它從根本上改變了算力部署的“空間邏輯”。大模型訓練可以集中在超大規模數據中心完成,但推理必須靠近用戶,因為推理場景低延遲、高并發、數據合規的特點,每一道剛性約束都在把算力推向邊緣。IDC研究顯示,到2027年,超過80%的企業將部署分布式邊緣基礎設施,以滿足AI應用對低時延、高并發、高可靠的核心訴求。Gartner則預測,到2026年,75%的企業數據將通過邊緣設備本地處理。
在傳統數字化時代,端側計算設備分工清晰、邊界明確。消費級AI PC主打個人輕量化辦公與簡單AI交互,傳統工作站聚焦工業仿真、3D渲染、科學計算等專業場景,云端服務器則承載超大模型訓練、大規模算力調度等核心任務。三類設備各司其職,形成了穩定的產業格局。但智能體技術的爆發,徹底打破了原有設備的功能邊界與應用邏輯,推動端側To B計算設備完成全方位的結構性迭代。
在這種變化中,企業迎來了一個重要選擇:AI部署,到底是走云端路線,還是走本地路線?
成本、安全,決定選擇
過去兩年,不少企業選擇了一條看似最簡單的路徑,直接調用云端大模型的API。ChatGPT、Claude、Qwen……各廠商的模型接口唾手可得,無須自購硬件,無須維護基礎設施,就像用電一樣“隨取隨用”。但“像用電一樣”的代價是,電表一直在轉。
根據行業統計,2025年至2030年,中國AI推理Token消耗量年復合增長率將達330%,總量預計從約10千萬億增長至約3,900千萬億,五年增長約370倍。更令人警醒的是實際案例:Uber CTO的內部備忘錄傳出,公司在四個月內便耗盡了2026年全部年度AI預算。業界有專家曾坦言,客戶Token生成需求的增長速度遠遠快于Token價格的下降速度,這意味著客戶的總賬單正在迅速攀升。”
當前企業應用AI等數字化技術的過程中,成本已經成為了一個高度敏感的關注點。而隨著AI能力不斷提升,對Token的消耗量也在不斷提升,以OpenClaw為例,據統計,其單任務Token消耗可達傳統AI的10-50倍,并且Token消耗量會隨任務復雜度不斷增加,即便普通用戶日均消耗量也在幾萬到幾十萬Token之間,而對于企業級用戶而言,OpenClaw的價值主要體現在其重度復雜任務處理能力方面,而在復雜任務處理方面,其Token消耗量可達到數百萬甚至數億Token?。
對于很多中小企業企業而言,Token價格與消耗量同時飆升,從長遠角度來看,也讓通過API調用的方式應用AI的成本呈幾何倍數式增長,本地化部署的方式就顯得更具性價比了。此時,高性價比成為智能體工作站的核心競爭力。
相較于純云端部署方案,智能體工作站一次性采購后,長期運營成本極低,第二年起即可實現Token調用成本歸零,僅需承擔每年千元級的電費支出。對比傳統多PC集群部署模式,單臺工作站可替代3-4臺辦公PC的算力需求,長期4-5年周期內,綜合運營成本優勢持續放大。同時,智能體工作站還能同時兼容傳統渲染、仿真、科學計算等業務,一機滿足企業多元算力需求,避免多設備采購的資源浪費,以部門級的采購成本,為中小企業、OPC(一個人公司)團隊提供企業級的算力服務,大幅降低AI試錯與數字化轉型門檻。
Token成本只是冰山一角。數據安全是另一個懸在企業頭上的達摩克利斯之劍。某研究機構預測,到2026年將有超過40%的企業AI部署采用本地化優先策略,特別是在金融、醫療、政務等數據敏感領域。浪潮信息邊緣服務器產品部副總經理劉景志也直言:“很多企業老板對數據上云是有擔憂的。他們不愿意把企業數據放到云端,甚至個人的行為習慣,也不希望放到云端去跑。”
安全一直是企業部署AI時最容易被忽視卻又最致命的問題。大模型本身的泛化特性帶來了一定的“隨意性”——讓智能體修改數據,它有可能改錯。更具隱蔽性的是,當用戶從社區中導入第三方“技能包”或Skill時,這些包可能預埋惡意代碼,在運行過程中竊取數據或損害系統。
因此智能體工作站的安全設計必須貫穿硬件到軟件的每一個層級。以浪潮信息最新發布的元腦智能體工作站Z3為例,在硬件層,其采用了企業級冗余電源設計和主備雙ROM固件方案可以在異常發生時自動切換,避免宕機風險,保障7×24小時的穩定運行。在系統層,工作站可以搭載企業級安全加固的操作系統,內置TPM/TCM硬件級安全芯片。在應用層,ClawManager的安全模塊對所有技能包進行木馬掃描與合規校驗,保障應用原生安全。AI網關則負責對智能體的每一次調用行為進行精細化的權限管理和合規審計。
這種全棧式的安全體系,與Gartner所強調的“零信任”理念不謀而合,更與AI時代企業對數據主權的根本訴求直接呼應:“數據不離開用戶自己”正在成為企業AI部署的底層底線。
與此同時,當前混合AI正在成為產業主流方向。某行業專家曾對筆者表示,2026年將標志著向本地部署“混合人工智能”投資轉變的開端,“這種模式將云端大模型的泛化能力與本地私有數據的深度結合,既保留了云端‘知識面廣’的優勢,又通過本地化部署確保了‘數據不出門’。”該專家如是說。
而在劉景志看來,隨著智能體時代的到來,企業級工作站的核心能力評判標準也將被重新定義。正是在這樣的背景下,智能體工作站這種新的硬件形態,開始進入企業決策者的視野。它不是個人電腦的簡單升級,也不是服務器的小型化縮水,而是一種專為企業智能體本地部署而設計的全新產品品類。
與傳統工作相比,新一代AI智能體工作站需要具備“極致算力、易部署、全棧安全、高性價比”的能力,才能適配多智能體協同、大模型本地推理、企業常態化AI辦公的落地需求。而從市場角度出發,隨著AI硬件的邊界越來越模糊,AI智能體工作站也成為了眾多硬件廠商接下來重要搶占的市場之一。
(文|Leo張ToB雜談,作者|張申宇,編輯丨楊林)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.