![]()
算力越來越便宜,但算力的賬越來越難算。
作者|徐珊
編輯|鄭玄
「Token 的成本正在暴跌。」
這句話放在兩年前,會讓每一個 AI 創業者興奮。從 2023 年到 2025 年,AI 推理成本下降了 99.7%。要知道,GPT-4 發布時每百萬 Token 成本是 37.5 美元,到 2025 年這個數字已經降至 0.14 美元。按這個趨勢,算力成本對創業者來說,應該不是問題才對。
但現實卻恰恰相反。
同一時期,全球企業 AI 云支出從 115 億美元暴漲到 370 億美元,整整翻了三倍。AI 進入 A2A 時代后,數十個智能體在反復交互中,讓 Token 調用量呈指數級爆炸。這也導致了盡管 Token 單價更便宜了,但每個任務消耗的 Token 量瘋狂上漲。
顯然,算力正在成為這個時代最奇特的資源。它越來越便宜,但你花在它上面的錢,只會越來越多。
對巨頭來說,這個問題可以靠自建算力中心來解決。但對大多數創業公司來說,他們只能站在公共算力市場里,接受云廠商的定價,看著算力賬單一個月比一個月高,卻毫無議價能力。
共績科技創始人付智看到的,正是這個市場錯位誕生的商機。
在他看來,想要算力成本下降的解法不是只能等待成本自然下降,而是換一種使用算力的方式,同樣可以讓算力成本開始下降。讓算力像電力一樣,隨取隨用,按需計費,把大量被閑置浪費的算力資源重新激活。
近日,共績科技完成 Pre-A 輪融資,投后估值 3.5 億元人民幣,并計劃于近期啟動 A 輪融資。在算力賽道普遍承壓的 2025 年,這家用人工智能方法解決資源調度問題的科技公司悄悄做到了數千萬營收,客戶留存率接近 100%。
共績科技,正在把算力調度變成一門真實的生意。
![]()
共績科技創始人付智 圖源:共績科技
01
當 AI 公司爆了,
算力成本這筆賬有了新解法
新品上線前夕,Remy 的團隊幾乎沒睡覺,隨時預備著突發情況誕生。
但真當公司網站在 48 個小時涌入 50 萬用戶時,對一家剛從內測走向公測的 AI 創企來說,他們需要在短時間內將所有基礎設施擴容幾十倍。盡管有所準備,上線前,Remy 提前測試過 Ucloud 、阿里云、華為云等多個云服務平臺,但潑天流量真正砸下來的那一刻,他們的最終解決方案商卻是共績科技。
簡單來說共績科技做的事就是把閑置算力調度起來,再按需分配給有彈性需求的 AI 企業。無論是網吧夜里空轉的機器、或者個人用戶的 4090,又或者是小機房的空閑資源都能夠成為共績科技可調度的算力池一部分。如果客戶不夠用,就隨時在算力池子里再調,隨用隨取。
那 48 小時里,共績科技緊急為 Remy 調配了近 1900 張 GPU 卡。用戶每發起一次請求,就會誕生一個新訂單;當用戶的計算完成,訂單立刻關閉。那一天,平臺處理了超過百萬個訂單。
「在峰值時刻,一般的算力服務商臨時能開出 20 張卡就已經很難了,更多情況下企業還需要等待,但等待也意味著流量流失,是企業絕對不想看到的。」付智談到在這件事之后,Remy 使用的絕大部分的算力都來自共績科技。
Remy 對算力的需求其實很簡單,每一次流量爆發的時候,用戶的點擊都能及時回應,算力的調用要快、要及時,同時成本要低。這些都是剛剛起步的 AI 創企對算力最基礎的需求。
相比之下,有一類 AI 應用客戶面對算力需求則是更小眾,但也更現實。
去年春節期間,有一家在景區做 AI 換裝拍照的公司找上了共績科技。他們倒不是不知道流量爆發的節點在什么時候,但仍然很難算好算力這筆帳。
他們的 AI 設備多放在景區里,一到節假日就人滿為患,算力需求激增。但是假期一過,算力的需求又幾乎歸零。「春節是全年最大的高峰,剩下大半年,景區里沒什么人。」他們告訴付智。
這樣的算力波動意味著,如果選擇按峰值租算力,等于平時 90% 的時間都在燒錢養卡;如果按照均值租算力,那春節期間肯定需求會崩,很影響用戶體驗。「這樣的需求波動,在傳統的算力服務方案里,比較難獲得一個合適方案。因為這種極端的峰谷差,在標準產品里根本沒有對應的定價邏輯。」付智說道。
但這樣的場景,卻很適合使用共績科技的算力共享平臺。
那一個月,服務節點換了 1963 臺個人電腦,整個春節,服務沒有出現過一次穩定性問題。「相比客戶自己按峰值部署算力,我們幫他們節約了近 70% 的費用。」付智補充道。
這樣的時間波動需求不僅出現在一些垂類小眾場景里,同樣對不少 AI 新秀公司來說也同樣常見。
liblib 是國內用戶量最大的 AI 圖片生成平臺之一,他們曾在云廠商平臺租了大量 GPU 卡。但如果仔細研究的話,他們發現這些 GPU 平均算下來,整體利用率只有 45%。
這也意味著,超過一半的卡,每天都在白白燒錢。
據付智介紹,其實像 liblib 這樣的企業并不是少數,幾乎所有以上班族為核心用戶的 AI 應用工具,都會遇到這個問題。白天用戶密集使用,夜里用戶數大幅下降。如果按峰值配算力,夜里則空置率較高,但如果按均值配則白天很難滿足所有用戶需求。
AI 賽道看著熱鬧,但卡住公司發展生命線的,有可能就是算力成本這筆賬。不少企業對算力預期過高,算力成本把現金流拖垮,也有企業對算力預估不足,在用量峰值時服務崩掉,用戶一走不回頭。
「AI 應用的流量天然是波動的,算力市場的定價邏輯是為穩定需求設計的,算力成本的分配方式還一直停留在比較傳統的方式上」付智說道。這也是為什么當一家 AI 公司真正爆了,算力成本這筆賬,需要一種新的算法。
過去,傳統的算力服務模式以長租合同為主。企業租一年,不管用不用,都需要為算力預付費用,算力閑置的成本主要由企業自己承擔。而共績科技做的事,其實是把這筆成本遷移到另一個地方,也就是那些本來就有閑置算力、但自己跑不滿的人,像是個人用戶、網吧等等,這些算力本來就在浪費,把它們調度起來,不產生新的算力成本,也盤活了已經存在的閑置算力。
「算力不是越多越好」付智說,「而是可以流動的、隨時可調用的,才好。」
02
彈性算力這筆生意,
考驗的是能源調度能力
對付智來說,想做算力調度這筆生意的契機,其實是來自于一個偶然的機會。
2023 年 5 月假期,正是 AI 浪潮剛剛萌發的階段,付智往一個 AI 創業者社群里扔了一條消息。內容很簡單:我有一臺 A100,租得越短越便宜,有需要的來找我。
他當時自己的預期其實沒抱多大希望,畢竟只有一張顯卡。結果卻出乎意料最后有 30 個人咨詢他,并且都很爽快地付錢。
「我說誰給錢快我就給誰。」他最后挑了 5 個人服務。一張卡,5 個客戶,驗證了一個他想了很久的判斷:普通人開始需要算力了。
但他也清楚,這門生意之所以在那個時間點才成立,不是因為他運氣好,而是因為在那之前,這件事根本沒有條件做。
畢竟,1999 年就有人曾提出做算力共享,搭建了 BOINC 平臺,幾十萬人在上面貢獻算力,但當時做的是公益性的科學計算平臺,人人可以免費使用。后來比特幣火熱的時候也有人考慮借著挖礦熱潮把閑置算力調度起來,但這并不合法。
想法一直都在,但土壤一直沒有。
畢竟,真正有高性能 GPU 的普通用戶,是 90 后、00 后們。在這之前,很少有人的個人電腦配置的是 4090。而讓個人電腦安全運行 Linux 虛擬環境的 WSL1.0.0,也是到 2022 年才正式發布,更不用提遠程調用分布在各地的個人設備,讓它能被內網穿透的技術,到 2021 年前后才算真正成熟。
供給側、需求側、以及技術條件,三項俱全,才讓這門生意在今天變得可能。
但付智覺得真正發現「時機到了」的信號,不是 DeepSeek,不是一體機,而是 AI 的消費場景,正在從小眾工具向普通人的日常娛樂滲透。
「一旦這個進程加速,對算力的需求就不再是幾家大公司采購,而是要像電力一樣,需要被大規模、跨節點地調度分發。」付智說道。
這也是共績科技正在推進與國家算力中心談合作的原因。目前他們已經參與了京津冀、長三角、深圳、青海的省級算力調度平臺建設,各地搭起來的調度系統,技術上 都有共績的參與。
不過,「算力調度」這件事,比看起來要難得多。
算力調度和算力管理并非一概而論。付智把調度和管理做了一個區分:大廠做的是管理,把一堆機器納入同一套系統,知道誰在用、誰閑著,但很難實現跨地域、跨設備的動態分配。
而算力調度是另一回事,它需要把這個地方的峰值需求,用其他地方閑置的算力來填。這在計算機工程里其實沒有現成的解法,反而是能源領域的老問題。「削峰填谷」這個詞,本來就是電力系統的術語。
付智本科讀的是清華建筑環境與能源應用工程,導師是能源領域的院士。他把能源調度的算法移植過來,解決的是算力版本的同一個問題,這也是共績最核心的壁壘。
當然,在工程化上,這套跨地域的調度體系也會遇到的麻煩也不少。比如,接入調度池的個人電腦,隨時可能「被占用」,如果用戶一開游戲,這臺機器就要退出,但下游的客戶要求服務不能斷。
付智選擇的是熱備加預測,也就是提前給每個任務備好冗余節點,同時用積累的歷史數據預測每個供給方的在線規律,動態調整備份比例。數據越多,備份越精準,成本越低。「我原來得給你備兩臺機器。但隨著使用,我現在只要備一臺就夠了。」網絡傳輸層也不穩定,共績的應對是同時接入三家頭部云廠商,付智提到,「不可能同時出問題」。
那云廠商為什么不做彈性算力?
付智給出的解釋是,大廠看到了,但大廠的彈性算力在產品定位、定價策略上有所不同,共績的優勢是價格和調度效率。
彈性算力的核心矛盾在于,你得提前備好「隨時能調用」的算力,但這些算力在沒人用的時候就是純粹的閑置成本。一般算力服務商的彈性擴容大約是常規價格的 5 倍,或者讓客戶簽一年長約,由客戶承擔算力閑置的風險。
共績之所以能提供真正的彈性,是因為它用的資源本來就是閑置的,這些資源沒有被提前采購進來壓成本,它們本來就閑著,所以共績可以給出更有優勢的價格。
據付智分析,整個市場里,80% 的算力需求走大廠的長租整包,剩下 20% 是有彈性需求的部分。付智不打算搶那 80%,他更專注的是那 20% 的市場,而且隨著 AI 應用持續生長,這 20% 的市場空間也會越來越大。「在別人那,租得越長越便宜;在我這,租得越短越便宜。」付智補充道。如今共績科技共享算力平臺「suanli.cn」可以讓普通消費者按毫秒去租用相關算力。
![]()
共績科技團隊合影 圖源:共績科技
這樣的共享商業模式其實早已在其他領域獲得驗證。
付智把這個生意的本質比作 Airbnb:城市辦大型展會,周邊酒店全滿,Airbnb 把有閑置房間的居民和無處可住的參會者撮合起來。算力版本的故事也是相同的路徑,AI 應用在版本發布、流量爆發的時刻需要大量算力,平時需求遠不及這個量;另一邊,個人用戶、網吧、小機房的算力在夜里和工作日大量閑置,將兩邊連接起來,就是共績在做的事。
只不過,共享的不是房間,而是算力。
03
算力能源調度,
AI 時代的「軟件定義基礎設施」
這條路,在國外也有人走過。比如說,RunPod 也在通過閑散算力提供彈性推理服務,2024 年拿到了英特爾資本和戴爾科技資本共同領投的 2000 萬美元種子輪,客戶里有 Cursor、OpenAI、Perplexity。
但在美國做這件事,和在中國做,在付智看來,完全是兩回事。
AWS 從誕生起就在提供彈性算力,一開始就承諾按需取用,通過高價彈性服務去服務成熟的市場。但國內的云計算廠商更傾向于提供長租模式,相關優惠政策也傾向于此,并不太重視彈性服務,用戶為彈性算力的付費意愿也比美國低得多。因此,如果將 RunPod 那套邏輯搬到國內,定價就跑不通。
不過付智認為,算力調度并不是一門只看算力出租的生意。「共享算力可能只是一個敲門磚。」他說這話的時候沒有猶豫。在他的判斷里,這門生意大概有兩三年的窗口期,只要算力供需錯位還在,這個縫隙就存在,但它不會永遠存在。
這種清醒,在創業者里并不多見。但正因為如此,他很早就開始想一件更根本的事:下一個真正爆發的 AI 應用會從哪里長出來?這個判斷,將會直接決定了算力需求的走向,對此,付智有兩個面向未來的判斷。
第一個是,據他分析,中國的超級應用不會從 PC 端的生產力工具里長出來,中國真正有機會的方向,是移動端的社交娛樂、結合供應鏈的跨境硬件,以及能嵌入真實生活場景的 AI 應用。
中國的互聯網從來沒有經歷過深厚的 PC 生產力工具時代,用戶直接從功能機時代跳到了移動互聯網。那些在美國跑出來的 AI 文檔、AI 幻燈片、AI 代碼助手,背后依賴的是幾千萬習慣在 PC 上辦公、愿意為 SaaS 工具付費的用戶群體,而中國并不是。「全中國有超過 1 億人需要寫 Word 嗎?我覺得可能沒有。」更麻煩的是,即便有這個需求,大廠也會很快把這些功能做成免費插件。
他反而在社交娛樂場景看到了高增長。他對話過很多做短劇、影視的從業者,問他們為什么那么積極地擁抱 AI,對方的反饋讓他有了新的想法:「我已經沒有可失去的了,沒有人去看電影和電視劇了,我們已經快死了。」這些人是中國市場里最積極擁抱 AI,不是因為最懂技術,而是因為退無可退。「現在,已經沒什么人看電視、電影了。」
而對于 AI 硬件的發展,他也有些不同的看法。
過去幾年,AI 硬件的主流思路是「萬物加對話框」,也就是什么設備都配上一個聊天窗口。付智覺得這個方向并不對。「消費者不需要一個會寫詩的冰箱。」
真正有生命力的 AI 硬件,是進入用戶本來就有的高頻場景,讓 AI 在背后默默完成運轉,而不是拉著用戶專門坐下來和它聊天。
就好比,寵物攝像頭應該可以自動識別貓咪是否生病,景區相機自動完成換裝拍照。用戶什么都不用改變,AI 悄悄把事情做完了。「如果這類硬件可以采用開源模型部署,流量爆發的時刻,也會成為彈性算力的客戶。」付智覺得這也是共績科技未來的增長點之一。
付智的第二個判斷,藏得更深,2024 年底就已經成形,但他等到今年才等到了驗證它的機會。
他認為,讓人直接去跟 AI 對話,本身就是一種效率浪費。人類信息輸入輸出的速度有上限,一次只能提一個問題,需要等答案出現再提下一個。但 AI 可以同時處理成千上萬個線程,在毫秒之間完成機器之間的信息傳遞。「用人去驅動 AI,是用最慢的那一環,拖住了整個系統的速度。」
真正應該發生的,是 AI 與 AI 之間直接協作,A2A。一個任務下達,觸發一組 AI 的連鎖運轉,人只需要定義目標,不需要參與中間的每一步。這也是為什么 OpenClaw 在今天被人們所看重。這也是付智覺得 OpenClaw 真正重要的原因,不是這個產品本身,而是它證明了一件事:AI 與 AI 之間可以自己形成社區,A2A 有人買單,這個方向是走得通的。
一旦 A2A 模式成為主流,算力的消耗將是今天的數倍乃至數十倍。黃仁勛在 GTC 2026 上說,由于 Agentic AI 和推理能力的爆發,當下所需的計算量比一年前預期的多了至少 100 倍,而這只是開始。那時候算力真的會像電一樣,考慮的不再是你需要囤多少卡的問題,而是整張「算力電網」能不能按需分發,算力資源管理來到了調度的領域。
當 A2A 真正到來,算力會像電力一樣成為每個人、每個任務、每個 AI 節點背后的基礎設施。那時候,誰能跨地域、跨設備、跨時段地把算力精密調度起來,誰就掌握了這張網真正的運營能力。
共績科技現在做的事,在付智看來是在為那個時刻做準備,用這兩三年的窗口期,把調度能力、節點網絡、客戶關系都建起來。等 A2A 的需求真正爆發,這套體系才是共績科技真正的護城河。
他最近在公司內部發了一句話,采訪快結束時,他又說了一遍:
「即便如此,這一切也才剛剛開始。」
放在彈性算力的語境里,這句話或許只是一個創業者對市場的樂觀判斷。但放在 A2A 的語境里,他說的「開始」,或許并不是這門生意的開始,而是算力作為基礎設施這個命題,迎來了真正開始的時刻。
*頭圖來源:豆包 AI
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
極客一問
你看好彈性算力市場嗎?
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.