<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      用不起Token的我,成了AI時代的下沉市場人群

      0
      分享至


      文丨黃依婷

      編輯丨王閃

      2026年,人類在工作上最“奢侈”的消費是什么?答案并不是買一部性能頂配的電腦,或是置辦幾身體面的行頭,而是能夠不受限制、不計成本地使用這個世界上最先進的AI工具。

      這意味著你不用為了控制成本,絞盡腦汁優化提示詞,生怕彈出一句“今日免費額度已用完”;也不用再三對比,舍不得累到心愛的Claude(由美國AI公司Anthropic開發的大語言模型),只能把不那么重要的工作交給更便宜、更輕量的模型處理。

      AI當然好用,但每用一次都對應著成本,Token(詞元)消耗量貴到你有點用不起了。斤斤計較、小心翼翼,成了如今AI“牛馬”們最真實的狀態。

      這讓人想到了二十年前,撥號上網的時代。那時帶寬緊缺且昂貴,開發者為了節約網站的帶寬消耗,盡可能壓縮圖片、精簡代碼,幾乎不敢上傳視頻。像土豆網這樣的視頻領域創業公司是極少數,視頻所帶來的帶寬消耗成為網站運營的成本大頭。

      昨日重現。

      在AI產業鏈條上,算力像水一樣自上而下流動。從上游的GPU(圖形處理器)和數據中心出發,經由云廠商、模型廠商,被封裝成API(應用程序編程接口)接口,最終流向開發者和普通用戶,變成一次次具體的調用、一個個可以計價的Token。它看似無形,卻在每一個環節都對應著清晰的成本,GPU折舊、電力消耗、高帶寬存儲,最終都會匯總成賬單。

      現在,這條水管正在變得擁堵。一頭是需求在爆發,多模態、Agent(智能體)等復雜推理場景讓Token消耗量千倍增長,另一頭則是供給仍未解綁,GPU、HBM(高帶寬存儲器)、電力和數據中心建設都存在物理極限,GPU利用率仍處于較低位置。聰明是有代價的,雖然爆發式增長導致Token單價更便宜了,但調用它需要花的錢卻越來越多。

      漲價逐級傳導。上游GPU有價無市、算力緊缺,中游云廠商率先調整價格,亞馬遜云、谷歌云、百度云、阿里云等,在過去一個季度相繼上調部分AI相關服務費用,模型廠商也結束補貼周期,騰訊、阿里等接連停止免費公測,提高API調用價格,其中,騰訊混元大模型最高漲價463%。

      模型和應用側的漲價,讓算力不再是獨屬巨頭競爭中的抽象概念,它以Token的形式,給每個普通人也上了一堂付費課。就像當年的流量,以MB(手機上網流量單位)為單位計價,號主一不留神就會欠費停機。

      黃仁勛日前提出的“Token經濟學”概念,認為推理已成為AI最核心的工作負載,Token則是新的大宗商品——標準化、可計量、可交易。由此Token從模型訓練的技術副產品,演變為驅動數字經濟的核心生產要素。

      在黃仁勛看來,“Token”作為商品是有質量的優劣之分的。從免費層到頂級層,每百萬Token價格從0美元到150美元不等。低時延、高交互的Token(如實時對話、智能駕駛)需要昂貴算力,定價高;高吞吐、離線處理的Token(如大規模離線推理、批量數據處理)對時延不敏感,可以用便宜算力生產,定價低。

      Token已經作為“商品”產生價值分層了,那使用它的人呢?或許未來,“下沉市場”人群的定義,也不再僅限于能否消費得起實體商品了。

      AI使用者,被焦慮裹挾

      “我難道不是尊貴的會員嗎?”3月11日晚,蘇玉看著電腦屏幕上跳出的彈窗,有點生氣。彈窗提示她,本周Token使用量已達到限額的90%,限額消耗完后將暫停相關模型的使用,直到下周限額更新。

      蘇玉是某高校在讀博士研究生,最近在準備畢業大論文。過去三年,谷歌旗下的Gemini、OpenAI旗下的ChatGPT,一直是她的最佳拍檔,她也是這兩個“AI長工“的忠實訂閱用戶。今年2月中旬,Anthropic旗下的Claude也加入了她的隊伍,并很快成為她最信任的一個。

      “Claude太好用了,工具屬性太強了。”蘇玉說。她讓幾款AI應用同時為她梳理、設計研究思路模型,ChatGPT給出的答案邏輯不夠嚴密,Gemini太過浮夸諂媚,只有Claude,像一位客觀專業的高級顧問,逐字閱讀過客戶需求后,才輸出了一份真正可使用、有啟發的方案。

      免費使用半個多月后,蘇玉花費大約180元人民幣開通了Claude的月度會員。和Gemini、ChatGPT相比,Claude特殊的地方在于它對會員也設置了每日和每周Token消耗的限額。這其實能理解,根據全球知名的大模型盲測榜單LMArena,截至3月20日,Claude的主力模型Claude-Opus-4-6-thinking排名全球第一。

      但蘇玉從未感受到如此直接的Token限制。第一次觸發Claude限額機制時是周三,“扎根理論”了解到一半就不能再調用了,那一刻她頗有一種“學術停滯”的無力感。習慣了Claude的輔助,她很難再回到最初做科研的狀態。她嘗試“手搓”,翻閱最原始的理論書籍,但效率極低,有些經過翻譯的資料她也不完全相信,“最后我還是要等Claude恢復使用后復核一遍。”四天時間,她等得很煎熬。

      Claude限用讓蘇玉異常焦慮。在一個周二,蘇玉發來一張Claude后臺截圖,上面顯示她本周的限額已經使用了45%。“這周才過去不到兩天!我已經用得很節省了,一天只討論一個論文選題,它就到限額了!”蘇玉情緒有點崩潰,誰說AI不能替代人類?這個AI已經快比她的導師還難搞了。


      蘇玉的Claude后臺。圖源:受訪者

      她已經養成了提一個問題就去看一眼后臺的習慣,生怕沒米下鍋。想起以前竟然還和Claude老師嘮閑嗑,讓它幫自己做PPT,她心里直罵自己浪費。

      這種對“好用的模型”的謹慎使用,正逐漸變得普遍。一位AI影視行業創業者告訴我,他所在團隊在使用字節跳動的AI視頻模型“即夢”時,會同步接入其他多家模型廠商的API,“效果好的模型確實更貴,我們只能在不同模型之間切換,去平衡成本。”

      不久前,即夢下調會員積分額度,他一方面覺得很正常,“C端本來就在補貼,現在只是收回一部分”。但另一方面又為自己的處境擔心,嘆息“這下更用不起了”,AI成本上漲,有時候會直接卡住小創業者的生命線。

      終端用戶為Token焦慮,模型廠商也在為算力成本焦慮。

      談及Token調用量暴增的原因,中國工程院院士王堅此前借用電力的發展做了類比,早期人工智能應用就像是“點電燈”,消耗電量有限。而以OpenClaw(智能體)為代表的新一代應用,則像是開啟了“空調”,需要耗費的電力也越來越多。

      不過,王堅強調,這種增長不僅意味著應用普及,更意味著單體Token成本的下降。“如果電價不降,老百姓是用不起空調的。”

      但相比早期一問一答的簡單調用,如今越來越多任務通過Agent完成。模型需要自行拆解問題、調用工具、寫代碼、調試、再修正,一次看似簡單的請求,背后往往對應的是多輪推理和多次API調用,Token消耗呈指數級放大,雖然單價降低了,但總體所需要的算力成本更高昂了。

      “模型變更大了,推理成本也相應提高了,我們也希望把它回歸到正常的商業價值上。長期靠低價競爭,對整個行業發展并不利,這也是我們的一個考量。”智譜CEO張鵬說。最近兩個月,智譜三次上調GLM(智譜研發的大語言模型)系列模型價格,部分模型價格已逼近國際頭部模型定價水平。

      張鵬的另一個擔心是,“未來12個月面臨的最大問題可能就是算力。所有的技術,包括智能體框架,讓很多人的創造力與效率提升了10倍。但前提條件是,大家能夠用得起來,不能因為算力不夠,導致一個問題讓Agent思考半天也不給我答案。”

      流動的算力,累加的成本

      按照Claude的計算方式,100 Tokens大約相當于75個英文單詞或50個漢字,而Token輸出的價格是輸入價格的五倍——這是一個最簡單的換算方式。換言之,AI的每一個回答都要經過深思熟慮,后臺思考、查詢、生成,乃至模型幻覺帶來的錯誤消耗的Token,都會被計算在內,最終變成真金白銀的賬單。

      智能紀元AGI創始人林志佳算過一筆賬。他養了四個“龍蝦”,有本地部署的,也有云端部署的。以云端部署為例,他按月購買了Coding Plan(AI編碼訂閱服務),大約30-40元人民幣,在3月還剩9天的時候,他的Token消耗量還不到套餐額度的10%——作為媒體人,他對Token的需求其實并不大。

      但按照Token來計費又不太劃算。“如果我只是每天早上九點讓它給我發條新聞,消耗的Tokens價格大概0.9元人民幣,30天大概二十多塊錢,已經跟買Coding Plan的錢差不多了。有時候還有損耗、還有模型更新,光更新就可能要消耗三四塊錢的Tokens。”

      在不同計費方式之間權衡,幾乎成了高頻使用者的日常,而購買Token花費的一分一厘,最終都指向同一件事——算力,以及背后對應的GPU折舊成本和數據中心的耗電。

      GPU成了一切的起點,高端芯片的供給決定了整個系統的上限。“除了給部分客戶預留的備用機,其他基本都賣完了,一卡不剩。”優刻得架構技術中心副總經理劉華說。

      GPU之下,還要搭建起數據中心、網絡和存儲系統——高速互聯、低延遲傳輸,這些都不是“即插即用”的標準件。劉華提到,僅網絡和存儲部分,成本就可能占到整體算力成本的20%左右。

      再下一層,是模型廠商和API服務商。他們把大模型部署在這些基礎設施之上,封裝成標準化接口,供開發者調用。近兩年,這幾層角色開始出現重疊,云廠商既賣算力也提供模型API,逐漸成為連接GPU、模型和開發者的中樞。


      算力是如何流動的示意圖。圖源:AI生成

      算力就這樣一層一層向下滲透,最新的變化是在產業的需求端。“以前AI大部分是To B在付費,現在To C端付費也越來越普及了。”林志佳說。模型被封裝成API,入口被簡化,使用門檻降低,個人開發者甚至普通用戶,都可以直接調用底層算力。“現在基本上刷一刷社交平臺,大家就知道怎么用了。”

      算力甚至出現零售化趨勢。2024年前后,一些云廠商開始推出GPU“日卡”、輕量級云主機,甚至“一鍵部署”的體驗產品。比如優刻得面向“養蝦戶”推出的6.9元體驗套餐,本質上更像一張門票,把復雜的環境配置和算力調度打包好,讓用戶用極低成本試一次。“很多人其實是來‘排雷’或者嘗鮮的,”劉華說,“大家都有點焦慮,怕落后。”

      但門檻降低,并不意味著成本下降。在劉華看來,“用互聯網發展階段類比,現在的算力成本毫無疑問還是在一個發展初期、很貴的階段。”正因為如此,開發者才會精打細算,平臺也不敢輕易放開調用規模。

      即便是頭部廠商也在做取舍。OpenAI此前關停視頻生成項目Sora,被不少業內人士解讀為算力與投入產出之間的權衡,在資源有限的情況下,優先集中到更核心的模型能力和業務上。阿里巴巴、騰訊、字節跳動等互聯網大廠,近期對AI業務做的一系列調整,核心也是一種算力資源聚焦。

      大家都正在意識到一件事:未來拼的不是算力規模,而是算力利用率。算力緊缺帶來的連鎖效應,是AI時代一場漫長的梅雨,每一個身處時代的人都會免不了潮濕。

      算力流動到末端發生了什么

      蘇玉正在嘗試分配和調度算力資源。

      她把不同模型分了層級:ChatGPT用來寫公文、整理簡報,Gemini負責畫圖、處理語言細節,Claude則專門用在最核心的環節,比如研究框架、思路設計、長文本分析。這樣能保證她的效率和錢包都效果最大化。

      比如,她最近在處理一批訪談材料,會先讓Claude給出分析框架,再把這個框架“丟”給Gemini去做初始編碼。“我更相信Claude給的指導性的東西,但細節性的工作可以交給便宜一點的模型。”如果Claude不限額,她甚至會停用Gemini。

      當然,這并不是在給Claude打廣告,只是蘇玉認為自己的需求更適用這一款應用。好用的模型變得稀缺,而稀缺的資源只會被用在最關鍵的地方。

      為了進一步節省,很多用戶都和蘇玉一樣,開始在細節上摳成本。

      社交平臺上,一度流行起用文言文與AI對話,因為更短的字數意味著更少的Token。也有人認為,跟風對AI說“你好”“謝謝”,是否也是一種不必要的資源浪費?畢竟,AI并不需要情緒價值。

      其實很多浪費并不在用戶可控范圍內,有時是模型接入和運行方式的問題。

      不久前,MiMo大模型團隊負責人羅福莉提到,“我沒辦法嚴格計算第三方harness(駕馭)接入造成的損失,但我近距離看過OpenClaw的上下文管理,很糟糕。在單次用戶查詢里,它會觸發多輪低價值工具調用,每輪作為獨立API請求發出,每個請求攜帶的上下文窗口往往超過 100K Tokens。實際請求次數是Claude Code原生框架的數倍。折算成API定價,真實成本大概是訂閱價格的數十倍。”

      回到使用問題上,用戶主動節省Token,平臺也不敢完全放開用戶規模,這種基于節省成本的“束手束腳”,比如OpenAI正在面臨一種矛盾——其在2025年上半年創造了43億美元的收入,同期,該公司凈虧損高達135億美元,這意味著OpenAI每賺一美元,就會損失三美元。虧損的大頭正是對算力的投入。

      在當下,算力已經不再只是有沒有的問題,而是能不能持續用、能用到什么程度。當AI足夠好用,人會圍繞它重新組織工作方式;當Token變得昂貴而有限,這種新的組織方式本身也會被迫收縮。

      如果未來算力無法真正像電力一樣普及,那么AI必然會引起分化,人與人之間的認知差距會進一步拉大。比如蘇玉,她并不打算把自己的AI使用方法完全分享給身邊人,如何和Claude老師交互、喂什么樣的語料,這是她的小秘密,短期內也是她的競爭力。

      如果同事請她推薦好用的模型,她會強烈推薦Gemini和ChatGPT,“當然,DeepSeek也是個好選擇”。蘇玉調皮地眨了眨眼。

      在“一人公司(OPC)”“超級個體”逐漸流行的當下,這樣的“小心機”并不罕見。當AI的好用程度對應成一個個可以計價的Token,真正拉開差距的,其實是如何使用它的人。

      (文中蘇玉為化名)

      封面來源: 《宇宙探索編輯部》

      參考資料

      【 版權聲明】所有內容著作權歸屬鏡相工作室,未經書面許可,不得轉載、摘編或以其他形式使用,另有聲明除外。

      繼續閱讀:

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      男子16歲時便出軌嫂子,婚后瞞著妻子繼續出軌,還與嫂子生下一子

      男子16歲時便出軌嫂子,婚后瞞著妻子繼續出軌,還與嫂子生下一子

      老貓觀點
      2026-05-07 07:12:10
      廣東男籃大戰北京!球員半場評分:2人滿分、2人及格、3人崩盤

      廣東男籃大戰北京!球員半場評分:2人滿分、2人及格、3人崩盤

      林子說事
      2026-05-09 20:36:50
      文章面館爆火后再開酒吧!劉歡劉威到場祝賀,張若昀父親張健捧場

      文章面館爆火后再開酒吧!劉歡劉威到場祝賀,張若昀父親張健捧場

      露珠聊影視
      2026-05-09 21:24:29
      山東女孩放學回家路上失蹤,連續5天給母親托夢:我就在鍋里

      山東女孩放學回家路上失蹤,連續5天給母親托夢:我就在鍋里

      紙鳶奇譚
      2025-01-26 17:18:28
      華為Pura X Max這銷量,讓友商咋整?

      華為Pura X Max這銷量,讓友商咋整?

      數碼Antenna
      2026-05-09 12:35:49
      G2淘汰山東采訪!盧偉認可全隊+調整外援狀態,洛夫頓談自身發揮

      G2淘汰山東采訪!盧偉認可全隊+調整外援狀態,洛夫頓談自身發揮

      籃球資訊達人
      2026-05-09 23:41:07
      2026年強厄爾尼諾已就位!今年夏天,這四大風險每個人都躲不開

      2026年強厄爾尼諾已就位!今年夏天,這四大風險每個人都躲不開

      老特有話說
      2026-05-08 16:09:01
      影響力,梅西照片僅用五天成為F1賬號歷史點贊量最高的一條

      影響力,梅西照片僅用五天成為F1賬號歷史點贊量最高的一條

      懂球帝
      2026-05-09 13:12:06
      大快人心!山東女子網購榴蓮僅退款被拘留,村支書也說她是慣犯

      大快人心!山東女子網購榴蓮僅退款被拘留,村支書也說她是慣犯

      映射生活的身影
      2026-05-08 16:13:04
      紅場閱兵首現拒邀國,中方出席人選引關注,外交部明確回應

      紅場閱兵首現拒邀國,中方出席人選引關注,外交部明確回應

      諦聽骨語本尊
      2026-05-09 14:45:21
      威廉支持哈里離婚,只有離開吸血鬼梅根,弟弟才能回歸正常生活

      威廉支持哈里離婚,只有離開吸血鬼梅根,弟弟才能回歸正常生活

      紅袖說事
      2026-05-08 05:51:53
      于和偉越來越不對勁了,不是演技退步,而是整個人肉眼可見的變化

      于和偉越來越不對勁了,不是演技退步,而是整個人肉眼可見的變化

      喜歡歷史的阿繁
      2026-05-08 07:19:46
      劉德華一家三口回娘家,沒豪車沒保鏢,卻藏著最貴的豪門范兒

      劉德華一家三口回娘家,沒豪車沒保鏢,卻藏著最貴的豪門范兒

      木子娛你同行
      2026-05-09 13:00:03
      C919核心被卡,長江1000A批量安裝,2030年完全自主

      C919核心被卡,長江1000A批量安裝,2030年完全自主

      暖心萌阿菇涼
      2026-05-10 00:00:22
      王平河系列:人不狠,站不穩(8/9)

      王平河系列:人不狠,站不穩(8/9)

      金昔說故事
      2026-05-10 00:03:07
      劉震云:當你一無所有時,死心塌地跟著你的女人,就是你的貴人

      劉震云:當你一無所有時,死心塌地跟著你的女人,就是你的貴人

      杏花煙雨江南的碧園
      2026-04-29 14:15:03
      段永平評OPPO母親節文案風波:確實不合適,文案欠妥

      段永平評OPPO母親節文案風波:確實不合適,文案欠妥

      南方都市報
      2026-05-09 22:04:09
      美軍空襲伊朗設施

      美軍空襲伊朗設施

      中國北方
      2026-05-08 21:50:45
      廣西一小區門口路面突然塌陷,女業主連人帶車掉進坑受傷;目擊者:塌陷時我剛把孩子從那個地方抱開十來秒

      廣西一小區門口路面突然塌陷,女業主連人帶車掉進坑受傷;目擊者:塌陷時我剛把孩子從那個地方抱開十來秒

      大風新聞
      2026-05-09 18:44:08
      總結了一些鍛煉“大腦前額葉”的小方法,孩子真的越來越聰明了!

      總結了一些鍛煉“大腦前額葉”的小方法,孩子真的越來越聰明了!

      蓁蓁心理撫養
      2026-05-06 12:00:08
      2026-05-10 01:12:49
      鏡相工作室 incentive-icons
      鏡相工作室
      記錄商業世界的風向與人,生產嚴肅、可信、給讀者以啟迪的內容,為信息降噪,為用戶拓寬視野。
      189文章數 85關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      數碼
      家居
      藝術
      本地
      公開課

      數碼要聞

      有鴻蒙·更美的——全球首臺鴻蒙智選美的智能空調上市

      家居要聞

      菁英人居 全能豪宅

      藝術要聞

      深圳終究失去“中國第一高樓”,華潤接手地塊!

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品夜间视频香蕉| 精品国产成人三级在线观看 | 日韩另类欧美日韩| 久久久久久99精品热久久| 亚洲成a人片在线观看久| 国产AV大全| 亚洲第一色区| 亚洲欧美国产五月天综合| 亚洲国产精品无码一区二区三区| A级毛片18以上观看视频免费| 国内成人自拍| 亚洲成a人v欧美综合天堂软件| 欧美熟妇乱子伦XX视频| 艳妇乳肉豪荡av无码免费反馈| 97se亚洲综合自在线| 国产一区二区野外| 精品久久久久中文字幕日本 | 熟女人妻aⅴ一区二区三区电影| 国产 日韩 在线 亚洲 字幕 中文 亚洲精品宾馆在线精品酒店 | 国产AV无码专区亚洲AV| 成人做受视频试看60秒| 亚洲视频精品| 国产三级a三级三级| 女邻居夹得好紧太爽了av| 欧美精品一产区二产区| h动态图男女啪啪27报gif| 黑人大战中国av女叫惨了| 女女互揉吃奶揉到高潮视频| 91精品国产91热久久p| 亚洲一二三四区中文字幕| 色中色AV| 国外少妇视频网站| 亚洲—日韩aV在线| 国产日韩精品欧美一区灰| 亚洲综合色网一区二区三区| 色爱综合另类图片av| 国产精品麻豆va在线播放| 亚洲VA中文字幕无码毛片| 日韩中文字幕国产精品| sewang网页版入口| 资源在线观看视频一区二区|