過去三個月,Pigsty.io 的月度 PV 翻了大約 100 倍。
月請求量數據:1月84 萬,2月1000萬,3月3400萬,4月直接過億。
![]()
我每天都忍不住打開 Cloudflare 首頁看看,就這么一個年活躍用戶幾萬,日均 PV 兩三萬的的開源項目文檔站,哪里來的這么多請求量?
![]()
人類還是 Agent?
當然,Pigsty 有多少活人用戶,我心里還是有點數的。從 Google Analytics 上的數據來看,年度活躍用戶數量大約在 10 萬左右。
當然還有不少用戶是從文章博客過來的,這個部分可能會有幾百萬。比如,3月初的時候,我接盤了 MinIO,還上了幾個小時的 HackerNews 頭條,這帶來了一大波人類獨立訪客,但熱度過了之后,這波突增的人類訪客數量就開始下降了。
![]()
![]()
![]()
那么這些流量從哪里來的呢?在之前這篇里我提過一嘴,基本上都是各種 Agent ——
AI Agent 時代的內容分發
我之前算過一次 Cloudflare 上 pigsty.io 流量構成,機器人占大約 92%。當時就覺得夸張。
現在回頭看,92% 還是低估了。
而且不只是傳統搜索爬蟲。從 UA 和訪問路徑來看,流量大致可以拆成三類:
第一類是聲明明確的 AI 爬蟲:GPTBot、ClaudeBot、PerplexityBot、ByteSpider 這些,它們抓內容是為了喂訓練數據。
第二類是搜索 / SEO 爬蟲:Googlebot、AhrefsBot 這些。這部分歷史上一直存在,但量級在漲——因為越來越多的下游系統(包括 AI 系統)依賴它們的索引。
第三類是 Agent 類訪問:看起來像瀏覽器、實際是腳本驅動的請求。一次性 IP 數量暴漲、API endpoint 高頻探測——很多是 AI Agent 在執行任務時主動來抓頁面、試接口、探數據。
之前在做 Pigsty DBA Agent 的時候,我就在想一個問題:Agent 應該怎么讀基礎設施?怎么訪問文檔? 怎么消費內容?
結果不用我想了—— 它們已經在讀了,而且讀得比人多得多。
這件事的方向已經清楚:開源基礎設施進入了新階段 —— 主要的內容消費者,從人變成了機器。
這不是壞消息。它意味著內容真的在被使用、被索引、被引用、被學習。但它也意味著傳統的用戶增長概念需要重新理解。
多虧了慷慨的賽博佛祖
這里還是要夸一下賽博佛祖 Cloudflare,這么多流量都白給不收錢。
為全球用戶提供這些軟件倉庫的基礎設施,每月收費多少呢?存儲每周 6 美分,折合一年 22 美元;.io 域名一年 50 美元,加一塊 72 美元,總共五百塊不到。
![]()
當然,我也為 pigsty.io 買了個 cloudflare pro 計劃(20$/月),所以一年總成本兩千塊出頭,差不多就是一個月的 Codex 訂閱錢。倒也沒啥新東西,能多看點統計分析指標。不買也不影響用,就當給賽博佛祖上香了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.