機器之心發布
當所有人都盯著模型層廝殺,一支手握開源推理事實標準的團隊,帶著硅谷最豪華的種子輪投資人陣容,正式將矛頭對準了新時代的 AI 基礎設施。
5 月 5 日,AI 基礎設施初創公司 RadixArk 宣布完成 1 億美元種子輪融資,投后估值 4 億美元。無論金額、估值還是投資人陣容,這都是 2026 年 AI Infra 賽道中目前最重的一筆早期下注。
![]()
本輪由 Accel 領投,Spark Capital 聯合領投。機構投資人覆蓋了 NVIDIA 旗下 NVentures、AMD、聯發科、Databricks,以及 Salience Capital、HOF Capital、Walden Catalyst、A&E Investment、LDVP、WTT Fubon Family 等一線機構。從 GPU 到 CPU,從邊緣芯片到數據平臺,核心硬件與系統層的關鍵玩家幾乎全部到齊。
![]()
在頂級機構陣營之外,多位涵蓋 Intel、Broadcom、OpenAI、xAI、PyTorch 等背景的全球技術領袖也以天使投資人身份參與了本輪投資。
「硬件三巨頭 CEO + 頂級模型實驗室創始人 + PyTorch 締造者」,要在一筆種子輪里同時湊齊這個組合,在 AI Infra 的歷史上都極其罕見。熟悉這一領域的投資人直言:這是在押注「下一代基礎設施事實標準」。
全世界最好的推理引擎,在他們手里
RadixArk 的故事,必須從一個叫做 SGLang 的開源項目說起。
![]()
自 2023 年誕生以來,SGLang 在兩年內以難以置信的迭代速度,成為開源大模型推理的事實標準之一,在 GitHub 積累了 27K+ stars,被部署在 400K+ GPU。每天有數萬億 token 的生產流量跑在 SGLang 之上,其用戶包括 Google、Microsoft、NVIDIA、Oracle、AMD、LinkedIn、xAI、Thinking Machines Lab。
過去兩年,模型架構經歷 MoE、長上下文、Reasoning 模型、多模態融合等一系列劇變。每一次架構的重塑,SGLang 都做到了 Day-0 兼容——首創的開源模型發布即支持機制,性能直逼機器物理極限。被投資人反復提及的一個評價是,SGLang 的迭代速度與工程紀律合一的風格,在開源項目中絕對頂尖。
底層紀律的背后,是一支在系統與算法領域積累深厚的創始團隊。
![]()
CEO 盛穎(Ying Sheng)本科畢業于上海交通大學 ACM 班,博士畢業于斯坦福大學,是 LMSYS Org 的發起者及 SGLang 的主要創始人之一。她博士期間曾作為訪問學者在 UC Berkeley Sky Lab 進行研究,先后就職于 Databricks 和 xAI,曾擔任 xAI 推理團隊負責人。盛穎在注意力稀疏化、KV 緩存復用等方向的工作備受業內關注,SGLang 早期的 RadixAttention 機制即是其代表作之一。
CTO 朱邦華(Banghua Zhu)本科畢業于清華大學電子工程系,博士畢業于 UC Berkeley,師從機器學習泰斗 Michael I. Jordan 與 Jiantao Jiao。博士期間曾聯合創立 Nexusflow,后被英偉達收購,出任英偉達 Principal Research Scientist。在他經手過的項目里,既有面向工業級訓練系統的整套搭建,也有 NVIDIA 內部底層系統優化與大規模訓練上的長期積累。
某核心硬件廠商的技術負責人評價,這是 2026 年 AI Infra 創業中最有含金量的一組創始人組合:一邊是握住開源推理事實標準的研究型創業者,一邊是來自 GPU 廠商最核心研究層的大模型算法行家。
手握每天吞吐萬億級 token 的推理引擎 SGLang——這本身已經是 AI Infra 創業的夢幻起點。而這支團隊的牌,還不止這一張。
Day-0 馴服 DeepSeek V4 強化學習
除了推理引擎,RadixArk 在訓練端同樣有所突破。
2025 年 11 月,團隊開源了強化學習框架 Miles,主攻大規模 RL 訓練的穩定性與效率,目前已被超 20 支團隊用于 MoE 模型的強化學習訓練。
2025–2026 年,Reasoning、Tool Use、Agentic 能力的競爭全面升級,而每一步進步背后,都需要一套能扛住超大規模分布式 RL 的系統。業內觀察人士指出了一個被反復提及卻長期無法解決的痛點:今天大模型團隊最痛苦的,遠超出任何一段單點優化。從訓練到 RL 再到上線推理這條完整鏈路上的邊界摩擦,每一段單獨看都接近最優,拼在一起卻處處掉效率。
Miles 與 SGLang 的組合,正試圖填平當前大模型團隊在「訓練-RL-推理」完整鏈路上面臨的效率斷層。
新模型 Day-0 支持能力是 Infra 團隊工程實力的直觀體現。
4 月 25 日,架構復雜的 DeepSeek-V4 發布。當天,SGLang 和 Miles 便實現了對 DeepSeek-V4 推理和 RL 訓練的同時支持。這得益于團隊底層的系統級優化,包括為混合注意力設計的 ShadowRadix 前綴緩存、單次芯片內完成壓縮的 Flash Compressor,以及將 Top-K 延遲壓縮至 15 微秒的 Lightning TopK,并打通了從 FP8 推理到 BF16 訓練的完整 RL 管線。
全棧共識背書:
巨頭們集體入局,到底在焦慮什么?
NVIDIA、AMD、聯發科、Broadcom、Intel——硬件層最關鍵的公司,同時出現在種子輪,在行業內幾乎是不可想象的。事實上,硬件廠商比任何人都清楚,當下算力仍然昂貴且稀缺,僅靠堆硬件已經無法持續。一個真正硬件解耦、能在異構平臺上將芯片性能壓榨到極限的開源推理系統,是他們最迫切需要的最大訴求。
Databricks、PyTorch 締造者、OpenAI / Thinking Machines / xAI 的一線人物同時入局,則代表了模型與系統層對「訓練-推理一體化基礎設施」的強烈預期。天使陣容中的每一個名字,都意味著一個極度精準的下注視角:
- 陳立武,Intel CEO,半導體行業深耕數十年的泰斗級人物。
- John Schulman 是 OpenAI 前聯合創始人,Thinking Machines Lab 聯合創始人,強化學習的奠基人之一。
- Soumith Chintala——PyTorch 聯合創始人,全球深度學習框架的守門人。
- Igor Babuschkin,xAI 前聯合創始人,親手搭過業界最復雜的訓練系統與硬件平臺。
- Lilian Weng,Thinking Machines Lab 聯合創始人,對 AI 系統的工業級落地有最一線的洞察。
當這些在任何場合都能獨自撐起一輪融資的人,選擇集體出現在同一張 cap table 上,便是未來的熱切押注。
面向所有人的基礎設施:
讓 AI 的建設權,不再被少數人壟斷
RadixArk 的愿景,用一句話可以概括:讓 AI 基礎設施,成為像電力一樣普及、可靠、不被任何人壟斷的公共品。這聽起來像個理想主義宣言,但從實際落地來看,他們正在將這句話變為現實:
- 學術界
三年前,一個做 LLM 推理優化的博士生面前通常只有兩個選項:一個是 OpenAI 的 API,按 token 計費、看不到任何內部結構;另一個是古早的開源代碼,README 里寫著「works on a single GPU」,離論文里要實現的真實分布式場景隔著數年的工程量。
SGLang 打破了這個二選一——工業級日吞吐、代碼完全開放,斯坦福、伯克利、CMU、UW 的系統研究組默認將其設為 baseline。對做 agent 的研究者而言,RadixAttention 的 prefix cache 把共享前綴組織成樹狀結構、相同 KV 只算一次,原來要跑兩天的實驗半天就能跑完,本地推理論文引用 SGLang 幾乎成了默認動作。
- 初創公司
一群離開大廠的工程師,帶著對某個垂直場景的深刻理解出來創業。他們沒有百萬美元的算力預算,沒有專門的 Infra 團隊,只有對產品的一腔直覺。
過去,搭建生產級推理管線、維護跨硬件兼容性的工程重負,往往超出種子輪公司的承受上限,大量時間消耗在重復造輪子上。現在,他們可以直接站在 SGLang 之上拉起接近前沿性能的推理服務,用 Miles 訓練領域專屬模型——基礎設施不再是瓶頸,省下的時間和錢可以全部投入他們真正想造的東西。
- 科技巨頭
為什么 Google、Microsoft、NVIDIA 這些擁有全世界最強內部 Infra 的巨頭,也會出現在 SGLang 的用戶列表里?答案藏在本輪投資人結構中——NVIDIA、AMD、聯發科、Broadcom、Intel 五家核心硬件廠商同時入局。它們比任何人都清楚,一個硬件無關、不被任何競爭對手鎖定的開源推理系統對整個生態意味著什么。使用一個被社區共同維護、多家硬件廠商共同支持的開源系統,本身就是更高維度的基礎設施戰略。
RadixArk 的官方表述沒有煽情,但足夠鋒利:
「下一代 AI 不應該被對私有基礎設施的訪問權所限制。更多團隊應該能夠擁有自己的模型、自己的系統、自己的未來。」
這 1 億美元的種子輪融資,就是要讓這句話變成工程現實:讓 SGLang 成為任何新模型的 Day-0 生產標準;把 Miles 做成大規模訓練與 RL 的基礎設施級框架;然后,在開源內核之上,建一套不鎖定模型、不綁架客戶、卻提供頂級基礎設施能力的托管平臺。
RadixArk 的愿景,從來不是取代誰。而是讓一個學術實驗室、一個三人工作室、一家剛拿到種子輪的初創公司,和市值萬億的巨頭——站在同一條基礎設施起跑線上。
如果說 2023 年的 Anthropic、2024 年的 Mistral、2025 年的 Thinking Machines Lab 各自代表了 AI 模型層一次方向性的下注,那么 2026 年的 RadixArk 下注的東西更底層、也更漫長:讓前沿 AI 的建設權,真正回到足夠多的人手里。
而融資落定之后,團隊發起了一項面向開源社區的回饋:Star SGLang 的 GitHub 倉庫并留下用戶名,即可在 RadixArk 托管平臺正式上線后獲得免費使用積分。對于這支從開源社區生長出來的團隊而言,這是用真金白銀的算力,感謝那些一路支撐 SGLang 走到今天的人。
![]()
- 鏈接:platform.radixark.com
尋找那些對幾毫秒延遲都無法容忍的人
RadixArk 目前正在全球范圍招聘,系統、模型、編譯器、內核、調度、評測等各條線全面開放。如果你也會因為幾毫秒延遲睡不著覺,會為兩次內存拷貝的冗余來回推敲,看到不優雅的系統就渾身不舒服,不動手改掉,絕不罷休。這或許是今年最值得認真考慮的一封簡歷。
- 簡歷投遞入口:https://job-boards.greenhouse.io/radixark
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.