![]()
責編 | 夢依丹
出品丨AI 科技大本營(ID:rgznai100)
極致的推理延遲、極高的吞吐量、極大的模型規模……在大模型工程化的戰場上,這曾是一個被公認為‘不可能’的三角。
回望 2025 年,DeepSeek-V3 技術報告為大家揭示了超大規模模型推理的新一代范式。通過 MLA 架構將 KV Cache 壓縮 93%,配合 MTP(多 Token 預測) 技術大幅提升訪存效率,全球開發者見證了萬億參數模型在大規模并發下實現“高吞吐、低延遲”的工程突破。
然而,站在 2026 年的當下,依靠 FP8 精度和基礎架構已難以滿足爆發式的即時響應需求。在大規模真實并發的洪流前,每一毫秒的延遲縮減,都直接掛鉤著數以億計的算力成本與集群效能。
正是在這種“性能即生命”的行業背景下,2026 線上黑客松:AMD E2E Model Speedrun 全球挑戰賽正式拉開帷幕!
AMD 聯手 GPU MODE,豪擲 110 萬美元發起這場全球競速。
尋找那些能徒手拆解底層邏輯、將 AMD 旗艦算力的每一滴潛能都榨取出來的頂級開發者。
![]()
![]()
預選賽——入圍即拿 1 萬美金
本次大賽采用“預選賽 + 端到端決賽大考”的雙階段賽制,每個階段都設立了令人心動的重磅獎勵。
該階段前 10 名優勝者將獲得 1 萬美金,并拿到決賽入場券
三大核心內核任務(總分 3750 Pts)
參賽者需對以下三個 GPU 內核進行極限性能調優,各單項最高分值為:
MXFP4 MoE:1500 分
MLA Decode:1250 分
MXFP4 GEMM:1000 分
硬核競技規則
唯快不破:基于測試用例的絕對運行時間進行排名,計算所有基準用例的幾何平均值;
準入門檻:作品性能必須超越官方基線(Baseline)且排在前 20 名方可計分,未入前 20 者得分為零;
積分公式:單項得分 = 最大分值 × [1 - (排名分值/20)],排名按順序對應分值 0, 1, 2...19;
先到先得:總分為三項內核得分之和。若遇平局,以提交時間最早的內核為準;
權威復現:總分最高的前十名需經主辦方獨立復現結果后,正式確定決賽席位。
問題詳情及參考實現將在 GPU MODE 網站或微信比賽群公布。
預選賽作品可通過 Popcorn CLI 提交,安裝及提交說明見此鏈接:
https://github.com/gpu-mode/popcorn-cli
![]()
決賽大考: 晉級選手將瓜分 100 萬美元現金大獎!
預選賽排名前 10 的頂尖團隊將獲得 AMD 旗艦級算力集群的操控權,開啟為期一月的端到端模型性能極限壓榨。
決賽大考共分為兩條賽道,分別是 DeepSeek-R1-0528 (FP4+MTP) 與 Kimi K2.5 1T (FP4)。參賽選手可以同時開啟雙線作戰,多維度壓榨旗艦算力潛能,贏取總計 100 萬美元的決賽大獎。
![]()
![]()
決賽核心評測邏輯:
多維評估:在 Input 8K / Output 1K 的標準測試負載下,綜合考量每 GPU 總 Token 吞吐量、交互性(Interactivity)以及端到端延遲(E2E Latency);
算力分配:支持最大 TP/EP = 8 的 8 卡節點配置,開發者可根據顯存與通信效率自由調優配置;
結果為王:每個并發等級將根據吞吐量(權重 60%)與交互性(權重 40%)進行排名賦分,三大并發等級得分之和即為決賽總分。
這些數字并非僅僅為了篩選一份跑分榜單,而是要通過這場極限競速,去回應大模型規模化落地中最硬核的工程命題。
![]()
?決戰時刻表:倒計時已經開啟!
目前距離預選賽截止已進入關鍵倒計時,留給各位算子調優、性能壓榨的時間已經不多了!這不僅是一場算力的博弈,更是一場與時間的賽跑。
請務必鎖定以下關鍵節點(北京時間):
3 月 7 日 08:00 — 4 月 7 日 14:59 | 預選賽開戰
提醒:距離報名通道關閉即將僅剩 12 天, 這是通往 110 萬美元獎金池的唯一入場券。
4 月 8 日 00:00 — 5 月 16 日 14:59 | 總決賽沖刺
?向百萬美元最高獎金發起最后沖刺。
5 月 19 日 | 全球頒獎典禮
見證算力之王的誕生,代碼正式封榜合入開源主分支!
AMD 全球推理競速挑戰賽,只等你來戰!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.