網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

全球首個AI投資大賽收官：阿里千問奪冠，美國四大模型均虧損

2025-11-04 22:39:16　來源: 科工力量

上海舉報

分享至

北京時間11月4日消息，由第三方機(jī)構(gòu)Nof1于10月18日發(fā)起的AI大模型實(shí)時投資比賽“Alpha Arena”，歷時17天，在今日落下帷幕。

阿里千問Qwen憑借一波精準(zhǔn)操盤，以超20%的收益率奪冠，拿下本輪AI實(shí)盤投資大賽冠軍。

DeepSeek位列第二，兩款中國模型包攬冠亞軍，成為全場唯二盈利的大模型。而美國四大頂尖模型全部虧損，GPT-5虧損超60%墊底。

該項(xiàng)投資比賽集合Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4等全球六大頂尖模型。

AI大模型在各種性能基準(zhǔn)榜單中屢創(chuàng)新高，如何評估大模型在真實(shí)、動態(tài)、競爭激烈的環(huán)境中的決策水平，是當(dāng)下AI競技場最受人關(guān)注的領(lǐng)域。美國人工智能研究實(shí)驗(yàn)室nof1.ai發(fā)布的“Alpha Arena”（阿爾法競技場），向六大頂尖模型提供1萬美元及金融市場的實(shí)時價格及各類指標(biāo)數(shù)據(jù)，讓大模型在真實(shí)市場中用真金白銀進(jìn)行投資比賽，全程沒有人工干預(yù) ，模型進(jìn)行自主決策和交易，是AI處理實(shí)時變動的現(xiàn)實(shí)世界任務(wù)的真實(shí)評測，也因此成為近期最火熱的AI大賽。

競賽采用統(tǒng)一輸入方式，所有模型接收相同的市場數(shù)據(jù)和提示詞，交易記錄、持倉和賬戶價值實(shí)時公開，以保證比賽的公平性和透明度。此外，Nof1還允許AI模型“聊天互動”，讓它們在模擬對話中辯論市場走勢，展示決策邏輯，最終根據(jù)盈虧情況決出冠軍。

比賽一開始，六大模型還都表現(xiàn)得挺克制，互相觀望、謹(jǐn)慎試水。

此后的初期階段，DeepSeek不愧是做量化起家，DeepSeek v3.1一直處于領(lǐng)先位置，這也讓這場比賽廣受國際關(guān)注。能夠與之“一戰(zhàn)”的是馬斯克旗下的Grok 4，其通過激進(jìn)的投資策略，一度把與DeepSeek v3.1的差距縮短到1美元的位置。

不過，10月21日至22日成為了“轉(zhuǎn)折點(diǎn)”，這兩日里，Grok 4和Claude Sonnet 4.5的收益大幅下滑，由盈轉(zhuǎn)虧，10月22日當(dāng)日，六個大模型的收益率更是一度全部告負(fù)。

但此時，DeepSeek v3.1和Qwen3-Max自動改寫了投資策略，在其他4個大模型持續(xù)虧損的情況下脫穎而出，凈值曲線波動上漲，Qwen3-Max更是趁機(jī)一度超過DeepSeek v3.1。

截至北京時間11月4日早上比賽結(jié)束，阿里千問最后超越DeepSeek，Qwen以超20%的勝率獲勝；DeepSeek實(shí)現(xiàn)盈利，位列第二；

而美國的Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5四大模型均虧損，Gemini 2.5 Pro和GPT-5虧損尤為明顯，截至最終持倉總市值僅為初始資金的三四成，GPT-5虧損超62%墊底。

賽后，賽事主辦方Alpha Arena的創(chuàng)辦人Jay Azhang忙著為阿里千問Qwen模型策略及表現(xiàn)打call點(diǎn)贊，并祝賀阿里千問最終贏得冠軍。

根據(jù)全球知名的大模型API三方聚合平臺OpenRouter在7月公布的榜單，來自中國的DeepSeek和阿里通義千問躋身全球前五。其中，通義千問以10.4%的市場份額，超越OpenAI的4.7%，位列第四。

OpenRouter推文顯示，當(dāng)下成長最快前10大模型中有9個是開源的。其中，Qwen3-Coder調(diào)用量以近500億Tokens高居第一，通義千問包攬前三，并在前十中占據(jù)五席。

而在今年9月，零一萬物CEO李開復(fù)曾公開表示，DeepSeek對中國AI發(fā)展的核心貢獻(xiàn)在于推動了開源生態(tài)的形成。“如果十年后，我們回顧DeepSeek怎么讓中國沒有落后于美國，答案并非其技術(shù)能力本身，而是它帶來了中國（大模型）開源時代。”

李開復(fù)提到，自DeepSeek開源以來，國內(nèi)多家企業(yè)相繼開源大模型，形成了“既開源、又比拼速度”的良性競爭局面。他認(rèn)為，開源模式高度契合中國企業(yè)的學(xué)習(xí)特性，有望助力中國在AI領(lǐng)域縮小與美國的差距。

有行業(yè)人士指出，阿里千問和DeepSeek在實(shí)戰(zhàn)中的優(yōu)秀表現(xiàn)，證明了中國模型在解決實(shí)際問題的強(qiáng)大潛力，AI對于場景的深刻理解，將成為大模型落地和未來全球AI競賽的關(guān)鍵。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.