![]()
4月的大模型競賽,先被阿里拉開了序幕。
此前,我們獨家獲悉 DeepSeek V4將于4月發(fā)布。消息傳出后,市場預(yù)期迅速升溫。尤其是清明節(jié)前,圍繞 DeepSeek V4何時亮相的討論持續(xù)發(fā)酵,幾乎成了AI圈共同等待的一件大事。
但率先出牌的不是DeepSeek。就在這一節(jié)點上,阿里連續(xù)三天發(fā)布三款模型,覆蓋全模態(tài)、文生圖和代碼能力,迅速接管了節(jié)前AI圈的話題中心。
3月30日Qwen3.5-Omni、4月1日Wan2.7-Image、4月2日Qwen3.6-Plus,72小時里,阿里的全模態(tài)、文生圖、編程三大核心模型陸續(xù)更新。據(jù)悉,4月3日,全球知名大模型盲測榜單LMArena旗下聚焦編程能力的Code Arena公布新一期排名,Qwen 3.6-Plus位列全球第二,超越OpenAI、Google、xAI等國際巨頭,成為該榜單上排名最高的中國大模型。
![]()
而這距離阿里AI事業(yè)部(ATH)正式成立,才剛剛過去兩周。這說明新事業(yè)群的意義不只是整合資源,在重視基礎(chǔ)模型的同時,更強調(diào)阿里AI能力和矩陣的連續(xù)供給,保持在新一輪模型競賽中的領(lǐng)先位置。
這次密集發(fā)布固然疊加了多重因素,但本質(zhì)上還是阿里在大模型領(lǐng)域長期投入的結(jié)果。早在2019年,阿里就是國內(nèi)較早投入大模型方向的公司,2021年更是在全球范圍內(nèi)率先大幅降低萬億參數(shù)超大模型(M6大模型)的訓(xùn)練能耗。
隨后幾年,從達摩院到通義實驗室,前者負責(zé)打底層研究,后者負責(zé)把模型做成系列和持續(xù)迭代的產(chǎn)品能力。千問(Qwen)系列模型不斷壯大,阿里更是在大模型AGI路線上,不僅夯實了技術(shù)底座,也為后續(xù)大模型的產(chǎn)品化與商業(yè)化落地奠定了堅實基礎(chǔ)。
組織上,阿里建立了常態(tài)化的人才培養(yǎng)機制。與國內(nèi)外多所高校共建聯(lián)合實驗室,同時引進了一批在多模態(tài)、強化學(xué)習(xí)、智能體等前沿方向有積累的研究者。這也保證了通義實驗室長期形成的結(jié)構(gòu)穩(wěn)定、層次清晰的人才梯隊。
正是過去幾年在研究、工程和組織上的連續(xù)投入,讓阿里AI整體的推進保持穩(wěn)定節(jié)奏。從模型性能的顯著提升,到應(yīng)用端的同步上線,再到對Agent賽道的提前布局,我們能看到,阿里大模型的迭代不是單點突破,而是模型研發(fā)、系統(tǒng)能力和產(chǎn)品相互促進的完整鏈路。
01
三天三款SOTA
這次阿里AI的集中更新,最突出的地方不是連發(fā)三款模型,而是每一款都在對應(yīng)賽道交出了領(lǐng)先行業(yè)的成績。
例如在編程賽道上,Qwen3.6-Plus相較于上一代模型整體性能提升明顯,并且涌現(xiàn)出很強的智能體編程能力。在系列編程能力權(quán)威評測中,千問3.6編程表現(xiàn)超越2倍乃至3倍參數(shù)量的GLM-5、Kimi-K2.5等模型,接近全球最強編程模型Claude系列。
![]()
正是因為編程能力的顯著提升,大模型才能更好地支撐AI智能體的運行,讓代理式編程(Agentic Coding)真正落地。千問3.6在實測中展現(xiàn)出了完整的任務(wù)閉環(huán)能力,面對前端網(wǎng)頁開發(fā)、大型倉庫維護等復(fù)雜需求,它能自主拆解步驟、規(guī)劃執(zhí)行路徑,并通過反復(fù)測試修改最終交付結(jié)果。
此外,它在代碼修復(fù)、終端操作、自動化任務(wù)執(zhí)行等工程環(huán)節(jié)表現(xiàn)穩(wěn)定,在多個行業(yè)公認的高難度長程任務(wù)中取得了領(lǐng)先成績。
最大的亮點還是Qwen3.6-Plus的原生多模態(tài)能力,直接解鎖了“視覺智能體編程”的想象空間。例如,設(shè)計師上傳一張界面截圖或Figma設(shè)計稿,模型就能自動拆解任務(wù)、生成前端代碼、調(diào)用工具調(diào)試修改,真正打通了從“看懂設(shè)計”到“交付產(chǎn)品”的完整鏈路。
再配合百萬詞元上下文和全Agent框架支持,曾經(jīng)只存在于概念中的“氛圍編程”,終于從噱頭變成了普通人也能用的工具。
文生圖賽道上,Wan2.7-Image具備文生圖、圖生組圖、圖像指令編輯和交互式編輯等全鏈路能力。尤其針對行業(yè)詬病已久的“AI標(biāo)準(zhǔn)臉”和“色彩盲盒”兩大痛點,Wan2.7-Image給出了教科書級別的解決方案,從骨相、眼眸到五官的全維度定制,真正實現(xiàn)“千人千面”。
![]()
這次在全模態(tài)賽道上升級的Qwen3.5-Omni模型,表現(xiàn)更為驚艷。據(jù)阿里云官方測試后給出的數(shù)據(jù)顯示,它在音視頻理解、語音識別、多語種翻譯等215項任務(wù)中取得SOTA,超越了谷歌Gemini-3.1 Pro。
02
阿里AI的“變”與“不變”
這場備受行業(yè)關(guān)注的三連發(fā),看似是ATH成立后的突然爆發(fā),實則是阿里七年大模型積累的必然結(jié)果。背后是阿里AI不變的技術(shù)底蘊,結(jié)合動態(tài)變化的組織邏輯。
所謂不變的技術(shù)底蘊,包括阿里深耕大模型的長期主義和體系化能力。早在2019年,阿里就啟動了大模型研發(fā),是國內(nèi)最早布局這一領(lǐng)域的企業(yè)之一。
七年里,阿里沉下心來做底層能力建設(shè)。在算力層面,依托阿里云構(gòu)建了國內(nèi)領(lǐng)先的大模型訓(xùn)練與推理集群,為持續(xù)迭代提供了穩(wěn)定的基礎(chǔ)設(shè)施支撐。技術(shù)層面,逐步打通了自然語言處理、計算機視覺、語音識別、多模態(tài)融合等多個技術(shù)領(lǐng)域的壁壘,形成了從基礎(chǔ)算法到工程落地的完整技術(shù)棧。
經(jīng)過七年的人才培養(yǎng)和技術(shù)沉淀,通義實驗室已經(jīng)形成了完整的人才梯隊,而不是依賴少數(shù)人。
此前行業(yè)曾有傳言,部分人員流動會影響阿里的研發(fā)節(jié)奏,這次三連發(fā)直接打破了這種質(zhì)疑。萬相團隊獨立突圍拿下國內(nèi)生圖第一,千問團隊同時推進全模態(tài)和編程兩條線,證明阿里的技術(shù)儲備早已實現(xiàn)了多點開花,個別人員的流動難以撼動根基。
變化的是,阿里AI的發(fā)展邏輯和組織方式。ATH成立之前,阿里的大模型、應(yīng)用、云服務(wù)曾存在一定的“各自為戰(zhàn)”現(xiàn)象,模型研發(fā)偏向?qū)嶒炇覍?dǎo)向,與市場需求存在脫節(jié)。
而ATH的成立,徹底打通了從算力、模型到應(yīng)用的全鏈路壁壘,從組織架構(gòu)思路上對標(biāo)谷歌的DeepMind機構(gòu),將大模型轉(zhuǎn)型為產(chǎn)品驅(qū)動研發(fā),研發(fā)提升產(chǎn)品的閉環(huán)邏輯。
ATH是阿里"全棧AI服務(wù)商"戰(zhàn)略的重要組成部分,與阿里云智能事業(yè)群、電商事業(yè)群平行,成為阿里三大核心事業(yè)群之一。阿里巴巴集團CEO吳泳銘將其核心目標(biāo)定義為"創(chuàng)造Token、輸送Token、應(yīng)用Token",構(gòu)建Token從生產(chǎn)到消費的完整閉環(huán)。
吳泳銘明確判斷,當(dāng)下正處于AGI爆發(fā)前夜,AI的核心交互方式正在從"問答式"轉(zhuǎn)向"代理式"。未來大量數(shù)字化工作將由數(shù)以百億計的AI Agent來支撐,而Token是支撐智能體運行的核心能量單位,相當(dāng)于AI時代的石油。
在這種理念指導(dǎo)下,阿里AI從實驗室思維全面轉(zhuǎn)向市場導(dǎo)向。從這次發(fā)布的所有功能也能看出,幾乎沒有一個是為了跑分而設(shè)計的,調(diào)色盤解決了設(shè)計師的配色痛點,音視頻處理解放了內(nèi)容創(chuàng)作者,Agent編程降低了普通人的開發(fā)門檻。
除了模型更新,對“龍蝦熱”的快速反應(yīng),如悟空、Qoder等Agent產(chǎn)品的密集迭代,更是體現(xiàn)了阿里對市場需求的嗅覺。
在強調(diào)AI應(yīng)用的大年里,模型研發(fā)也不能再走閉門造車的老路,而是與應(yīng)用團隊深度聯(lián)動。我們發(fā)現(xiàn),比模型性能更值得關(guān)注的,是阿里這次展現(xiàn)出的“模型-應(yīng)用”協(xié)同速度。應(yīng)用團隊把用戶需求反饋給模型團隊,模型團隊快速迭代優(yōu)化,再通過阿里云百煉這個統(tǒng)一出口,同步給所有開發(fā)者和企業(yè)用戶。
千問3.6發(fā)布當(dāng)天,ATH旗下的悟空、千問APP、Qoder等產(chǎn)品就全部官宣上線。這種“零時差接入”的能力,在整個行業(yè)都很罕見。
這意味著阿里發(fā)揮出自身的組織優(yōu)勢,完成了從“單點突破”到“協(xié)同作戰(zhàn)”的戰(zhàn)略轉(zhuǎn)變,也讓阿里的技術(shù)優(yōu)勢能夠快速轉(zhuǎn)化為產(chǎn)品優(yōu)勢和市場優(yōu)勢。
03
大模型需要和產(chǎn)業(yè)更深地連接
2026年初,開源項目OpenClaw突然引爆全球科技圈,幾乎成為繼ChatGPT之后AI領(lǐng)域又一個具標(biāo)志性的現(xiàn)象級事件。
這個由海外獨立開發(fā)者團隊打造的輕量級Agent框架,無需對接任何平臺的專屬API,僅通過模擬人類鼠標(biāo)、鍵盤操作,就能直接控制電腦完成機票酒店預(yù)訂、郵件批量處理、PPT自動生成與發(fā)送等一系列復(fù)雜的跨應(yīng)用任務(wù)。
它真正改變行業(yè)認知的地方在于,第一次向大眾直觀展示了AI是如何蛻變成“執(zhí)行者”的,不僅能夠理解人類的自然語言指令,還能自主拆解任務(wù)、規(guī)劃執(zhí)行路徑、處理突發(fā)異常并完成最終交付。
這一趨勢也倒逼大模型研發(fā)邏輯發(fā)生轉(zhuǎn)變,也就是說,模型研發(fā)不能脫離產(chǎn)業(yè)。此前行業(yè)的競爭重心集中在參數(shù)量、上下文窗口長度、基準(zhǔn)測試跑分等純技術(shù)指標(biāo)上,但在Agent時代,模型的核心競爭力變成了工具調(diào)用的精準(zhǔn)度、長程任務(wù)的規(guī)劃能力、錯誤回溯與修正能力,以及與真實世界交互的魯棒性(Robustness)。
阿里巴巴集團CEO吳泳銘是在2026年3月19日的財報電話會上指出,2025年下半年以來,AI技術(shù)已進入由"AI Agent"驅(qū)動的新階段。
他強調(diào),與早期AI階段最大的區(qū)別在于,模型與應(yīng)用之間的緊密配合變得至關(guān)重要,提升模型能力、改善應(yīng)用效果的關(guān)鍵,越來越依賴于這種緊密結(jié)合以及在客戶使用場景中形成的數(shù)據(jù)閉環(huán)。
所以,阿里的這次三連發(fā),證明了ATH成立后,大模型到AI應(yīng)用的協(xié)同效應(yīng)正在生效。同時也是為了驗證,阿里“產(chǎn)模一體”后取得的初步成果。
今年以來,阿里的核心戰(zhàn)略就是快速推進“產(chǎn)模一體”的進程。比如將AI的總稱和核心品牌統(tǒng)一為“千問”,告別“通義”前綴,僅保留“通義實驗室”作為AI機構(gòu)組織名稱。
這一品牌整合是“產(chǎn)模一體”戰(zhàn)略的一部分,目的是將大模型能力更緊密地與C端應(yīng)用(如千問App)和B端產(chǎn)品(如悟空)結(jié)合,做大用戶規(guī)模。
作為阿里企業(yè)級AI旗艦應(yīng)用,“悟空”率先接入了最新的Qwen3.6-Plus模型,將模型的智能體編程、長程任務(wù)規(guī)劃等能力,直接應(yīng)用于企業(yè)研發(fā)、知識管理、業(yè)務(wù)流程自動化等真實工作流中。這是“產(chǎn)模一體”的典型實踐。
設(shè)立ATH(Alibaba Token Hub)事業(yè)群同樣如此。將通義實驗室、MaaS平臺、千問、悟空智能體等核心AI資源進行整合,是為了打通“模型—應(yīng)用—數(shù)據(jù)”的全鏈路閉環(huán)。
此外,阿里正將千問大模型深度嵌入淘寶、高德、飛豬等生態(tài)業(yè)務(wù)中,并推出千問AI眼鏡等硬件產(chǎn)品。這些產(chǎn)品不僅是模型的應(yīng)用場景,也是用真實數(shù)據(jù)反哺模型迭代,形成數(shù)據(jù)飛輪。
這也印證了一個樸素的道理,技術(shù)是基礎(chǔ),組織力或許才是決定勝負的關(guān)鍵。再先進的技術(shù),如果卡在了部門墻和繁瑣流程里,也沒法變成實實在在的產(chǎn)品和用戶價值。
阿里成立ATH,正是對這個問題的直接回應(yīng)。
對于普通用戶來說,阿里這次模型三連發(fā),意味著AI平民化時代正在加速到來。未來,編程不再是程序員的專利,普通人用自然語言就能開發(fā)自己的APP。內(nèi)容創(chuàng)作不再需要專業(yè)技能,人人都能成為設(shè)計師和導(dǎo)演。全模態(tài)交互的AI助手,將真正融入我們的工作和生活,成為每個人的超級生產(chǎn)力工具。
未來,阿里AI的花路會越走越寬。據(jù)悉,千問3.6系列還將開源其他尺寸模型,性能更強的旗艦?zāi)P蚎wen3.6-Max也將于近期發(fā)布。可以看到的是,在ATH的統(tǒng)一指揮下,阿里AI通過協(xié)同已經(jīng)重新找到一種更強勁的節(jié)奏。
撰寫|吳尋
編輯|劉培
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.