<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      獨(dú)家|字節(jié)迎戰(zhàn)阿里快樂(lè)馬:開(kāi)源多模統(tǒng)一模型,推理速度快18倍

      0
      分享至



      阿里旗下HappyHorse(快樂(lè)馬)、HappyOyster兩款模型爆紅出圈,發(fā)布未滿(mǎn)一月,字節(jié)就悄然出手正面應(yīng)戰(zhàn)。

      5月6日消息,智能紀(jì)元AGI獨(dú)家獲悉,字節(jié)跳動(dòng)日前低調(diào)公布全球首個(gè)25B級(jí)、基于混合專(zhuān)家 (MoE) -擴(kuò)散自注意力機(jī)制(DiT) 的開(kāi)源增強(qiáng)統(tǒng)一多模態(tài)模型Mamoda2.5。

      Mamoda2.5依托Qwen3-VL-8B、128 個(gè)專(zhuān)家,Top-8 路由的MoE+DiT架構(gòu)搭建,最終模型參數(shù)高達(dá)250億,而每次僅激活約30億參數(shù)(約12%)。

      基于稀疏激活優(yōu)勢(shì),單設(shè)備下,Mamoda2.5模型推理速度比阿里Wan2.2 A14B快12倍以上,比美團(tuán)LongCat Video快18倍。

      視頻編輯層面,新的Mamoda2.5模型采用4步方案,將編輯延遲降至僅9.2秒,比VInO快95.9倍,比OmniVideo2快41.7倍。

      同時(shí),統(tǒng)一視覺(jué)生成與編輯層面,Mamoda2.5將多模態(tài)理解、生成和編輯結(jié)合在一起,形成統(tǒng)一多模態(tài)模型架構(gòu)。

      所以,該模型僅激活3B參數(shù),就實(shí)現(xiàn)文生圖、文生視頻、文生圖像、視頻編輯全任務(wù)SOTA,模型性能接近閉源的Sora和快手Kling。



      谷歌Omni全模態(tài)還沒(méi)登場(chǎng),阿里快樂(lè)馬剛刷屏完圈,字節(jié)直接甩出Mamoda2.5開(kāi)源王炸。

      這波操作太明顯了:

      不管是谷歌、阿里還是字節(jié),最終路線(xiàn)全都指向同一個(gè)終點(diǎn):

      開(kāi)源+統(tǒng)一全模態(tài)。

      誰(shuí)能想到,曾經(jīng)各走各路的AI巨頭,如今竟在同一條賽道上徹底會(huì)師。



      追成本和速度優(yōu)勢(shì),新模型實(shí)現(xiàn)95.9倍提速

      事實(shí)上,統(tǒng)一的視覺(jué)模型正在經(jīng)歷從“單任務(wù)專(zhuān)家”到具備理解與生成能力的集成系統(tǒng)的范式轉(zhuǎn)變。

      然而,目前大多數(shù)統(tǒng)一的模型聚焦于圖像領(lǐng)域,主要將視覺(jué)理解與圖像生成和編輯相結(jié)合。

      雖然這些模型在靜態(tài)視覺(jué)生成方面取得了顯著進(jìn)展,但針對(duì)視頻生成和編輯的統(tǒng)一框架仍處于早期階段,主要受限于數(shù)據(jù)復(fù)雜性和計(jì)算瓶頸。

      從專(zhuān)業(yè)視頻生成模型的角度看,HunyuanVideo和WanVideo表明,在DiT范式內(nèi)擴(kuò)展參數(shù)能顯著提升視頻質(zhì)量和對(duì)現(xiàn)實(shí)世界物理規(guī)律的建模能力。

      而工業(yè)級(jí)系統(tǒng)如Aquarius進(jìn)一步驗(yàn)證了在生產(chǎn)環(huán)境中部署大規(guī)模視頻生成的可行性。

      領(lǐng)先的閉源模型如Sora被認(rèn)為參數(shù)規(guī)模可達(dá)數(shù)十億甚至更高。

      然而,視頻任務(wù)本質(zhì)上是計(jì)算密集型:視覺(jué)Tokens數(shù)量隨空間分辨率和時(shí)間長(zhǎng)度同步增長(zhǎng),而DiT對(duì)這些tokens的全注意力計(jì)算帶來(lái)二次方成本。

      因此,訓(xùn)練和推理成本隨著模型規(guī)模和視頻長(zhǎng)度的增加急劇上升,使得高質(zhì)量、長(zhǎng)時(shí)視頻生成在稠密架構(gòu)下的實(shí)際部署變得極其昂貴。

      為了解決規(guī)模擴(kuò)展帶來(lái)的質(zhì)量提升與時(shí)空建模爆炸式計(jì)算成本之間的矛盾,專(zhuān)家混合(MoE)提供了一種可擴(kuò)展的解決方案。

      實(shí)際上,大型語(yǔ)言模型已成功采用路由機(jī)制實(shí)現(xiàn)稀疏激活,在不成比例增加計(jì)算成本的情況下擴(kuò)展能力。

      DeepSeekMoE的細(xì)粒度專(zhuān)家分割進(jìn)一步增強(qiáng)了專(zhuān)業(yè)化與可擴(kuò)展性。MoE在圖像生成中也展現(xiàn)出巨大潛力。

      例如,DiT?MoE成功將擴(kuò)散Transformer擴(kuò)展至數(shù)十億參數(shù),而Race?DiT和DiffMoE優(yōu)化了路由策略,進(jìn)一步提升了生成質(zhì)量和訓(xùn)練效率。

      在視頻領(lǐng)域,WanVideo 2.2探索了一種粗粒度的雙專(zhuān)家MoE,通過(guò)去噪時(shí)間步進(jìn)行路由。



      然而,細(xì)粒度MoE在視頻生成中尚未得到系統(tǒng)性研究。

      與此同時(shí),以現(xiàn)有生成模型為基礎(chǔ)進(jìn)行高質(zhì)量視覺(jué)編輯已成為一個(gè)關(guān)鍵的研究焦點(diǎn)。

      在圖像編輯領(lǐng)域,獲取配對(duì)數(shù)據(jù)的相對(duì)簡(jiǎn)易性推動(dòng)了快速進(jìn)展,近期的閉源和開(kāi)源模型已取得了強(qiáng)勁成果。

      相比之下,視頻編輯仍處于早期階段,這主要源于構(gòu)建高質(zhì)量配對(duì)訓(xùn)練數(shù)據(jù)的復(fù)雜性,以及生成效率的挑戰(zhàn),顯著增加內(nèi)存占用和推理延遲。

      基于這些觀察,團(tuán)隊(duì)推出統(tǒng)一的自回歸?擴(kuò)散(AR–Diffusion)框架模型Mamoda2.5,核心就是:顯著降低了訓(xùn)練成本,同時(shí)擴(kuò)展了模型容量。

      該 AR-Diffusion 框架以 Qwen3-VL-8B 多模態(tài)理解模型為底座、MoE DiT 為生成骨干網(wǎng)絡(luò),既引入高效細(xì)粒度 MoE 架構(gòu),又實(shí)現(xiàn)了視覺(jué)生成與編輯任務(wù)的統(tǒng)一。

      盡管總參數(shù)量規(guī)模達(dá)25B,但模型每次前向傳播僅激活約3B參數(shù)。這種極致的稀疏性帶來(lái)了卓越的訓(xùn)練和推理效率,直接應(yīng)對(duì)了視頻生成模型中固有的高昂時(shí)間復(fù)雜性挑戰(zhàn)。



      新的Mamoda2.5模型,30步編輯模型比VInO的推理速度快12.8倍;而精簡(jiǎn)后的4步模型則將編輯延遲降至僅9.2秒,比VInO快95.9倍,比OmniVideo2快41.7倍。

      下面是基準(zhǔn)測(cè)試。

      字節(jié)Mamoda團(tuán)隊(duì)昨日公布的技術(shù)報(bào)告顯示,在VBench 2.0測(cè)試中,Mamoda2.5視頻生成方面達(dá)到61.64分,與騰訊HunyuanVideo 1.5和美團(tuán)LongCat-Video水平相當(dāng),延遲僅為110秒,快于Wan2.2,稱(chēng)是“頂級(jí)開(kāi)源模型水平”。

      而視頻編輯方面,Mamoda2.5模型達(dá)到了SOTA水平:在OpenVE-Bench測(cè)試中排名第一,超越快手可靈Kling O1;在FiVE-Bench測(cè)試中排名第一,達(dá)87.41分,并在Reco-Bench測(cè)試中整體表現(xiàn)最佳——所有這些測(cè)試的推理速度都比同類(lèi)編輯基線(xiàn)快約10倍。



      值得一提的是,此次Mamoda2.5引入了一個(gè)聯(lián)合的少步蒸餾和強(qiáng)化學(xué)習(xí)框架,將30步編輯模型壓縮為4步模型,極大地加速了模型推理。

      因此,視頻編輯速度層面,Mamoda2.5模型相比上交&快手&南洋理工VinO模型最高提升95.9倍,同時(shí)保持頂尖多模態(tài)理解能力。



      真實(shí)世界被顛覆了

      下面欣賞幾個(gè)案例:

      把人變成樹(shù)人。



      將馬換成冰馬。



      將手變成機(jī)械手



      編輯天氣環(huán)境,從夏天到冬雪天。



      編輯性別,從男生視頻生成為穿同樣衣服的女生。



      當(dāng)然還支持文字轉(zhuǎn)視頻能力。

      Mamoda 團(tuán)隊(duì)表示,該模型具備一流的文生視頻生成效果,推理速度比同規(guī)格稠密模型快 12 倍以上。



      更多案例推薦你們到官方GitHub上看。

      團(tuán)隊(duì)透露,在實(shí)際應(yīng)用中,Mamoda2.5已成功部署于廣告場(chǎng)景的內(nèi)容審核和創(chuàng)意修復(fù)任務(wù)中,在內(nèi)部廣告視頻編輯場(chǎng)景中取得了98%的成功率。



      總結(jié)

      今年4月,阿里ATH創(chuàng)新事業(yè)部團(tuán)隊(duì)連續(xù)發(fā)布了兩個(gè)爆火的多模態(tài)開(kāi)源模型:HappyHorse(快樂(lè)馬)和可實(shí)時(shí)構(gòu)建和交互的世界模型產(chǎn)品 HappyOyster(快樂(lè)生蠔)。

      這直接對(duì)標(biāo)字節(jié)剛發(fā)布不到3個(gè)月的Seedance 2.0。



      但這輪競(jìng)爭(zhēng)遠(yuǎn)遠(yuǎn)未結(jié)束,Mamoda2.5就是最好的證明之一。

      目前字節(jié)并未公布Mamoda2.5更詳細(xì)的情況。

      但早在2025年10月1日,該團(tuán)隊(duì)就利用Qwen3VL-8B發(fā)布了MammothModa2-Dev版本。

      去年底,開(kāi)源的MammothModa2發(fā)布,采用MoE DiT架構(gòu),支持視頻生成,今年2月發(fā)布了視頻生成和視頻編輯推理代碼。

      如今,Mamoda2.5更是一個(gè)新的開(kāi)源模型——不過(guò)依然基于Qwen3VL進(jìn)行訓(xùn)練,模型能力遠(yuǎn)超快手可靈等多個(gè)閉源模型。

      然而,盡管Mamoda2.5在生成和編輯任務(wù)上表現(xiàn)出強(qiáng)大性能,但仍存在一些值得未來(lái)探索的可行方向:

      1. 全模態(tài)音頻?視頻生成與編輯。

      Mamoda2.5 目前支持統(tǒng)一的圖像和視頻生成與編輯。一個(gè)自然的下一步是將音頻處理整合到框架中,實(shí)現(xiàn)在單一模型中同步進(jìn)行音頻?視頻生成和編輯。這將使模型能夠生成具有連貫配樂(lè)、對(duì)話(huà)和音效的視頻,極大地?cái)U(kuò)展其在現(xiàn)實(shí)世界內(nèi)容創(chuàng)作場(chǎng)景中的應(yīng)用范圍。

      2. 更深度的理解與生成統(tǒng)一。

      最近的系統(tǒng)如GPT?Image?2和Vision Banana已表明,深度整合理解與生成能夠解鎖涌現(xiàn)能力——將生成作為多樣化視覺(jué)任務(wù)的通用接口,并利用推理來(lái)提高生成質(zhì)量,因此,Mamoda2.5的統(tǒng)一架構(gòu)內(nèi)進(jìn)一步探索理解與生成之間的協(xié)同作用,使這兩種能力能夠相互強(qiáng)化。

      從谷歌Omni的全模態(tài)野心,到阿里快樂(lè)馬的落地突襲,再到字節(jié) Mamoda2.5 的開(kāi)源重拳。

      現(xiàn)在已經(jīng)看得很明白:

      AI 的終局,就是統(tǒng)一全模態(tài),而且必須開(kāi)源。

      巨頭們嘴上各說(shuō)各的,身體卻無(wú)比誠(chéng)實(shí)。

      未來(lái)世界的AI模型,統(tǒng)一、開(kāi)源、全能,才是唯一答案。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      美國(guó)胃有多愛(ài)中餐?特朗普給出在美中餐館數(shù)據(jù),直呼“驚人”

      美國(guó)胃有多愛(ài)中餐?特朗普給出在美中餐館數(shù)據(jù),直呼“驚人”

      澎湃新聞
      2026-05-14 21:07:15
      俄軍前線(xiàn)失控,指揮癱瘓、軍頭林立,1917年式危機(jī)陰影重現(xiàn)。

      俄軍前線(xiàn)失控,指揮癱瘓、軍頭林立,1917年式危機(jī)陰影重現(xiàn)。

      高博新視野
      2026-05-13 07:30:17
      高通、英特爾股價(jià)跌幅均擴(kuò)大至5%以上

      高通、英特爾股價(jià)跌幅均擴(kuò)大至5%以上

      每日經(jīng)濟(jì)新聞
      2026-05-14 21:38:47
      江西舉報(bào)恩人沈女士已社死,正臉照曝光,大叔崗位被調(diào),景區(qū)回應(yīng)

      江西舉報(bào)恩人沈女士已社死,正臉照曝光,大叔崗位被調(diào),景區(qū)回應(yīng)

      水泥土的搞笑
      2026-05-14 19:34:54
      特朗普談判遇挫,中方堵死討價(jià)空間!專(zhuān)家:美棄臺(tái)可能性超90%!

      特朗普談判遇挫,中方堵死討價(jià)空間!專(zhuān)家:美棄臺(tái)可能性超90%!

      生性灑脫
      2026-05-14 19:39:44
      特朗普抵京,F(xiàn)CC連夜改口!中國(guó)淡定收下大禮,人民日?qǐng)?bào)點(diǎn)透大局

      特朗普抵京,F(xiàn)CC連夜改口!中國(guó)淡定收下大禮,人民日?qǐng)?bào)點(diǎn)透大局

      天光破云來(lái)
      2026-05-14 20:22:21
      突然宣布:馬浚偉辭任CEO

      突然宣布:馬浚偉辭任CEO

      每日經(jīng)濟(jì)新聞
      2026-05-13 22:54:07
      季后賽到現(xiàn)在,這4名球星把身價(jià)打沒(méi)了!頂薪合同要泡湯

      季后賽到現(xiàn)在,這4名球星把身價(jià)打沒(méi)了!頂薪合同要泡湯

      籃球掃地僧
      2026-05-14 08:34:02
      戛納紅毯全員落敗!鞏俐低調(diào)亮相,被評(píng)又壯又矮?氣場(chǎng)卻斷層第一

      戛納紅毯全員落敗!鞏俐低調(diào)亮相,被評(píng)又壯又矮?氣場(chǎng)卻斷層第一

      看盡落塵花q
      2026-05-14 07:10:43
      很顯然,在這次晚宴上馬斯克最想見(jiàn)的并不是雷軍!

      很顯然,在這次晚宴上馬斯克最想見(jiàn)的并不是雷軍!

      吃瓜小偵探
      2026-05-14 20:56:10
      1979年新兵吳建國(guó)身中八槍?zhuān)杰娷姽倏拷鼤r(shí),他突然抱住敵人墜崖

      1979年新兵吳建國(guó)身中八槍?zhuān)杰娷姽倏拷鼤r(shí),他突然抱住敵人墜崖

      野史日記
      2026-05-13 20:55:04
      馬斯克:只有我和黃仁勛坐上了“空軍一號(hào)”

      馬斯克:只有我和黃仁勛坐上了“空軍一號(hào)”

      大象新聞
      2026-05-14 07:50:06
      馬斯克攜幼子現(xiàn)身北京人民大會(huì)堂,外國(guó)網(wǎng)友:孩子那身新中式簡(jiǎn)直太棒了!

      馬斯克攜幼子現(xiàn)身北京人民大會(huì)堂,外國(guó)網(wǎng)友:孩子那身新中式簡(jiǎn)直太棒了!

      江南晚報(bào)
      2026-05-14 19:24:27
      U17亞洲杯大冷:越南3-2力壓韓國(guó)奪頭名!8強(qiáng)誕生,國(guó)足戰(zhàn)東道主

      U17亞洲杯大冷:越南3-2力壓韓國(guó)奪頭名!8強(qiáng)誕生,國(guó)足戰(zhàn)東道主

      侃球熊弟
      2026-05-14 04:12:36
      隨著騎士加時(shí)4分險(xiǎn)勝,NBA季后賽最新排名出爐!東部第一命懸一線(xiàn)

      隨著騎士加時(shí)4分險(xiǎn)勝,NBA季后賽最新排名出爐!東部第一命懸一線(xiàn)

      薇說(shuō)體育
      2026-05-14 11:43:28
      CBA半決賽4名高水平外籍裁判出爐:歐洲兩人 韓國(guó)泰國(guó)各一人

      CBA半決賽4名高水平外籍裁判出爐:歐洲兩人 韓國(guó)泰國(guó)各一人

      醉臥浮生
      2026-05-14 16:06:39
      武漢大學(xué)理工科學(xué)生怒了!再次要求與文科生劃清界限:不想再為你們的錯(cuò)誤買(mǎi)單

      武漢大學(xué)理工科學(xué)生怒了!再次要求與文科生劃清界限:不想再為你們的錯(cuò)誤買(mǎi)單

      可達(dá)鴨面面觀
      2026-05-14 09:24:56
      特朗普訪華歡迎晚宴,雷軍找馬斯克自拍合影

      特朗普訪華歡迎晚宴,雷軍找馬斯克自拍合影

      大碗科技
      2026-05-14 21:38:44
      王洪文38歲正國(guó)級(jí),狂草藏三處神技,你絕對(duì)沒(méi)見(jiàn)過(guò)!

      王洪文38歲正國(guó)級(jí),狂草藏三處神技,你絕對(duì)沒(méi)見(jiàn)過(guò)!

      書(shū)畫(huà)相約
      2026-05-14 09:15:45
      俄總統(tǒng)新聞秘書(shū):只要美國(guó)不再把經(jīng)貿(mào)合作與烏克蘭問(wèn)題掛鉤,俄愿同美開(kāi)展商業(yè)往來(lái)

      俄總統(tǒng)新聞秘書(shū):只要美國(guó)不再把經(jīng)貿(mào)合作與烏克蘭問(wèn)題掛鉤,俄愿同美開(kāi)展商業(yè)往來(lái)

      極目新聞
      2026-05-14 09:58:58
      2026-05-14 22:07:00
      智能紀(jì)元AGI
      智能紀(jì)元AGI
      專(zhuān)注科技、科學(xué)、商業(yè)產(chǎn)業(yè)報(bào)道
      2315文章數(shù) 10609關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克說(shuō)會(huì)談很順利 黃仁勛點(diǎn)贊 庫(kù)克比耶

      頭條要聞

      重慶"萌感"佛頭意外走紅 雕刻者:不是文物且尚未完工

      頭條要聞

      重慶"萌感"佛頭意外走紅 雕刻者:不是文物且尚未完工

      體育要聞

      爭(zhēng)議抽象天王山,和季后賽最穩(wěn)定中鋒

      娛樂(lè)要聞

      何九華官宣當(dāng)爸!全程不提孩子?jì)?/h3>

      財(cái)經(jīng)要聞

      李強(qiáng)會(huì)見(jiàn)美國(guó)工商界代表

      汽車(chē)要聞

      雙零重力座椅/AI智能體/調(diào)光天幕 啟境GT7內(nèi)飾發(fā)布

      態(tài)度原創(chuàng)

      教育
      旅游
      親子
      房產(chǎn)
      軍事航空

      教育要聞

      南京秦淮、雨花臺(tái)、玄武、建鄴2026高考考點(diǎn)公布!

      旅游要聞

      長(zhǎng)江三峽翠屏林立 呈現(xiàn)碧水青山詩(shī)意畫(huà)卷

      親子要聞

      監(jiān)控下的幼兒園小可愛(ài),主動(dòng)幫老師搬桌開(kāi)門(mén),邏輯超在線(xiàn)

      房產(chǎn)要聞

      海南樓市新政要出!擬調(diào)公積金貸款額度,最高可貸168萬(wàn)!

      軍事要聞

      美以伊戰(zhàn)爭(zhēng)期間以總理密訪阿聯(lián)酋

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 无码超乳爆乳中文字幕久久| 老子午夜精品888无码不卡| 乌克兰美女浓毛bbw| 97av视频在线观看| 国产精品妇女一二三区| 国产一区日韩二区欧美三区| 欧美A区| 一本色道无码DVD色诱| 中文字幕第一页日韩 | 成人午夜污一区二区三区| 亚洲无码在线播放| 极品无码国模国产在线观看| 一区二区三区人妻无码| 欧美人与禽ZOZO性伦交视频 | 影音先锋一区| 小鲜肉自慰网站| 最新日韩无码| 精品自拍偷拍一区二区| 上司的丰满人妻中文字幕| 国产亚洲欧洲AⅤ综合一区| 国产黄色视屏| 伊人久久人妻| 无码人妻丰满熟妇区毛片 | 亚洲免费人成视频观看| 精品国产国产2021| 日日视频色| 全黄性性激高免费视频| 99久久久成人国产精品免费| 亚洲色欲色欲www在线看| 久久香蕉国产线看观看猫咪av| 好吊妞人成视频在线观看| 午夜8888| 肉色超薄丝袜脚交一区二区| 精品流白浆| 欧美人与禽2o2o性论交| 欧美国产日产一区二区| 精品无码人妻| 超级黄色a毛片视频| 日本成人免费| 玖玖在线精品免费视频| 亚洲国产av区一区二|