<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek開眼!核心技術全公開,推理范式大顛覆

      0
      分享至



      4月底,國產大模型DeepSeek悄悄上線灰度識圖模式,一夜之間,這個曾專注文本推理的AI,終于擁有了“看懂世界”的能力。4月30日,其官方發布技術報告《用視覺原語思考》,揭開了這款多模態模型的神秘面紗。不同于行業內堆砌分辨率、追求“看得清”的常規思路,DeepSeek另辟蹊徑,讓AI學會“邊想邊指”,用空間坐標錨定思維,在復雜視覺推理任務中實現對GPT-5.4、Gemini-3-Flash等頂尖模型的反超。這場技術革新,不僅是多模態賽道的一次彎道超車,更在探索AI“系統二級”智能的新路徑。



      一、打破“指代鴻溝”:從“純語言空想”到“邊指邊想”

      長期以來,多模態大模型的研發重心都在“感知鴻溝”上——通過更高清的圖像切分、更精細的動態分塊,讓AI看清圖片里的每一個細節。但DeepSeek團隊發現,就算把感知做到極致,AI在復雜視覺推理中依然容易“崩潰”,核心問題在于自然語言的“指代鴻溝”。



      簡單說,當你對AI說“左邊那個紅色物體”,在擁擠的畫面里,“左邊”“那個”到底指什么,AI根本沒法精準鎖定。純語言思維鏈看似連貫,每一步都可能跑偏,一旦遇到密集計數、迷宮導航、多步空間推理這類任務,邏輯鏈條就會徹底崩塌。

      為了破解這個難題,DeepSeek給出了顛覆性方案:把語言推理升級為“語言邏輯+空間坐標”的雙軌思維。讓AI思考時不再只靠文字,而是像人一樣,用點和框在圖上“指出來”,把這些視覺原語變成思維的基本單元。

      它的工作邏輯很直觀:用戶上傳圖片后,DeepSeek-ViT先把圖像轉為視覺特征,文本分詞器處理文字指令,兩者輸入基座模型DeepSeek-V4-Flash融合推理,最終輸出文字+坐標框/點的聯合響應。比如推理時,AI會先框出圖中的目標,后續每一步思考都引用這個框定的“視覺錨點”,基于空間位置做判斷,徹底解決指代模糊的問題。

      二、4000萬數據淬煉:讓AI學會“精準指向”

      想法很創新,但要讓AI真正“學會指”,并把這個動作變成思維習慣,離不開海量高質量數據和針對性訓練。DeepSeek團隊為此搭建了“預訓練-冷啟動-強化學習”的完整訓練流水線,每一步都精準發力。

      1.預訓練:篩選4000萬優質樣本打基礎

      預訓練階段,團隊從互聯網爬取近10萬個目標檢測相關數據源,用嚴格的自動化審查機制過濾低質量數據——亂碼標簽、覆蓋全圖的“巨型框”、模糊不清的標注全部剔除,最終篩選出3萬多個高質量數據源,提煉出超4000萬個精準樣本。這批數據先讓AI掌握基礎的定位能力,知道“該指哪里”。

      2.冷啟動:四類任務專項練“推理”

      有了基礎能力后,團隊針對計數、空間推理、迷宮導航、路徑追蹤這四類最考驗視覺原語的任務,合成了帶精確思考軌跡的冷啟動數據,手把手教AI“怎么邊指邊推理”。

      計數任務:要求AI先批量框出所有候選物體,再逐個校驗、累加,避免漏數、重復數;

      迷宮任務:每一步探索都要輸出點坐標標記位置,撞墻就回溯,學會一步步規劃路徑。

      這種訓練讓AI在起步階段就建立“指向-推理”的強關聯,不是靠猜答案,而是靠精準的視覺定位推導結論。



      3.強化學習:稠密獎勵逼AI“認真指”

      冷啟動后的模型,再通過“訓練專家再融合”策略精細化打磨。核心創新是稠密獎勵機制,不再只看最終答案對錯,而是把獎勵拆成多個維度:

      迷宮任務:探索進度、不撞墻、路徑有效都給正向獎勵,哪怕答案對了,中途撞墻也會扣分;

      計數任務:框選精準、校驗嚴謹才得分,模糊標注直接懲罰。

      同時,團隊還分別訓練了“框定位”和“點指向”兩個專家模型,再用在線策略蒸餾融合,避免兩種能力互相干擾。這套機制讓AI必須認真對待每一個坐標、每一個框,沒法靠“蒙混過關”拿獎勵。

      三、7000倍壓縮:高效推理的“輕量密碼”

      讓AI“邊指邊想”解決了推理準度問題,但新的挑戰來了:高清圖片像素海量,直接處理會讓推理變得又慢又耗資源。DeepSeek的解決方案,是一套超高效的視覺編碼壓縮架構,把“笨重”的圖像數據,變成AI能快速處理的“精簡索引”。



      壓縮過程分三步走,以756×756分辨率的圖片為例:

      ViT切分:把圖片切成14×14的小塊,生成2916個視覺token;

      空間壓縮:將每9個相鄰token合并成1個,數量驟降;

      稀疏注意力壓縮:底座模型再將KV緩存中的視覺條目壓縮4倍。

      最終,2916個原始token只保留81個視覺條目,整體壓縮比高達7056倍。這意味著AI推理時,不用在海量像素里反復找信息,每一步思考都很“輕量”,復雜空間推理也能高效完成。

      這種高效率帶來了直觀體驗:實測中,DeepSeek識圖模式分“思考/非思考”雙模式。非思考模式秒回答案,適合簡單識別;開啟深度思考后,能攻克空間拼圖、復雜場景解析等難題,雖然耗時稍長,但推理邏輯清晰、準確率大幅提升。



      四、能力碾壓與邊界:多模態智能的新起點

      技術的突破直接體現在性能上。在高難度視覺QA任務測試中,這款284B參數、13B激活的多模態模型,全面超越GPT-5.4、Claude-Sonnet-4.6、Gemini-3-Flash、Qwen3-VL等主流頂尖模型,成為視覺推理賽道的新標桿。



      實際測試中,它的表現同樣亮眼:能精準識別兔子品種、描述姿態;僅憑靈隱寺路燈上的草書字樣和建筑風格,就能鎖定地理位置并給出精確經緯度;解析無文字提示的風景照時,能從植被、建筑、山脈輪廓一步步推導拍攝地,誤差不到十公里。

      當然,這項技術仍有邊界:復雜拓撲推理的跨場景泛化能力不足,視覺基元的激活還需依賴觸發詞,沒法完全自發調用。但這不妨礙它成為多模態領域的里程碑——DeepSeek沒有跟著行業卷分辨率,而是換了個思路,用空間坐標錨定抽象思維,探索出了一條通往“系統二級”多模態智能的新路徑。

      從純文本推理到圖文雙軌交互,DeepSeek的識圖模式,是國產大模型在多模態賽道的一次關鍵突破。它讓我們看到,AI的視覺智能,不只是“看得清”,更要“想得明白”——像人一樣,用手指著目標,一步步理清邏輯。

      未來,隨著權重整合進基礎模型并正式發布,這套技術或將徹底改變AI識圖的應用場景:從日常的圖片解析、信息提取,到專業的工業質檢、地理測繪、科研分析,都能用上精準、高效的視覺推理能力。而DeepSeek的“指物思考”之路,也為整個行業提供了新方向:多模態智能的終極目標,從來不是模仿人類的眼睛,而是模仿人類的思維方式。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      華西不開空調被投訴,住院患者已足額繳納費用,官方回復了

      華西不開空調被投訴,住院患者已足額繳納費用,官方回復了

      醫脈圈
      2026-05-05 20:06:03
      吳宜澤奪冠,在歷史上屬于什么級別

      吳宜澤奪冠,在歷史上屬于什么級別

      今夜無局
      2026-05-05 10:07:27
      中超激烈沖突!費利佩推倒費利佩,韋世豪暴怒,徐正源冷眼旁觀

      中超激烈沖突!費利佩推倒費利佩,韋世豪暴怒,徐正源冷眼旁觀

      奧拜爾
      2026-05-05 21:35:34
      亮劍中趙剛死前透露:李云龍當年不顧降職也要斬山貓子是另有原因

      亮劍中趙剛死前透露:李云龍當年不顧降職也要斬山貓子是另有原因

      呆子的故事
      2026-02-09 14:19:33
      特斯拉 Model Y 將大改款?網傳有 5 項升級,每個都是車主想要的!

      特斯拉 Model Y 將大改款?網傳有 5 項升級,每個都是車主想要的!

      新浪財經
      2026-05-04 22:51:52
      中超積分榜:成都擴大領先優勢,泰山反超申花,津門虎負分清零

      中超積分榜:成都擴大領先優勢,泰山反超申花,津門虎負分清零

      懂球帝
      2026-05-05 23:00:07
      39分大勝!尼克斯痛宰76人1-0,布倫森35分唐斯17+6+6

      39分大勝!尼克斯痛宰76人1-0,布倫森35分唐斯17+6+6

      湖人崛起
      2026-05-05 10:47:15
      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      夜深愛雜談
      2026-02-18 20:55:58
      血色檔案:決命臨津江,朝鮮戰爭最悲壯一戰,志愿軍5個師戰死

      血色檔案:決命臨津江,朝鮮戰爭最悲壯一戰,志愿軍5個師戰死

      史政先鋒
      2026-05-05 12:56:52
      曹查理自曝拍三級片狂賺幾千萬,高產期日入 9 萬,坦言拍完從不敢回看

      曹查理自曝拍三級片狂賺幾千萬,高產期日入 9 萬,坦言拍完從不敢回看

      阿廢冷眼觀察所
      2026-05-04 20:39:25
      徐正源抵達沈陽 將與全隊見面 給鐵人先支一招?李金羽走的不體面

      徐正源抵達沈陽 將與全隊見面 給鐵人先支一招?李金羽走的不體面

      替補席看球
      2026-05-05 14:20:51
      森林狼是如何撕碎馬刺的?將DPOY當替補用,聯盟最被低估的名帥!

      森林狼是如何撕碎馬刺的?將DPOY當替補用,聯盟最被低估的名帥!

      你的籃球頻道
      2026-05-05 14:13:54
      外媒:FIFA仍在與中印談世界杯轉播權,想對印度要6千萬美元

      外媒:FIFA仍在與中印談世界杯轉播權,想對印度要6千萬美元

      懂球帝
      2026-05-05 17:13:04
      難怪不哭不鬧!原來新歡產子,是楊子送黃圣依最好的禮物

      難怪不哭不鬧!原來新歡產子,是楊子送黃圣依最好的禮物

      阿策聊實事
      2026-05-04 14:31:42
      五胡亂華之時,是誰拯救了瀕臨滅亡的漢民族?請記住這三位英雄!

      五胡亂華之時,是誰拯救了瀕臨滅亡的漢民族?請記住這三位英雄!

      老范談史
      2026-05-05 07:04:40
      時尚評論人把"露點"封為最佳配飾

      時尚評論人把"露點"封為最佳配飾

      娛圈觀察員
      2026-05-05 19:47:26
      26 歲范丞丞和71歲媽媽合影,范媽媽狀態絕了,根本不像七十多

      26 歲范丞丞和71歲媽媽合影,范媽媽狀態絕了,根本不像七十多

      橙星文娛
      2026-05-04 17:19:52
      朱自清長子被執行死刑33年后,法院:判決純屬錯判,決定撤銷原判

      朱自清長子被執行死刑33年后,法院:判決純屬錯判,決定撤銷原判

      近史談
      2026-04-18 16:54:35
      演員朱珠疑似塌房?照片流出,驚呆網友!

      演員朱珠疑似塌房?照片流出,驚呆網友!

      大眼妹妹
      2025-12-15 10:39:19
      分錢了!斯諾克世錦賽中國11人,分別拿到多少獎金?吳宜澤夠買房

      分錢了!斯諾克世錦賽中國11人,分別拿到多少獎金?吳宜澤夠買房

      體育大學僧
      2026-05-05 09:09:17
      2026-05-06 00:55:00
      魏家東 incentive-icons
      魏家東
      一個人的營銷商學院!
      2705文章數 12239關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      藝術
      健康
      家居
      房產
      公開課

      藝術要聞

      AI應用“豆包”要收費,第一批“韭菜”是誰?

      干細胞治燒燙傷面臨這些“瓶頸”

      家居要聞

      靈動實用 生活藝術場

      房產要聞

      五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 麻豆国产精品一二三在线观看| 一色桃子中出欲求不满人妻| 亚洲无码熟妇人妻AV在线| 国产精品一区av在线观看| 精品福利一区二区三区| 午夜射精日本三级| 国产激情粗大| 一本色道久久综合亚洲精品按摩 | 看你懂的巨臀中文字幕一区二区| 女同精品女同系列在线观看| 国产高清一区二区视频| 日本一区二区三区有码视频| 午夜国产高清精品一区免费| 久久婷婷五月综合色国产官网| 日韩精品欧美激情亚洲综合 | aV无码av高潮aV三区| 日韩一区二区三区精彩视频| 亚洲精品成人片在线观看精品字幕| 久久伊99综合婷婷久久伊| 国产内射一级一片内射高清视频| 青青青国产费观看视频国产| 99精品人妻少妇一区二区| 欧美色丁香| 国产真人性做爰久久网站| 久久天堂av色综合| 精品中文人妻在线不卡| 日韩午夜午码高清福利片| 亚洲国内自拍| 丰满人妻一区二区三区在线视频53| 尤物yw午夜国产精品视频| 亚洲精品天堂在线观看| 欧美亚洲另类制服卡通动漫| 久久人妻制服乱码中文字幕| 欧美在线成人午夜网站| 东京热A?V无码| 亚洲国产精品日韩av专区| 伊人九九网香蕉精品| 国产精品国产高清国产av| 日本精品αv中文字幕| 麻豆精产国品一二三产| 亚洲精品一区国产精品|