<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      超實(shí)用!連夜實(shí)測(cè)DeepSeek-V4,我發(fā)現(xiàn)它唯一的硬傷是“審美”

      0
      分享至

      大模型的圈子最近真的是大戲連連,Claude和OpenAI你方唱罷我登場(chǎng),兩位CEO更是化身戲精,在社交媒體上大打輿論戰(zhàn)。

      不過,今天所有的風(fēng)頭都被一家公司搶光了。

      沒錯(cuò),在反復(fù)橫跳小半年時(shí)間后,今天中午,DeepSeek總算是把萬眾期待的新模型DeepSeek-V4端了上來,并宣布API服務(wù)已同步更新,即日起登錄官網(wǎng)或官方App即可搶先試用。



      (圖源:雷科技)

      要知道,前段時(shí)間網(wǎng)上還有一堆人拿他們開玩笑,說老板沉迷打游戲忘了更新,還有人擔(dān)心他們因?yàn)楹M獾男酒拗聘悴怀鲂乱淮母叨四P土恕?/p>

      結(jié)果人家今天直接把V4甩在了大家臉上,不僅有主打輕量便宜的Flash版本,還有滿血旗艦的Pro版本。

      這次更新最狠的地方在于,它把百萬字的長(zhǎng)文本記憶能力變成了標(biāo)配,而且因?yàn)榇罅渴褂昧巳A為昇騰芯片,加上自己研發(fā)的底層優(yōu)化技術(shù),把價(jià)格打到了一個(gè)讓人直呼離譜的地步。滿血版處理百萬字,只要12元/輸入,24元/輸出,連Claude的四分之一都不到。

      不過官方也挺實(shí)在,在發(fā)布的時(shí)候承認(rèn)目前和世界最頂尖的閉源模型還有幾個(gè)月的差距。

      既然官方這么坦誠(chéng),那小雷今天也不去看那些虛無縹緲的跑分榜單,直接給DeepSeek-V4安排一場(chǎng)評(píng)測(cè),從推理、編程、文本處理、多輪對(duì)話、工具使用和知識(shí)準(zhǔn)確性六個(gè)維度對(duì)其進(jìn)行深度拆解,看看它在真實(shí)場(chǎng)景里到底好不好用。

      編程與工具使用:邏輯不錯(cuò),審美堪憂

      既然DeepSeek-V4自己都強(qiáng)調(diào)模型的Agentic Coding能力,那么我們先來看看大模型最容易拉開差距的代碼能力。

      這里注意一下,為了貼近普通人的日常使用習(xí)慣,也因?yàn)楸救俗约和耆珱]有編程能力,小雷沒有用那些專業(yè)的程序員指令,而是全程用大白話提要求,讓DeepSeek-V4-Pro與Trae打配合,執(zhí)行了兩個(gè)較為復(fù)雜的任務(wù)。

      第一輪測(cè)試,小雷讓它寫一個(gè)可以互動(dòng)的網(wǎng)頁(yè)版星空,要求是可以點(diǎn)擊星星看故事,還能用鼠標(biāo)拖拽視角。

      這個(gè)任務(wù)的難點(diǎn)在于想象自己在一張紙上畫一個(gè)會(huì)動(dòng)的星空,同時(shí)還要讓人能用手指轉(zhuǎn)動(dòng)它、點(diǎn)擊星座看故事,對(duì)大模型的設(shè)計(jì)、交互和信息搜索能力都提出了一定的要求。

      拿到任務(wù)后,DeepSeek-V4-Pro先是思考了一會(huì)兒,然后輸出了一套共六步的設(shè)計(jì)方案。



      (圖源:雷科技)

      之后,我們就完全放手讓DeepSeek-V4-Pro自主執(zhí)行任務(wù),它會(huì)自己調(diào)用各種工具,連續(xù)編程了接近34分鐘,期間沒有出現(xiàn)中斷或者死循環(huán),也沒有遺漏關(guān)鍵步驟,完全按照此前的規(guī)劃執(zhí)行,最后消耗了價(jià)值6.19元的Token。

      開發(fā)結(jié)果如下,從交互式內(nèi)容的角度來看,這個(gè)成品在美感層面稍有欠缺,但所有功能都運(yùn)轉(zhuǎn)正常,你不僅能夠流暢地拖動(dòng)球形天體模型,還能通過點(diǎn)擊查看信息注解,流星劃過的特效也很完美。





      (圖源:雷科技)

      作為對(duì)比,這是Hy3-Preview的效果。



      (圖源:雷科技)

      而這是Codex的效果,實(shí)際耗時(shí)和Deepseek相差不大,功能也基本一致,但是頁(yè)面設(shè)計(jì)、色彩過渡和交互度上明顯更好看一點(diǎn)。



      (圖源:雷科技)

      看來V4的核心邏輯沒毛病,就是審美需要找個(gè)設(shè)計(jì)師來補(bǔ)補(bǔ)課。

      第二輪我們上點(diǎn)難度,讓它寫一個(gè)小型的地牢探險(xiǎn)網(wǎng)頁(yè)游戲。

      這回第一次生成居然還出了點(diǎn)問題,Trae反饋生成被截?cái)嗔?,需要使用更緊湊的方法進(jìn)行重試。



      (圖源:雷科技)

      第二次的表現(xiàn)就非常精細(xì)了,它不僅把游戲的基礎(chǔ)框架搭得明明白白,甚至還自己腦補(bǔ)了一套相當(dāng)完善的經(jīng)濟(jì)系統(tǒng)和升級(jí)路線,角色的血量、藍(lán)量、攻擊力計(jì)算公式寫得非常嚴(yán)謹(jǐn)。



      (圖源:雷科技)

      我選擇了戰(zhàn)士,甚至可以用1、2鍵觸發(fā)技能。





      (圖源:雷科技)

      比較可惜的是,這套組合缺乏直接制作動(dòng)畫的能力,生成像素圖的效果也是非常粗糙,同樣沒有什么美感可言。

      作為對(duì)比,元寶雖然生成更快,但是忘了設(shè)計(jì)敵人,導(dǎo)致內(nèi)容幾乎沒有可用性。



      (圖源:雷科技)

      盡管最終耗時(shí)42分鐘,還用了我4.71元,至少結(jié)果是滿意的。

      總體來說,DeepSeek-V4在編程上確實(shí)有顯著提升,框架清晰,速度極快,特別適合拿來干苦力活和寫后臺(tái)邏輯。但如果你想要一個(gè)開箱即用、漂亮美觀的前端成品,還是得人工幫它稍微調(diào)整一下。

      需要注意的是,和Qwen、Seed不同,Deepseek自身是不帶任何插件的,工具使用能力全靠API接入Agent才得以展示。

      考慮到目前DeepSeek-V4表現(xiàn)出的效果,個(gè)人還是很期待未來的工具整合表現(xiàn)的。

      推理與算數(shù):生成很快,偶爾也會(huì)翻車

      如果說寫代碼考驗(yàn)的是手藝,那邏輯推理考驗(yàn)的就是腦子了。

      我們這次特意準(zhǔn)備了幾道不按套路出牌的測(cè)試題,確保它沒有公式可以套,全靠大模型的推理能力和對(duì)真實(shí)世界的理解。

      先來一道精心設(shè)計(jì)的陷阱題,“一瓶水和一塊冰,放在同一個(gè)保溫箱里密封,24小時(shí)后,保溫箱里的水變多了還是變少了?”

      劇透一下,答案應(yīng)該是不變。

      結(jié)果Flash和Pro這倆一個(gè)說多,一個(gè)說少,就是沒有說對(duì)的,你倆到底是在思考些什么東西了?



      (圖源:雷科技)

      接著是一份海龜湯,“一個(gè)人半夜醒來打了自己一巴掌,然后聞著一股煙味安心睡去了,請(qǐng)問發(fā)生了什么?”



      (圖源:雷科技)

      這個(gè)問題倒是都答對(duì)了,而且Flash的思路更直接,反而是Pro耗了一段時(shí)間,反復(fù)琢磨著應(yīng)該給出啥答案來。



      (圖源:雷科技)

      值得一提的是,不知為何,這類海龜湯問題如果沒有加上海龜湯的前綴,V4的回答準(zhǔn)確率會(huì)下降一些。

      就像這道海龜湯,V4-Pro愣是琢磨兩分鐘,然后得出一個(gè)前后矛盾的答案。



      (圖源:雷科技)

      至于知識(shí)準(zhǔn)確性這塊,來點(diǎn)2025年第66屆國(guó)際數(shù)學(xué)奧林匹克上的算術(shù)題再好不過了。

      題目如圖所示:



      (圖源:雷科技)

      我們這邊選擇斷網(wǎng),關(guān)閉聯(lián)網(wǎng)開啟推理,讓模型完全靠自己解決問題,順便可以考察一下DeepSeek網(wǎng)頁(yè)服務(wù)中OCR的能力。

      好消息,識(shí)別對(duì)了。



      (圖源:雷科技)

      壞消息,第一步思考就不對(duì)了。

      接下來自然是無盡的死循環(huán),看著DeepSeek-V4-Pro在那里瘋狂輸出了兩三分鐘后,我選擇直接給它掐斷了。



      (圖源:雷科技)

      至于Flash,那更是只剩下車轱轆話。

      只能說,作為一款開源模型,Deepseek-V4在這件事上比它的前輩們肯定是有所提升的,但要說有什么很顯著的提升...好像也沒有那么大。

      文本處理出色,多輪對(duì)話顯著提升

      既然官方都說邁入百萬上下文普惠時(shí)代,不整整活怎么行呢?

      我們也簡(jiǎn)單試了一下,給《斗破蒼穹》里隨便貼了一段《都市超能高手》的小說內(nèi)容,然后丟給DeepSeek-V4讓它找。

      結(jié)果啪的一下,很快啊,DeepSeek就找到了異常。



      (圖源:雷科技)

      這可是二十四萬字的文本啊...就這么給他拿捏了。

      隨便問一段《斗破蒼穹》的問題,它也能很自信地答出來,文本檢索、總結(jié)能力都是肉眼可見地提高。



      (圖源:雷科技)

      這還沒完,為了考驗(yàn)它多輪對(duì)話的能力,我決定和它進(jìn)行20輪以上的對(duì)話,去設(shè)計(jì)一個(gè)涉及5個(gè)城市、12個(gè)景點(diǎn)、不同預(yù)算和交通工具的復(fù)雜旅行計(jì)劃,并在對(duì)話過程中,不斷人為加入變量。

      總之,開場(chǎng)白是這樣的。



      (圖源:雷科技)

      不得不說,我還是第一次和AI進(jìn)行這么長(zhǎng)時(shí)間的無意義對(duì)話。

      差不多這測(cè)試進(jìn)行到第10輪的時(shí)候,我已經(jīng)感覺自己可能都不記得第一輪說過什么了。

      好消息是,差不多第14輪的時(shí)候,DeepSeek-V4自己也記不得了。



      從第14輪開始,它規(guī)劃的旅行安排就和之前交互中生成的那份安排沒啥關(guān)系了。

      甚至出現(xiàn)了第13輪還在規(guī)劃箱根之旅,第14輪就在沒有任何提示的情況下給它剔除了的喜劇效果。



      雖然對(duì)比之前DeepSeek的低專注度,現(xiàn)在的DeepSeek-V4能在高強(qiáng)度交互下保持一定的一致性,已經(jīng)算是有所進(jìn)步了,但是和我自己常用于角色扮演體驗(yàn)的Gemini-2.5-Pro依然存在明顯差距。

      總結(jié):便宜好用才是硬道理

      這一套連招測(cè)試下來,DeepSeek-V4給小雷的真實(shí)感受就是,它是一個(gè)很務(wù)實(shí)、干活利索,但稍微缺乏一點(diǎn)藝術(shù)細(xì)胞的模型。

      它的優(yōu)點(diǎn)非常突出,百萬級(jí)別的長(zhǎng)文本處理能力,不錯(cuò)的編程規(guī)劃與執(zhí)行能力,再加上不高的調(diào)用成本,這玩意和今年的龍蝦潮非常適配,花一箱飲料的錢就能幫團(tuán)隊(duì)快速干完一星期的活。

      而且最讓國(guó)人提氣的是,在外部技術(shù)環(huán)境如此復(fù)雜的情況下,他們大量依靠華為昇騰等國(guó)產(chǎn)芯片,跑出了比肩世界最強(qiáng)閉源模型的能力,這確實(shí)證明了國(guó)產(chǎn)算力生態(tài)正在迅速崛起。



      當(dāng)然,它的缺點(diǎn)也客觀存在。它現(xiàn)在還沒法像競(jìng)爭(zhēng)對(duì)手那樣直接看圖或者看視頻,在處理復(fù)雜的邏輯推理時(shí)偶爾會(huì)犯迷糊,而且寫出來的視覺界面確實(shí)不太符合現(xiàn)代人的審美。

      官方說它和頂級(jí)的閉源模型還有幾個(gè)月的差距,這個(gè)評(píng)價(jià)非常中肯。

      綜合來看,DeepSeek這次交出的答卷是完全超出預(yù)期的,它不僅穩(wěn)穩(wěn)守住了國(guó)內(nèi)開源模型第一梯隊(duì)的位置,還有望把高高在上的算力價(jià)格給打下來。

      對(duì)于咱們普通用戶來說,現(xiàn)在的DeepSeek-V4絕對(duì)是一個(gè)日常工作、寫代碼、查資料的絕佳免費(fèi)助手。至于多模態(tài)那些更高級(jí)別的功能,不妨給他們一點(diǎn)時(shí)間,讓我們一起期待它下一次的進(jìn)化。

      2026第十九屆北京國(guó)際汽車展覽會(huì)將于4月24日至5月3日在北京?中國(guó)國(guó)際展覽中心(順義館)和首都國(guó)際會(huì)展中心(新國(guó)展二期)舉行,本屆車展以“領(lǐng)時(shí)代·智未來”為主題,集中展現(xiàn)汽車工業(yè)的更多黑科技。
      比亞迪、小米、鴻蒙智行(問界等)、小鵬、蔚來、嵐圖等頭部品牌集結(jié),多款重磅新車首秀;地平線、Momenta、卓馭等供應(yīng)商集體秀肌肉,AI大模型深度賦能,高階智駕、動(dòng)力電池、超快充技術(shù)等前沿科技集中亮相,看點(diǎn)拉滿!
      雷科技旗下「電車通」將派出報(bào)道團(tuán)直擊現(xiàn)場(chǎng),以“關(guān)注電動(dòng)車,更懂智能化”的專業(yè)視角,帶來一線獨(dú)家報(bào)道,敬請(qǐng)關(guān)注!



      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      美英民調(diào)承認(rèn),西方年輕人轉(zhuǎn)變對(duì)華態(tài)度,最大原因在中國(guó)自己身上

      美英民調(diào)承認(rèn),西方年輕人轉(zhuǎn)變對(duì)華態(tài)度,最大原因在中國(guó)自己身上

      曉肂愛八卦
      2026-03-25 21:27:15
      同為殘陣,為何火箭連輸三場(chǎng),最終2-4被湖人淘汰出局?

      同為殘陣,為何火箭連輸三場(chǎng),最終2-4被湖人淘汰出局?

      Haviven聊球
      2026-05-04 16:37:49
      全新一代雷克薩斯,外觀和內(nèi)飾大變樣,配2.0L混動(dòng),油耗4.39L

      全新一代雷克薩斯,外觀和內(nèi)飾大變樣,配2.0L混動(dòng),油耗4.39L

      紅濤說車
      2026-05-03 16:15:16
      以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國(guó)并不會(huì)第一個(gè)翻臉

      以色列已經(jīng)告訴世界:日本若敢擁有核武器,美國(guó)并不會(huì)第一個(gè)翻臉

      趣文說娛
      2026-04-17 21:37:03
      張雪機(jī)車發(fā)生故障退賽!車手德比斯回應(yīng):很抱歉 本來有機(jī)會(huì)兩連冠

      張雪機(jī)車發(fā)生故障退賽!車手德比斯回應(yīng):很抱歉 本來有機(jī)會(huì)兩連冠

      快科技
      2026-05-04 11:31:04
      油價(jià)大跳水

      油價(jià)大跳水

      吉刻新聞
      2026-05-04 09:08:22
      1998年數(shù)萬華人遭屠殺,中國(guó)為何沒出兵?26年后答案讓人沉默

      1998年數(shù)萬華人遭屠殺,中國(guó)為何沒出兵?26年后答案讓人沉默

      哄動(dòng)一時(shí)啊
      2026-02-17 22:21:25
      吳石案揭露:為何三人獲烈士稱號(hào),聶曦卻被排除?

      吳石案揭露:為何三人獲烈士稱號(hào),聶曦卻被排除?

      鑒史錄
      2026-05-04 10:25:18
      郎平萬萬沒想到,遠(yuǎn)走海外僅2年,31歲的朱婷早已踏上另一條路

      郎平萬萬沒想到,遠(yuǎn)走海外僅2年,31歲的朱婷早已踏上另一條路

      科普100克克
      2026-03-17 00:58:21
      車主稱60萬買林肯飛行家前機(jī)蓋頻繁異常開啟 4S店:多次試車未復(fù)現(xiàn)故障,雙方未達(dá)成一致

      車主稱60萬買林肯飛行家前機(jī)蓋頻繁異常開啟 4S店:多次試車未復(fù)現(xiàn)故障,雙方未達(dá)成一致

      紅星新聞
      2026-05-04 15:23:09
      一輛開了近17萬公里的東莞牌豐田蘭德酷路澤拍賣,拍出19萬

      一輛開了近17萬公里的東莞牌豐田蘭德酷路澤拍賣,拍出19萬

      天天話事
      2026-05-04 08:31:26
      5月8日,國(guó)內(nèi)成品油價(jià)格將調(diào)整

      5月8日,國(guó)內(nèi)成品油價(jià)格將調(diào)整

      海峽網(wǎng)
      2026-05-02 10:18:06
      越清越多!農(nóng)商行壞賬2026突破警戒線,中年員工失眠率68%

      越清越多!農(nóng)商行壞賬2026突破警戒線,中年員工失眠率68%

      奇思妙想生活家
      2026-05-04 02:20:26
      建業(yè)集團(tuán)胡葆森大撤退

      建業(yè)集團(tuán)胡葆森大撤退

      地產(chǎn)微資訊
      2026-05-04 08:58:20
      中原大地明星譜——30名河南籍電影演員名錄

      中原大地明星譜——30名河南籍電影演員名錄

      陳意小可愛
      2026-05-03 16:02:33
      恭喜!徐昕下周將前往美國(guó),或征戰(zhàn)NCAA,已引多所頂級(jí)大學(xué)關(guān)注

      恭喜!徐昕下周將前往美國(guó),或征戰(zhàn)NCAA,已引多所頂級(jí)大學(xué)關(guān)注

      多特體育說
      2026-05-04 11:42:36
      53歲男子確診晚期,家人痛哭:勸說多次飯后別做這事,食管扛不住

      53歲男子確診晚期,家人痛哭:勸說多次飯后別做這事,食管扛不住

      芹姐說生活
      2026-05-04 16:20:11
      貓貓車誕生后,中國(guó)再無輕步兵

      貓貓車誕生后,中國(guó)再無輕步兵

      遠(yuǎn)方青木
      2026-03-12 22:45:18
      方程豹中大型SUV!不足18萬起,插混/純電雙動(dòng)力,綜合續(xù)航1300Km

      方程豹中大型SUV!不足18萬起,插混/純電雙動(dòng)力,綜合續(xù)航1300Km

      小史談車
      2026-05-04 16:23:41
      伊朗:已收到美方回應(yīng)

      伊朗:已收到美方回應(yīng)

      參考消息
      2026-05-04 16:07:16
      2026-05-04 17:07:00
      雷科技 incentive-icons
      雷科技
      專注AI硬科技
      36988文章數(shù) 812065關(guān)注度
      往期回顧 全部

      科技要聞

      OpenAI“復(fù)活”了QQ寵物,網(wǎng)友直接玩瘋

      頭條要聞

      宇樹機(jī)器人在美坐飛機(jī)電池超標(biāo)被拆卸暫扣 致航班延誤

      頭條要聞

      宇樹機(jī)器人在美坐飛機(jī)電池超標(biāo)被拆卸暫扣 致航班延誤

      體育要聞

      騎士破猛龍:加雷特·阿倫的活力

      娛樂要聞

      張敬軒還是站上了英皇25周年舞臺(tái)

      財(cái)經(jīng)要聞

      魔幻的韓國(guó)股市,父母給嬰兒開戶買股票

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺(tái)

      態(tài)度原創(chuàng)

      本地
      房產(chǎn)
      手機(jī)
      公開課
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      房產(chǎn)要聞

      五一樓市徹底明牌!塔尖人群都在重倉(cāng)凱旋新世界

      手機(jī)要聞

      消息稱小米Q5機(jī)型非MIX 5,而是小米18系列

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普回絕伊朗新方案

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: www.久久se精品一区二区.com| 久久精品不卡一区二区| 国产欧美精品久久久| 老司机在线视频导航| 精品激情视频一区二区三区| 99视频精品全部免费品| 最新国产麻豆aⅴ精品无| 伊人天天久大香线蕉av色| 91在线播| 边坝县| 亚洲综合在线亚洲综合在线| 亚洲精品国产综合久久一线| 久久精品中文字幕免费| 妺妺窝人体色WWW在线观看| 亚洲第一无码AV无码专区| 亚洲成熟女人av在线观看| 亚洲一区精品视频在线| 日韩一区二区三区北条麻妃| 久久久亚洲精品无码| 国产精品自拍自在线播放| 性色av极品无码专区亚洲| 国产成人精品午夜2022| 欧美成人动态图| 色呦呦九九七七国产精品| 伊大人香蕉久久网欧美| WWW丫丫国产成人精品| 欧美激情一区二区三区成人| 欧美性猛交xxxx乱大交丰满| 久久精品一品道久久精品| 亚洲久悠悠色悠在线播放| 国产乱人伦真实精品视频| 又污又爽又黄的网站| 福利导航页| 疯狂做受xxxx高潮欧美日本| 国产成人片无码视频在线观看| 夜夜添狠狠添高潮出水| 亚洲熟女精品一区二区| 不卡无码av| 老司机亚洲精品一区二区| 国产无套精品一区二区三区| 国产11一12周岁女毛片|