<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      丟張圖就能復(fù)刻:GLM-5V-Turbo視覺Coding實(shí)測(cè)

      0
      分享至

      用龍蝦干活的朋友應(yīng)該都遇到過(guò)這種情況:你想分享一張截圖讓它幫你分析,或者發(fā)張?jiān)O(shè)計(jì)稿讓它參考著寫代碼,結(jié)果發(fā)現(xiàn)——它是個(gè)瞎子。

      你只能用文字把圖片或者你腦子里想呈現(xiàn)的東西描述一遍。「左邊有個(gè)藍(lán)色卡片,右邊是柱狀圖,標(biāo)題用的粗體白字...」寫了半天,它理解的和你看到的還是兩回事。

      智譜剛發(fā)布了GLM-5V-Turbo。和之前的GLM-5-Turbo最大的區(qū)別就一個(gè)字:能看了。

      而且挺有趣的是,5V-Turbo定位不是一個(gè)獨(dú)立的視覺理解模型,而是Agent基座(我知道這個(gè)表達(dá)很有AI感,但我真特么是手寫的)??赐瓴皇悄康模瑒?dòng)手才是??炊貓D之后能調(diào)用工具、寫代碼、執(zhí)行、驗(yàn)證結(jié)果,整個(gè)鏈路跑通。

      我之前一直在用GLM系列模型做Claude Code的主替模型之一。glm-4.7的時(shí)候就覺得還挺不錯(cuò),能連續(xù)執(zhí)行一個(gè)小時(shí)以上的任務(wù),管理多個(gè)子agent批量執(zhí)行也沒問(wèn)題。但純文本模型始終有個(gè)繞不過(guò)去的短板:遇到需要「看」的任務(wù)就抓瞎。這次5V加了原生視覺能力,我第一時(shí)間想試試它在實(shí)際Agent工作流里到底能補(bǔ)上多少。

      Benchmark:看不懂?讓5V-Turbo幫你重新設(shè)計(jì)

      說(shuō)實(shí)話,現(xiàn)在各家發(fā)的Benchmark表我已經(jīng)越來(lái)越看不懂了。Design2Code、BrowseComp-VL、ClawEval Pass3,這些到底在衡量什么?二十行數(shù)字看完也不知道該得出什么結(jié)論。

      正好拿來(lái)當(dāng)?shù)谝粋€(gè)測(cè)試。把官方的兩張Benchmark截圖直接扔給AutoClaw里的5V-Turbo:



      幫我用經(jīng)濟(jì)學(xué)人風(fēng)格去重構(gòu)這兩張圖表的設(shè)計(jì)。視覺設(shè)計(jì)上更符合我的風(fēng)格和審美;給圖表加上標(biāo)題;交互式圖表;左側(cè)很多指標(biāo)不太好理解,每行加一句話解釋幫助普通用戶理解;最最最重要的,讀取和復(fù)刻出來(lái)的圖表數(shù)據(jù)一定要100%準(zhǔn)確。


      19個(gè)指標(biāo)、3-4個(gè)模型、超過(guò)60個(gè)數(shù)值,5V-Turbo全部讀對(duì)了。數(shù)據(jù)我逐個(gè)核對(duì)過(guò),零錯(cuò)誤。

      更有意思的是它自己提煉的結(jié)論:「看圖的事,交給GLM-5V;寫代碼的事,Claude仍是標(biāo)桿?!?/strong>


      12/19的最佳成績(jī)屬于5V-Turbo(多模態(tài)+ToolUse為主),9/19屬于Claude Opus 4.6(代碼+Agent為主)。

      然后是四組可視化。終于能看懂每個(gè)指標(biāo)在說(shuō)什么了:

      視覺理解全面領(lǐng)先。雷達(dá)圖里5V-Turbo的紅色輪廓幾乎包住了其他兩個(gè)模型。Design2Code 94.8(網(wǎng)頁(yè)截圖→前端代碼)、BrowseComp-VL 51.9(視覺網(wǎng)頁(yè)瀏覽與操作)、V* 89.0(綜合視覺理解)。

      桌面不如人,手機(jī)遙遙領(lǐng)先。GUI Agent三個(gè)平臺(tái)的結(jié)果挺有意思:OSWorld(macOS桌面)三家接近,Claude 72.2略勝;AndroidWorld(手機(jī)App操控)5V-Turbo 75.7,領(lǐng)先Kimi 32個(gè)百分點(diǎn);WebVoyager(瀏覽器導(dǎo)航)88.5,也是最高。

      純代碼:Claude的地盤,但差距不大。后端、前端、代碼庫(kù)探索三項(xiàng)Claude都領(lǐng)先,5V-Turbo和純文本版GLM-5-Turbo基本持平。美團(tuán)內(nèi)測(cè)說(shuō)「原生多模態(tài)能力的引入并未削弱其編程邏輯」,我自己測(cè)下來(lái)也是這個(gè)感受。Agent編程:差距最大的戰(zhàn)場(chǎng)。PinchBench(多輪編輯代碼)、ClawEval(三次嘗試內(nèi)通過(guò)率)、ZClawBench(智譜自研綜合基準(zhǔn)),Claude Opus 4.6每項(xiàng)都是最高分,5V-Turbo排第二。

      最后兩張數(shù)據(jù)表,每個(gè)指標(biāo)帶一句話中文解釋。Design2Code下面寫著「網(wǎng)頁(yè)截圖→前端代碼」,ClawEval Pass3下面寫著「三次嘗試內(nèi)通過(guò)率」。這種處理對(duì)普通讀者友好多了。


      代碼與Agent編程數(shù)據(jù)


      接入教程

      三種接入方式,都不復(fù)雜。

      AutoClaw(智譜出品的澳龍)

      最簡(jiǎn)單的方式。AutoClaw已經(jīng)內(nèi)置了GLM-5V-Turbo,在底部模型選擇器里直接切換就行,消耗AutoClaw積分即可使用,不需要額外配置API。

      如果你想用自己的API key(比如有獨(dú)立的智譜賬號(hào)額度),也可以走自定義模型:設(shè)置 → 模型與API → 添加自定義模型,服務(wù)商選智譜,模型ID填 glm-5v-turbo,Base URL填:https://open.bigmodel.cn/api/paas/v4


      OpenClaw

      配置方式類似AutoClaw的自定義模型接入,其實(shí)我很建議你直接把官方接入文檔丟給Claude Code或者龍蝦,讓他們自己搞定。 GLM-5V-Turbo官方接入文檔:https://docs.bigmodel.cn/cn/guide/models/vlm/glm-5v-turbo

      Claude Code

      在 ~/.claude/settings.json 里配置:

      {
      "env": {
      "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-5v-turbo",
      "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5v-turbo",
      "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5v-turbo",
      "ANTHROPIC_AUTH_TOKEN": "你的智譜API Key",
      "ANTHROPIC_BASE_URL": "https://open.bigmodel.cn/api/anthropic",
      "API_TIMEOUT_MS": "3000000",
      "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": 1
      }
      }

      重啟命令行窗口,輸入/status確認(rèn)模型切換成功。也可以在對(duì)話中用/model glm-5v-turbo臨時(shí)切換。

      PPT截圖復(fù)刻

      最直觀的場(chǎng)景:給5V-Turbo一張PPT截圖,讓它直接輸出HTML代碼復(fù)刻。

      我用了一張「AI Agent 2026趨勢(shì)報(bào)告」的幻燈片做測(cè)試,深色背景、左側(cè)標(biāo)題加三個(gè)要點(diǎn)、右側(cè)柱狀圖表,很典型的商務(wù)PPT風(fēng)格。

      分析這張PPT的設(shè)計(jì),輸出HTML代碼復(fù)刻它。


      它不光把整體布局還原了(左文右圖、深色背景、紅色強(qiáng)調(diào)色),連圖表里的柱狀圖顏色漸變方向都對(duì)了。文字層級(jí)也清晰:左上角的小標(biāo)簽、大標(biāo)題、三個(gè)帶編號(hào)的要點(diǎn)、底部品牌名,位置和大小基本一致。OCR零錯(cuò)誤,所有數(shù)字、中英文、標(biāo)點(diǎn)都識(shí)別對(duì)了。

      這個(gè)場(chǎng)景很實(shí)用。你看到一個(gè)好看的PPT模板,想用類似的風(fēng)格但不想從零做。截個(gè)圖扔給5V-Turbo,輸出HTML版本,在這個(gè)基礎(chǔ)上改內(nèi)容就行。

      封面風(fēng)格遷移

      作為B站UP主,我經(jīng)常需要設(shè)計(jì)視頻封面。以前想?yún)⒖紕e人的封面風(fēng)格,只能靠肉眼看、憑感覺模仿。

      5V-Turbo能做的不只是「描述一下」,它能把視覺分析直接變成AI生圖的prompt。

      我拿了一張B站科技區(qū)常見的封面做測(cè)試:


      暗黑代碼背景、大字標(biāo)題配描邊、右下角chibi角色。讓5V-Turbo分析設(shè)計(jì)要素,提取出配色方案、字體風(fēng)格、構(gòu)圖比例、角色特征,然后我基于這些參數(shù)寫了一段中文prompt給AI生圖,內(nèi)容改成「GLM-5V 視覺革命」,角色換成戴眼鏡的男生:


      暗色代碼背景的bokeh光效、白→藍(lán)漸變英文標(biāo)題、金黃色描邊中文「視覺革命」、紫發(fā)戴圓框眼鏡的chibi角色雙手捧臉的驚訝表情。文字零錯(cuò)誤,風(fēng)格幾乎1:1還原。

      5V-Turbo在這個(gè)鏈路里扮演的角色算是設(shè)計(jì)翻譯官:它把一張圖片里的視覺信息拆解成了可描述的參數(shù),讓你不需要懂設(shè)計(jì)也能精確地告訴生圖模型你要什么。

      財(cái)報(bào)桑基圖批量復(fù)刻

      前面兩個(gè)場(chǎng)景是單張圖。這次來(lái)個(gè)更有挑戰(zhàn)性的:一整份PDF文檔里的復(fù)雜圖表。

      我從莊明浩老師那找了一份App Economy Insights出品的「How They Make Money」。40多MB的PDF,62頁(yè),里面全是各大公司的財(cái)報(bào)?;鶊D(Sankey diagram)。這種圖的信息密度很高:一張里面20+個(gè)數(shù)據(jù)節(jié)點(diǎn),包含金額、同比變化、利潤(rùn)率、占營(yíng)收比例,左邊業(yè)務(wù)板塊匯入總營(yíng)收,右邊分流到毛利潤(rùn)、成本、運(yùn)營(yíng)費(fèi)用、凈利潤(rùn)。

      我直接把整個(gè)PDF扔給AutoClaw里的5V-Turbo,就一句話:

      幫我去讀取并且復(fù)刻下這個(gè)PDF中耐克那一頁(yè)的財(cái)報(bào)頁(yè)面,我們把主要內(nèi)容翻譯成中文,樣式盡量維持和原來(lái)的一致

      注意這個(gè)任務(wù)的難度:一個(gè)40MB、62頁(yè)的PDF,我沒告訴它耐克在第幾頁(yè),也沒截圖,就給了個(gè)文件讓它自己找。

      接下來(lái)的過(guò)程挺能體現(xiàn)Agent能力的。5V-Turbo發(fā)現(xiàn)PDF有40多MB超過(guò)了工具限制,就自動(dòng)換了命令行工具處理;然后它開始逐頁(yè)翻閱62頁(yè)P(yáng)DF尋找耐克的那一頁(yè),從第34頁(yè)一路翻到第52頁(yè)沒找到,又折回去最終在第7頁(yè)定位到了;提取高清圖片后讀取所有數(shù)據(jù),最后生成了完整的HTML復(fù)刻。


      整個(gè)過(guò)程我沒有做任何干預(yù),它自己處理了「文件太大→換工具」「找不到→繼續(xù)翻」這些中間問(wèn)題。這就是Agent基座和普通視覺模型的區(qū)別:不只是看懂,還能在遇到障礙時(shí)自主調(diào)整策略。


      GLM-5v-turbo復(fù)刻的版本


      復(fù)刻程度談不上100%,但想想它做了什么:從一個(gè)40MB、62頁(yè)的PDF里自己翻到目標(biāo)頁(yè)面,看懂一張包含20多個(gè)數(shù)據(jù)節(jié)點(diǎn)的復(fù)雜桑基圖,把所有數(shù)據(jù)提取出來(lái),然后生成一個(gè)完整的HTML頁(yè)面還原了圖表結(jié)構(gòu)和樣式。輸出的HTML直接用瀏覽器打開就能看到效果,每個(gè)數(shù)字都可編輯。

      我覺得至少以后讀論文之類的,英文圖表都完全可以讓龍蝦先去中文化一波,會(huì)比你直接用翻譯API強(qiáng)不少。

      5V-Turbo還配了一組官方Skills:PDF-to-WEB、PDF-to-PPT、Web-Replication、PRD-to-App,都是需要模型看懂視覺內(nèi)容然后輸出代碼的場(chǎng)景,感興趣的可以去 ClawHub 搜索下載。 GLM官方Skills合集:https://clawhub.ai/jaredforreal/glm-master-skill

      說(shuō)回來(lái),5V-Turbo值不值得切換?

      如果你在用龍蝦,而且工作流里有「看圖→寫代碼」的需求,我覺得非常值得。之前遇到需要看的場(chǎng)景只能靠文字描述或者外掛OCR,現(xiàn)在模型原生就能看懂,省掉了中間環(huán)節(jié)。

      它最適合兩類任務(wù):多模態(tài)Coding(發(fā)截圖/設(shè)計(jì)稿直接輸出前端代碼)和視覺Agent(龍蝦看懂界面后自主操作)。本質(zhì)上就是給你的AI Agent裝了一雙眼睛。

      接入方式:智譜開放平臺(tái)、Z.ai、Coding Plan均可使用。AutoClaw直接內(nèi)置了,OpenClaw和Claude Code改一下配置就行,前面有詳細(xì)教程。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      快訊!魯比奧被攔國(guó)門!中方底線絕不退讓!

      快訊!魯比奧被攔國(guó)門!中方底線絕不退讓!

      達(dá)文西看世界
      2026-05-11 12:22:44
      他信假釋出獄:與前總理女兒搭車牌“4444”的車離開,“現(xiàn)在什么也記不起來(lái)”

      他信假釋出獄:與前總理女兒搭車牌“4444”的車離開,“現(xiàn)在什么也記不起來(lái)”

      紅星新聞
      2026-05-11 15:09:20
      王浩案重現(xiàn)?老人猝死公交車上,家屬索要巨額賠償,法院這樣判!

      王浩案重現(xiàn)?老人猝死公交車上,家屬索要巨額賠償,法院這樣判!

      北緯的咖啡豆
      2026-05-11 09:31:31
      梁靖崑婆媳同框,顏值氣質(zhì)不輸明星

      梁靖崑婆媳同框,顏值氣質(zhì)不輸明星

      陳意小可愛
      2026-05-11 15:15:58
      外交部:為維護(hù)相關(guān)決議嚴(yán)肅性和權(quán)威性,中方?jīng)Q定不同意臺(tái)灣地區(qū)參加今年世衛(wèi)大會(huì)

      外交部:為維護(hù)相關(guān)決議嚴(yán)肅性和權(quán)威性,中方?jīng)Q定不同意臺(tái)灣地區(qū)參加今年世衛(wèi)大會(huì)

      澎湃新聞
      2026-05-11 15:32:33
      是誰(shuí)在偷換了世界杯轉(zhuǎn)播權(quán)之爭(zhēng)的邏輯?

      是誰(shuí)在偷換了世界杯轉(zhuǎn)播權(quán)之爭(zhēng)的邏輯?

      魯先生的筆
      2026-05-10 21:12:47
      曹操撩寡婦時(shí)說(shuō)的金句,如今成了約會(huì)開場(chǎng)白,男人經(jīng)常掛在嘴邊

      曹操撩寡婦時(shí)說(shuō)的金句,如今成了約會(huì)開場(chǎng)白,男人經(jīng)常掛在嘴邊

      掠影后有感
      2026-05-11 11:31:38
      出售公民信息千元一條,國(guó)家反詐平臺(tái)成內(nèi)鬼?yè)u錢樹

      出售公民信息千元一條,國(guó)家反詐平臺(tái)成內(nèi)鬼?yè)u錢樹

      高恒說(shuō)
      2026-05-10 16:58:40
      中國(guó)移動(dòng)通信集團(tuán)四川有限公司基建工程辦公室原總經(jīng)理曹江洪被查

      中國(guó)移動(dòng)通信集團(tuán)四川有限公司基建工程辦公室原總經(jīng)理曹江洪被查

      界面新聞
      2026-05-11 14:43:08
      無(wú)法共情,理解不了

      無(wú)法共情,理解不了

      求實(shí)處
      2026-05-10 22:34:56
      悲哀!見義勇為英雄韋兆安,因無(wú)錢治療,從醫(yī)院19樓一躍而下

      悲哀!見義勇為英雄韋兆安,因無(wú)錢治療,從醫(yī)院19樓一躍而下

      莫地方
      2026-05-09 00:55:03
      直到同事離職,才知道在國(guó)企:領(lǐng)導(dǎo)中,有1個(gè)很臟但真實(shí)的潛規(guī)則

      直到同事離職,才知道在國(guó)企:領(lǐng)導(dǎo)中,有1個(gè)很臟但真實(shí)的潛規(guī)則

      細(xì)說(shuō)職場(chǎng)
      2026-05-08 21:52:58
      麻省理工發(fā)現(xiàn):?jiǎn)拘押⒆幼月勺羁斓姆椒?,竟是飛輪效應(yīng)!

      麻省理工發(fā)現(xiàn):?jiǎn)拘押⒆幼月勺羁斓姆椒ǎ故秋w輪效應(yīng)!

      戶外阿毽
      2026-05-10 19:24:43
      男子駕駛摩托車國(guó)道上逆行致1死,西安交警通報(bào)

      男子駕駛摩托車國(guó)道上逆行致1死,西安交警通報(bào)

      界面新聞
      2026-05-11 15:33:38
      約個(gè)"炮"花120萬(wàn),是什么體驗(yàn)?

      約個(gè)"炮"花120萬(wàn),是什么體驗(yàn)?

      8099999街頭巷尾
      2026-05-11 13:50:08
      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      女子因18元奶茶被親姐拉黑,崩潰大哭:離婚帶娃5年,都看不起我

      辣媒專欄記錄
      2026-05-11 08:21:59
      張本智和回應(yīng)遭梁靖崑逆轉(zhuǎn):一切都怪我,留下了太多遺憾,金牌依然遙不可及,回家好好訓(xùn)練變更強(qiáng)

      張本智和回應(yīng)遭梁靖崑逆轉(zhuǎn):一切都怪我,留下了太多遺憾,金牌依然遙不可及,回家好好訓(xùn)練變更強(qiáng)

      魯中晨報(bào)
      2026-05-11 10:18:08
      賣掉格力換來(lái)的416億,被他們“敗”光了!

      賣掉格力換來(lái)的416億,被他們“敗”光了!

      犀利強(qiáng)哥
      2026-05-11 08:30:22
      國(guó)際乒聯(lián)發(fā)林詩(shī)棟跳上球桌視頻,日本網(wǎng)友炸了:非常無(wú)禮必須處罰

      國(guó)際乒聯(lián)發(fā)林詩(shī)棟跳上球桌視頻,日本網(wǎng)友炸了:非常無(wú)禮必須處罰

      楊華評(píng)論
      2026-05-11 14:30:27
      瘋了!9天大漲15倍,股價(jià)沖至1215,它是怎么做到不聲不響上去的

      瘋了!9天大漲15倍,股價(jià)沖至1215,它是怎么做到不聲不響上去的

      丁丁鯉史紀(jì)
      2026-05-11 15:01:25
      2026-05-11 17:16:49
      AI進(jìn)化論花生 incentive-icons
      AI進(jìn)化論花生
      AI博主,AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開發(fā)者
      201文章數(shù) 112關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛:你們趕上了一代人一次的大機(jī)會(huì)

      頭條要聞

      媒體:中美元首即將北京會(huì)晤 美方一細(xì)節(jié)耐人尋味

      頭條要聞

      媒體:中美元首即將北京會(huì)晤 美方一細(xì)節(jié)耐人尋味

      體育要聞

      尼克斯橫掃費(fèi)城:唐斯恩比德的命運(yùn)與角色

      娛樂(lè)要聞

      “孕婦墜崖案”王暖暖稱被霸凌協(xié)商解約

      財(cái)經(jīng)要聞

      "手搓汽車"曝光:偽造證件、電池以舊代新

      汽車要聞

      吉利銀河“TT”申報(bào)圖曝光 電動(dòng)尾翼+激光雷達(dá)

      態(tài)度原創(chuàng)

      數(shù)碼
      親子
      時(shí)尚
      旅游
      家居

      數(shù)碼要聞

      小米“米家保溫杯口袋版”新增三色可選,42.9元

      親子要聞

      一轉(zhuǎn)眼兒子3歲了,從出生到現(xiàn)在帶來(lái)太多快樂(lè)幸福,生日快樂(lè)!

      伊姐周日熱推:電視劇《主角》;電視劇《良陳美錦》......

      旅游要聞

      安徽巢湖:“船塘花海”絢爛綻放

      家居要聞

      多元生活 此處無(wú)聲

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲日韩AV无码专区影院| 国产成 人 综合 亚洲影音| 国产精品国产精品国产专区不卡| 91人妻丰满熟妇Aⅴ无码| 久久无码人妻热线精品| 国产一区二区性感自拍| 99热这里只有精品5| 精品免费看国产一区二区| 人妻少妇精品久久久久久0000 | 水蜜桃视频在线观看免费18| 67194亚洲无码| 伊在人间香蕉最新视频| 99青青青精品视频在线| 一本色道久久综合亚洲精品久久| 亚洲一区二区偷拍怎么找 | 亚洲人妻系列中文字幕| 真人作爱免费视频| 男女91| 激情宗合| 五月丁香色综合久久4438| 精品国产一区二区亚洲人| 日本久久久亚洲精品| 大陆熟妇丰满多毛xxxx| 91操碰| 欧美综合网| 3751色视频| 婷婷久久综合九色综合88| 国内精品久久人妻无码不卡| www.操在线观看| 一本色道av久久精品+网站| 国产成人啪精品视频网站午夜| 久女女热精品视频在线观看| 18禁无遮挡啪啪无码网站破解版| 少妇人妻真实偷人精品| 六十路老熟妇乱子伦视频| 天天橾夜夜操| 亚洲国产AⅤ精品一区二区不卡| 岛国一区| 精品一区二区亚洲国产| 国产亚洲精品成人av久| 思思热在线播放|