<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      本地4B開源模型,把任何App當Skill用!告別token焦慮,私密性強~

      0
      分享至

      大家好,我是袋鼠帝。

      上次給大家分享了一個 CUA 的開源項目,能讓 AI Agent 直接操控電腦界面,相當于把任何 App 都變成 Agent 的 Skill。反響還不錯。


      但評論區有兩個比較多的反饋:

      太耗 token 了。

      截圖上云,安全嗎?

      說實話,這兩個問題,我自己用下來也發現了,GUI 操作確實耗 token:

      模型要持續截屏、理解界面、定位元素、執行操作,每一步都在燒token。

      特別是在全自動編程流程里,有數據表明,GUI 測試消耗的 token 甚至占到整體的一半以上,是最大的單項開銷。

      而且每一幀截圖都要上傳到云端模型去處理,企業級場景下確實有隱私顧慮。

      前兩天我偶然挖到了一個開源模型,叫 Mano-P

      https://github.com/MININGLAMP-AI/MANO-P


      它天生就是為 GUI 操作設計的,而且是端側模型:可以在你自己的 Mac 上本地運行,截圖和任務數據不出設備。

      有72B版本,最小也有 4B 參數版本,本地一臺 Mac 就能跑。

      不花 token,不上云,私密性拉滿,聽起來挺完美的。

      但其實還有一個很現實的問題:本地跑模型,雖然不耗 token 了,但效率怎么樣?速度怎么樣?會不會跑起來就把電腦卡住了?

      這也是本地跑模型一直以來最頭疼的問題之一。

      不過,我最近挖到的另一個開源框架 Cider,恰好解決了這事(下面會簡單介紹)。


      ok萬事俱備,就差效果了。

      所以我想親手試試:4B端側小模型 + 本地推理加速,跑 GUI 操作,到底行不行?

      先說 Mano-P 是什么。

      是一個開源的端側 GUI-VLA(視覺-語言-動作)Agent 模型。

      簡單來說,它能夠像人一樣看屏幕,并操作電腦。

      開源不久(應該才半個月不到)在GitHub 有1.3k Star了。

      目前開源了兩個尺寸:Mano-P 1.0-72B 和 Mano-P 1.0-4B。

      72B 大模型在 OSWorld Benchmark 的專項排行里排第一,成功率 58.2%,超過第二名 13 個百分點,但 72B 需要通過高配設備來跑。

      4B 是專門為端側設計的輕量版,可以直接跑在 Mac mini / MacBook 上,量化后峰值內存才 4.3GB。

      我的電腦配置有限,所以這次部署的是 4B。但在 CUA 任務上的準確率也已經跟云端大模型相當了,訓練數據的底子很扎實:20,000+ 條瀏覽器操作軌跡、40,000+ 條桌面操作軌跡,覆蓋 300 萬+ 動作。

      它的核心能力是純視覺驅動,不依賴 CDP 協議,不解析 HTML,直接"看"屏幕截圖來理解界面、定位元素、執行點擊和輸入。

      這意味著它不局限于瀏覽器,桌面軟件、3D 應用、專業工具、甚至游戲界面,理論上都能操作。

      這一點非常關鍵。之前用 Playwright 這類工具做瀏覽器自動化,本質上是在操作 DOM 樹。碰到 Canvas 渲染的頁面、Flash 游戲、或者非瀏覽器的桌面應用,直接GG。


      再說說 Cider:我挖到的另一個開源框架。

      前面說了,Mano-P 解決了 token 和隱私問題。但本地跑模型,速度和效率是繞不開的坎。

      Cider 是一個基于 Apple MLX 生態的推理加速框架,解決的就是這個問題:

      讓模型在 Mac 上跑得更快、更省內存。

      因為它真正調用了 Apple GPU 的 INT8 計算能力。

      Apple 的 M 系列芯片其實原生支持 INT8 計算,但 MLX(Apple 自己的 AI 框架)一直沒把這個能力完全用上,只做了權重量化,沒做激活量化。


      Cider 補齊了這塊,它是第一個在 Apple GPU 上實現硬件加速 INT8 TensorOps 的框架。

      實測下來,W8A8 模式比 MLX 原生的 W4A16 快 1.4 到 1.9 倍。

      而且 Cider 不只是給某一個模型用的,Qwen、Llama、Mistral 這些主流開源模型都能接入使用。

      安裝其實越來越簡單了。

      我用 Codex 幫我自動裝的,全程幾乎沒動手

      Mano-P和Cider都是讓Codex幫忙安裝的



      官方推薦的硬件:Apple M4 芯片 + 32GB 內存的 Mac mini 或 MacBook

      對了它還有一個skill,也讓codex幫忙安裝一下

      https://clawhub.ai/hanningwang/mano-cua


      4B 模型跑起來還是輕松的,完全不卡。

      好,環境搭好了。也通過skill把Mano-P接入Codex了(也可以接入別的Agent,比如Claude Code等...)。

      接下來看看 Mano-P 的效果到底如何。


      1、自動瀏覽小紅書并互動

      先來試一個稍微復雜的經典任務。

      小紅書的 UI 是挺復雜的:信息流、彈窗、多種交互方式混在一起。

      我讓 Mano-P 去搜 AI 話題->瀏覽前三個帖子->點贊->并評論。

      這個任務我只是抱著試一試的態度,結果 Mano-P 竟然圓滿完成了,有點意外。

      讓我驚喜的是一個細節是,第一個帖子打開的時候是已經點贊的狀態,它一進來就習慣性地點了點贊按鈕,實際上是把點贊取消了。但它很快意識到不對,立馬又把點贊重新點了回來。

      這說明它不是在機械執行,而是能根據界面的視覺反饋來判斷操作是否正確,并自動糾偏。這個能力對于 GUI Agent 來說非常關鍵。

      這種自動互動的能力其實還有個很實際的用途:比如你想做 X(Twitter)的冷啟動,去各個大 V 下面點贊、評論、轉發來增加曝光,這種重復性高的任務,拿GUI Agent來跑就很合適。


      2、用 tiktok-gen 做 E2E 測試

      然后我嘗試了一個開發者場景。

      我自己有一個開源項目 tiktok-gen(營銷短視頻生成平臺)

      https://github.com/kangarooking/tiktok-gen


      之前做 GUI 測試都是自己手動點,登錄、上傳、生成、驗證,一套流程走下來挺費勁的。

      這次我想試試讓 Codex + Mano-P 配合來跑。

      Codex 負責調度和監督,Mano-P 負責 GUI 操作打開項目前端->測試注冊、登錄->資產中心上傳圖片和音頻素材->文案素材生成->最后產出一份測試報告。

      整個過程里,Codex 像個監工,Mano-P 是主要干活的。

      4B 小模型的 GUI 操作能力確實不錯,但偶爾會跑偏或者卡住,這時候 Codex 作為監督者就能及時糾偏,把任務拉回正軌。

      我甚至覺得這個組合比單獨用 Codex 的 CUA 效果更好。我之前試過 Codex 自己做 GUI 操作,速度倒是快一些,但也會跑偏。而且沒有另一個 AI 幫它糾偏,出了問題只能自己死磕。

      之前就遇到過,讓Codex自己去qq音樂搜周杰倫的歌,結果它在哪里輸入周杰倫的拼音,死活找不到。。

      還有一個更大的優點:整個過程不需要用到 Codex 的視覺能力。

      視覺理解這塊完全由 Mano-P 在本地完成,Codex 只負責安排任務和糾偏。這意味著截圖不會上傳到云端,能省不少 token,私密性也更好。

      整個過程除了慢一點,穩是真的穩。

      慢的原因我總結了一下,主要是三個:一是 Codex 本身的思考耗時;二是我本地配置一般,沒達到 Mano-P 官方推薦的 M5 芯片 + 32GB 內存;三是 Codex 和 Mano-P 之間的信息同步還不夠絲滑,這塊也占了一部分耗時。

      也希望開源作者能繼續優化這一點。

      以下是Codex的原話,Codex是沒有參與GUI的查看和執行的



      3、玩游戲

      再來個有趣的。我也一直想試試,讓大模型玩掃雷,反正我小時候是沒玩明白過,只知道亂點

      我之前試過用 Playwright(最好用的瀏覽器自動化 MCP 工具之一)去操作 4399 上的掃雷,完全做不到。

      原因很簡單:4399 的游戲界面是 Canvas 渲染的,Playwright 操作的是 DOM 樹,在 Canvas 面前直接失效,它根本"看不到"游戲里的格子和數字。

      但 Mano-P 是純視覺路線,肯定是能操作的

      所以我讓它打開 4399->搜索掃雷->進入游戲->開始玩。

      結果挺有意思的:它一步一步打開了 4399,搜索到掃雷,順利進入了游戲界面。游戲確實能玩上,能點擊到掃雷的方塊。

      但說實話,它并不太理解掃雷的游戲邏輯,玩得比較隨機,沒有根據數字去推理哪些格子安全

      不過 Playwright 做不到的事,4B 小模型通過純視覺還是能做。

      「最后」

      我想說,Mano-P 4B雖然游戲玩得菜,但頁面操作這塊,還是挺專業的

      頁面元素定位、按鈕點擊、表單填寫、跨步驟任務執行,這些它都能做得不錯。

      Mano-P 4B更適合的定位是:自動化執行給定的 GUI 任務,而不是全程獨立思考怎么做。

      搭配一個聰明的大模型(比如接入 Codex 配合 GPT-5.5)一起用,效果最好。

      回到開頭的那兩個痛點:token 成本和數據安全。

      Mano-P + Cider 的組合,確實一定程度上解決了這兩個問題。本地 GUI 操作不花或少花 token,數據不出設備,這不是安全協議上寫的"我們承諾不看你的截圖數據",而是物理上數據就沒出過你的電腦。

      然后端側 AI 的方向也越來越清晰了:端側模型不需要具備通用性,而是在某一個具體場景深耕、打穿。

      更私密、更省錢、更可控,以及在 GUI 操作這件事上,它不一定比大模型差。

      如果你有 M4 Mac,推薦自己跑跑看。

      如果你也嘗試了一些有意思的 Case,歡迎評論區聊聊~

      能看到這里的都是鳳毛麟角的存在!

      如果覺得不錯,隨手點個贊、在看、轉發三連吧~

      如果想第一時間收到推送,也可以給我個星標?

      謝謝你耐心看完我的文章~

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      國宴破例舉杯,特朗普登機前說出真心話 ,中國應邀今秋赴美

      國宴破例舉杯,特朗普登機前說出真心話 ,中國應邀今秋赴美

      麓谷隱士
      2026-05-16 11:05:47
      高三曬家長“開天窗”穿搭,被嘲:該端莊的時候,你解扣子干嘛?

      高三曬家長“開天窗”穿搭,被嘲:該端莊的時候,你解扣子干嘛?

      妍妍教育日記
      2026-05-10 11:50:07
      “大車時代”狂飆:誰殺死了汽車輕量化

      “大車時代”狂飆:誰殺死了汽車輕量化

      汽車預言家
      2026-05-15 17:13:25
      申花雪藏主力練兵云南,斯盧茨基的豪賭可信嗎?

      申花雪藏主力練兵云南,斯盧茨基的豪賭可信嗎?

      寒律
      2026-05-16 10:45:18
      訪華最后一天,中方以茶論道,給了特朗普中美外交史上唯二的待遇

      訪華最后一天,中方以茶論道,給了特朗普中美外交史上唯二的待遇

      泛舟碧波湖水
      2026-05-15 22:56:48
      特朗普訪華晚宴,雷軍是座上賓,為什么?

      特朗普訪華晚宴,雷軍是座上賓,為什么?

      二月禾
      2026-05-15 11:18:14
      雷軍開打價格戰,小米廉價車型要來了

      雷軍開打價格戰,小米廉價車型要來了

      科技頭版Pro
      2026-05-14 14:36:27
      夏天已至,醫生叮囑高血壓患者:寧可吃桃子,也別天天吃這5種物

      夏天已至,醫生叮囑高血壓患者:寧可吃桃子,也別天天吃這5種物

      路醫生健康科普
      2026-05-15 17:57:30
      金曲獎來了,看完提名名單,我要說:華語樂壇完了!

      金曲獎來了,看完提名名單,我要說:華語樂壇完了!

      八卦南風
      2026-05-13 18:27:59
      湖南岳陽一女神太漂亮了,這是什么逆天顏值,媲美西施并不過分

      湖南岳陽一女神太漂亮了,這是什么逆天顏值,媲美西施并不過分

      草莓解說體育
      2026-05-16 00:13:00
      漲的是車價,要的是老命

      漲的是車價,要的是老命

      虎嗅APP
      2026-05-16 00:36:12
      兩老人撿十幾年破爛存五六萬,這都下得去手!真正的“騙子”是誰

      兩老人撿十幾年破爛存五六萬,這都下得去手!真正的“騙子”是誰

      走讀新生
      2026-05-15 15:05:17
      除了談判妥協,沒有第二條路?中美有共識:伊朗必須滿足兩個要求

      除了談判妥協,沒有第二條路?中美有共識:伊朗必須滿足兩個要求

      瀲滟晴方DAY
      2026-05-16 11:04:15
      訪華3天,美國一眾高層都被震撼!魯比奧贊嘆:中國軍力世界第二

      訪華3天,美國一眾高層都被震撼!魯比奧贊嘆:中國軍力世界第二

      有范又有料
      2026-05-16 11:06:45
      47歲郝蕾坐姿引熱議!該胖的地方胖,比紙片人耐看太多

      47歲郝蕾坐姿引熱議!該胖的地方胖,比紙片人耐看太多

      孤芳自賞的小李
      2026-05-14 23:26:20
      印度 GDP 半年大變臉?從第四退到第六,盧比貶值扯下遮羞布

      印度 GDP 半年大變臉?從第四退到第六,盧比貶值扯下遮羞布

      烈史
      2026-05-15 16:34:10
      伊朗視角下的特朗普訪華:看穿美國急于脫困,篤定中國絕不交易

      伊朗視角下的特朗普訪華:看穿美國急于脫困,篤定中國絕不交易

      嘆為觀止易
      2026-05-16 11:11:30
      哈登今年第五次!米切爾八年魔咒!

      哈登今年第五次!米切爾八年魔咒!

      籃球大圖
      2026-05-16 10:34:46
      雙贏,火箭綠軍巨星互換,綠軍再奪一次總冠軍,火箭得更年輕核心

      雙贏,火箭綠軍巨星互換,綠軍再奪一次總冠軍,火箭得更年輕核心

      體壇風之子
      2026-05-16 07:00:17
      惠州一男子會所猝死。二審落槌:維持原判,會所賠23萬余元

      惠州一男子會所猝死。二審落槌:維持原判,會所賠23萬余元

      南方都市報
      2026-05-15 21:10:12
      2026-05-16 12:15:00
      袋鼠帝 incentive-icons
      袋鼠帝
      持續分享AI實踐干貨,走超級個體崛起之路
      83文章數 73關注度
      往期回顧 全部

      科技要聞

      漲的是車價,要的是老命

      頭條要聞

      美國媒體在天壇里尋找俄勒岡木材 被指非常耐人尋味

      頭條要聞

      美國媒體在天壇里尋找俄勒岡木材 被指非常耐人尋味

      體育要聞

      35歲坎特,干了一件這輩子最吵的事

      娛樂要聞

      張嘉譯和老婆的差距讓人心酸

      財經要聞

      造詞狂魔賈躍亭

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態度原創

      本地
      時尚
      教育
      旅游
      公開課

      本地新聞

      用蘇繡的方式,打開江西婺源

      0緩震的鞋,怎么就火了?

      教育要聞

      武漢大學第1專業,就業現狀與報考性價比分析!#金榜同行人

      旅游要聞

      水上漫游、野奢露營、飛天鳳凰……六安把全域旅游玩出了新花樣

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人免费午夜无码视频在线播放| 中文字幕在线无码一区二区三区| 欧美大黑屄| 精品国产av 无码一区二区三区| 夜色福利久久精品福利| AV无码精品一区二区三区宅噜噜 | 伊人久久中文字幕| 久久96热在精品国产高清| 免费的黄网站精品久久| 色综合久久五月天久久久 | 少妇人妻偷人精品无码视频| 亚洲黑人av| 亚洲丶国产丶欧美一区二区三区| 成人亚洲一区无码久久| 精品日产一卡2卡三卡4卡自拍| 中文字幕熟妇人妻在线视频| 粉嫩av一区二区三区蜜臀| 人妻少妇无码精品专区| 亚洲国产精品一区二区三| 亚洲综合在线一区| 玩弄少妇人妻一区二区三区四区| 欧美人与动牲交ZOOZ乌克兰| 夜夜爽免费888视频| 亚洲另类欧美在线电影| 在线色综合| 亚洲色无码中文字幕| 日韩人妻一曲二曲| 国产成人亚洲综合色| 黄色99| 熟女系列丰满熟妇AV| 久久亚洲女同第一区综合| 一区二区三区激情都市| 亚洲成人动漫av在线| 午夜A理论片在线播放| 怡春院网站| 欧洲美熟女乱av亚洲一区| 乱色视频中文字幕在线看 | 久久99精品久久久久| 天堂网亚洲综合在线| 中文亚洲爆乳av无码专区| 午夜阳光精品一区二区三区 |