<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      用Mac本地跑大模型,靠譜嗎?

      0
      分享至


      看到橘子說:強烈建議購買MacBook Air或者Mac Mini。


      我經常被人問到一個問題:你那臺MacBook Pro到底能不能跑得動大模型?

      這個問題背后藏著一種普遍的懷疑。

      Apple Silicon出來之后,蘋果一直強調它的AI算力有多強,M系列芯片的神經網絡引擎跑分多漂亮。

      但真正上手之后你會發現,事情沒那么簡單。模型是能跑,但跑得怎么樣,那就是另一回事了。

      我自己用MLX跑過不少模型,Qwen、Llama、Mistral都試過。

      MLX確實是個好東西,蘋果官方開源生態,上手快,社區活躍。

      但你跑著跑著就會發現一些讓人抓狂的地方。

      比如激活量化基本沒有,W8A8這種在很多推理框架里已經是標配的模式,在MLX里就是缺的。


      你想壓榨一下Apple GPU的INT8 TensorOps能力,發現原生框架根本調不動。

      硬件擺在那里,但你用不上,這種感覺就像買了一輛法拉利,結果只能開60邁。

      直到最近,明略科技開源了一個叫Cider的項目,我才覺得事情開始變得有意思了。

      01Mano-P:把GUI測試的成本打到地板

      先說說Mano-P。

      這是明略科技開箱的一個端側GUI Agent模型,4B參數,專門做圖形界面理解和操作。

      聽起來可能有點抽象,我換一個說法。

      現在的AI編程工具已經很火了,Copilot、Cursor這些大家用得飛起。

      但你發現沒有,AI能幫你寫代碼,但它寫完代碼之后呢?

      它不能幫你跑起來測試,不能幫你點開界面驗證功能,不能幫你發現問題然后自己修。

      完整的軟件開發流程里,寫代碼只是其中一環。

      寫完代碼要編譯,要部署,要測試,尤其是GUI測試,你得打開軟件,點點按鈕,填填表單,看看頁面跳轉是不是正常。


      這些事,目前都還得人來做。

      Mano-P想做的是把這個最后環節也自動化。

      它通過純視覺理解屏幕截圖,定位界面元素,然后像人一樣去點擊、輸入、判斷結果。

      不依賴什么CDP協議,不依賴HTML解析,所以不管是網頁系統還是桌面軟件,甚至3D應用和專業工具,它都能操作。


      但這里面有一個硬成本問題。

      GUI測試要頻繁處理截圖,持續推理,如果每次都調用云端大模型,token消耗會非??鋸?。

      明略科技給過一個數據,在全自動編程流水線里,GUI測試消耗的云端token占比往往超過百分之五十。

      也就是說,你花在讓AI幫你測試上的錢,比讓它幫你寫代碼的錢還多。

      Mano-P的解法是把模型搬到端側,在你自己的Mac上跑。

      4B量化模型在M4 Pro上能做到476 tokens每秒的預填充,76 tokens每秒的解碼,峰值內存只占4.3GB。

      這意味著你不用花一分錢API費用,所有截圖和數據都不出設備,就能完成整個GUI自動化流程。


      我自己測試了一下,在一個典型的網頁表單填寫任務里,Mano-P的準確率和云端那些幾十B甚至上百B的模型差不多,坐標偏差控制在1像素以內。

      這不是縮水版AI,這是在端側重新實現了大模型級別的能力。

      但問題來了,模型能力到了,推理效率能不能跟上?這就要說到Cider了。

      02Cider:比蘋果原生框架更懂Apple Silicon

      Mano-P證明了端側GUI Agent有落地價值,但它跑得快不快,省不省內存,開發者接入門檻高不高,這些底層問題需要一個基礎設施來解決。

      Cider就是那個基礎設施。


      Cider是基于MLX生態的一個推理加速框架,但它做的事情比MLX原生更進一步。

      原生MLX支持W4A16、W8A16這樣的權重量化模式,也就是說權重可以壓到4bit或8bit,但激活值還是16bit。

      這在很多場景下夠用,但如果想要更極致的性能,就需要把激活值也壓到8bit,同時讓GPU跑INT8的TensorOps。

      Cider是第一個在Apple GPU上實現硬件加速INT8 TensorOps的開源框架。


      它通過調用蘋果底層的Metal 4 API,提供了W8A8和W4A8兩種模式。W8A8是權重和激活都壓到8bit,W4A8是把權重壓到4bit,激活保持8bit。

      實測數據很實在。相比原生MLX,Cider在W8A8模式下的算子速度提升了1.4倍到2.2倍,具體看Batch Size。

      W4A8模式下,權重的內存占用比W8A8直接減半,而且在Batch Size大于等于16的高并發場景里,性能完全不輸給原生MLX的W4A16方案。

      我用自己的一個實際項目測了一下,跑的是Qwen3-VL-2B這個視覺語言模型。


      在chunked prefill場景里,Cider帶來了百分之十到十九的端到端預填充加速。

      都不是那種實驗室環境下的理論峰值,是真實跑出來的數字。


      更有意思的是Cider的接入方式。

      它不是一個封閉的專屬加速庫,只要你模型接入了MLX生態,就可以用Cider來加速。

      Qwen可以,Llama可以,Mistral可以,當然Mano-P也可以。

      開發者不需要改模型結構,不需要重新訓練,幾行代碼就能把原來的推理后端換成Cider。

      這讓我想起當年CUDA生態早期的時候,NVIDIA也是先把硬件性能釋放出來,然后開發者自然就涌過來了。

      Cider在做類似的事情,只不過它是在Apple Silicon上,而且是開源的。

      03數據零上云,不是一個安全口號

      端側AI這兩年提得很多,但大家有沒有想過一個問題,為什么說了這么久,真正落地的案例還是少?

      原因很簡單,很多號稱端側AI的方案,其實只是在本地跑一個很小的模型做一些簡單任務,稍微復雜一點的事情還是要走云端。

      根本問題在于本地推理效率跟不上。模型大了跑不動,模型小了能力不夠。

      你跟我說數據不出設備很安全,但一個任務要等半分鐘才有結果,用戶體驗就崩了。


      Mano-P和Cider的組合解決的是這個工程層面的死結。

      Mano-P提供了足夠強的端側模型能力,Cider確保這個能力能跑得足夠快足夠省。

      每秒476個token的預填充速度意味著什么?

      意味著你給它一張截圖,它幾乎在瞬間就能理解屏幕上有什么。76的解碼速度意味著它生成下一步操作指令的時間,比你手動點一下鼠標還要短。

      4.3GB的內存占用意味著你可以在跑模型的同時,正常開瀏覽器、開IDE、開設計軟件,完全不影響日常使用。

      這種效率提升帶來的不僅是體驗上的改善,更是一種工程上的可行性。

      以前你覺得端側AI不靠譜,是因為你試過,確實慢、確實卡、確實不好用。

      現在有人告訴你,在Mac上跑一個4B的GUI Agent,速度比PyTorch CPU推理快60倍以上,量化后的精度和全精度輸出幾乎沒差別,坐標偏差控制在1像素以內。

      再去試,發現真的可以用了。


      這對于企業級場景尤其重要。很多公司做AI應用開發,最大的顧慮不是模型能力,而是數據安全。

      業務數據、用戶信息、界面截圖,這些東西一旦上傳到云端模型,就在別人的服務器上過了一遍。

      法律合規是一方面,商業機密是另一方面。

      Mano-P的本地運行模式實現了真正的物理隔離,所有截圖和任務數據都不出設備,離線狀態下也能完成自主規劃和決策。

      這不是寫在白皮書里的安全承諾,是工程上確定的。

      04開源生態的下一站:本地智能基礎設施

      我一直在想一個問題,開源模型的價值到底在哪里。

      很多人說是免費,是不用給OpenAI或者Anthropic交API費用。但這只是表面。

      真正的價值在于,開源模型給了開發者控制權。你可以自己部署,自己微調,自己決定數據流向哪里。

      當你需要在敏感數據上做AI應用時,閉源模型的API就像一條透明的管道,數據從你這頭進去,從他那頭出來,你永遠不知道中間發生了什么。

      開源模型不一樣,你可以把它鎖在自己的機房或者自己的Mac里,運行邏輯完全可控。

      但光有模型還不夠。你還需要一個能讓模型高效跑起來的本地推理基礎設施。

      Cider做的就是這件事,它不屬于某一個模型,它屬于整個開源模型生態。

      Qwen的用戶能用,Llama的用戶能用,Mistral的用戶能用,任何接入MLX生態的模型都能用。

      這種基礎設施層面的開源,比單個模型的開源更有生態意義。因為模型會迭代,今天最強的4B模型,過兩個月可能就被新的替代了。

      但推理框架不一樣,它沉淀下來的是硬件利用的工程經驗,是底層API的調用邏輯,是量化計算的優化路徑。這些東西的復用價值更高,周期更長。


      明略科技這次把Cider和Mano-P一起開源,而且Mano-P的訓練方法、剪枝、量化技術后續也會陸續放出來。

      這種做法讓我想起早年的Hugging Face,他們不是只做一個模型,而是做了一整套工具鏈,讓整個生態都能用起來。

      Cider目前主要解決的是Apple Silicon上的推理效率問題。但我覺得它的想象空間不止于此。

      未來端側AI的設備會越來越多,Mac只是第一步。手機、平板、甚至邊緣計算設備,都需要類似的本地推理基礎設施。

      Cider的技術路徑,調用底層Metal API實現INT8 TensorOps,補齊激活量化的能力,這些思路在被其他硬件平臺上復用,只是時間問題。

      05端側AI不是未來,是現在

      最后說一些個人判斷。

      很多人覺得端側AI是下一代的事,現在的主流還是云端大模型。

      但從工程落地的角度看,端側和云端從來不是替代關系,是分工關系。

      云端負責那些需要超大參數規模、海量知識、復雜推理的任務,端側負責那些需要低延遲、高隱私、低成本的任務。

      GUI自動化恰恰屬于后者。

      一個企業內部的自動化流程,天天都要跑,每次跑都傳截圖到云端,成本根本扛不住。

      而且界面數據里可能包含客戶信息、業務邏輯、內部系統結構,這些你愿意交給第三方的API嗎?大概率不愿意。

      所以端側不是云端的高配替代,而是特定場景下的唯一解。


      Mano-P和Cider的組合證明了,在Mac這個平臺上,端側AI已經可以達到接近實用的水平。

      推理速度夠快,內存占用夠小,模型能力夠強,接入門檻夠低。四個條件同時滿足,才叫真正的可用。

      我還注意到一個有意思的細節。

      Cider是在Apple MLX生態上做的二次開發,但它比蘋果原生框架走得更遠。蘋果自己的MLX沒有做W8A8,沒有做INT8 TensorOps,Cider補齊了。

      這其實反映了開源生態的一個優勢,大廠提供基礎框架和硬件驅動,社區貢獻者把邊界往外推。蘋果不會為所有小眾場景寫代碼,但開源社區會。


      端側AI的最后一公里,往往不是模型架構的問題,而是工程優化的問題。

      誰能把硬件潛能釋放得最徹底,誰就能在端側落地這場競賽里跑在前面。

      Cider目前走在了前面,但后面肯定會有更多人跟上來。

      對于開發者和企業用戶來說,現在是一個很好的時機。

      工具鏈已經基本齊了,Mano-P提供了端側GUI Agent的能力參考,Cider提供了通用的本地推理加速方案。

      你可以直接拿它們做產品,也可以基于它們做二次開發。

      代碼都在GitHub上,Apache 2.0協議,商業使用沒問題。


      https://github.com/Mininglamp-AI

      https://github.com/Mininglamp-AI/Mano-P

      https://github.com/Mininglamp-AI/cider

      接下來的半年到一年,端側AI會進入真正的落地爆發期。

      推理框架會越來越成熟,硬件利用率會越來越高,模型參數和能力的平衡會找到更優解。

      Apple Silicon在這個生態里的角色會越來越重要,不是因為蘋果自己做了什么,而是因為開源社區在它的硬件上把事做成了。

      回去再看那個問題,Mac到底能不能跑大模型。

      答案是可以,而且跑得比很多人想象的要好。

      只是需要一點正確的方法。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “一定要投”!摩根士丹利明確看好A股硬科技,外資加速回流,中國資產戰略配置正當其時

      “一定要投”!摩根士丹利明確看好A股硬科技,外資加速回流,中國資產戰略配置正當其時

      每日經濟新聞
      2026-05-29 17:43:32
      別喝“駝奶”了,全世界的駱駝也擠不出那么多的駝奶

      別喝“駝奶”了,全世界的駱駝也擠不出那么多的駝奶

      黃河新流域
      2026-05-14 15:10:42
      每天一個西紅柿,研究發現:三周后身體炎癥下降38%,延緩腦衰老

      每天一個西紅柿,研究發現:三周后身體炎癥下降38%,延緩腦衰老

      科學認識論
      2026-05-28 10:06:49
      霍華德淘汰賽選NBA現役最佳:家鄉情結與大個子偏好的雙重勝利

      霍華德淘汰賽選NBA現役最佳:家鄉情結與大個子偏好的雙重勝利

      籃壇第一線
      2026-05-30 00:40:56
      大定破2萬!余承東:全新M9是地球上最強SUV,沒有之一!網友:廣告法能不能管管他

      大定破2萬!余承東:全新M9是地球上最強SUV,沒有之一!網友:廣告法能不能管管他

      大白聊IT
      2026-05-28 21:21:39
      中國移動迎來史上最年輕的總經理!

      中國移動迎來史上最年輕的總經理!

      ICT解讀者
      2026-05-08 19:50:41
      生育大局已定:如不出意外,2026年起中國人口將迎來3大變化

      生育大局已定:如不出意外,2026年起中國人口將迎來3大變化

      蜉蝣說
      2026-03-17 15:58:31
      帶孫子最狠的一招:不罵不吼,就兩字,我照做3年,孫子越來越懂事

      帶孫子最狠的一招:不罵不吼,就兩字,我照做3年,孫子越來越懂事

      心理觀察局
      2026-05-20 07:51:20
      又一個巨頭倒下了?虧損超62億,一代空調大王爆雷!

      又一個巨頭倒下了?虧損超62億,一代空調大王爆雷!

      素衣讀史
      2026-05-29 22:12:03
      徹底沒得選!德部長帶40家巨頭落地北京,警告歐盟不準碰中國

      徹底沒得選!德部長帶40家巨頭落地北京,警告歐盟不準碰中國

      嘆為觀止易
      2026-05-30 00:26:16
      重返騎士信號?詹姆斯轉發2016年奪冠高光:這支球隊實在太棒了

      重返騎士信號?詹姆斯轉發2016年奪冠高光:這支球隊實在太棒了

      羅說NBA
      2026-05-29 08:44:56
      女子凌晨乘網約車在車內排泄,司機崩潰:臭味洗不掉!乘客全程清醒,還和男友打電話……

      女子凌晨乘網約車在車內排泄,司機崩潰:臭味洗不掉!乘客全程清醒,還和男友打電話……

      環球網資訊
      2026-05-29 13:42:23
      建國初,甚至有部分將帥手握幾十萬兵力,為何沒一人敢擁兵自重?

      建國初,甚至有部分將帥手握幾十萬兵力,為何沒一人敢擁兵自重?

      史之銘
      2026-05-29 16:55:36
      DO&皇馬跟隊:穆里尼奧已簽下三年合同,皇馬主席選舉后官宣

      DO&皇馬跟隊:穆里尼奧已簽下三年合同,皇馬主席選舉后官宣

      懂球帝
      2026-05-29 22:20:07
      法網|爆冷出局后,辛納有點后悔

      法網|爆冷出局后,辛納有點后悔

      北青網-北京青年報
      2026-05-29 08:58:06
      最高層終于給房地產托底了!

      最高層終于給房地產托底了!

      櫻桃大房子
      2026-05-29 22:03:02
      綠營想用牢飯鎖定馬英九?臺商集體倒戈鄭麗文,這才是致命反殺!

      綠營想用牢飯鎖定馬英九?臺商集體倒戈鄭麗文,這才是致命反殺!

      坦蕩的雪莉
      2026-05-29 08:17:10
      688033,被證監會立案!

      688033,被證監會立案!

      中國基金報
      2026-05-29 21:46:04
      3分鐘傾家蕩產?年入千億“精神鴉片”,正精準掏空中國人的錢包

      3分鐘傾家蕩產?年入千億“精神鴉片”,正精準掏空中國人的錢包

      趣文說娛
      2026-05-12 19:53:22
      巔峰對決!吳宜澤VS趙心童 比賽時間公布 小吳再戰艾倫復刻世錦賽

      巔峰對決!吳宜澤VS趙心童 比賽時間公布 小吳再戰艾倫復刻世錦賽

      念洲
      2026-05-29 14:09:37
      2026-05-30 01:32:49
      AI異類 incentive-icons
      AI異類
      從硅谷到中關村,AI信息與測評
      188文章數 8關注度
      往期回顧 全部

      數碼要聞

      LG電子澄清:并無出售電視業務的計劃

      頭條要聞

      釋永信被判24年 中國佛教協會:完全是咎由自取

      頭條要聞

      釋永信被判24年 中國佛教協會:完全是咎由自取

      體育要聞

      即使是文班亞馬,也做不到這件事

      娛樂要聞

      奚夢瑤何猷君將于6月在法國舉行婚禮

      財經要聞

      近3個月跌超20% 黃金"猴市"下的眾生相

      科技要聞

      Claude Opus 4.8凌晨突發上線

      汽車要聞

      900V+3.2秒破百 領克10+&領克10上市16.99萬元起

      態度原創

      房產
      健康
      手機
      數碼
      教育

      房產要聞

      順德澐璟「澐冠」再出圈:頂階人群不是買房,是追加“傳世資產”

      嘗試干細胞療法如何避免踩坑?

      手機要聞

      華為雙箭齊發:Mate80系列618官降500元,闊比例直板新機曝光!

      數碼要聞

      宏碁推多款游戲新品:兩款筆記本、一款串流掌機,還有鍵盤、背包

      教育要聞

      山東省家庭教育志愿服務總隊公益大講堂膠州巡講落幕

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品人一区二区三区| 久久久久久久综合| 国产激情福利短视频在线| 欧洲美熟女乱av在免费| 国产奶头好大揉着好爽视频| 亚洲AV色香蕉一区二区蜜桃小说| 专区国产无码| www.俺去也| 亚洲国产主播一区二区| 亚洲综合天堂一区二区三区| 国产激情无码一区二区三区| 国产AV无码一区精品天堂| 国产成AV人片久青草影院| 日韩av不卡一区二区在线| 欧美乱人伦人妻中文字幕| 日屄在线观看| 色狠狠色婷婷丁香五月| 婷婷五月激情综合| 亚洲三级网| 亚洲 日韩 国产 制服 在线| 亚洲大尺度一区二区av| 亚洲愉拍99热成人精品| 亚洲国语在线视频手机在线| 一卡二卡三卡在线观看| 亚洲女女女同性video| 天天爽日日澡AAAA片| 久久九九有精品国产尤物| 欧美色综合天天久久综合精品| 国产涩涩视频在线观看| 亚洲婷婷综合色高清在线| Jizz国产色系免费| 亚洲人妻影院| 悠悠人体艺术视频在线播放| 青草精品国产福利在线视频| 亚洲经典一区二区三区四区| 国精一二二产品无人区免费应用| 亚洲女人天堂成人av在线| 少妇熟女视频一区二区三区| 国产日本一区二区三区| 乱色视频中文字幕在线看| 色一情一乱一伦麻豆|