<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      ollama v0.20.4 正式發布!MLX 性能大幅提升 , Gemma4 閃光注意力全面啟用

      0
      分享至




      前言

      2026年4月9日,本地大模型運行框架ollama正式推出v0.20.4 Latest穩定版本。本次更新圍繞MLX硬件加速性能優化、Gemma4系列模型支持、前端代碼規范、Safetensors模型創建流程、函數調用輸出能力、MLX動態庫兼容、集成測試體系搭建等多個核心維度展開,共計8次提交、51個文件變更,由4位貢獻者共同完成,整體新增2458行代碼、刪除215行代碼,在保持框架穩定性的同時,進一步強化了對新型大模型、多硬件平臺以及自定義模型部署的支持能力。

      本文將基于官方完整提交記錄與文件變更明細,對ollama v0.20.4的每一項更新進行逐點拆解,覆蓋核心功能優化、代碼結構調整、兼容性修復、測試用例新增、底層庫加載邏輯改進等全部內容,不遺漏任何一處技術變更,為開發者提供可直接參考的完整更新指南。

      一、ollama v0.20.4整體更新概覽

      本次v0.20.4版本發布時間為2026年4月9日,核心提交集中在4月7日與4月8日,整體變更可劃分為六大核心板塊:

      1. 1. 底層推理加速優化:MLX框架M5性能提升、Gemma4閃光注意力啟用與兼容修復

      2. 2. 模型創建流程重構:實驗性路徑清理、Safetensors模型導入修復與邏輯簡化

      3. 3. 前端UI代碼規范整改:未使用變量、常量聲明、空捕獲語句等語法問題修復

      4. 4. 接口能力擴展:函數調用輸出數組類型支持

      5. 5. 硬件兼容強化:macOS Metal版本檢測、舊GPU閃光注意力禁用、MLX庫路徑匹配優化

      6. 6. 測試體系完善:新增圖像生成集成測試、Safetensors解析單元測試、模型創建集成測試

      從代碼改動規模來看,本次更新以新增功能與兼容修復為主,刪除代碼多為冗余邏輯與廢棄路徑,整體架構更加精簡高效,同時大幅完善了測試覆蓋,保障自定義模型、多模態模型、Safetensors格式模型的運行穩定性。

      二、核心功能更新逐點解析 (一)MLX框架性能優化:M5性能提升與NAX技術應用

      本次更新首項核心優化針對MLX框架,通過NAX技術實現M5硬件平臺的推理性能提升。MLX作為蘋果生態下的高性能數值計算框架,是ollama在macOS平臺實現GPU加速的核心依賴,本次針對M5芯片的專項優化,直接提升了本地大模型在蘋果最新硬件上的推理速度、吞吐量與內存利用效率。

      該優化直接面向硬件底層計算調度,通過NAX指令集與計算流水線優化,減少推理過程中的冗余計算與內存拷貝,在運行參數量更大的語言模型與多模態模型時,能夠顯著降低首token生成延遲,提升連續對話流暢度。該項改動屬于底層推理引擎核心優化,無需用戶額外配置,更新后即可自動生效。

      (二)Gemma4模型全面支持:閃光注意力啟用與兼容修復

      Gemma4作為新一代輕量級高性能大模型,在ollama v0.20.4中獲得完整支持,核心更新包括兩項:

      1. 1. 正式啟用閃光注意力(Flash Attention)
        閃光注意力是提升Transformer模型推理效率的關鍵技術,能夠大幅降低注意力計算的內存占用與計算耗時,本次更新將Gemma4加入閃光注意力支持列表,在GGML底層代碼中完成配置注冊,使Gemma4模型在支持的GPU平臺上自動開啟閃光注意力加速。

      2. 2. 舊GPU平臺閃光注意力兼容修復
        考慮到部分老舊顯卡不兼容閃光注意力實現,本次更新針對性添加了舊GPU禁用邏輯,避免因硬件不兼容導致的推理崩潰、內存溢出或速度異常下降,保障不同世代GPU用戶都能穩定運行Gemma4模型。

      同時,本次更新還補充了Gemma4相關缺失文件,完善模型加載依賴,解決了此前版本中Gemma4模型加載失敗、配置缺失的問題,實現從模型加載到推理運行的全流程穩定支持。

      (三)模型創建流程重構:實驗性路徑清理與Safetensors修復

      ollama的模型創建功能是自定義模型部署的核心入口,本次更新對create命令相關邏輯進行全面重構:

      1. 1. 清理實驗性路徑,簡化代碼結構
        刪除冗余的實驗性路徑引用,合并重復邏輯,減少代碼維護成本,同時保留核心的Safetensors模型創建與圖像生成模型創建能力,僅通過--experimental flag進行功能管控,保持接口簡潔統一。

      2. 2. 修復從現有Safetensors創建模型的問題
        修復了在使用本地Safetensors格式模型文件創建ollama模型時的路徑錯誤、文件讀取異常問題,支持直接從本地Safetensors權重目錄導入模型,配合Modelfile完成自定義配置,大幅降低開源模型本地化部署門檻。

      3. 3. 遠程模型創建限制明確
        在實驗性模式下明確限制遠程Safetensors模型創建,僅支持本地服務器操作,避免因網絡傳輸、文件權限等問題導致模型創建失敗,提升使用確定性。

      (四)函數調用能力升級:支持輸出數組類型

      ollama的函數調用(Function Call)能力在v0.20.4中得到擴展,新增對函數調用輸出數組的支持。此前版本中函數調用返回結果多為單值對象,難以滿足批量數據返回、多結果返回場景,本次更新后,模型可直接返回數組格式的函數調用輸出,適配更復雜的工具調用、數據處理、多步驟推理業務場景,提升框架在企業級應用中的實用性。

      該項改動位于responses模塊,直接擴展API響應結構,前端與后端服務均可無縫對接新的返回格式,無需額外適配改造。

      三、前端UI代碼規范全面整改

      本次更新對app/ui前端代碼進行系統性語法規范修復,覆蓋多個核心組件,提升代碼健壯性與可維護性:

      1. 1. Message.tsx組件優化
        移除JSON解析捕獲語句中的無用異常變量,將catch(e)簡化為catch(),消除未使用變量告警;統一異常處理邏輯,保持代碼風格一致,避免因語法告警導致構建失敗。

      2. 2. MessageList.tsx組件優化
        清理空捕獲語句,添加注釋明確忽略邏輯,消除lint工具對空catch的警告,提升代碼可讀性。

      3. 3. Badge.tsx與Button.tsx組件優化
        將可變變量let聲明改為常量const聲明,符合前端代碼最佳實踐,減少意外變量修改風險,同時保持樣式類計算邏輯不變,不影響UI展示效果。

      本次前端整改全部為語法規范優化,不改變任何交互邏輯與UI展示效果,能夠有效降低長期維護成本,避免因代碼規范問題導致的構建報錯。

      四、底層硬件兼容與庫加載邏輯強化 (一)MLX動態庫加載機制優化

      1. 1. 切換默認HTTP客戶端
        簡化MLX模塊網絡請求邏輯,使用系統默認HTTP客戶端,減少第三方依賴,提升網絡請求穩定性,避免因自定義客戶端配置導致的連接異常。

      2. 2. MLX庫路徑匹配規則優化
        在GPU設備發現邏輯中添加mlx_前綴過濾,避免因路徑匹配錯誤導致的MLX庫加載失敗,精準識別mlx_開頭的硬件加速庫目錄,提升蘋果芯片與NVIDIA GPU平臺的庫加載成功率。

      (二)macOS Metal版本兼容性檢測

      新增macOS系統版本檢測邏輯,針對Metal加速庫做嚴格兼容判斷:

      1. 1. 新增dynamic_darwin.go文件,通過syscall讀取macOS系統主版本號

      2. 2. 對mlx_metal_v4及以上版本進行限制,僅在macOS 26及以上系統啟用,避免在低版本macOS上加載高版本Metal著色器導致渲染失敗、推理崩潰

      3. 3. 非macOS平臺直接跳過檢測,保持跨平臺一致性

      該項優化解決了長期存在的舊版macOS運行MLX加速異常的問題,提升跨系統版本兼容性。

      (三)統一MLX變體加載策略

      對mlx_*目錄進行倒序排序加載,優先加載高版本MLX庫(如mlx_metal_v4優先于mlx_metal_v3),自動跳過不兼容硬件平臺的變體,實現硬件自適應加載,無需用戶手動指定庫路徑。

      五、Safetensors模塊重構與測試體系完善 (一)Safetensors解析模塊獨立重構

      將原位于x/imagegen/safetensors的extractor.go遷移至x/safetensors目錄,實現Safetensors解析能力獨立化,不再與圖像生成模塊強綁定,支持語言模型、多模態模型統一使用Safetensors解析邏輯,提升代碼復用性。

      該模塊提供完整的Safetensors文件讀取、張量信息提取、原始數據讀取、打包與解包能力,核心功能包括:

      1. 1. 讀取Safetensors文件頭,解析張量名稱、數據類型、形狀、數據偏移

      2. 2. 提取指定張量原始數據,支持F32、F16、U8等多種數據類型

      3. 3. 構建打包Safetensors格式數據,支持多張量合并

      4. 4. 自動過濾__metadata__字段,避免元數據干擾張量解析

      (二)新增大量集成測試與單元測試

      本次更新大幅擴充測試用例,提升代碼質量與穩定性:

      1. 1. 新增create_imagegen_test.go(107行)
        實現圖像生成模型完整集成測試,覆蓋模型下載、Modelfile創建、ollama create執行、圖像生成、格式校驗、模型刪除全流程,要求最低13GB顯存支持,驗證Z-Image-Turbo等多模態模型的創建與推理能力。

      2. 2. 新增create_test.go(350行)
        實現Safetensors格式LLM模型集成測試,以TinyLlama-1.1B為測試對象,驗證從HuggingFace下載模型、通過實驗性模式創建ollama模型、模型信息查看、對話推理等全流程能力,同時添加遠程服務器跳過邏輯,保障測試可靠性。

      3. 3. 新增extractor_test.go(394行)
        覆蓋Safetensors解析模塊全功能測試,包括文件創建、張量讀取、異常處理、循環讀寫校驗、元數據過濾、多張量打包等場景,保障解析邏輯零錯誤。

      測試體系的完善,使ollama在自定義模型、多模態模型、Safetensors模型支持上具備更強的穩定性保障,減少版本更新帶來的兼容性問題。

      六、配置文件與輔助文件更新

      1. 1. .github/workflows/release.yaml
        將macOS構建環境從macos-14-xlarge升級為macos-26-xlarge,適配最新蘋果硬件構建需求,提升發布包兼容性。

      2. 2. .gitignore
        新增integration/testdata/models/目錄忽略規則,避免測試模型文件被提交至倉庫,保持倉庫整潔。

      七、ollama v0.20.4更新對開發者的實際價值
      1. 1. 硬件性能進一步釋放
        MLX M5優化與Gemma4閃光注意力啟用,使蘋果芯片用戶獲得更高推理速度,老舊GPU也能穩定運行新型模型。

      2. 2. 自定義模型部署更簡單
        Safetensors導入修復、實驗性路徑簡化,讓開源模型一鍵轉為ollama可用格式,降低本地化部署成本。

      3. 3. 企業級應用能力增強
        函數調用數組輸出支持,適配復雜工具鏈與業務系統,提升框架實用價值。

      4. 4. 跨平臺兼容性大幅提升
        Metal版本檢測、MLX庫自適應加載,解決不同系統、不同硬件的運行異常問題。

      5. 5. 代碼質量與可維護性升級
        前端規范整改、模塊重構、全面測試覆蓋,為后續版本迭代打下穩定基礎。

      八、總結

      代碼地址:github.com/ollama/ollama

      ollama v0.20.4作為2026年4月的最新穩定版,以“性能提升、模型適配、兼容強化、測試完善”為核心,完成了從底層推理引擎、模型管理流程、前端代碼規范到硬件兼容邏輯的全鏈路升級。8次提交、51個文件變更看似規模不大,但每一處改動都精準解決實際使用痛點,尤其是對Gemma4的完整支持、MLX硬件加速優化、Safetensors模型創建修復以及測試體系的全面搭建,直接提升了ollama在本地大模型部署領域的競爭力。

      我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      駐馬店市林業局二級調研員張志云接受紀律審查和監察調查

      駐馬店市林業局二級調研員張志云接受紀律審查和監察調查

      大象新聞
      2026-05-12 18:58:02
      “悶殺”,也許是最終選擇!

      “悶殺”,也許是最終選擇!

      深度報
      2026-05-10 22:44:58
      哈登一夜狂刷7大歷史紀錄!36歲仍封神,騎士真賺翻,奪冠有望

      哈登一夜狂刷7大歷史紀錄!36歲仍封神,騎士真賺翻,奪冠有望

      錢說體育
      2026-05-12 12:54:02
      南京二手房跌麻了:三大小區一口氣降近1900元/㎡

      南京二手房跌麻了:三大小區一口氣降近1900元/㎡

      愛看劇的阿峰
      2026-05-13 01:13:28
      太神奇了!場場三分命中率五成以上,苦熬七年,終于能拿億元合同

      太神奇了!場場三分命中率五成以上,苦熬七年,終于能拿億元合同

      球毛鬼胎
      2026-05-12 21:38:02
      研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

      研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

      黯泉
      2026-04-01 17:28:39
      21歲女子和“鴨子”纏綿后,嘲諷情人比不上鴨子,2018年被情夫殺

      21歲女子和“鴨子”纏綿后,嘲諷情人比不上鴨子,2018年被情夫殺

      漢史趣聞
      2026-05-12 11:14:45
      “頂令入場”,他投完這一票直接被羈押,菲律賓參議院一夜換帥

      “頂令入場”,他投完這一票直接被羈押,菲律賓參議院一夜換帥

      天氣觀察站
      2026-05-12 13:04:10
      王炸!總面積約1462.5畝,投資約61.9億元,武漢新一批城市更新重點片區出爐!

      王炸!總面積約1462.5畝,投資約61.9億元,武漢新一批城市更新重點片區出爐!

      越喬
      2026-05-12 22:36:04
      8勝2負,資格賽國羽男單小將僅1人突圍,附泰國公開賽13日賽程

      8勝2負,資格賽國羽男單小將僅1人突圍,附泰國公開賽13日賽程

      佑銘羽球
      2026-05-13 01:26:13
      冠軍近在咫尺卻遭絕平,終場后C羅神情落寞低頭捂臉難掩失落

      冠軍近在咫尺卻遭絕平,終場后C羅神情落寞低頭捂臉難掩失落

      懂球帝
      2026-05-13 04:33:27
      美總統出訪為何連排泄物都要打包帶回?

      美總統出訪為何連排泄物都要打包帶回?

      觀星賞月
      2026-05-12 02:38:46
      江蘇錯失第二個“蘇州”,2市一旦“合并”,有望晉級特大城市

      江蘇錯失第二個“蘇州”,2市一旦“合并”,有望晉級特大城市

      水泥土的搞笑
      2026-05-12 18:25:11
      湖人出局!東契奇火速發聲:退出國家隊,這個夏天我要專心帶娃

      湖人出局!東契奇火速發聲:退出國家隊,這個夏天我要專心帶娃

      仰臥撐FTUer
      2026-05-12 16:10:08
      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      新歐洲
      2026-04-21 19:37:05
      EIA:預計霍爾木茲海峽將關閉至5月底 6月逐步恢復通航

      EIA:預計霍爾木茲海峽將關閉至5月底 6月逐步恢復通航

      財聯社
      2026-05-13 00:10:12
      新能源汽車維修遭壟斷,4400萬車主選擇權被鎖

      新能源汽車維修遭壟斷,4400萬車主選擇權被鎖

      第一財經資訊
      2026-05-11 16:52:11
      上海將新增地鐵線路!未來前往機場、高鐵站更方便

      上海將新增地鐵線路!未來前往機場、高鐵站更方便

      上海交通
      2026-05-11 17:28:07
      大伯出獄全家沒人接,我開車去接他,他偷偷塞我一張卡說有1200萬

      大伯出獄全家沒人接,我開車去接他,他偷偷塞我一張卡說有1200萬

      千秋文化
      2026-05-09 20:08:48
      央視點名!沒想到孫穎莎世乒賽剛奪冠,轉眼就傳來另一大好消息

      央視點名!沒想到孫穎莎世乒賽剛奪冠,轉眼就傳來另一大好消息

      介知
      2026-05-13 03:47:57
      2026-05-13 06:12:49
      moonfdd incentive-icons
      moonfdd
      福大大架構師每日一題
      1223文章數 67關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      頭條要聞

      特朗普稱將同中方討論對臺軍售和黎智英案 外交部回應

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      利潤再腰斬 京東干外賣后就沒過過好日子

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      房產
      藝術
      教育
      親子
      家居

      房產要聞

      穗八條引爆樓市!萬博寶藏紅盤,五一勁銷出圈

      藝術要聞

      這位女攝影師的航拍風景照片,簡直太美了!

      教育要聞

      求求你試試「5+1+1」學習法!!!

      親子要聞

      夏天建議:把孩子的空調服換成它!

      家居要聞

      極簡主義下的居住場域與空間

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产国产人免费人成免费| 日韩精品一区二区三区中文9| 熟女Www亚洲国产W| 久久免费观看归女高潮特黄| 色婷婷日日躁夜夜躁| 小鲜肉自慰网站| 亚洲永久精品一区二区三区| 91福利姬| 乱色熟女综合一区二区三区| 国产成人亚洲精品日韩激情| 国产片AV国语在线观看手机版| 97国产揄拍国产精品人妻| 99久久精品午夜一区二区| 亚洲中文字幕有综合久久| 美女无遮挡免费视频网站| 高清偷拍一区二区三区| 泰宁县| 亚洲熟女片嫩草影院| 国产精品久久久久久久白晢女i| 亚洲午夜成人精品电影在线观看| 又大又硬又爽免费视频| 国产播放91色在线观看| 亚洲天堂高清无码一区| 天天摸天天做天天爽天天舒服| 人成午夜免费大片| 国产熟女在线播放第一页| 欧洲成人综合| 日韩欧美一区二区精品久久| 免费国产一级 片内射老| 97国产成人无码精品久久久| 一本色道久久综合狠狠躁小说| 一本色婷婷| 四虎国产精品永久在线国在线| 欧美 亚洲 日韩 在线综合| 国产成人午夜精品福利| 精品福利一区二区在线观看| 国产-第1页-浮力影院| 九九热视频在线观看精品| 久久人体视频| 4444在线欧美| 午夜福利无码一区二区|