<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      ollama v0.17.6 發布:重大解析修復與 Qwen3.5 完整支持,全鏈路優化模型渲染與工具調用

      0
      分享至




      2026 年 3 月 5 日,Ollama 正式發布了v0.17.6版本。這是一次極具實用價值的改進版本,在保持系統穩定的基礎上,重點修復了多個長期存在的細節性問題,包括GLM-OCR 的 Prompt 渲染錯誤Qwen 3.5 工具調用與解析邏輯, 并帶來了對模型渲染、工具鏈、配置兼容性等方面的進一步完善。

      本篇文章將全面解析 v0.17.6 的變更列表、核心代碼結構調整、測試覆蓋改進及潛在影響,幫助開發者清晰理解此次升級的深度與意義。

      一、版本概覽

      發布日期:2026 年 3 月 5 日
      版本號:v0.17.6
      更新重點:

      1. 1. 修復GLM-OCR模型因 prompt 渲染錯誤導致無法工作的問題

      2. 2. 修復Qwen 3.5模型工具調用的解析與渲染問題

      3. 3. 優化模型配置文件命名兼容,例如Ollama (local)自動遷移為Ollama

      4. 4. 移除舊版本imagegenLLM 模型與peak memoryAPI 字段

      5. 5. 引入全新的 Qwen3.5 渲染及解析模塊,全面支持thinking模式

      此次更新共包含12 次提交、修改51 個文件,由 7 名開發人員完成。從 diff 記錄看,涉及到新增代碼超過 3900 行,同時刪除舊邏輯 4010 行,可見是一次覆蓋范圍較大的“重構 + 修復”整合版本。

      二、總體改動組成 1. API 層變化:移除PeakMemory字段

      api/types.go文件中刪除了Metrics結構體中的PeakMemory相關字段與輸出邏輯。
      其原始功能用于在模型推理時統計峰值內存占用,但由于mlx(Memory Layout Executor)層的 API 已移除此項指標,因此不再返回該值。

      舊結構:

      type Metrics struct {
      TotalDuration time.Duration `json:"total_duration,omitempty"`
      PeakMemory uint64 `json:"peak_memory,omitempty"`
      }

      刪除后:

      type Metrics struct {
      TotalDuration time.Duration `json:"total_duration,omitempty"`
      }

      同時刪除了相關的格式化函數formatPeakMemory、控制臺輸出內容,更新后的日志輸出更加簡潔,避免“空指標”誤導用戶。

      這也意味著未來 Ollama 將更聚焦性能時間維度指標,而非硬件狀態統計。

      2. 命令行層更新:移除imagegen運行參數

      cmd/cmd.go文件中刪除了--imagegen標志相關邏輯,不再通過 CLI 參數控制圖像生成模型使用內部 Runner。

      這體現了 v0.17.6 開始逐步統一模型調用接口,將生成型與多模態模型整合至統一 runner 體系中,從設計上簡化用戶調用路徑。

      3. 配置遷移優化:Ollama (local) → Ollama

      在配置管理模塊cmd/config/opencode.go中新增了名稱遷移邏輯,解決了配置兼容問題。
      許多開發者此前使用本地 provider 時,其配置如下:

      {
      "provider":{
      "ollama":{
      "name":"Ollama (local)",
      "npm":"@ai-sdk/openai-compatible",
      "options":{"baseURL":"http://localhost:11434/v1"}
      }
      }
      }

      新版本中,當檢測到Ollama (local)名稱時會自動遷移為Ollama,保證現有配置無需手動修改即可被識別。

      同時,新單元測試驗證邏輯如下:

      • ? 自動遷移本地 provider 名稱。

      • ? 保留自定義 provider 名稱(即不會覆蓋非默認配置)。

      • ? 刪除模型時保留非 Ollama 模型的子項。

      這確保了升級后配置文件兼容性 100%,不會破壞舊有項目結構。

      三、模型解析層全面升級:Qwen 3.5 Parser

      v0.17.6 最為關鍵的更新在于模型解析器部分。
      新增文件model/parsers/qwen35.go(238 行新增)正式引入了Qwen3.5 專屬解析器 Qwen35Parser,取代原有的通用Qwen3Parser

      (1) 核心特性

      • ? 完整支持thinking推理標簽 ...

      • ? 增強對分塊流式輸出的識別能力(跨 token stream 漸進渲染)

      • ? 可區分思考內容(thinking content)與輸出內容(response content)

      • ? 在思考區間不解析 ,避免錯把 reasoning 內部結構誤識別為工具調用

      (2) 狀態機設計

      新增狀態:

      const (
      qwen35ParserStateCollectingThinking
      qwen35ParserStateThinkingDoneEatingWhitespace
      qwen35ParserStateCollectingContent
      )

      解析邏輯以有限狀態機(FSM)形式實現。當遇到 起始標簽進入思考模式,遇到切換到內容模式。
      與此同時,對流式數據的分段處理更加精準,支持不完整的關閉標簽(如+nk>分兩次到達),確保輸出不會斷裂。

      (3) 異常情況處理

      • ? 若 未關閉,自動將后續內容視為思考過程輸出;

      • ? 若 Assistant 消息為續寫(帶 prefill),默認跳過起始思考階段;

      • ? 處理 嵌套、空格、換行符自動剔除,輸出純凈的 reasoning 文本。

      (4) 測試覆蓋 (model/parsers/qwen35_test.go)

      測試文件新增382 行,覆蓋以下場景:

      • ? 工具調用 XML 格式識別;

      • ? 含顯式 標簽的 reasoning 內容提取;

      • ? Assistant 預填充(prefill)場景;

      • ? 思考階段中誤判工具調用;

      • ? 標簽被分片情況;

      • ? 未閉合標簽情況下的安全輸出。

      這些測試使 Qwen 3.5 解析流程從多線程推理到斷流恢復都具備強魯棒性。

      四、模型渲染層優化:全面更新 Qwen3.5 與 GLM-OCR Renderer

      渲染器層:model/renderers/目錄新增了兩大核心組件:

      1.Qwen35Renderer

      文件model/renderers/qwen35.go,新增 389 行。
      該渲染器對應 Qwen3.5 模型 prompt 生成邏輯,旨在讓模型完全遵循 XML 函數調用格式與 思考框架。

      功能亮點:

      • ? 支持 指令區塊嵌入,格式嚴格遵循模型需求;

      • ? 自動拼接系統提示與函數聲明;

      • ? 支持生成 塊,帶

      • ? 邏輯層支持多工具順序調用,多次 塊組裝;

      • ? 思考與輸出完美分離,緊密銜接模型訓練格式。

      渲染示例結構:

      <|im_start|>assistant

      I need to fetch the data first.

      Here is my analysis.



      42

      <|im_end|>
      其他改進:
      • ? 支持useImgTags圖片標記嵌入([img-0], [img-1]),兼容多模態;

      • ? 提供emitEmptyThinkOnNoThink參數,用于未啟用思考模式時補充空 模塊;

      • ? 對工具多次調用場景支持批量寫入;

      • ? 對assistant prefill保留最后階段輸出,不關閉<|im_start|>塊。

      測試文件model/renderers/qwen35_test.go共新增 389 行,涵蓋:

      • ? 多輪對話、函數調用遞歸;

      • ? Back-to-back 工具響應;

      • ? 思考與工具交錯場景;

      • ? Assistant 預填充完整性校驗。

      該模塊的引入使得 Ollama 在多模型推理框架下更貼合阿里 Qwen3.5 推理接口的真實結構。

      2.GLM-OCR Renderer 大幅修復

      文件model/renderers/glmocr.go修改 99 行。
      這次修復針對核心問題:GLM-OCR 模型無法正確渲染帶圖像的 prompt

      更新要點:

      • ? 新增GlmOcrRenderer結構體屬性useImgTags

      • ? 引入內部函數renderContent(),根據配置動態選擇是否添加[img-x]標記;

      • ? 改善 ImageOffset(圖片計數偏移)管理;

      • ? 用戶消息按[img-0][img-1]順序標識多圖輸入;

      • ? 流程中修正原先message.Content與圖片塊拼接順序。

      渲染前后差異:

      舊版輸出(無法識別圖片位):

      <|user|>請識別圖片內容。

      新版輸出(帶多圖標記):

      <|user|>
      [img-0][img-1]請識別圖片內容。

      同時新增glmocr_test.go文件(99 行),驗證包括以下 5 種情況:

      1. 1. 單張圖片;

      2. 2. 多張圖片;

      3. 3. 多輪對話圖像偏移;

      4. 4. 默認模式不添加圖像標簽;

      5. 5. 無圖像場景內容保持一致。

      這意味著以后 GLM-OCR 模型將可以在多圖輸入下穩定進行 OCR 推理,輸出定位將完整無誤。

      3. 渲染器選擇邏輯更新

      model/renderers/renderer.go中更新了模型映射:

      case "qwen3.5":
      renderer := &Qwen35Renderer{isThinking: true, emitEmptyThinkOnNoThink: true, useImgTags: RenderImgTags}
      case "glm-ocr":
      return &GlmOcrRenderer{useImgTags: RenderImgTags}

      即:

      • ? 將原來的Qwen3VLRenderer替換為新的Qwen35Renderer

      • ? 為GLM-OCR渲染器開啟全局圖片標簽選項。

      這使兩個模型在渲染階段均獲得一致的上下文構造與多模態支持。

      五、服務器邏輯補充更新

      server.go中,刪除了CompletionResponse返回體的PeakMemory字段,使 API 輸出與 Metrics 同步調整。
      這確保了傳輸數據更輕量化、字段結構一致。

      六、測試體系增強

      此次更新新增測試覆蓋超過 1000 行,主要針對以下方向:

      • ?配置遷移測試
        確保舊配置自動升級為標準名稱;

      • ?GLM-OCR 多圖輸入測試
        確認每張圖片得到正確索引;

      • ?Qwen3.5 渲染與解析系統測試
        模擬思考場景、函數嵌套、流式數據拼接;

      • ?工具調用與 reasoning 多階段測試
        驗證多工具連續調用的 XML 結構合法性;

      • ?Streaming 行為測試
        分塊輸入下保持狀態一致性。

      針對復雜推理模型,如 Qwen3.5 這種包含 的混合流式結構,此輪測試確保無論在并發推理還是斷流恢復場景下都不丟失內容。

      七、移除舊模型與無效依賴

      本次更新清理了歷史遺留的imagegen LLM模型,以及云模型拉取過程中的存根要求,進一步簡化了部署過程。
      Revert提交中體現了多次回滾與重放操作,表明研發團隊對云端模型加載機制進行深度優化與驗證。

      八、總結與展望

      Ollama v0.17.6 是一次結構性的重要版本更新。它沒有去追求新增功能,而是聚焦于底層穩定性、模型兼容與推理一致性的打磨,體現出平臺從實驗型向工業化過渡的信號。

      核心收益總結:

      1. 1.GLM-OCR修復后,OCR 模型可穩定處理多圖輸入。

      2. 2.Qwen3.5渲染與解析系統配套上線,支持完整 思考標簽鏈路。

      3. 3.配置文件自動遷移,升級成本為零。

      4. 4.API 數據結構簡化,輸出更清晰、兼容性更高。

      5. 5.測試覆蓋度大幅提升,確保行為穩定與準確。

      通過對 v0.17.6 的更新,可以預見 Ollama 在未來版本中將繼續強化多模態與 reasoning 模式集成,為 LLM 本地部署與企業多模型協作提供更堅實的基礎。

      結語

      代碼地址:github.com/ollama/ollama

      Ollama v0.17.6 雖非大版本跳躍,但卻在細節上體現了極高的工程重視度。
      從配置遷移到渲染邏輯,再到工具調用與流式解析,幾乎每個子模塊都在朝著更統一、更可靠、更智能的方向演進。

      我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      特朗普即將訪華,啟程前提了個要求,向中方點名要這個人

      特朗普即將訪華,啟程前提了個要求,向中方點名要這個人

      帶你領略世界風采
      2026-05-08 18:05:23
      EIA:預計霍爾木茲海峽將關閉至5月底 6月逐步恢復通航

      EIA:預計霍爾木茲海峽將關閉至5月底 6月逐步恢復通航

      財聯社
      2026-05-13 00:10:12
      俄軍實戰證明輕機槍不足,中國重裝7.62毫米機槍

      俄軍實戰證明輕機槍不足,中國重裝7.62毫米機槍

      領悟看世界
      2026-05-13 01:28:03
      鬧大了!江蘇女深夜暴打網約車司機,扇到累癱,結局神反轉!

      鬧大了!江蘇女深夜暴打網約車司機,扇到累癱,結局神反轉!

      荊門熱點
      2026-05-13 01:05:03
      《主角》:花彩香懷孕,才是黃正經張光榮聯手坑死胡三元的真兇

      《主角》:花彩香懷孕,才是黃正經張光榮聯手坑死胡三元的真兇

      慫熊劇場
      2026-05-13 03:55:11
      主動投案,南昌軌道交通集團原副總經理凌相國接受審查調查

      主動投案,南昌軌道交通集團原副總經理凌相國接受審查調查

      界面新聞
      2026-05-12 16:10:15
      當年2萬一張的2080Ti,如今還能吊打多少顯卡?

      當年2萬一張的2080Ti,如今還能吊打多少顯卡?

      小柱解說游戲
      2026-05-13 01:51:19
      太尷尬!樓上夫妻生活太猛烈,打擾女兒睡覺,樓下要求9點前做完

      太尷尬!樓上夫妻生活太猛烈,打擾女兒睡覺,樓下要求9點前做完

      譚談社會
      2026-04-20 20:55:32
      兩條公告連發!四川一地計劃改造23個老舊小區

      兩條公告連發!四川一地計劃改造23個老舊小區

      天府觀察
      2026-05-12 21:37:35
      印媒:大尼科巴島將成為中國的噩夢!

      印媒:大尼科巴島將成為中國的噩夢!

      達文西看世界
      2026-05-10 08:28:38
      2017年,78歲鋼琴大師劉詩昆迎娶41歲學生孫穎,6年生了一兒一女

      2017年,78歲鋼琴大師劉詩昆迎娶41歲學生孫穎,6年生了一兒一女

      毒舌小紅帽
      2026-05-11 15:55:18
      熟客不再光顧都是因為啥?網友:這老板掉錢眼里了

      熟客不再光顧都是因為啥?網友:這老板掉錢眼里了

      解讀熱點事件
      2026-05-05 00:05:15
      中山市古鎮鎮古三村黨委原書記區順垣被查

      中山市古鎮鎮古三村黨委原書記區順垣被查

      南方都市報
      2026-05-12 12:00:14
      記者:麥基和斯佩爾曼這倆大爺的態度 北京未來很難過上海這一關

      記者:麥基和斯佩爾曼這倆大爺的態度 北京未來很難過上海這一關

      狼叔評論
      2026-05-13 01:50:16
      地球最強高富帥:25歲繼承90億英鎊,如今掌舵主動甩賣7億英鎊美國地產!

      地球最強高富帥:25歲繼承90億英鎊,如今掌舵主動甩賣7億英鎊美國地產!

      英國那些事兒
      2026-05-12 23:22:58
      美國衛星:中國“羚羊礁”快變成西沙最大“填島”

      美國衛星:中國“羚羊礁”快變成西沙最大“填島”

      世家寶
      2026-05-11 10:25:10
      獨行俠12月回顧:Flagg爆發40分 戴維斯圣誕前連砍66分

      獨行俠12月回顧:Flagg爆發40分 戴維斯圣誕前連砍66分

      籃壇第一線
      2026-05-13 08:19:53
      蔚來4月銷量爆冷:ES8獨攬1.3萬臺,占品牌一半以上!

      蔚來4月銷量爆冷:ES8獨攬1.3萬臺,占品牌一半以上!

      沙雕小琳琳
      2026-05-12 13:52:06
      41歲C羅獲評6.4分:拼盡全力,目睹球隊遭絕平,無緣率隊提前奪冠

      41歲C羅獲評6.4分:拼盡全力,目睹球隊遭絕平,無緣率隊提前奪冠

      側身凌空斬
      2026-05-13 04:13:15
      灰熊球員克拉克去世!年僅29歲!

      灰熊球員克拉克去世!年僅29歲!

      章蠞戶外
      2026-05-13 07:29:07
      2026-05-13 08:47:00
      moonfdd incentive-icons
      moonfdd
      福大大架構師每日一題
      1223文章數 68關注度
      往期回顧 全部

      科技要聞

      谷歌劇透安卓重大升級 Gemini深度集成底層

      頭條要聞

      牛彈琴:印度的大麻煩來了 CNN的報道更是觸目驚心

      頭條要聞

      牛彈琴:印度的大麻煩來了 CNN的報道更是觸目驚心

      體育要聞

      騎士終于玩明白了?

      娛樂要聞

      白鹿風波升級!掉粉20萬評論區淪陷

      財經要聞

      深圳夫妻囤芯片,身家飆漲320億

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      時尚
      本地
      教育
      藝術
      親子

      沒八卦、純素人、不驚艷,可她贏麻了

      本地新聞

      用蘇繡的方式,打開江西婺源

      教育要聞

      600分以下想要本科就業,如何報志愿

      藝術要聞

      這位女攝影師的航拍風景照片,簡直太美了!

      親子要聞

      什么字呢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人午夜激情| 国产av普通话对白国语| 成人午夜精品网站在线观看| 亚洲AV永久无码精品牛牛影视| 人妻丝袜AV中文系列先锋影音| 欧美3p视频在线观看| 欧美色香婷婷影视| 少妇粗大进出白浆嘿嘿视频| chinese国产av| 久久综合网色| 97色色资源站| 日韩中文字幕综合第二页| 草草地址线路①屁屁影院成人| h片免费| 樱花草视频www日本韩国| 国产无遮挡吃胸膜奶免费看| 亚洲男人天堂2022| 一本色道久久综合精品婷婷| 欧洲亚洲色一区二区色99| 国产精品网站在线观看免费传媒| 中文字幕亚洲综合小综合在线| 国产亚洲av嫩草久久| 不卡一区二区国产精品| 亚洲人人综合| 亚洲AV永久无码精品放毛片| 亚洲男人AV天堂午夜在| 欧美在线a| 亚洲综合第一色| 国产成人丝袜网站在线看| 久久精品一区二区东京热 | 日韩av一区二区三区在线| 国模和精品嫩模私拍视频| 被两个19厘米粗大空少双龙| 亚洲免费成人av一区| 五月婷婷丁香| www.youjizz.com国产| 欧美日韩一区二区三区麻豆| 人妻丰满熟AV无码区HD| 免费国产一区二区不卡| 国产免费一区二区三区在线观看 | 精品国产杨幂在线观看福利|