![]()
![]()
![]()
RAGFlow v0.25.0 于 2026年4月21日發(fā)布,這是一次覆蓋范圍非常廣的版本更新,幾乎橫跨了從文檔接入、解析、同步、Agent 能力、界面國(guó)際化、模型生態(tài)、移動(dòng)端適配、存儲(chǔ)與數(shù)據(jù)庫升級(jí),到安全修復(fù)、CLI、Go 服務(wù)、API 重構(gòu)等多個(gè)核心方向。對(duì)于已經(jīng)在使用 RAGFlow 的團(tuán)隊(duì)來說,這個(gè)版本不僅帶來了能力增強(qiáng),也帶來了大量穩(wěn)定性優(yōu)化、兼容性升級(jí)和安全加固。
一、Ingestion Pipeline:解析管道全面增強(qiáng),模板更豐富,解析能力更強(qiáng)
本次版本在 Ingestion Pipeline 方向的變化非常顯著。最核心的更新之一,就是新增了 7 個(gè)內(nèi)置 pipeline 模板,并且這些模板與 RAGFlow 原生文檔解析器保持一致。相比之前單一或通用化的處理方式,這次新增模板明顯提升了可配置性和落地效率。
同時(shí),官方也明確提到:多個(gè)新模板帶來了顯著的解析改進(jìn)。這意味著在實(shí)際使用過程中,文檔進(jìn)入知識(shí)庫前的結(jié)構(gòu)識(shí)別、內(nèi)容切分、格式保持等能力都將得到增強(qiáng)。
除此之外,本次版本還對(duì) ingestion pipeline UI 做了更新,并且加入了preprocess 預(yù)處理能力。官方后續(xù)還進(jìn)一步補(bǔ)充了pipeline add preprocess、add preprocess parameters for ingestion pipeline等更新,說明預(yù)處理并不是簡(jiǎn)單的 UI 微調(diào),而是已經(jīng)進(jìn)入了可配置、可擴(kuò)展的管道能力中。
本版本還包括以下 pipeline 相關(guān)改進(jìn):
? pipeline 支持 preprocess 參數(shù)
? pipeline 支持 ONE chunking method
? pipeline parser 文檔支持補(bǔ)充
? pipeline support doc for parser in word
? pipeline 支持關(guān)閉 VLM parsing 的按鈕
? pipeline 中增加音視頻支持修復(fù)
? pipeline 中 markdown parser 修復(fù)
? pipeline canvas category 修復(fù)
? pipeline template 更新
? pipeline parser log 顯示修復(fù)
? pipeline page 樣式優(yōu)化
? Refact pipeline
? Refact update pipeline template
這些更新說明,RAGFlow 在 ingestion 層已經(jīng)不只是“能導(dǎo)入”,而是在向“可控、可定制、可調(diào)優(yōu)”的方向繼續(xù)推進(jìn)。
二、Data Sources:新增多種數(shù)據(jù)源,支持刪除同步,連接器能力更完整
RAGFlow v0.25.0 在數(shù)據(jù)源能力上擴(kuò)展非常明顯。官方新增的數(shù)據(jù)源包括:
? Seafile
? RSS
? DingTalk AI Sheet
其中,Seafile 還新增了庫和目錄同步范圍支持,RSS 也正式進(jìn)入數(shù)據(jù)源支持范圍,DingTalk AI Sheet 則進(jìn)一步拓展了企業(yè)常見協(xié)作數(shù)據(jù)的接入場(chǎng)景。
除了新增數(shù)據(jù)源,這一版本還加入了一個(gè)非常實(shí)用的能力:支持從數(shù)據(jù)源同步文件刪除。
這意味著數(shù)據(jù)源側(cè)的刪除動(dòng)作不再被忽略,知識(shí)庫內(nèi)容可以更準(zhǔn)確地與源端保持一致。
圍繞數(shù)據(jù)源與同步,更新還包括:
? 支持 Google Drive 優(yōu)化
? 支持 Jira 增量更新遺漏問題修復(fù)
? 支持 MySQL/PostgreSQL 增量同步字段暴露
? 支持 Seafile 庫與目錄同步范圍
? 支持?jǐn)?shù)據(jù)源更新后重新切塊
? 支持?jǐn)?shù)據(jù)源同步刪除文件
? 支持 WebDAVConnector 注冊(cè)
? 支持文件類型校驗(yàn)
? 支持文件夾上傳
? 支持文件相關(guān)功能補(bǔ)齊
? 支持 file ancestor directory lookup
? 支持 file list API 重構(gòu)
? 支持 list files 修復(fù)
在同步場(chǎng)景下,這些能力意味著 RAGFlow 對(duì)企業(yè)知識(shí)來源的覆蓋正在進(jìn)一步擴(kuò)張,尤其是針對(duì)協(xié)作平臺(tái)、網(wǎng)盤、表格和持續(xù)同步場(chǎng)景,實(shí)用性很強(qiáng)。
三、DOCX 與其他解析能力:更省內(nèi)存、更穩(wěn)定、更適合大文檔
v0.25.0 對(duì)文檔解析內(nèi)部實(shí)現(xiàn)也做了明顯優(yōu)化,尤其是 DOCX 解析策略。
官方明確提到:DOCX parsing strategy with lazy-load support for images,減少內(nèi)存消耗。
后續(xù)提交記錄中也有多處相關(guān) refactor,包括:
? lazy-load DOCX images to reduce peak memory without changing output
? unified lazy image loading for Docx parsers
? excel use lazy image loader
? refactor word parser lazy image loader
這說明圖片懶加載已經(jīng)成為文檔解析體系的重要方向。對(duì)大文檔、包含大量圖片的 Word/Excel 文件來說,這種改動(dòng)通常意味著更低的峰值內(nèi)存、更平穩(wěn)的處理過程,以及更少的加載壓力。
此外,本版本還修復(fù)和增強(qiáng)了大量解析相關(guān)問題:
? PDF 絕對(duì)頁索引混淆問題修復(fù)
? garbled PDF text 自動(dòng) fallback 到 OCR
? MinerU 的坐標(biāo)上下顛倒修復(fù)
? Paddle OCR 缺失輪廓修復(fù)
? PDF chunking 參數(shù)名修正
? markdown table double extraction 修復(fù)
? html heading mapping 修正
? image PDF in ingestion pipeline 修復(fù)
? epub parsing 支持
? Docling parser return type hint 修復(fù)
? external Docling server via DOCLING_SERVER_URL 支持
? respect chunk_token_num for MinerU/docling/paddleocr parsers
? fixed parsing status recovery after transient errors
? document parsing status check logic 修正
整體來看,v0.25.0 的文檔解析更偏向“生產(chǎn)環(huán)境可用性強(qiáng)化”,尤其是在異常恢復(fù)、OCR 回退、圖片處理、內(nèi)存控制和不同解析器協(xié)同方面。
四、Agent:發(fā)布能力上線,沙箱執(zhí)行、圖表生成、數(shù)據(jù)分析模板與記憶系統(tǒng)增強(qiáng)
Agent 是這次版本最值得關(guān)注的模塊之一。
1. Agent 發(fā)布能力正式引入
官方明確新增了:agent publishing capability。
這意味著 Agent 不再只是內(nèi)部配置或調(diào)試產(chǎn)物,而是可以進(jìn)入更完整的發(fā)布流轉(zhuǎn)。
對(duì)應(yīng)的更新還包括:
? published agent version control
? agent 版本歷史展示發(fā)布狀態(tài)
? agent application can not show Cite 修復(fù)
? agent 不能發(fā)布的問題修復(fù)
? agent embedded page 與移動(dòng)端兼容
? agent embedded page 不再跳轉(zhuǎn)登錄頁問題修復(fù)
? agent 模板標(biāo)題中文模式顯示問題修復(fù)
? agent form sheet 被 log sheet 遮擋問題修復(fù)
? agent exploration 頁面空對(duì)話框報(bào)錯(cuò)修復(fù)
? agent page 樣式優(yōu)化
? agent log 導(dǎo)出
? agent log time 可選問題修復(fù)
? agent log 增加 user_id
? agent application embedded page 支持隱藏下載按鈕
版本中明確寫到:Sandboxed code execution and chart generation。
同時(shí)安全層面也有重要升級(jí):
? Adopt Jinja2 SandboxedEnvironment for template rendering
? fix security vulnerability using SandboxedEnvironment
? sandbox cannot accept large args list 修復(fù)
? sandbox import error 修復(fù)
? sandbox attachment metadata 問題修復(fù)
? sandbox do not attach attachment metadata 修復(fù)
? sandbox 中中文轉(zhuǎn)英文翻譯處理
這說明 Agent 的代碼執(zhí)行與模板渲染在安全性上被進(jìn)一步加固。
3. 新模板:Data Analysis Agent
官方新增了一個(gè)非常重要的模板:Data Analysis Agent。
結(jié)合 sandbox、chart generation、code execution,可以看出這個(gè)模板不是簡(jiǎn)單的聊天模板,而是面向數(shù)據(jù)分析任務(wù)的完整 Agent 能力組合。
4. 記憶系統(tǒng)增強(qiáng)
版本說明中提到:Memory: ddded user-level memory storage and retrieval.
后續(xù)更新又補(bǔ)充了:
? record user_id in memory
? OceanBase memory get_aggregation
? OceanBase memory get_highlight
這表明 RAGFlow 在記憶層面已經(jīng)開始更加細(xì)粒度地支持用戶級(jí)存儲(chǔ)與檢索,同時(shí)也對(duì)不同存儲(chǔ)后端的能力進(jìn)行適配。
五、語言與界面:新增阿拉伯語、保加利亞語、土耳其語,支持 RTL
v0.25.0 的國(guó)際化和 UI 方向也非常強(qiáng)。
新增語言支持包括:
? Arabic
? Bulgarian
? Turkish
同時(shí),官方明確寫到:UI now supports Right-to-Left (RTL) layout。
這對(duì)于阿拉伯語等從右向左閱讀的語言尤為關(guān)鍵,說明 RAGFlow 在真正走向多語言全球化界面支持。
對(duì)應(yīng)的更新還包括:
? enable Arabic in production UI
? complete Arabic documentation
? Add Bulgarian language support
? add Turkish language support
? complete Turkish localization
? Turkish README translation
? remove duplicate “arabic” key in French translations
? on-demand import of i18n language pack
? language configuration moved to web/.env
? standard language codes and time zones unified
? replace hardcoded English strings with i18n in floating chat widget
? embedded dialog text translation
? global navigation bar style adjustment
? chat page style optimization
? dataset page styles adjustment
? knowledge graph、chunk、metadata、agent log styles update
可以看出,這次升級(jí)不只是增加語言包,而是從布局、組件、配置方式到文案國(guó)際化都進(jìn)行了較為系統(tǒng)的整理。
六、模型與 Provider:支持更多模型生態(tài),模型提供商持續(xù)擴(kuò)展
RAGFlow v0.25.0 在模型層面的擴(kuò)展也非常值得關(guān)注。官方這次新增了多種模型與 Provider 支持,說明系統(tǒng)正在進(jìn)一步向“多模型、可插拔、跨生態(tài)”的方向演進(jìn)。
本次更新中比較明確的新增包括:
? support Anthropic Claude models
? support ZhipuAI
? support Mistral
? support yandex models
? support Jina embeddings
? support Qwen3 series models
? support GPT-4o-mini
? support GPT-4.1
? support DeepSeek OCR model
? support nv-embed models
? support more embedding/rerank/LLM options
從實(shí)際意義來看,這類更新有三個(gè)層面的價(jià)值:
1. 模型選擇更靈活
不再局限于單一廠商或少數(shù)幾類模型,用戶可以根據(jù)任務(wù)類型、成本、語言能力、推理速度和部署環(huán)境靈活選擇。
2. 生態(tài)兼容性更強(qiáng)
新增 Anthropic、ZhipuAI、Mistral、Yandex 等支持,意味著 RAGFlow 對(duì)國(guó)際與本土模型生態(tài)的適配能力更成熟。
3. 檢索鏈路能力更完整
Jina embeddings、nv-embed 等能力的加入,會(huì)直接影響向量化、召回效果和檢索質(zhì)量,對(duì) RAG 系統(tǒng)本身是非常關(guān)鍵的增強(qiáng)。
此外,更新中也包括:
? model provider configuration improvements
? provider UI updates
? model option display fixes
? selected model persistence improvements
? API model and provider refactoring
這說明模型層不僅在“支持更多”,也在“配置更清晰、切換更順暢、顯示更合理”。
七、存儲(chǔ)與數(shù)據(jù)庫:OceanBase、SQLite、Redis 等后端適配繼續(xù)深化
這次版本在底層存儲(chǔ)和數(shù)據(jù)庫支持上同樣有不少動(dòng)作,說明 RAGFlow 正在進(jìn)一步適應(yīng)企業(yè)級(jí)部署和多環(huán)境落地。
比較重要的方向包括:
? support OceanBase for memory aggregation/highlight
? support SQLite batch update
? support Redis config isolation
? support Redis lock
? support mysql/postgresql incremental sync exposure
? database schema adjustments
? vector storage related fixes
? storage migration related fixes
這些更新的意義在于:
1. 更適合企業(yè)部署
OceanBase、MySQL、PostgreSQL、Redis 等都是常見企業(yè)環(huán)境組件,支持范圍越廣,落地阻力越小。
2. 高可用與同步能力更穩(wěn)
Redis lock、配置隔離等改動(dòng),通常意味著并發(fā)控制和多環(huán)境部署會(huì)更可靠。
3. 數(shù)據(jù)處理效率更高
SQLite batch update、增量同步字段暴露等優(yōu)化,直接關(guān)系到批處理效率和同步準(zhǔn)確性。
八、API、CLI、Go 服務(wù)與架構(gòu)重構(gòu):平臺(tái)化能力持續(xù)增強(qiáng)
從這次更新的提交內(nèi)容來看,RAGFlow 內(nèi)部架構(gòu)也在做比較大規(guī)模的整理。
API 與接口重構(gòu)
包括:
? api refactor
? file list API refactor
? model and provider API refactor
? prompt API fix
? agent API improvements
? dashboard API fixes
? workflow API related fixes
這類變化通常意味著接口邊界在重新梳理,有利于后續(xù)功能擴(kuò)展和前后端協(xié)同。
CLI 與運(yùn)維能力
官方提到:
? CLI import assistant
? CLI app improvements
? CLI related fixes
這說明 RAGFlow 正在加強(qiáng)命令行部署、導(dǎo)入和運(yùn)維可控性,對(duì)自動(dòng)化部署和批量管理很有幫助。
Go 服務(wù)
版本中還出現(xiàn)了:
? go service fixes
? go service runtime related improvements
這意味著系統(tǒng)內(nèi)部可能仍在推進(jìn)部分服務(wù)化、性能優(yōu)化或解耦改造。
九、安全修復(fù):本次版本非常重要的升級(jí)重點(diǎn)之一
如果說前面很多是“能力升級(jí)”,那安全修復(fù)就是 v0.25.0 另一條非常重要的主線。
本次更新里,安全相關(guān)內(nèi)容非常明確:
? fix security vulnerability using SandboxedEnvironment
? use sandboxed Jinja2 environment
? validate file type and URL more strictly
? prevent unsafe template rendering
? disable risky behavior in sandbox execution
? fix permission and access control related issues
尤其是模板渲染和沙箱執(zhí)行這部分,通常都是 RAG/Agent 系統(tǒng)里比較敏感的安全面。
官方顯然對(duì)這部分做了專門加固,這對(duì)于企業(yè)部署非常關(guān)鍵。
十、其他值得注意的體驗(yàn)優(yōu)化與修復(fù)
除了以上大模塊,v0.25.0 還包含大量“看似細(xì)碎、實(shí)則很影響體驗(yàn)”的修復(fù)和優(yōu)化,例如:
? mobile adaptation improvements
? embedded page style fixes
? floating chat widget style and i18n improvements
? knowledge graph UI fixes
? token/page count display fixes
? import/export edge cases fixed
? pagination and sorting optimizations
? log display improvements
? empty state and error handling improvements
? versioning and history UI fixes
這些更新整體上會(huì)讓系統(tǒng)更穩(wěn)定、更順手,也更適合真實(shí)業(yè)務(wù)場(chǎng)景長(zhǎng)期使用。
總結(jié):v0.25.0 是一次“平臺(tái)化”味道很強(qiáng)的版本
代碼地址:github.com/infiniflow/ragflow
整體來看,RAGFlow v0.25.0 不只是一次常規(guī)迭代,而是一次非常明顯的能力擴(kuò)張:
?文檔接入更強(qiáng):pipeline、preprocess、解析器、OCR、DOCX/Excel 懶加載全面增強(qiáng)
?數(shù)據(jù)源更廣:Seafile、RSS、DingTalk AI Sheet 等新增接入
?Agent 更完整:發(fā)布、版本管理、sandbox、數(shù)據(jù)分析模板、圖表生成、記憶系統(tǒng)都更成熟
?國(guó)際化更徹底:新增阿拉伯語、保加利亞語、土耳其語,并支持 RTL
?模型生態(tài)更開放:Claude、ZhipuAI、Mistral、Yandex、Qwen3 等持續(xù)擴(kuò)展
?底層更穩(wěn):數(shù)據(jù)庫、存儲(chǔ)、API、CLI、Go 服務(wù)、安全都在持續(xù)強(qiáng)化
我們相信人工智能為普通人提供了一種“增強(qiáng)工具”,并致力于分享全方位的AI知識(shí)。在這里,您可以找到最新的AI科普文章、工具評(píng)測(cè)、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.