![]()
![]()
當AI真正觸及復雜的工作流,衡量“超級智能”的標準,正從抽象的模型參數,轉向結果交付的穩定性。
作者|周悅
編輯|栗子
4月27日,百度文庫網盤在AI DAY上發布通用智能體GenFlow4.0,并首次集中展示GenFlow融合OpenClaw后的新進展。
這次更新的指向十分明確。一方面,GenFlow4.0試圖讓AI更深地介入Word、Excel、PPT等基礎辦公軟件,更深度打通從內容激發、生成到排版交付的完整鏈條;另一方面,GenFlow在兼容OpenClaw后,將Agent引入個人云端工作區與團隊空間,使AI能夠直接讀取、分析、整理文件,并實質性地參與團隊協作。
![]()
通用智能體GenFlow4.0,圖片來源:百度
這兩個更新分別錨定了不同的痛點。前者旨在擴大單兵作戰的業務半徑,后者則嘗試讓AI沉浸入復雜的文件流與任務流,推動人機之間、甚至多智能體之間的全向協同。
過去兩年,AI行業的主線敘事是“更聰明的模型”,但真實需求正在向實用性收斂。在實際使用中,用戶更關心一份報告能否直接調取數據成稿,或者一堆散落的表格能否一次性轉化為可視化的匯報材料。
當AI真正觸及復雜的工作流,衡量“超級智能”的標準,正從抽象的模型參數,轉向結果交付的穩定性。
1.智能體工作流的現實需求
“超級智能”并不是一個新概念,但在當下的AI競爭中,它正在被賦予不同含義。
OpenAI傾向于塑造“數字勞動力”以接管認知工作;Anthropic押注“科學加速”,期望強AI在生物醫療等領域成倍放大人類的研發效能;Google DeepMind則堅持將AI置于物理現實與科學發現的交叉點,強調其對復雜系統的解析與行動力。
與此同時,圖靈獎得主Yann LeCun多次指出,單純依賴大語言模型,很難實現對物理世界的理解與長期規劃能力。
盡管巨頭們的愿景各異,但行業的共識正逐漸收斂于一組務實的核心能力:理解復雜任務、靈活調用工具、連接數據孤島,并在持續反饋中完成流程閉環。
由此,“智能體工作流(Agentic Workflow)”作為更貼近現實的形態開始顯現。對普通用戶而言,一套能切實把活干完的系統,遠比一個全知的問答機器更有價值。
以“智能體工作流”為坐標系重新審視,百度文庫網盤的演進路線就顯得清晰且必然。文庫天然沉淀了結構化內容與創作場景,網盤則承載著海量的文件資產與協作網絡。當這兩大基本盤被同一套底座打通,AI便不再是一個單點的“內容生成器”,而是一條縱貫“知識檢索、文件處理、結果交付、內容消費”的完整工作鏈條。
GenFlow 4.0兼容 OpenClaw,正是這條鏈路從概念走向執行的關鍵錨點。
這種進化的核心特征,是系統開始掌握“自決權”。百度集團副總裁、個人超級智能事業群總裁王穎告訴「甲子光年」在內媒體,GenFlow 4.0最核心的變化是“把模式選擇收回給模型”。在3.0時代,系統還會將任務模式、記憶模式等選項擺在臺面供用戶挑選。而4.0的邏輯是直接深度理解用戶需求、全自動進行意圖識別與規劃。
這一技術動作的轉變,反映了智能體工作流的關鍵:真正的自動協同,意味著用戶無需再費時思考“何時該調用何種能力”。當系統能夠基于用戶目標,自行判斷是直接生成文本、調用特定工具,還是調度多個已有 Agent 并行運作時,它在形態上就告別了傳統的對話框,轉變為一個自動調度的工作中樞。
換句話說,這種進化讓超級智能得以跳出ChatBot的限制。AI 的運轉中樞不再是聊天記錄,而是轉向了用戶長期沉淀的文件資產。系統扮演的角色演變為一套會判斷、懂分工、能執行的復雜任務網絡。
2.接手辦公的中間工作
做匯報是最典型的辦公場景之一。
尋找資料、撰寫文檔、清洗數據、調整排版,即便有AI輔助生成局部圖文,真正消耗精力的,依然是跨工具的復制粘貼與格式對齊等細節。
GenFlow4.0瞄準的正是這段長期存在的“中間工作”。其核心抓手Office Agent將PPT、Excel、Word統合進一條任務鏈。
例如,在處理行業報告時,Word Agent負責長文生成和編輯,Excel Agent跨格式提取、分析數據并完成計算、制圖、寫公式,PPT Agent則負責最終的內容和視覺呈現。對于用戶而言,文檔、表格和PPT不再需要割裂處理。
為什么GenFlow4.0會把Office能力做深?王穎的判斷很直接:“Office是一個剛需,用戶使用高頻,且對質量要求極高。”因此,百度文庫網盤不是在給辦公軟件疊加一個聊天入口,而是把AI推向錯誤成本更高、也更接近交付結果的環節。
具體到功能層面,PPT Agent區分了專業與創意模式,以適應嚴肅匯報或視覺展示,并可以一鍵排版美化,在遵循原始內容的基礎上優化視覺、版式、層級;Excel Agent提供了基于自然語言的數據提取、圖表繪制、公式計算;Word Agent則在萬字長文生成以外,將觸角延伸至排版、校對與格式統一。
GenFlow4.0 PPT創意模式,視頻來源:百度
GenFlow4.0 Excel生成,視頻來源:百度
單項功能或許并不炫技,但被整合進連續的任務鏈后,AI 的角色從提供點子進化為把控交付。
另一方面,GenFlow兼容OpenClaw則為中小團隊協作提供了新解法。
面對當下大量的三五人小團隊或者一人公司(OPC),他們不需要繁冗的考勤報銷系統,更渴求單純的生產力提升。
網盤推出了“獨立工作區”功能。用戶授權文件夾后,AI可直接在云端分析、整理并回寫數據,輔以歷史版本記錄以控制操作風險。同時,用戶可一鍵部署7×24小時在線的Agent,電腦手機絲滑聯動,并調用各項專業Skills。
GenFlow兼容OpenClaw后的文件總結和分析,視頻來源:百度
為驗證這套模式的可行性,百度網盤目前已在千余家組織中進行灰度測試,吸引了超6000家企業與24萬開發者入駐。這種協作模式在攝影、傳媒、營銷等“任務雜、鏈路長”的行業中效果尤為明顯。
以品牌傳播為例,一場活動結束后的數百張原片,如今可通過指令觸發多個數字員工并行處理,完成人臉歸類、剔除廢片、風格修圖并匹配新聞稿,將原本耗時一天的多人協作壓縮至數分鐘。在短劇出海等場景中,這種并行處理同樣將長達數周的工作流縮短至小時級。
GenFlow兼容OpenClaw后的短劇工作流,視頻來源:百度
GenFlow兼容OpenClaw后的電商工作流,視頻來源:百度
這種效率提升的前提,是底層數據的無縫流轉。百度個人超級智能事業群國內業務部負責人鐘昊指出:“這套機制能跑通,核心在于‘無感的數據同步’。用戶不需要先把幾GB的東西下載下來,再漫長地傳到另一個剪輯軟件上。打通云端與本地后,系統直接在虛擬環境中調度各項工具開始干活。”
3.從能力突圍到系統工程
如果說GenFlow4.0和其兼容OpenClaw展示的是“AI如何開始干活”,那么更深層的問題是:為何是在當下發生?
答案并非單一模型的技術突變,而是整套基礎架構長期疊加的結果。
首先是豐富的業務數據。在大模型語境中,數據通常被理解為訓練語料,但在文庫和網盤的場景里,數據更接近于工作現場。
目前,百度文庫擁有超18億份專業文檔,百度網盤服務超10億用戶,使用空間總和超1000億GB;整個GenFlow的月活用戶已超過1億。文庫對應公域知識,網盤對應私域資產,兩者的交匯為AI構筑了具備充足上下文的真實任務環境。
其次是系統調度能力。滄舟OS扮演了樞紐角色,它將分散的資料、記憶與數百項Agent能力統合,賦予了系統在知識庫、編輯器與工具間平滑切換的執行力。
同時,精準的執行能力離不開底層記憶與調度機制。百度個人超級智能事業群應用研發負責人楊在申告訴「甲子光年」,系統提取了包括用戶畫像、上下文邏輯、全域興趣印記在內的三層信息。基于這些數據,系統通過算法進行意圖切分,從而在控制算力消耗的同時,讓AI真正做到“懂你要什么”。
這種底層系統工程的構建與產品路徑的演變,并非一蹴而就。從去年4月GenFlow1.0試水多智能體協作,到2.0打通跨端生態,再到3.0強化全局記憶,直至如今4.0強化Office執行、全向協作。
“這個產品路線圖從來沒有變化,”王穎強調,“團隊一開始想做的就是通用AI,只是受限于模型和工具演進,沒有辦法一步走到那。”在她看來,從內容生成到 Office執行,是沿著用戶需求持續推進的必然結果。
最后,是真實用戶驗證。國民級應用的龐大基數,構成了天然的復雜任務測試場。根據公開數據,文庫智能PPT突破3400萬的月訪問量,網盤AI筆記上線首月的500萬用戶,這些非標、含糊且極具個性化的真實交互,持續反向驅動著系統調優,逼近可交付的工業狀態。
今年年初,百度對內部組織架構進行調整,成立了個人超級智能事業群(PSIG),文庫網盤的業務協同被提升至新的戰略高度。在王穎看來,升級為獨立BG后,最大的變化在于戰略格局的打開。資源的充沛與決策的獨立,讓團隊能以更清晰的路徑向“通用智能體”這一終局持續迭代。
在這個通往終局的競技場上,各大Chatbot應用都在將服務鏈路做寬;而百度的路徑,則是憑借數據資產壁壘,從垂直場景做深做厚,把服務鏈條打磨到極致。
讓AI真正融入工作流,是數據、系統架構、產品定力與真實場景共同作用的綜合工程。這也印證了行業的風向邏輯:當技術脫離了參數競賽,決定超級智能能走多遠的,終究是它在真實生態系統中長效運轉的能力。
(封面圖:AI生成)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.