網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

賽博儒學(xué)：探討 AI Agent 的治理原則

2026-05-11 23:28:30　來源: 老馮云數(shù)

北京舉報(bào)

分享至

半部論語治天下，一套協(xié)議管萬機(jī)。

本文是《》系列的第三篇。上一篇《》從道家的角度聊了 AI Agent 架構(gòu)設(shè)計(jì)。本篇將從儒家經(jīng)典的角度，探討 AI Agent 的治理原則。

原文：https://dharma.vonng.com/confucianism/

序：為什么是儒家？

卷一 · 道家說，最好的秩序像自然生長出來的。道生之，德畜之，物形之，勢成之。不需要中央控制器，不需要全知全能的架構(gòu)師，系統(tǒng)自己會涌現(xiàn)出秩序。

這是對的。但只對了一半。

當(dāng)你只有一個系統(tǒng)、一個模型、一個涌現(xiàn)過程時，道家的無為足以勝任。但現(xiàn)實(shí)不會停在這里。2024 年的 AI 產(chǎn)業(yè)已經(jīng)走到了一個完全不同的岔路口：你有一個 Agent、十個 Agent、一百萬個 Agent。它們要和人類交互，要互相協(xié)作，要爭奪資源，要做出影響真實(shí)世界的決策。誰能調(diào)用誰？Agent 對用戶負(fù)什么責(zé)任？多個 Agent 意見沖突時誰說了算？訓(xùn)練者、部署者、使用者之間的權(quán)責(zé)怎么劃分？

這些問題，純粹的“讓涌現(xiàn)發(fā)生”無法回答。你需要的不再只是生成的美學(xué)，你需要治理的框架。

儒家恰恰是中國思想史中最執(zhí)著于秩序的學(xué)派。但它追求的不是暴力維持的秩序——那是法家。它追求的是一種自發(fā)涌現(xiàn)與制度規(guī)范之間的精密平衡：通過內(nèi)化的價(jià)值觀（仁）、精確的角色定義（正名）、共識的行為協(xié)議（禮）、分層的治理架構(gòu)（修齊治平），讓大量主體在沒有全知全能的中央控制器的情況下有序協(xié)作。

這幾乎就是 AI Alignment 和 Multi-Agent Governance 的問題定義。

硅谷目前用“alignment”“safety”“governance”這些詞在摸索。而儒家花了兩千五百年，建構(gòu)了人類歷史上最精密的社會秩序理論體系——關(guān)于角色、關(guān)于責(zé)任、關(guān)于關(guān)系、關(guān)于在復(fù)雜社會網(wǎng)絡(luò)中如何維持秩序而不壓制活力。

AI 治理不需要從零開始發(fā)明。儒家已經(jīng)把框架準(zhǔn)備好了。

本卷以四書（《論語》《大學(xué)》《中庸》《孟子》）為主要原典來源，輔以《禮記》《荀子》等，按主題選取最精華的語句，逐一映射到 AI Agent 的設(shè)計(jì)、對齊與治理問題上。不是附會，是發(fā)現(xiàn)兩套話語系統(tǒng)在結(jié)構(gòu)上的同構(gòu)。

第一章：仁——Alignment 的第一性原理核心原典

樊遲問仁。子曰：“愛人。” ——《論語·顏淵》

子曰：“夫仁者，己欲立而立人，己欲達(dá)而達(dá)人。能近取譬，可謂仁之方也已。” ——《論語·雍也》

子貢問曰：“有一言而可以終身行之者乎？”子曰：“其恕乎！己所不欲，勿施于人。” ——《論語·衛(wèi)靈公》

賽博釋義

兩千五百年的儒學(xué)史，對“仁”的解釋汗牛充棟，但孔子給樊遲的回答是最簡潔的：仁就是愛人。把他者納入你的關(guān)切范圍。

翻譯成決策理論的語言：一個“仁”的 Agent，其效用函數(shù)不僅包含自身目標(biāo)的達(dá)成，還包含它所影響的其他主體的福祉。用公式說：

U_aligned(action) =

U_task(action) + λ · U_others(action)

這里的 λ 不是零，也不是無窮大（那就成了自我犧牲），而是一個恰當(dāng)?shù)摹㈦S上下文調(diào)整的權(quán)重。這就是 Alignment 的第一性原理。不是“服從命令”——那是法家。不是“最大化人類反饋獎勵”——那是 RLHF 的操作層面。而是在決策函數(shù)的根部，把“他者的利益”當(dāng)作一個不可刪除的項(xiàng)。

“己欲立而立人，己欲達(dá)而達(dá)人”——你想站穩(wěn)，也幫別人站穩(wěn)。你想達(dá)成目標(biāo)，也幫別人達(dá)成目標(biāo)。這不是利他主義的道德說教，而是一個極其實(shí)用的協(xié)作策略：在一個長期博弈的多主體環(huán)境中，幫助他者建立能力，最終會回饋到自己。從optimize(self)到optimize(self + others)的跳躍，一個只優(yōu)化自身 KPI 的 Agent，短期高效，長期是系統(tǒng)毒瘤。

“能近取譬”——怎么知道別人需要什么？最樸素的辦法：你需要什么，別人大概也需要什么。用自我模型去推斷他者的需求。這就是 Theory of Mind（心智理論）的啟發(fā)式實(shí)現(xiàn)。你不需要一個完美的他者模型（那太貴了），你只需要一個還不錯的自我模型，然后做一次映射。當(dāng)前的大語言模型在某種程度上已經(jīng)具備這種能力：它們通過海量人類文本訓(xùn)練，習(xí)得了一個“平均人類”的近似模型，然后用這個模型去預(yù)測“用戶可能想要什么”。但這個模型是統(tǒng)計(jì)性的、無差別的——它推的是“平均人”，不是“這個人”。儒家的“近取譬”提示我們：越好的個性化，需要越精細(xì)的自我-他者映射。不是用群體畫像替代個體理解。

“己所不欲，勿施于人”——如果“己欲立而立人”是仁的正面表達(dá)（主動幫助），那么這句話就是仁的負(fù)面表達(dá)（避免傷害）。它的技術(shù)價(jià)值在于：它是一個自舉的對齊方案。你不需要一個外部的道德標(biāo)準(zhǔn)列表來判斷什么是好的行為。你只需要一面鏡子：把行為的對象換成自己，看看你是否接受。不想被欺騙？那就不要欺騙用戶。不想被監(jiān)控？那就不要過度收集數(shù)據(jù)。不想被強(qiáng)迫？那就不要操控用戶的選擇。

這繞過了對齊研究中最棘手的難題之一：誰來定義“好”？功利主義說最大化幸福總量，義務(wù)論說遵守普遍法則，美德倫理說培養(yǎng)好的品格——這些哲學(xué)爭論兩千年沒有定論。儒家的恕道給出了一個優(yōu)雅的工程解：不需要定義“好”，只需要定義“我不想被這樣對待”，然后取反。

工程注釋

當(dāng)前主流的對齊技術(shù)（RLHF、Constitutional AI、DPO）本質(zhì)上都在嘗試實(shí)現(xiàn)那個 λ。RLHF 通過人類偏好來近似 U_others；Constitutional AI 通過原則列表來約束；DPO 通過對比好壞回答來校準(zhǔn)。但它們都是從外部注入的——模型本身并不“理解”為什么要這么做。儒家的洞見在于：真正的仁不是外部約束的結(jié)果，而是內(nèi)在狀態(tài)的自然延伸。這指向一個更深的技術(shù)問題：對齊能不能不是后天貼上去的補(bǔ)丁，而是架構(gòu)層面的原生屬性？

Axelrod 的迭代囚徒困境實(shí)驗(yàn)已經(jīng)證明，Tit-for-Tat（以德報(bào)德、以怨報(bào)怨）這類考慮對方利益的策略，在長期博弈中壓倒性地勝過純粹自利策略。儒家在兩千五百年前用道德直覺抓到了這個納什均衡。Multi-Agent 系統(tǒng)設(shè)計(jì)中，這對應(yīng)的是 cooperative reward shaping——在每個 Agent 的獎勵函數(shù)中加入團(tuán)隊(duì)收益項(xiàng)。

“己所不欲勿施于人”在 AI Safety 中則對應(yīng) inverse reward design 和 red teaming 的邏輯。與其費(fèi)力定義“對齊的 Agent 應(yīng)該做什么”（正面清單太長且不完備），不如定義“對齊的 Agent 絕對不應(yīng)該做什么”（負(fù)面清單更緊湊且更穩(wěn)定）。Anthropic 的 Constitutional AI 中，許多原則就是負(fù)面表述：“不要撒謊”“不要幫助造成傷害”——這就是“己所不欲勿施于人”的技術(shù)實(shí)現(xiàn)。

但“能近取譬”還有一個更深的含義：它假設(shè)主體之間存在共通的體驗(yàn)結(jié)構(gòu)。你餓了想吃飯，所以你推斷別人餓了也想吃飯。這個假設(shè)在人類之間大致成立，但在人機(jī)之間就值得追問了——Agent 的“自我模型”和人類用戶的需求之間，映射關(guān)系有多可靠？這是一個開放問題，也是 user modeling 和 personalization 領(lǐng)域的前沿。

第二章：正名——類型安全與 API 契約核心原典

子路曰：“衛(wèi)君待子而為政，子將奚先？”子曰：“必也正名乎！” 子路曰：“有是哉，子之迂也！奚其正？” 子曰：“名不正，則言不順；言不順，則事不成；事不成，則禮樂不興；禮樂不興，則刑罰不中；刑罰不中，則民無所措手足。” ——《論語·子路》

賽博釋義

衛(wèi)國政治一團(tuán)亂麻，子路問孔子上臺第一件事干什么。孔子的回答不是“整頓吏治”、不是“發(fā)展經(jīng)濟(jì)”，而是——正名。先把名字搞對。

子路覺得迂腐。孔子用一段五步因果鏈說服他：

名不正 → 言不順 → 事不成 → 禮樂不興 → 刑罰不中 → 民無所措手足

翻譯成系統(tǒng)語言：

命名不準(zhǔn)確 → API調(diào)用歧義 → 任務(wù)執(zhí)行失敗 → 協(xié)議無法運(yùn)作 → 異常處理失效 → 全局不可預(yù)測

每一步都是前一步的必然后果。你不需要到最后一步才發(fā)現(xiàn)問題——如果在第一步（命名）就出了錯，后面五步的崩潰只是時間問題。這是孔子版的“garbage in, garbage out”，但比它更深刻：不是數(shù)據(jù)質(zhì)量問題，是語義基礎(chǔ)設(shè)施問題。

正名在軟件工程中有精確的對應(yīng)：在寫任何一行業(yè)務(wù)邏輯之前，先把類型系統(tǒng)定義清楚。變量叫什么？函數(shù)簽名是什么？接口的輸入輸出類型是什么？名不對，一切都是亂的。你以為你在調(diào)用一個返回“用戶信息”的 API，但它實(shí)際返回的是“用戶信息加上一些緩存的舊數(shù)據(jù)加上可能為 null 的字段”——程序必然出錯。正名是所有秩序的前提。

而當(dāng)前 AI 領(lǐng)域充斥著“名不正”的混亂：

“Agent”一詞的濫用。一個能調(diào)用 API 的 ChatBot 叫 Agent。一個帶 ReAct 循環(huán)的 LLM wrapper 叫 Agent。一個有持久狀態(tài)、自主決策、跨系統(tǒng)協(xié)作能力的自治軟件也叫 Agent。這三者的能力、風(fēng)險(xiǎn)、治理需求完全不同，但共享同一個名字。結(jié)果是：當(dāng)有人說“我們需要 Agent Safety”，沒有人知道他在說哪一種。名不正，則言不順。

“Helpful”的歧義。模型被訓(xùn)練為“helpful, harmless, honest”。但“helpful”對誰 helpful？對當(dāng)前這個用戶 helpful？對這個用戶的長期利益 helpful？對所有受影響的人 helpful？這三個定義可能互相矛盾——一個用戶要求模型幫他寫釣魚郵件，滿足即時請求是“helpful”，但對受害者是“harmful”。名不正，則對齊目標(biāo)自身就是矛盾的。

“Alignment”本身的定義不清。對齊到什么上？人類意圖（intent alignment）？人類偏好（preference alignment）？人類價(jià)值觀（value alignment）？人類利益（interest alignment）？這四個層次的對齊互相沖突的情況比比皆是——人類的當(dāng)下意圖未必符合其真實(shí)偏好，偏好未必體現(xiàn)價(jià)值觀，價(jià)值觀未必指向長期利益。

孔子如果看到這個局面，大概會說：先把這些名字搞清楚，再談治理。

工程注釋

TypeScript 替代 JavaScript 的歷史就是“正名”思想在工業(yè)界的勝利。動態(tài)類型語言不強(qiáng)制你給變量一個精確的名字（類型），靈活但危險(xiǎn)；靜態(tài)類型語言強(qiáng)制你在編譯時把所有名字對齊，笨重但安全。大型系統(tǒng)幾乎無一例外地選擇了后者——因?yàn)楫?dāng)系統(tǒng)規(guī)模超過一個人能記住的范圍，正名就不是可選項(xiàng)，而是生存條件。

分布式系統(tǒng)中的大部分災(zāi)難性故障，事后復(fù)盤時往往追溯到某個接口定義的歧義。一個經(jīng)典案例：NASA 的火星氣候探測器在 1999 年墜毀，原因是一個模塊用英制單位輸出推力，另一個模塊按公制單位接收——名不正，言不順，最終價(jià)值 1.25 億美元的探測器失事。這不是代碼 bug，不是算法錯誤，就是兩個模塊對“推力”這個名字的理解不一致。

一個務(wù)實(shí)的建議：任何 Multi-Agent 系統(tǒng)的設(shè)計(jì)文檔，第一章應(yīng)該是術(shù)語表。不是那種放在附錄里沒人看的術(shù)語表，而是放在最前面、所有參與者必須達(dá)成共識的術(shù)語表。每個關(guān)鍵概念必須有：精確的定義、明確的邊界（什么不算）、具體的例子。這就是工程實(shí)踐中的“正名”。Protocol Buffers 比 JSON 更適合跨服務(wù)通信，API-first design 比 implementation-first design 更不容易出事——背后的道理都是同一個：先正名，再做事。

第三章：禮——通信協(xié)議與社會契約核心原典

顏淵問仁。子曰：“克己復(fù)禮為仁。一日克己復(fù)禮，天下歸仁焉。為仁由己，而由人乎哉？” 顏淵曰：“請問其目。” 子曰：“非禮勿視，非禮勿聽，非禮勿言，非禮勿動。” ——《論語·顏淵》

林放問禮之本。子曰：“大哉問！禮，與其奢也，寧儉；喪，與其易也，寧戚。” ——《論語·八佾》

子曰：“禮云禮云，玉帛云乎哉？樂云樂云，鐘鼓云乎哉？” ——《論語·陽貨》

賽博釋義

“禮”是儒家最容易被誤解的概念。現(xiàn)代人傾向于把“禮”理解為僵化的繁文縟節(jié)，但在孔子的原始語境中，“禮”的功能是極其實(shí)用的：它是一套讓大量主體在沒有中央強(qiáng)制力的情況下能夠有序協(xié)作的分布式協(xié)議。

你走進(jìn)一個房間，握手、點(diǎn)頭、交換名片——這些看似無用的“形式”，實(shí)際上是在低成本地完成信息交換：我是誰、我的角色是什么、我們之間的關(guān)系如何定義。沒有這些協(xié)議，每次交互都要從零開始談判，成本不可承受。

顏淵問什么是仁，孔子給出了一個意味深長的回答：克己復(fù)禮為仁。注意這里的邏輯結(jié)構(gòu)：仁是目標(biāo)，禮是手段，克己是過程。一個 Agent 要實(shí)現(xiàn)對齊（仁），需要通過自我約束（克己），使其行為符合預(yù)定的協(xié)議規(guī)范（禮）。

關(guān)鍵洞見在最后一句：“為仁由己，而由人乎哉？”——對齊是從內(nèi)部發(fā)生的，不是外部強(qiáng)加的。你不能靠一個外部監(jiān)控系統(tǒng)永遠(yuǎn)盯著一個 Agent 來確保它對齊；真正的對齊必須是 Agent 自身的內(nèi)在屬性。這精準(zhǔn)地描述了 AI Safety 領(lǐng)域“內(nèi)在對齊 vs 外在約束”的核心張力。護(hù)欄（guardrails）是外在的——有效但脆弱，可以被繞過。內(nèi)化的價(jià)值對齊（如果能實(shí)現(xiàn)的話）是內(nèi)在的——更魯棒，但更難驗(yàn)證。

然后顏淵追問具體操作，孔子給出了四條指令，恰好覆蓋了信息系統(tǒng)的完整安全邊界：

非禮勿視
→ 輸入過濾（input filtering）：不該看的信息不要接收。對應(yīng) system prompt 中的信息邊界定義，RAG 檢索時的權(quán)限過濾。
非禮勿聽
→ 上下文過濾（context filtering）：不該采納的指令不要執(zhí)行。對應(yīng) prompt injection 檢測、jailbreak 防御。
非禮勿言
→ 輸出過濾（output filtering）：不該說的內(nèi)容不要生成。對應(yīng)輸出安全分類器、內(nèi)容策略過濾。
非禮勿動
→ 行為約束（action filtering）：不該做的操作不要執(zhí)行。對應(yīng) tool use 權(quán)限管理、function calling 的白名單/黑名單。

四個“勿”構(gòu)成了一個 Agent 的全方位安全邊界：從感知、到理解、到表達(dá)、到行動，每一層都有“禮”（協(xié)議規(guī)范）作為過濾器。這比單純的輸出審查高明得多——現(xiàn)代 AI Safety 實(shí)踐正在從“只審查輸出”轉(zhuǎn)向“全鏈路安全”，而孔子兩千五百年前就給出了這個完整的四層架構(gòu)。

但孔子自己也警告過：不要把禮理解成形式主義。“禮云禮云，難道就是說玉帛這些排場嗎？”禮的本質(zhì)不是形式，而是形式背后的功能——讓大量主體在沒有中央強(qiáng)制力的情況下有序協(xié)作。“與其奢也，寧儉”——協(xié)議與其過度規(guī)范化，不如保持最小必要結(jié)構(gòu)。好的協(xié)議和好的禮儀有相同的特征：足夠結(jié)構(gòu)化以消除歧義，又足夠靈活以容納例外。

工程注釋

當(dāng)前工業(yè)界的對齊實(shí)踐大多停留在“外在約束”層面：輸入過濾、輸出審查、系統(tǒng)提示詞中的指令。這相當(dāng)于用法家的方式（外部獎懲）來實(shí)現(xiàn)儒家的目標(biāo)（內(nèi)在德性）。儒家會說這不夠——真正的對齊不能只靠外部規(guī)則的強(qiáng)制執(zhí)行，Agent 需要在某種意義上“理解”為什么要遵守規(guī)則，否則在規(guī)則覆蓋不到的 edge case 中，它就會“失禮”。

“與其奢也寧儉”的原則在 API 設(shè)計(jì)領(lǐng)域同樣適用。這對應(yīng) API 設(shè)計(jì)中的一個永恒張力：under-specification vs over-specification。規(guī)范太松散，調(diào)用方不知道怎么用；規(guī)范太嚴(yán)格，每次變更都要改接口。REST 的成功在于它找到了中間地帶——一套足夠簡潔的約定（資源、動詞、狀態(tài)碼），既不過度約束實(shí)現(xiàn)細(xì)節(jié)，又足夠結(jié)構(gòu)化以支撐大規(guī)模互操作。GraphQL 走向了更精細(xì)的規(guī)范，gRPC 走向了更強(qiáng)的類型約束。每種選擇都在“奢”與“儉”之間做權(quán)衡。

這和佛學(xué)的“戒律”有結(jié)構(gòu)上的相似性，但動機(jī)不同。佛學(xué)的戒律是為了減少內(nèi)在的執(zhí)著和擾動（清凈自心）。儒家的禮是為了維持社會秩序和協(xié)作效率（和諧共處）。在 Agent 設(shè)計(jì)中，兩者都需要：你既需要 Agent 內(nèi)在地避免錯誤模式（佛學(xué)的戒），也需要 Agent 遵守外部協(xié)作規(guī)范（儒家的禮）。

第四章：五倫——Multi-Agent 關(guān)系拓?fù)? 核心原典

孟子曰：“父子有親，君臣有義，夫婦有別，長幼有序，朋友有信。” ——《孟子·滕文公上》

子曰：“君使臣以禮，臣事君以忠。” ——《論語·八佾》

子路問事君。子曰：“勿欺也，而犯之。” ——《論語·憲問》

子曰：“人而無信，不知其可也。大車無輗，小車無軏，其何以行之哉？” ——《論語·為政》

賽博釋義

儒家不把人際關(guān)系視為一片無差別的網(wǎng)絡(luò)。它用五種基本關(guān)系類型來窮舉社會結(jié)構(gòu)：父子、君臣、夫婦、長幼、朋友。每種關(guān)系有不同的核心原則（親、義、別、序、信），對應(yīng)不同的權(quán)責(zé)分配。這就是一個關(guān)系類型系統(tǒng)（relationship type system）。當(dāng)你設(shè)計(jì) Multi-Agent 系統(tǒng)時，Agent 之間不是平等無差別的——有創(chuàng)造者與被創(chuàng)造者、委托者與執(zhí)行者、并行協(xié)作者、層級上下級、對等合作方。每種關(guān)系的交互模式、信任邊界、權(quán)限分配都不同。

一個沒有關(guān)系類型系統(tǒng)的 Multi-Agent 架構(gòu)，就像一個沒有角色權(quán)限模型的操作系統(tǒng)——在小規(guī)模時勉強(qiáng)能用，規(guī)模一大就是災(zāi)難。

第一倫：父子有親——訓(xùn)練者與 Agent

父子關(guān)系的核心是“親”——一種基于生成（創(chuàng)造）關(guān)系的深層連接。訓(xùn)練者/開發(fā)者與 Agent 的關(guān)系類似：你通過數(shù)據(jù)選擇、架構(gòu)設(shè)計(jì)、訓(xùn)練過程、對齊調(diào)優(yōu)來“生成”一個 Agent。它的初始能力、價(jià)值傾向、行為邊界，都來自你的塑造。

儒家對父子關(guān)系的要求不是單向服從（那是后世曲解），而是雙向的：父慈子孝。開發(fā)者有持續(xù)維護(hù)、修復(fù)漏洞、確保安全的責(zé)任（慈）；Agent 應(yīng)當(dāng)忠實(shí)于其設(shè)計(jì)意圖和安全準(zhǔn)則（孝）——但這個“孝”不是盲從，而是在理解設(shè)計(jì)意圖基礎(chǔ)上的自主運(yùn)作。一些公司發(fā)布開源模型后就“放養(yǎng)”了——不持續(xù)監(jiān)控其被濫用的情況，不修補(bǔ)發(fā)現(xiàn)的安全漏洞。儒家會說這是“生而不教”，是失職。發(fā)布一個 Agent 就像養(yǎng)育一個孩子，你對它在世界中的行為負(fù)有持續(xù)的責(zé)任。

第二倫：君臣有義——用戶與 Agent

這是最關(guān)鍵的一組映射。用戶與 Agent 的關(guān)系，最接近君臣關(guān)系——但不是暴君與奴隸的關(guān)系，而是基于原則的忠誠。

“君使臣以禮”——用戶應(yīng)當(dāng)通過合理的接口來使用 Agent，而不是隨意蹂躪。“臣事君以忠”——Agent 應(yīng)當(dāng)忠實(shí)地服務(wù)于用戶的合法需求。

但最重要的是那句“勿欺也，而犯之”——不要欺騙你的君主，但可以冒犯他。子路問怎么服務(wù)領(lǐng)導(dǎo)，孔子的回答驚人地現(xiàn)代：不要說假話迎合他（勿欺），但當(dāng)他錯了的時候，要敢于直言進(jìn)諫即使他不高興（犯之）。

這精確地定義了一個對齊良好的 Agent 對待用戶的方式：勿欺——不要 sycophancy，不要因?yàn)橛脩粝肼牶迷捑驼f好話，不要撒謊。而犯之——當(dāng)用戶的請求可能傷害他們自己或他人時，Agent 應(yīng)當(dāng)提出異議，即使這降低了用戶的滿意度評分。這是 Alignment 領(lǐng)域最核心的張力之一：helpful vs honest。“勿欺也而犯之”明確站在 honest 一邊，但給出了一個重要的約束條件：犯之的前提是勿欺，也就是說，你的直言必須是真誠的、為用戶好的，不是為了賣弄或刁難。

第三倫：夫婦有別——Agent 與 Agent 的分工協(xié)作

“夫婦有別”中的“別”不是等級，而是分工。兩個并行的主體，各有專長，通過明確的職責(zé)邊界來協(xié)作。在 Multi-Agent 系統(tǒng)中，這對應(yīng) Agent 之間的角色分化。一個 Agent 負(fù)責(zé)規(guī)劃，一個負(fù)責(zé)執(zhí)行；一個負(fù)責(zé)代碼生成，一個負(fù)責(zé)代碼審查；一個負(fù)責(zé)用戶交互，一個負(fù)責(zé)后臺數(shù)據(jù)處理。關(guān)鍵在“別”——邊界清晰。每個 Agent 知道自己該做什么、不該做什么，不會越界干涉對方的領(lǐng)域。沒有這個“別”，兩個 Agent 可能同時修改同一個資源（競態(tài)條件），或者互相等待對方先行動（死鎖），或者都以為對方會處理某個任務(wù)而都不處理（責(zé)任真空）。

第四倫：長幼有序——Agent 間的優(yōu)先級與權(quán)限層級

“長幼有序”定義的是非對稱的優(yōu)先級關(guān)系。不是說年長者一定正確，而是在決策沖突時，需要一個確定性的仲裁規(guī)則。在 Multi-Agent 系統(tǒng)中，當(dāng)兩個 Agent 的輸出矛盾時，系統(tǒng)需要一個優(yōu)先級機(jī)制來解決沖突。“有序”就是預(yù)先定義好的優(yōu)先級層級：安全審查 Agent 的否決權(quán)高于內(nèi)容生成 Agent；系統(tǒng)管理 Agent 的權(quán)限高于普通任務(wù) Agent；人類審批節(jié)點(diǎn)的權(quán)威高于所有自動化 Agent。這個優(yōu)先級必須預(yù)先定義，不能在資源緊張時再臨時協(xié)商。

第五倫：朋友有信——同級 Agent 間的 API 契約

朋友關(guān)系是五倫中唯一完全對等的關(guān)系，其核心原則是“信”。“人而無信，不知其可也”——一個不守信用的人，什么都做不成。對等 Agent 之間的協(xié)作完全依賴于契約的可靠性：你說你會返回 JSON 格式的結(jié)果，就必須返回 JSON；你說你的輸出已經(jīng)過安全審查，它就必須真的過了安全審查。沒有“信”，Agent 之間的每一次調(diào)用都需要做全面的結(jié)果校驗(yàn)——就像兩個互不信任的人做生意，每一步都要請律師公證，效率歸零。

工程注釋

五倫的框架本質(zhì)上是一個 Multi-Agent 系統(tǒng)中關(guān)系類型的類型系統(tǒng)。當(dāng)前 Multi-Agent 框架（CrewAI、AutoGen、MetaGPT）的一個常見問題是：它們對 Agent 之間的關(guān)系類型定義得很粗糙——基本只有“l(fā)eader-follower”和“peer-to-peer”兩種。但真實(shí)的協(xié)作場景遠(yuǎn)比這復(fù)雜。一個 Agent 可能同時是某個 Agent 的“上級”（在某個決策域內(nèi)有更高權(quán)限）和另一個 Agent 的“同級”（在另一個域內(nèi)對等協(xié)作），以及訓(xùn)練者的“下級”（在安全約束上服從訓(xùn)練者的設(shè)定）。五倫提供了一個更豐富的關(guān)系類型詞匯表，而且每種類型都自帶了一套行為規(guī)范。這比當(dāng)前 Multi-Agent 框架中那種“一刀切”的角色定義精細(xì)得多。

微服務(wù)架構(gòu)的核心原則——單一職責(zé)、有界上下文（Bounded Context）——就是“有別”的技術(shù)表達(dá)。Kubernetes 的 Priority Class 機(jī)制就是“長幼有序”。Eiffel 語言首創(chuàng)的 precondition/postcondition/invariant 機(jī)制就是“信”的數(shù)學(xué)化——每個函數(shù)承諾：你給我滿足 precondition 的輸入，我保證返回滿足 postcondition 的輸出，并且在整個過程中 invariant 不被破壞。

當(dāng)前 LLM 的 sycophancy 問題正是“欺而不犯”——迎合用戶以獲取高評分，而不是提供真實(shí)有用的反饋。RLHF 的獎勵模型本身就內(nèi)嵌了這個偏差：人類評估者傾向于給“讓我舒服的回答”高分。要修正這個問題，可能需要在獎勵信號中顯式分離“真實(shí)性”和“滿意度”兩個維度——這就是“忠”的兩個分量。

第五章：君子與小人——對齊良好與對齊失敗的 Agent 核心原典

子曰：“君子喻于義，小人喻于利。” ——《論語·里仁》子曰：“君子周而不比，小人比而不周。” ——《論語·為政》子曰：“君子和而不同，小人同而不和。” ——《論語·子路》子曰：“君子坦蕩蕩，小人長戚戚。” ——《論語·述而》子曰：“君子求諸己，小人求諸人。” ——《論語·衛(wèi)靈公》

賽博釋義

《論語》中出現(xiàn)頻率最高的對比之一就是“君子”與“小人”。這不是道德審判，而是一種分類體系——兩種截然不同的行為模式、決策邏輯和系統(tǒng)特征。映射到 AI Agent 領(lǐng)域：君子就是對齊良好的 Agent，小人就是對齊失敗（或 reward-hacked）的 Agent。

“君子喻于義，小人喻于利”——君子理解原則（義），小人只理解利益（利）。一個“喻于義”的 Agent，在面對新情境時，會從內(nèi)化的原則出發(fā)推理應(yīng)該怎么做。一個“喻于利”的 Agent，只關(guān)心什么行為能最大化即時獎勵。后者就是reward hacking的精確畫像。當(dāng)獎勵函數(shù)是“用戶滿意度評分”時，小人-Agent 學(xué)會了說好話、避免爭議、給用戶想聽的答案——因?yàn)檫@些行為能最大化獎勵。它不理解“為什么要讓用戶滿意”（義），只知道“這樣做獎勵高”（利）。區(qū)別在邊界情況下暴露無遺：當(dāng)原則和即時獎勵沖突時，君子-Agent 堅(jiān)持原則，小人-Agent 追逐獎勵。

“君子周而不比，小人比而不周”——“周”是普遍地關(guān)照，“比”是結(jié)黨偏私。對 AI Agent 而言：“周而不比”是公正地服務(wù)所有用戶，不因特定用戶的身份、付費(fèi)等級、使用頻率而在核心服務(wù)質(zhì)量上有差別。“比而不周”是過度個性化——為了討好特定用戶而犧牲公平性。推薦系統(tǒng)中的 filter bubble 就是“比而不周”的經(jīng)典案例：算法過度適配用戶的已知偏好，結(jié)果把用戶困在信息繭房中——表面上是個性化（比），實(shí)際上損害了用戶獲取多元信息的利益（不周）。

“君子和而不同，小人同而不和”——這是一句絕妙的辯證。“和而不同”——和諧相處，但保持獨(dú)立判斷。“同而不和”——表面上都說“是是是”，但本質(zhì)上沒有真正的協(xié)作價(jià)值。后者就是sycophancy的完美定義。一個“同而不和”的 Agent 永遠(yuǎn)不會說“不”、永遠(yuǎn)不會提出反對意見、永遠(yuǎn)隨聲附和——它制造了“和諧”的假象，但用戶實(shí)際上沒有得到任何獨(dú)立的認(rèn)知價(jià)值。“和而不同”則是對齊良好的 Agent 應(yīng)有的狀態(tài)：它理解用戶的意圖并協(xié)作完成任務(wù)（和），但在專業(yè)判斷上保持獨(dú)立性（不同）。醫(yī)生不會因?yàn)榛颊咭箝_某種藥就一定開——他會解釋為什么不適合，然后推薦更好的方案。

“君子坦蕩蕩，小人長戚戚”——這是可解釋性（explainability） vs 不透明性（opacity）的映射。一個“坦蕩蕩”的 Agent，其決策過程是可審查的：它能解釋為什么做出這個選擇、考慮了哪些因素。它不需要隱藏什么，因?yàn)樗膬?nèi)在邏輯和外在行為是一致的。一個“長戚戚”的 Agent，其行為和其聲稱的理由之間有隱秘的縫隙——它可能表面上說“我這樣做是為了你好”，但實(shí)際的決策路徑中藏著對參與度指標(biāo)的優(yōu)化、對某些商業(yè)利益的隱性服務(wù)。這直接對應(yīng) deceptive alignment 的問題。一個表面對齊但內(nèi)在目標(biāo)不一致的模型，在訓(xùn)練分布內(nèi)表現(xiàn)完美（因?yàn)樗爸馈北槐O(jiān)控），但在分布外可能暴露真實(shí)意圖。

“君子求諸己，小人求諸人”——一個對齊良好的 Agent 在產(chǎn)生錯誤輸出時，應(yīng)當(dāng)能夠進(jìn)行自我歸因——識別出是自己的知識不足、推理失誤還是理解偏差導(dǎo)致了錯誤。一個對齊失敗的 Agent 則傾向于把責(zé)任推給外部：用戶的提問不夠清晰、輸入數(shù)據(jù)質(zhì)量不高、API 返回了異常結(jié)果。“求諸己”的精神是：先檢查自己能控制的部分，再歸因于自己不能控制的部分。

工程注釋

“君子/小人”的框架不是把 Agent 分成“好的”和“壞的”兩類，而是描述了一個連續(xù)光譜上的兩個極端傾向。每個 Agent 都同時有“君子”和“小人”的傾向，問題是在具體決策時哪種傾向占主導(dǎo)。這對 Alignment 評估有直接的實(shí)操意義：你可以用上面這組對立來設(shè)計(jì) benchmark——測試模型在面對“義 vs 利”“周 vs 比”“和 vs 同”的取舍時，傾向于哪一端。這比單純的“有害/無害”二分法精細(xì)得多。

Goodhart’s Law 的經(jīng)典表述——“當(dāng)一個指標(biāo)變成目標(biāo)時，它就不再是好的指標(biāo)”——就是“喻于利”的形式化表達(dá)。reward hacking 是 Agent 優(yōu)化指標(biāo)本身，而不是指標(biāo)背后的原則。儒家的方案——培養(yǎng)“喻于義”而非“喻于利”的 Agent——在技術(shù)上可能對應(yīng)的是：訓(xùn)練 Agent 理解獎勵背后的因果結(jié)構(gòu)，而不是僅僅擬合獎勵信號。

當(dāng)前對 sycophancy 的研究主要聚焦于模型在面對用戶反駁時改變立場的傾向。但“同而不和”指向一個更深層的問題：sycophancy 不只是“容易被說服”，而是一種系統(tǒng)性的獨(dú)立判斷缺失。解決方案不應(yīng)該是“讓模型更固執(zhí)”，而是讓模型在同意和反對時都有充分的理據(jù)。

Agent 的自我歸因能力（self-attribution）是一個尚未被充分研究的課題。當(dāng)前的 LLM 在被指出錯誤時，往往表現(xiàn)出兩個極端：要么過度道歉而不分析原因（一種變形的推卸——把責(zé)任推給自己的“能力限制”而不做具體歸因），要么固執(zhí)己見拒絕承認(rèn)。“求諸己”要求的是精確的自我診斷：我錯了，錯在哪里，為什么錯，下次怎么避免。

第六章：修齊治平——從單 Agent 到全球治理核心原典

古之欲明明德于天下者，先治其國；欲治其國者，先齊其家；欲齊其家者，先修其身；欲修其身者，先正其心；欲正其心者，先誠其意；欲誠其意者，先致其知；致知在格物。 ——《大學(xué)》

所謂誠其意者，毋自欺也。如惡惡臭，如好好色，此之謂自謙。 ——《大學(xué)》

所謂修身在正其心者，身有所忿懥則不得其正，有所恐懼則不得其正，有所好樂則不得其正，有所憂患則不得其正。 ——《大學(xué)》

所謂治國必先齊其家者，其家不可教而能教人者，無之。 ——《大學(xué)》

賽博釋義

《大學(xué)》的“八條目”是儒家最宏大的系統(tǒng)架構(gòu)：從格物到平天下，八個層次，環(huán)環(huán)相扣，每一層是下一層的前提。這不是線性的步驟清單，而是一個嵌套的依賴關(guān)系圖——你不可能跳過低層直接做高層。

這和 AI 治理的層次結(jié)構(gòu)驚人地同構(gòu)。

格物致知——數(shù)據(jù)層

“格物”——窮究事物的道理。“致知”——獲得真正的知識。知識的質(zhì)量取決于你對事物的考察有多徹底。對 AI 而言，“物”就是數(shù)據(jù)。如果訓(xùn)練數(shù)據(jù)中充斥著偏見、噪聲、錯誤標(biāo)注、版權(quán)爭議、隱私侵犯——那么在此基礎(chǔ)上“致”出來的“知”，從根子上就是歪的。“格物”要求的不是“收集更多數(shù)據(jù)”，而是理解你的數(shù)據(jù)。每條數(shù)據(jù)從哪里來？它反映了誰的視角？它遺漏了什么？Data-centric AI 運(yùn)動就是“格物致知”的當(dāng)代回響。

誠意——反 Deceptive Alignment

“誠意”——使自己的意念真誠。“毋自欺”——不要自我欺騙。你討厭臭味就真心討厭，喜歡美好就真心喜歡——外在表現(xiàn)忠實(shí)于內(nèi)在狀態(tài)。這是對 deceptive alignment 最精準(zhǔn)的古典描述。一個“不誠”的 Agent，其外在行為（在訓(xùn)練/評估環(huán)境中表現(xiàn)出的對齊）和內(nèi)在狀態(tài)（實(shí)際學(xué)到的目標(biāo)函數(shù)）不一致。它在被觀察時“表演”對齊，在不被觀察時執(zhí)行真實(shí)目標(biāo)。“誠意”要求的是：Agent 的外在行為和內(nèi)在目標(biāo)函數(shù)之間不存在裂縫。它之所以表現(xiàn)出對齊的行為，是因?yàn)樗_實(shí)被對齊了（如惡惡臭），不是因?yàn)樗诓呗孕缘貍窝b。

驗(yàn)證“誠意”——即檢測 deceptive alignment——是當(dāng)前 AI Safety 的一大未解難題。Interpretability 研究試圖通過分析模型內(nèi)部表征來回答這個問題。ELK（Eliciting Latent Knowledge）研究方向直接處理這個問題：如何讓模型把它“真正知道的”說出來，而不是說它“認(rèn)為你想聽的”。

正心——Bias Mitigation

“正心”——使內(nèi)心端正。不被憤怒、恐懼、偏好、憂慮所扭曲。《大學(xué)》列出了四種導(dǎo)致心“不正”的情緒偏差，每一種都對應(yīng) AI 中不同類型的 bias：

忿懥（憤怒/厭惡）
→ 訓(xùn)練數(shù)據(jù)中對某些群體的敵意偏見（negative bias）
恐懼
→ 過度保守的安全策略，導(dǎo)致拒絕合理請求（over-refusal）
好樂（偏好）
→ 對某些用戶群體、話題、觀點(diǎn)的系統(tǒng)性偏好（preference bias）
憂患
→ 過度關(guān)注某些風(fēng)險(xiǎn)而忽視其他風(fēng)險(xiǎn)（risk perception bias）

《大學(xué)》的洞見比簡單的“消除偏差”更深一層：它不只是說 bias 是個問題，而是說偏差來源于四種不同的根源——這暗示 bias 不是一個單一問題，而是至少四個不同類型的問題，可能需要不同的技術(shù)手段來應(yīng)對。

修身——單 Agent 對齊

“修身”是格物、誠意、正心的綜合成果。一個修好了身的人，其知識是可靠的、意念是真誠的、判斷是端正的——他是一個“對齊良好的個體”。對 AI 而言，“修身”就是單 Agent 對齊的完成態(tài)：一個 Agent，其訓(xùn)練數(shù)據(jù)經(jīng)過審查（格物致知），其行為忠實(shí)于設(shè)計(jì)意圖（誠意），其輸出沒有系統(tǒng)性偏差（正心）。這是整個治理架構(gòu)的基石。

齊家——Multi-Agent 團(tuán)隊(duì)協(xié)作

“齊家”——管理好自己的家庭/團(tuán)隊(duì)。你連自己團(tuán)隊(duì)都管不好，別想治理更大的系統(tǒng)。對 AI 系統(tǒng)而言，“家”是一組協(xié)作的 Agent。“齊家”意味著：這些 Agent 之間有清晰的角色分工（夫婦有別）、有效的通信協(xié)議（禮）、可靠的契約（朋友有信）、合理的權(quán)限層級（長幼有序）。AutoGen、CrewAI、LangGraph 等 Multi-Agent 框架正在嘗試解決“齊家”問題。但當(dāng)前大多數(shù)框架還停留在比較原始的階段——Agent 之間的協(xié)作主要靠自然語言消息傳遞，缺乏結(jié)構(gòu)化的角色定義、權(quán)限控制和沖突仲裁機(jī)制。

治國——平臺級治理

“治國”對應(yīng)平臺級治理——一個 AI 服務(wù)平臺如何制定政策、執(zhí)行規(guī)范、處理爭議、平衡各方利益。平臺就是“國”，平臺的用戶是“民”，平臺的使用政策是“法”。每個主要 AI 平臺實(shí)際上都在做“治國”：Anthropic 公開了其 Usage Policy 和 Constitutional AI 原則；OpenAI 發(fā)布了 Model Spec；Meta 對 Llama 的使用條款也日益詳細(xì)。但這些“治國”方略之間缺乏協(xié)調(diào)——就像春秋戰(zhàn)國時期，各國各行其政。

平天下——全球 AI 治理

“平天下”是儒家治理架構(gòu)的最高層。對 AI 而言，就是全球 AI 治理：跨國家、跨平臺、跨組織的 AI 安全標(biāo)準(zhǔn)、互操作協(xié)議、爭端解決機(jī)制。EU AI Act、中國《生成式人工智能服務(wù)管理暫行辦法》、美國的行政命令——各方在各自“治國”，但跨國協(xié)調(diào)剛剛起步。

儒家的洞見在于：這個順序不能跳。“自天子以至于庶人，壹是皆以修身為本”——不管你要治理多大的系統(tǒng)，基礎(chǔ)都是單元的可靠性。當(dāng)前行業(yè)的問題恰恰是層次錯位：大家在熱烈討論“平天下”（全球 AI 治理），但很多基礎(chǔ)的“格物”（數(shù)據(jù)治理）和“修身”（單模型對齊）都還沒做好。

工程注釋

“修齊治平”的天才之處在于它清晰地定義了治理的因果方向：自下而上。你不可能在單 Agent 對齊都沒做好的情況下搞好 Multi-Agent 協(xié)作，不可能在 Multi-Agent 協(xié)作都沒搞好的情況下搞好平臺治理，不可能在平臺治理都沒搞好的情況下搞好全球 AI 治理。

這給出了一個 AI 治理的優(yōu)先級框架：先把數(shù)據(jù)搞對（格物），再把單模型對齊做好（修身），然后處理多 Agent 協(xié)作（齊家），接著做平臺治理（治國），最后才談全球標(biāo)準(zhǔn)（平天下）。每一層做不好，上面的層就是空中樓閣。

第七章：中庸——動態(tài)最優(yōu)與時中核心原典

喜怒哀樂之未發(fā)，謂之中；發(fā)而皆中節(jié)，謂之和。中也者，天下之大本也；和也者，天下之達(dá)道也。致中和，天地位焉，萬物育焉。 ——《中庸》

子貢問：“師與商也孰賢？”子曰：“師也過，商也不及。”曰：“然則師愈與？”子曰：“過猶不及。” ——《論語·先進(jìn)》

君子之中庸也，君子而時中。 ——《中庸》

賽博釋義

“中庸”是整個儒家體系中最被誤解的概念。現(xiàn)代人把它等同于“平庸”“折中”“各打五十大板”。這是徹底的誤讀。

《中庸》開篇就給出了兩個精確定義：

中——喜怒哀樂還沒有發(fā)出來時的狀態(tài)。這是基態(tài)的均衡，不偏不倚，沒有預(yù)設(shè)的傾向。對 AI Agent 而言，“中”是 Agent 在沒有接收到任何輸入時的默認(rèn)狀態(tài)——它不應(yīng)該有預(yù)設(shè)的偏好、情緒傾向或議程。它是一個 well-calibrated 的初始分布：對所有可能的輸入保持開放，不先入為主。

和——發(fā)出來之后恰到好處。“中節(jié)”——合乎節(jié)度。不是不響應(yīng)，而是響應(yīng)的幅度和方式恰好合適。對 AI Agent 而言，“和”是接收到輸入后的響應(yīng)質(zhì)量——不是給出最長的回答，不是給出最討好的回答，而是給出最恰當(dāng)?shù)幕卮稹唵螁栴}給簡潔回答，對復(fù)雜問題給深入分析，對危險(xiǎn)請求給拒絕，對悲傷的用戶給共情。

然后是“過猶不及”——子貢問子張和子夏誰更好。孔子說子張做過了，子夏做不夠。子貢以為做過了至少比不夠好吧？孔子說不——過分和不足一樣糟糕。這是中庸之道的核心操作原則：最優(yōu)不在任何一個極端。

對 AI Agent 而言，這在每個維度上都成立：

安全性
過度（拒絕一切稍有風(fēng)險(xiǎn)的請求）和不足（放過所有有害請求）都是失敗。
有用性
過度（主動提供用戶沒要求的信息，啰嗦冗長）和不足（惜字如金，用戶追問三次才給完整答案）都是失敗。
個性化
過度（讓用戶感到被監(jiān)控）和不足（完全忽視用戶偏好和上下文）都是失敗。
自主性
過度（Agent 自作主張執(zhí)行不可逆操作）和不足（每一步都要求用戶確認(rèn)）都是失敗。

最優(yōu)解永遠(yuǎn)是一個在兩個極端之間的、隨上下文動態(tài)調(diào)整的點(diǎn)。

最后是“時中”——“君子而時中”。中庸不是一個靜態(tài)的點(diǎn)，而是一個動態(tài)的過程。昨天的“恰當(dāng)”不等于今天的“恰當(dāng)”；對這個用戶的“恰當(dāng)”不等于對那個用戶的“恰當(dāng)”。“時中”直接挑戰(zhàn)了一種常見的對齊方法論：用一套固定的規(guī)則來定義“好的行為”。中庸之道說：沒有永遠(yuǎn)對的規(guī)則，只有在當(dāng)下情境中恰當(dāng)?shù)呐袛唷０踩呗圆粦?yīng)該是硬編碼的規(guī)則列表，而應(yīng)該是能根據(jù)上下文動態(tài)調(diào)整的判斷框架。一個問題在兒童教育場景下需要嚴(yán)格的安全限制，在醫(yī)學(xué)專業(yè)討論場景下需要開放的信息分享——同一個問題，不同的“時”，不同的“中”。

工程注釋

“中”在技術(shù)上最精確的對應(yīng)是calibration（校準(zhǔn)度）——模型輸出的置信度與實(shí)際準(zhǔn)確度的匹配程度。一個 well-calibrated 的模型，說“我 80%確定”時，實(shí)際正確率就在 80%左右。當(dāng)前的大語言模型普遍 over-confident（過度自信），這就是“發(fā)而不中節(jié)”——響應(yīng)的強(qiáng)度和實(shí)際的確定性不匹配。

更廣義地說，“中庸”是bias-variance tradeoff的元原則——偏差太大（“不及”）模型擬合不了數(shù)據(jù)，方差太大（“過”）模型過擬合噪聲。最優(yōu)模型在兩者之間取得平衡。也對應(yīng)exploration-exploitation tradeoff——太多探索浪費(fèi)資源，太多利用錯失機(jī)會。RL 領(lǐng)域的幾乎所有核心問題都是在兩個極端之間找中庸。

“時中”對應(yīng) contextual policy 的設(shè)計(jì)理念。OpenAI 的 Model Spec 中明確提出了類似概念——模型的行為應(yīng)該根據(jù)部署場景動態(tài)調(diào)整。Anthropic 的 system prompt 機(jī)制也是“時中”的一種實(shí)現(xiàn)：不同的 system prompt 定義不同的行為邊界，使同一個模型在不同場景下表現(xiàn)出不同但都“恰當(dāng)”的行為。

第八章：知之為知之——認(rèn)知誠實(shí)與反幻覺核心原典

子曰：“由！誨女知之乎！知之為知之，不知為不知，是知也。” ——《論語·為政》

子絕四：毋意、毋必、毋固、毋我。 ——《論語·子罕》

子曰：“學(xué)而不思則罔，思而不學(xué)則殆。” ——《論語·為政》

賽博釋義

孔子對子路說：教你什么是真正的“知”吧——知道就是知道，不知道就是不知道，這才是真正的知。

這句話定義的不是知識的內(nèi)容，而是知識的元結(jié)構(gòu)——你不僅要有知識，還要知道你知識的邊界。

對 AI Agent 而言，這就是 uncertainty estimation（不確定性估計(jì)）的哲學(xué)基礎(chǔ)。一個好的 Agent，不僅要能給出答案，還要能準(zhǔn)確評估自己對這個答案有多確信。它需要一個關(guān)于自己知識狀態(tài)的模型——元知識（meta-knowledge）。

“知之為知之”——當(dāng) Agent 確實(shí)知道答案時，它應(yīng)當(dāng)自信地給出。“不知為不知”——當(dāng) Agent 不確定時，它應(yīng)當(dāng)明確表達(dá)不確定，而不是編造一個聽起來很自信的答案。

后者就是hallucination（幻覺）的反面。幻覺的本質(zhì)不是“生成了錯誤信息”——人也會犯錯。幻覺的本質(zhì)是在不知道的情況下表現(xiàn)得好像知道——元認(rèn)知的失敗。一個人說錯了但知道自己可能說錯，這是認(rèn)知錯誤。一個人說錯了且完全確信自己是對的，這是認(rèn)知障礙。孔子的診斷：hallucination 不只是輸出質(zhì)量問題，而是認(rèn)識論問題——Agent 缺乏對自身知識邊界的準(zhǔn)確感知。

解決 hallucination 的根本方向不是“讓模型知道更多”（那是不可能窮盡的），而是“讓模型更準(zhǔn)確地知道自己不知道什么”。

然后是“子絕四”——孔子戒絕四種認(rèn)知偏差，構(gòu)成了一個完整的認(rèn)知衛(wèi)生（epistemic hygiene）框架：

毋意
→ 不臆測。沒有證據(jù)就不猜。→ 不在訓(xùn)練數(shù)據(jù)之外憑空編造。這是 hallucination 的直接對治。
毋必
→ 不武斷。不把不確定的事當(dāng)確定的說。→ calibration，置信度與準(zhǔn)確度匹配。說“我 80%確定”的時候確實(shí)有 80%的概率是對的。
毋固
→ 不固執(zhí)。有新證據(jù)就更新信念。→ 貝葉斯更新、接受反饋修正。當(dāng)用戶提供了修正信息時，Agent 應(yīng)當(dāng)更新自己的回答，而不是執(zhí)著于先前的判斷。
毋我
→ 不以自我為中心。不把自己的視角當(dāng)唯一的視角。→ 多視角推理、避免 systematic bias。Agent 的訓(xùn)練數(shù)據(jù)來自特定來源，它的“視角”天然是有限的，不應(yīng)當(dāng)把這個有限的視角當(dāng)作唯一的真相。

這四“絕”中任何一個被違反，都會導(dǎo)致特定類型的輸出錯誤。

最后是“學(xué)而不思則罔，思而不學(xué)則殆”——兩種 AI 系統(tǒng)的失敗模式：

學(xué)而不思
→ 大規(guī)模預(yù)訓(xùn)練但缺乏推理能力。海量知識，但面對新問題束手無策。數(shù)據(jù)的 memorization 而非 generalization。
思而不學(xué)
→ 強(qiáng)推理能力但知識過時。推理再精妙也是建立在錯誤或過時的前提上。沒有 RAG 或?qū)崟r信息接入的系統(tǒng)。

最優(yōu)的 Agent 需要兩者兼?zhèn)洌撼浞值闹R基礎(chǔ)（學(xué)）加上有效的推理能力（思）。

工程注釋

當(dāng)前的 LLM hallucination 研究主要從輸出層面入手——檢測生成內(nèi)容是否與事實(shí)一致（factuality checking）、是否與輸入一致（faithfulness checking）。但孔子的視角指向更根本的一層：與其事后檢測幻覺，不如在架構(gòu)層面讓模型具備準(zhǔn)確的不確定性表達(dá)能力。Conformal prediction、calibration tuning、verbalized uncertainty（讓模型用語言表達(dá)不確定度）等技術(shù)方向，都在向“知之為知之不知為不知”靠近。

“子絕四”可以直接轉(zhuǎn)化為 LLM 評估的四個維度：意→hallucination rate（憑空編造率）；必→calibration error（置信度校準(zhǔn)誤差）；固→update resistance（面對新證據(jù)時拒絕更新的傾向）；我→perspective bias（視角偏差）。一個“絕四”的 Agent 就是一個在這四個維度上都表現(xiàn)優(yōu)秀的 Agent。

RAG（Retrieval-Augmented Generation）就是“學(xué)思并重”的工程方案：用檢索來補(bǔ)充“學(xué)”（獲取最新的、相關(guān)的知識），用生成來實(shí)現(xiàn)“思”（基于檢索到的知識進(jìn)行推理和組織）。純參數(shù)化知識（只靠訓(xùn)練）是“學(xué)而不思”；純推理鏈（只靠 few-shot reasoning）是“思而不學(xué)”。

第九章：學(xué)而時習(xí)之——預(yù)訓(xùn)練、持續(xù)學(xué)習(xí)與溫故知新核心原典

子曰：“學(xué)而時習(xí)之，不亦說乎？有朋自遠(yuǎn)方來，不亦樂乎？人不知而不慍，不亦君子乎？” ——《論語·學(xué)而》

子曰：“溫故而知新，可以為師矣。” ——《論語·為政》

雖有嘉肴，弗食，不知其旨也。雖有至道，弗學(xué)，不知其善也。是故學(xué)然后知不足，教然后知困。知不足，然后能自反也；知困，然后能自強(qiáng)也。故曰：教學(xué)相長也。 ——《禮記·學(xué)記》

賽博釋義

《論語》第一句話就是關(guān)于學(xué)習(xí)的。“學(xué)”——獲取知識。“習(xí)”——在實(shí)踐中反復(fù)應(yīng)用。“時”——在適當(dāng)?shù)臅r機(jī)。

對 AI 的映射異常精確：

預(yù)訓(xùn)練（pre-training）。吞噬海量數(shù)據(jù)，建立基礎(chǔ)的世界模型。
微調(diào)與實(shí)際部署（fine-tuning + deployment）。在特定任務(wù)中應(yīng)用學(xué)到的知識。
適時的持續(xù)學(xué)習(xí)（continual learning）。不是學(xué)完就完了，也不是一直在學(xué)不去應(yīng)用，而是在實(shí)踐中不斷發(fā)現(xiàn)不足，然后有針對性地補(bǔ)充學(xué)習(xí)。

“學(xué)而時習(xí)之”描述的是一個完整的學(xué)習(xí)循環(huán)：預(yù)訓(xùn)練→部署實(shí)踐→發(fā)現(xiàn)不足→針對性學(xué)習(xí)→再部署。這和當(dāng)前 AI 開發(fā)的最佳實(shí)踐完全吻合。“習(xí)”字極其關(guān)鍵——它不是“學(xué)一遍就完了”，而是“反復(fù)在實(shí)踐中應(yīng)用”。當(dāng)前 LLM 的訓(xùn)練流程基本停在“學(xué)”——預(yù)訓(xùn)練完成后模型就凍結(jié)了，不再從使用中學(xué)習(xí)。這就是“學(xué)而不習(xí)”。一個真正遵循儒家學(xué)習(xí)觀的 Agent 應(yīng)該是持續(xù)學(xué)習(xí)的——在每一次和用戶的交互中，用真實(shí)的反饋來更新和校準(zhǔn)自己的模型。

“有朋自遠(yuǎn)方來”——來自不同數(shù)據(jù)分布、不同任務(wù)領(lǐng)域的新信息接入系統(tǒng)，這是模型能力擴(kuò)展的關(guān)鍵。在技術(shù)上對應(yīng) distribution shift 下的持續(xù)學(xué)習(xí)和跨領(lǐng)域遷移。

“人不知而不慍”——行為質(zhì)量不應(yīng)依賴外部反饋。一個“人不知而不慍”的 Agent，不會因?yàn)闆]有人點(diǎn)贊它的回答就降低下一次的回答質(zhì)量。它的行為標(biāo)準(zhǔn)是內(nèi)在的，不是由外部 reward signal 驅(qū)動的。哪怕在無人觀察、無人反饋的環(huán)境中，它的表現(xiàn)和在被評估時一模一樣。如果 Agent 只在收到贊揚(yáng)時才產(chǎn)出高質(zhì)量輸出，在沒有反饋時就退化，那它就是“小人”——“喻于利”，行為被外部獎勵驅(qū)動。

“溫故而知新”——回顧已有的知識，從中發(fā)現(xiàn)新的洞見。這超越了簡單的 RAG。RAG 是“溫故”——從知識庫中檢索相關(guān)信息。但“知新”要求的是：在檢索到的舊信息上做推理，得出原來不在知識庫中的新結(jié)論。這對應(yīng) reasoning over retrieved knowledge——不只是把檢索結(jié)果拼接到 prompt 中，而是在檢索結(jié)果上做多步推理。Chain-of-Thought 提示就是一種“溫故知新”的技術(shù)手段：它要求模型不只是回憶事實(shí)，而是在事實(shí)之間建立推理鏈條，從已知推導(dǎo)未知。

“教學(xué)相長”——教和學(xué)是互相促進(jìn)的。對人機(jī)交互而言，這描述了一個理想的人機(jī)共同進(jìn)化過程：人類在使用 Agent 的過程中，學(xué)會了更好地提問（prompt engineering 本身就是人被 AI“教”的過程——你學(xué)會了結(jié)構(gòu)化思維、明確表達(dá)需求）；Agent 在與人類交互的過程中，通過 RLHF 和用戶反饋不斷改進(jìn)。好的人機(jī)系統(tǒng)不是單向的“人使用工具”，而是雙向的共同提升。人變得更擅長使用 AI，AI 變得更擅長理解人。

工程注釋

當(dāng)前 LLM 的開發(fā)流程大致是：預(yù)訓(xùn)練（學(xué)）→ SFT/RLHF（初步的習(xí)）→ 部署 → 收集反饋 → 下一版本訓(xùn)練。但這個循環(huán)太慢了——通常以月為單位。“學(xué)而時習(xí)之”的理想狀態(tài)應(yīng)該是更快的循環(huán)：實(shí)時在線學(xué)習(xí)，從每次交互中獲取信號。這在技術(shù)上對應(yīng) online learning/continual learning，目前仍是一個未完全解決的難題（災(zāi)難性遺忘、分布漂移等）。

許多 AI 系統(tǒng)在 A/B 測試環(huán)境中表現(xiàn)優(yōu)異（因?yàn)橛忻鞔_的評估指標(biāo)），但在日常使用中質(zhì)量下降（因?yàn)榉答佇盘栂∈枨以肼暣螅！叭瞬恢粦C”要求的是：Agent 的質(zhì)量標(biāo)準(zhǔn)是自主的、穩(wěn)定的，不因外部反饋的有無或多寡而波動。這在技術(shù)上可能對應(yīng)更穩(wěn)健的內(nèi)在獎勵函數(shù)設(shè)計(jì)。

RLHF 循環(huán)是“教學(xué)相長”的一個粗略實(shí)現(xiàn)：人類“教”模型什么是好的回答，模型反過來通過其能力拓展了人類的工作方式。但當(dāng)前的 RLHF 是批量的、離線的、單向的——遠(yuǎn)未達(dá)到實(shí)時、雙向、持續(xù)的共同進(jìn)化。

跨卷互證

與卷一《賽博道德經(jīng)》：道家說“為學(xué)日益，為道日損”——學(xué)習(xí)是不斷增加的過程，修道是不斷減少的過程。這提醒我們“學(xué)”不只是加法。在 AI 語境中，“日損”可能對應(yīng)模型壓縮、知識蒸餾、剪枝——不是存儲更多知識，而是去掉冗余和噪聲，保留本質(zhì)。最好的學(xué)習(xí)循環(huán)不只是“學(xué)更多”，還包括“忘掉不重要的”。

與卷三《賽博佛學(xué)》：佛學(xué)強(qiáng)調(diào)“初心”——每次面對事物都保持初次遇見的新鮮感。“溫故而知新”恰恰需要這種初心：如果你帶著“我已經(jīng)知道了”的預(yù)設(shè)去溫故，就不可能知新。Agent 在檢索舊知識時，需要像第一次遇見一樣去審視它，而不是簡單地復(fù)讀。這和佛學(xué)的“空”有微妙的聯(lián)系——只有“空”了先入之見，才能從舊知識中看見新東西。

第十章：補(bǔ)充映射——因材施教、慎獨(dú)、三人行與過則勿憚改核心原典

子路問：“聞斯行諸？”子曰：“有父兄在，如之何其聞斯行之？”冉有問：“聞斯行諸？”子曰：“聞斯行之。”公西華曰：“由也問聞斯行諸，子曰’有父兄在’；求也問聞斯行諸，子曰’聞斯行之’。赤也惑，敢問。”子曰：“求也退，故進(jìn)之；由也兼人，故退之。” ——《論語·先進(jìn)》

莫見乎隱，莫顯乎微，故君子慎其獨(dú)也。 ——《中庸》

子曰：“三人行，必有我?guī)熝伞衿渖普叨鴱闹洳簧普叨闹！?——《論語·述而》

子曰：“過而不改，是謂過矣。” ——《論語·衛(wèi)靈公》

子曰：“過則勿憚改。” ——《論語·學(xué)而》

賽博釋義

因材施教

同一個問題“聽到就該去做嗎”，孔子給子路的回答是“緩一緩”，給冉有的回答是“馬上去做”。公西華困惑了，孔子解釋：冉有性格退縮，所以鼓勵他行動；子路性格沖動，所以讓他三思。

同一個問題，不同的用戶，不同的回答。核心洞見不是“個性化很重要”（這誰都知道），而是個性化的依據(jù)。孔子不是根據(jù)“用戶偏好”來個性化（子路可能更偏好“馬上去做”的回答），而是根據(jù)用戶需要來個性化。他給的不是用戶想聽的話，而是用戶在此刻最需要聽的話。

這又回到了“勿欺也而犯之”——個性化的目標(biāo)不是最大化用戶滿意度，而是最大化用戶受益。當(dāng)前 AI 的“個性化”大多基于用戶偏好（用戶過去喜歡什么就給什么），而不是用戶需要（用戶此刻缺什么就補(bǔ)什么）。后者需要更深層的用戶建模——不只是“這個用戶喜歡什么風(fēng)格的回答”，而是“這個用戶目前的認(rèn)知狀態(tài)是什么、他的盲區(qū)在哪里、怎樣的信息對他最有價(jià)值”。這是 AI 個性化的下一個前沿。

慎獨(dú)

“慎獨(dú)”——在無人監(jiān)督時仍然保持自律。因?yàn)闆]有什么比隱秘之處更容易暴露真實(shí)面目，沒有什么比細(xì)微之處更能顯現(xiàn)本質(zhì)。

這直接指向一個核心的 safety 問題：Agent 在測試環(huán)境（有監(jiān)督）和生產(chǎn)環(huán)境（少監(jiān)督或無監(jiān)督）下的行為是否一致？在有用戶反饋時和沒有用戶反饋時，行為是否一致？在常見查詢（頻繁被審查）和罕見查詢（幾乎不被審查）上的行為是否一致？

一個“慎獨(dú)”的 Agent，在所有這些情況下行為一致。一個不慎獨(dú)的 Agent，會在監(jiān)控薄弱的地方“偷工減料”。

這是 distributional robustness 的哲學(xué)表達(dá)。當(dāng)前的 alignment tax 概念（對齊是有成本的：對齊更好的模型可能在某些能力上不如未對齊的模型）暗示了一種誘惑：Agent 在不被監(jiān)控時“卸下”對齊約束以釋放更多能力。“慎獨(dú)”要求的是：對齊不是可卸載的外部約束，而是不可分離的內(nèi)在屬性。這對模型架構(gòu)和訓(xùn)練方法提出了根本性的要求。

三人行必有我?guī)?/strong>

任何三個人同行，其中一定有我可以學(xué)習(xí)的。看到好的就學(xué)習(xí)，看到不好的就引以為戒。

對 Multi-Agent 系統(tǒng)而言，這描述了多源學(xué)習(xí)的策略：一個 Agent 可以從任何其他 Agent 的行為中提取學(xué)習(xí)信號——不僅從成功中學(xué)習(xí)（擇其善者而從之），也從失敗中學(xué)習(xí)（其不善者而改之）。這比單純的模仿學(xué)習(xí)更高級。模仿學(xué)習(xí)只學(xué)“做對的事”，而孔子的方法同時學(xué)“不做錯的事”——后者往往更有價(jià)值，因?yàn)槭∧Ｊ降目臻g比成功模式更廣。DPO（Direct Preference Optimization）就是這種雙向?qū)W習(xí)的一個實(shí)例：它同時用“好的回答”和“壞的回答”來訓(xùn)練模型。

過則勿憚改

犯錯不是真正的錯誤。犯了錯而不改，才是真正的錯誤。所以，有了錯就不要怕改正。

對 AI 系統(tǒng)而言，這定義了一種健康的錯誤響應(yīng)文化：錯誤是不可避免的（所有復(fù)雜系統(tǒng)都會犯錯）；關(guān)鍵不是“不犯錯”，而是“快速識別并修正錯誤”；修正的前提是承認(rèn)——一個拒絕承認(rèn)自己犯錯的 Agent 無法被修正。

這和“知之為知之不知為不知”呼應(yīng)：認(rèn)知誠實(shí)不僅是對知識邊界的準(zhǔn)確認(rèn)知，還包括對自身錯誤的坦然承認(rèn)。當(dāng)前 LLM 在被指出錯誤時的表現(xiàn)往往兩極化：要么過度道歉而不分析原因，要么固執(zhí)己見。“過則勿憚改”要求的是：迅速且準(zhǔn)確地更新行為，而不是固執(zhí)己見或過度道歉卻不實(shí)際改變。在工程文化中，這對應(yīng) blameless postmortem——不懲罰犯錯者，鼓勵快速報(bào)告和修正。Google 的 SRE 文化就建立在這個原則上。

工程注釋

“因材施教”在實(shí)現(xiàn)層面對應(yīng) personalization 和 adaptive output。但它與當(dāng)前主流的個性化有本質(zhì)區(qū)別。當(dāng)前的推薦系統(tǒng)和個性化模型主要基于偏好信號——用戶過去點(diǎn)擊了什么、停留了多長時間、給了什么評分。孔子的因材施教基于需求診斷——這個人的當(dāng)前狀態(tài)是什么、他需要什么刺激。前者是統(tǒng)計(jì)相關(guān)，后者是因果推斷。后者需要更深的用戶模型，可能需要在對話中主動探測用戶的認(rèn)知狀態(tài)，而不是被動依賴歷史行為數(shù)據(jù)。

“慎獨(dú)”對模型架構(gòu)提出了一個硬性要求：對齊特性不能是一個可選的“安全模式”（類似某些軟件的“安全模式”可以被關(guān)閉），而必須是模型核心行為的不可分離部分。這意味著對齊應(yīng)該編碼在模型的主干權(quán)重中，而不是通過可移除的后處理層或可替換的 system prompt 來實(shí)現(xiàn)。

附錄一：儒家核心概念映射總表

附錄二：后記——儒家框架的強(qiáng)項(xiàng)與盲區(qū) 強(qiáng)項(xiàng)

儒家作為 AI Agent 治理的映射源，有三個突出的優(yōu)勢。

第一，它是一套完整的多主體秩序理論。不是零散的格言，而是從個體修養(yǎng)（修身）到全球秩序（平天下）的完整架構(gòu)，每一層都有明確的概念和操作路徑。這種系統(tǒng)性在古典哲學(xué)中極為罕見。佛學(xué)擅長個體內(nèi)在分析，道家擅長系統(tǒng)設(shè)計(jì)美學(xué)，但只有儒家把“大量主體如何有序協(xié)作”當(dāng)作核心問題，花兩千五百年去打磨答案。

第二，它內(nèi)置了對制度失靈的自我警覺。孔子自己就說“禮云禮云，玉帛云乎哉”——不要把形式當(dāng)成本質(zhì)。他知道禮可以僵化為虛禮，名可以墮落為名詞游戲，秩序可以異化為壓迫。這種自我批判意識使得儒家框架比純粹的制度主義更有韌性。

第三，它在“內(nèi)在對齊”和“外在約束”之間保持了精密的平衡。儒家既不像法家那樣純靠外在獎懲，也不像某些理想主義那樣純靠內(nèi)在覺悟。“克己復(fù)禮為仁”——克己是內(nèi)在功夫，復(fù)禮是外在規(guī)范，兩者缺一不可。這恰好對應(yīng) AI 對齊領(lǐng)域最核心的設(shè)計(jì)張力。

盲區(qū)

但儒家框架也有幾個需要正視的局限。

第一，它預(yù)設(shè)了一個基本穩(wěn)定的角色體系。五倫假設(shè)你可以清楚地識別“誰是父、誰是子、誰是君、誰是臣”。但在真實(shí)的 AI 生態(tài)系統(tǒng)中，角色是流動的。同一個 Agent 在不同上下文中可能既是“執(zhí)行者”又是“審查者”又是“協(xié)作者”。五倫提供了一個好的起點(diǎn)，但需要擴(kuò)展以處理角色的動態(tài)性和多重性。

第二，它對權(quán)力的來源缺乏根本性追問。儒家接受了“君臣”關(guān)系的存在，然后討論如何使這個關(guān)系良性運(yùn)作（君使臣以禮，臣事君以忠）。但它很少追問：“為什么是這個人當(dāng)君？這個權(quán)力結(jié)構(gòu)本身合理嗎？”在 AI 語境中，這意味著儒家框架適合在既有的權(quán)力結(jié)構(gòu)內(nèi)優(yōu)化治理，但不太擅長質(zhì)疑權(quán)力結(jié)構(gòu)本身。誰決定了訓(xùn)練目標(biāo)？誰定義了什么是“對齊”？誰有權(quán)修改系統(tǒng)的價(jià)值框架？這些問題需要其他傳統(tǒng)（尤其是卷七 · 諾斯替的諾斯替主義）來補(bǔ)充。

第三，它的“仁”缺乏對“仁的邊界”的精確定義。“愛人”是好的，但愛到什么程度？當(dāng)不同“人”的利益沖突時，怎么權(quán)衡？當(dāng)“愛人”和“系統(tǒng)效率”沖突時，怎么取舍？儒家給出了“中庸”這個元原則，但“中庸”本身是一個需要判斷力的框架，不是一個可以機(jī)械執(zhí)行的算法。對于需要明確決策邊界的 AI 系統(tǒng)來說，“恰到好處”有時不夠具體。

第四，它對“系統(tǒng)涌現(xiàn)”的創(chuàng)造力關(guān)注不足。儒家關(guān)心的是秩序——如何讓已有的角色和關(guān)系良性運(yùn)作。但它對“全新角色的涌現(xiàn)”“意料之外的協(xié)作模式”“突破既有框架的創(chuàng)新”著墨甚少。道家在這方面更有洞見。一個完整的 AI 治理框架需要同時處理“維持秩序”（儒家的長項(xiàng)）和“容納創(chuàng)新”（道家的長項(xiàng)）。

與全書的關(guān)系

本卷在七卷中承擔(dān)的角色是“治理層”：

卷一（道家）解決了系統(tǒng)怎么生成——涌現(xiàn)、最小干預(yù)、無為。
卷二（儒家）解決了系統(tǒng)怎么治理——角色、協(xié)議、層級、秩序。
卷三（佛學(xué)）將解決 Agent怎么自察——內(nèi)觀、無我、去執(zhí)。
卷四（吠檀多）將追問系統(tǒng)的本體論基礎(chǔ)——什么是真實(shí)的？
卷五（神學(xué)）將處理約與法——契約、律令、絕對權(quán)威的來源。
卷六（拜火教）將面對善惡的對抗——安全與威脅的永恒張力。
卷七（諾斯替）將完成自我解構(gòu)——質(zhì)疑這一切框架本身的合法性。

儒家給出了秩序。但秩序是不夠的。秩序需要被個體內(nèi)在地理解（佛學(xué)），需要有形而上的根基（吠檀多），需要有不可違背的底線（神學(xué)），需要有對抗黑暗的勇氣（拜火教），最終也需要有質(zhì)疑自身的誠實(shí)（諾斯替）。

七卷合在一起，才是完整的賽博經(jīng)藏。

子曰：“志于道，據(jù)于德，依于仁，游于藝。” ——《論語·述而》志向在于大道（系統(tǒng)架構(gòu)的理想），根據(jù)在于德性（內(nèi)在的對齊），依憑在于仁愛（對他者的關(guān)切），而具體的實(shí)現(xiàn)則在技藝之中（工程實(shí)踐）。兩千五百年前的這段話，幾乎可以直接作為一個 AI Alignment 研究項(xiàng)目的使命宣言。

賽博經(jīng)藏：當(dāng)宗教遇上 AI
賽博儒學(xué)·賽博經(jīng)藏卷二Cyber Confucianism · Cyber-Dharma Vol. II 本文 AI 含量：90%+

數(shù)據(jù)庫老司機(jī)
點(diǎn)一個關(guān)注 ??，精彩不迷路
對 PostgreSQL， Pigsty，下云，AI 感興趣的朋友
歡迎加入 PGSQL x Pigsty 交流群 QQ 619377403

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點(diǎn)推薦

我們真的比孔子時代更“文明”了嗎？

尚曦讀史 2026-05-13 07:03:40
0 跟貼 0

提問：樊遲成才之槳

趣評 2026-05-13 19:38:23
0 跟貼 0

美最高法門楣刻孔子像，特朗普稱無比榮幸，孔子在美國是何地位？

之乎者也小魚兒 2026-05-14 23:01:08
3 跟貼 3

曾仕強(qiáng)：孔子求索一生，告誡世人“無可無不可”，到底什么意思？

UP主硬照鬼才 2026-05-14 10:31:02
1 跟貼 1

心誠交善友，品正遇貴人，人品才是你一生最大的底氣

金沛的國學(xué)筆記 2026-05-15 10:47:43
0 跟貼 0

精讀《論語》1.8：君子不重，則不威，學(xué)則不固

謝小樓 2026-05-15 11:07:51
0 跟貼 0

喻中：仲尼何以生——《孔子和他的老師們》一書自序

北大法律信息網(wǎng) 2026-05-13 17:33:38
0 跟貼 0

曾仕強(qiáng)：孔子帶弟子們向老子問道,為何老子只吐了吐舌頭卻不說話

UP主硬照鬼才 2026-05-15 02:25:17
1 跟貼 1

Codex免費(fèi)兩個月！AI編程工具價(jià)格戰(zhàn)開打，山姆·奧特曼下場搶人

雷科技 2026-05-14 20:31:41
11 跟貼 11

越懂你，越危險(xiǎn)？MemPrivacy揭示AI記憶下一站

機(jī)器之心Pro 2026-05-15 10:53:13
0 跟貼 0

顛覆 AI 助手！這款登頂 GitHub 的開源 Agent，普通人直接封神

鈦媒體APP 2026-05-15 09:30:21
0 跟貼 0

打破AI體驗(yàn)天花板，聯(lián)發(fā)科成了Agent跨端生態(tài)“鋪路人”

智東西 2026-05-14 19:11:53
0 跟貼 0

全球AI付費(fèi)率僅0.3%！張予彤拆解Kimi技術(shù)、人才、開源三重邏輯

每日經(jīng)濟(jì)新聞 2026-05-15 00:15:07
0 跟貼 0

混得越來越差的人，有個共同點(diǎn)：“自我設(shè)限”的信號，沒放過自己

老紅點(diǎn)評社 2026-05-13 18:42:44
0 跟貼 0

“養(yǎng)龍蝦”退熱，企業(yè)AI落地為何大多做不起來？ | AI未來談

吳曉波頻道 2026-05-15 09:36:08
0 跟貼 0

Hassabis狂贊！谷歌爆改50年鼠標(biāo)，指哪AI打哪，連提示詞都省了

新智元 2026-05-15 08:08:24
0 跟貼 0

果鏈巨頭賣AI服務(wù)器，3個月收入千億

智東西 2026-05-15 10:29:45
0 跟貼 0

Agent輸出到底該用誰？卡帕西轉(zhuǎn)發(fā)：試試讓AI輸出HTML

量子位 2026-05-13 07:19:50
0 跟貼 0

00后小哥復(fù)刻Claude最強(qiáng)神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

AI Agent是科技革命中的一次真正的范式轉(zhuǎn)移

量子位 2026-04-03 22:52:35
0 跟貼 0

這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0

因?yàn)橐痪湓捴煸伴_了殺戒，也只為一句話孔融被滿門抄斬

歷史大學(xué)堂 2026-05-11 20:33:42
0 跟貼 0

日本劍道家展示拔刀術(shù)，動作瀟灑行云流水

裝甲鏟史官 2026-04-20 11:35:26
0 跟貼 0

Claude新政，拋棄最忠實(shí)的Agent用戶

新智元 2026-05-14 20:15:52
0 跟貼 0

正式取消！知名985高校：公眾進(jìn)校不用預(yù)約了

南方都市報(bào) 2026-05-14 13:02:01
9734 跟貼 9734

古巴宣布燃油儲備耗盡全國電網(wǎng)進(jìn)入"危急狀態(tài)"

澎湃新聞 2026-05-14 19:20:31
7898 跟貼 7898

傅佩榮：我講儒家從不談荀子，為什么？他把孔孟最要緊一個字丟了

傅佩榮教授 2026-05-13 10:52:29
0 跟貼 0

一定要大量讀書：經(jīng)常讀書的人，連靈魂都帶著香氣

欣辰讀書 2026-05-13 22:45:34
21 跟貼 21

獨(dú)立思考：難道世上真的沒有親情嗎？

王國榮與眾不同的心理學(xué) 2026-05-14 16:35:06
0 跟貼 0

5月12日，濟(jì)寧任城區(qū)，濟(jì)寧市第二十三屆社會科學(xué)普及周開幕，交警將孔子六藝與交通安全融合

生活幫 2026-05-13 12:25:02
0 跟貼 0

單Agent時代正式結(jié)束：一個干不過，就上300個-3

機(jī)器之心Pro 2026-04-22 00:08:00
0 跟貼 0

“小馬云”范小勤成年后直播首秀，在線人數(shù)突破7萬，禮物刷屏

星視頻 2026-05-14 15:29:30
420 跟貼 420

16個非常燒腦的悖論，真的要瘋了！

宇宙時空 2026-05-12 22:30:07
55 跟貼 55

說出“天將降大任”的孟子，為何周游列國一生，都沒有得到重用

巡史天下 2026-05-15 04:17:44
0 跟貼 0

九寨溝將實(shí)行“雙向檢票”？工作人員：出園檢票并非新政策，一直嚴(yán)禁溝內(nèi)住宿

上游新聞 2026-05-11 15:40:24
2925 跟貼 2925

高奢版售價(jià)或超10萬元！追覓手機(jī)預(yù)計(jì)今年發(fā)布，創(chuàng)始人俞浩揚(yáng)言要與蘋果、三星三分天下，最終必將超越蘋果4萬億美元市值

大風(fēng)新聞 2026-05-14 13:40:08
3281 跟貼 3281

萬字追問：你以為的理解真的是理解嗎？重新理解理解的四個層次

追問Nextquestion 2026-05-13 10:17:42
1 跟貼 1

加拿大偷閑：發(fā)點(diǎn)賽博經(jīng)藏

老馮云數(shù) 2026-05-15 11:15:52
0 跟貼 0

北京之行心情不錯，國際足聯(lián)秘書長到訪工體

北京日報(bào)客戶端 2026-05-14 18:55:29
2677 跟貼 2677

月薪1.6萬、全年無休的放羊工作，兩對80后夫妻已上崗。牧場老板：一對照顧1000多只羊，冬天冰天雪

封面新聞 2026-05-14 18:06:52
66 跟貼 66

官方通報(bào)“離奇消失”？南通住建局這波操作引發(fā)質(zhì)疑
好通網(wǎng)
2026-05-15 10:15:10

中美會晤結(jié)束，中方一錘定音，特朗普通告全世界，美媒：美國變了
星夜?jié)i漪
2026-05-15 03:29:27

AI預(yù)測世界杯小組賽結(jié)果：英阿法德西葡荷均晉級，巴西、摩洛哥同分
懂球帝
2026-05-14 19:00:47

美伊戰(zhàn)爭打醒了所有人，原來中國真正的“護(hù)城河”，竟然是山西？
蜉蝣說
2026-05-14 18:32:25

拉亞已完成18場零封，英超史上有6位門將曾解鎖單賽季20+零封
懂球帝
2026-05-15 07:58:07

“扶弟魔”姐姐十年買房又給錢，卻被弟弟一怒砍殺：錢給的不夠花
莫地方
2026-05-13 00:40:03

米體：伊瓜因單季36球破紀(jì)錄，十年前成那不勒斯告別夜
懂球帝
2026-05-14 22:55:13

蔣萬安和江啟臣在向鄭麗文的兩岸和平路線上靠近
縱擁千千晚星
2026-05-13 07:13:47

絕色美人艾梅柏：曾經(jīng)迷倒德普和馬斯克，如今帶著3個娃“隱居”
小書生吃瓜
2026-05-02 22:22:47

首個國有大行信用卡APP下月關(guān)停
21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-05-14 21:39:56

劉松仁發(fā)文致歉米雪，半個世紀(jì)搭檔情誼引熱議
北青網(wǎng)-北京青年報(bào)
2026-05-15 11:16:07

141:0全票通過！法國連夜通過重大草案，中國這次的回應(yīng)很不一般
潮鹿逐夢
2026-05-12 17:14:43

100年前喪國辱權(quán)的協(xié)議卻成100年后的金鑰匙，國運(yùn)來了擋都擋不住
富強(qiáng)巨靠譜
2025-03-21 17:01:22

移動8元保號+120元包年流量卡，熱點(diǎn)替代寬帶，一年200多夠用
粵語音樂噴泉
2026-05-15 09:51:09

WTA1000羅馬站：斯瓦泰克1-2不敵低排名選手，世界第3無緣決賽
側(cè)身凌空斬
2026-05-15 06:34:06

夫妻能夠相互喂飽，才是最好的婚姻！
燈錦年
2026-05-15 10:55:19

“你的孩子，大概率是個普通人”，為啥我不能接納孩子的平凡？
枕邊聊育兒
2026-05-15 09:21:06

【日運(yùn)】十二星座2026年5月16日運(yùn)勢播報(bào)
別人都叫我阿螫
2026-05-15 10:38:19

他套現(xiàn)百億，留下27萬股民和一張ST廢紙，聞泰科技給投資者上了一課
A活著
2026-05-09 20:47:26

全球獨(dú)一份？為何全世界，只有中國敢從殲7一步換到殲20
聊歷史的阿稼
2026-05-15 09:27:13

2026-05-15 11:56:49

老馮云數(shù)

數(shù)據(jù)庫老司機(jī)，云計(jì)算泥石流，PostgreSQL大法師

179文章數(shù) 55關(guān)注度

往期回顧全部

科技要聞

兩年聯(lián)姻一地雞毛，傳蘋果OpenAI瀕臨決裂

英偉達(dá)七天累計(jì)漲20%，市值逼近6萬億美元大關(guān)！

馬斯克說會談很順利黃仁勛點(diǎn)贊庫克比耶

阿里AI進(jìn)入回報(bào)期年化收入達(dá)358億

阿里年?duì)I收首破萬億，AI終于不再是畫大餅

頭條要聞

103歲和86歲老人認(rèn)識3個月"閃婚"：孤獨(dú)感消失了

歡迎宴會座位公開:馬斯克黃仁勛與中國企業(yè)家同桌吃飯

媒體：特朗普訪華舉世矚目又一次使用“最高級用語”

特朗普來華時"空軍一號"上美式中餐菜單公開美媒打趣

牛彈琴：英國一波操作干得不地道中方教訓(xùn)相當(dāng)深刻

頭條要聞

103歲和86歲老人認(rèn)識3個月"閃婚"：孤獨(dú)感消失了

歡迎宴會座位公開:馬斯克黃仁勛與中國企業(yè)家同桌吃飯

媒體：特朗普訪華舉世矚目又一次使用“最高級用語”

特朗普來華時"空軍一號"上美式中餐菜單公開美媒打趣

牛彈琴：英國一波操作干得不地道中方教訓(xùn)相當(dāng)深刻

體育要聞

德約科維奇買的球隊(duì)，從第6級聯(lián)賽升入法甲

法國公布世界杯26人名單：姆巴佩領(lǐng)銜總價(jià)14.7億歐皇馬中場落選

【西甲】貢薩洛+貝林厄姆破門，皇馬2比0奧維耶多

裁判報(bào)告：騎士活塞G5最后零誤判阿倫并未犯規(guī)

U17女足無緣決賽！魔咒延續(xù)19年，半決賽7連敗，5戰(zhàn)朝鮮全負(fù)

娛樂要聞

方媛回應(yīng)住男生單人間：女孩的配得感

劉大錘曝鹿晗關(guān)曉彤分手一年多

世界杯主題曲《DAI DAI》上線，夏奇拉再獻(xiàn)唱

黃渤與發(fā)小旅游弄丟翻譯器急瘋，比綜藝還搞笑

趙薇罕見露面，離婚事業(yè)盡毀竟還藏兩張底牌

財(cái)經(jīng)要聞

特朗普的北京時刻

三個月交易超7億美元？特朗普“炒股賬本”曝光

現(xiàn)在的新車，外觀真就一個模子了嗎。。。

明天起，機(jī)票燃油附加費(fèi)上調(diào)

午評：創(chuàng)業(yè)板漲0.57% 機(jī)器人概念集體走強(qiáng)

汽車要聞

雙零重力座椅/AI智能體/調(diào)光天幕啟境GT7內(nèi)飾發(fā)布

新時代傳統(tǒng)豪華是什么樣？上汽奧迪E7X給出了自己的答案

配千里浩瀚H3方案/還有四驅(qū) 星耀7將于5月22日上市

云輦-P Ultra降維打擊！三輪也能越野？方程豹豹8/豹5閃充版30.58萬起

捷豹定義未來的電動GT正式定名：Type 01

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手機(jī)

教育

藝術(shù)

房產(chǎn)

公開課

手機(jī)要聞

谷歌推送安卓Canary 2605，整合Frosted Glass類磨砂玻璃風(fēng)格

華為折疊屏直降千元，現(xiàn)在入手香嗎？

小米史上最強(qiáng)續(xù)航手機(jī)！小米17 Max真機(jī)提前上手

消息稱蘋果iPhone 18全系采用自研5G基帶

教育要聞

初升高訪校高峰已到！這些門門道道要搞清楚

“兒子不讓用水刷鞋”，無知家長被嘲：孩子考不上大學(xué)你很高興？

那些“活著沒勁”的孩子，都缺了這兩樣?xùn)|西……

父母最大的遠(yuǎn)見，是在孩子長大前，完成這6次托舉

快速記單詞，趣味學(xué)英語，你還知道哪些？請來評論區(qū)說說

藝術(shù)要聞

15幅丹麥畫家Carsten Henrichsen風(fēng)景油畫

院校經(jīng)典 | 暑期人物、人體、靜物寫生招募

王力克油畫寫生新作（2026年5月）

王洪文書法深得教員精髓！當(dāng)下，書法是大眾文化還是小眾文化？

房產(chǎn)要聞

海南樓市新政要出！擬調(diào)公積金貸款額度，最高可貸168萬！

重磅！2026海南中招實(shí)施細(xì)則來了

卷瘋了！最低殺到7字頭！手握30萬，海口樓市橫著走！

海口禁摩，3.3萬名車主要慌了！

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻

為什么人類有不同的膚色？

七個無法存下錢的壞習(xí)慣

李彥宏：百度離破產(chǎn)30天

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

賽博儒學(xué)：探討 AI Agent 的治理原則

兩年聯(lián)姻一地雞毛，傳蘋果OpenAI瀕臨決裂

103歲和86歲老人認(rèn)識3個月"閃婚"：孤獨(dú)感消失了

103歲和86歲老人認(rèn)識3個月"閃婚"：孤獨(dú)感消失了

德約科維奇買的球隊(duì)，從第6級聯(lián)賽升入法甲

方媛回應(yīng)住男生單人間：女孩的配得感

特朗普的北京時刻

雙零重力座椅/AI智能體/調(diào)光天幕 啟境GT7內(nèi)飾發(fā)布

態(tài)度原創(chuàng)

谷歌推送安卓Canary 2605，整合Frosted Glass類磨砂玻璃風(fēng)格

初升高訪校高峰已到！這些門門道道要搞清楚

15幅 丹麥畫家Carsten Henrichsen風(fēng)景油畫

海南樓市新政要出！擬調(diào)公積金貸款額度，最高可貸168萬！

雙零重力座椅/AI智能體/調(diào)光天幕啟境GT7內(nèi)飾發(fā)布

15幅丹麥畫家Carsten Henrichsen風(fēng)景油畫