對話 Lucius 趙赫：AI 員工的本質(zhì)，是一份有 SLA 的勞動合同

2026-05-19 08:11:16　來源: FounderPark

北京舉報

分享至

Lucius 是一家做企業(yè)級 AI 員工的公司，但創(chuàng)始人趙赫不太喜歡「AI 員工」這個標(biāo)簽。他更愿意說，Lucius 做的是企業(yè)的 Context Layer，一套讓 Agent 能夠進入組織、理解現(xiàn)場、遵守邊界、持續(xù)調(diào)度任務(wù)的組織調(diào)度系統(tǒng)。

「我們不碰 Coding，因為 Coding 還是 Human in the Loop。我們做的場景一定是 AI in the Loop——AI 是主體，人來接單。」

「AI 沒辦法為最終利潤率負責(zé)。只要有人要托底，你就沒辦法實現(xiàn) 100% 自動。這不是技術(shù)問題，是制度問題。」

在他看來，真正的 AI 員工是需要簽署「勞動合同」的，只有這樣才能保證交付。

Lucius 目前服務(wù)三十余家企業(yè)客戶，春節(jié)后最快的案例是客戶看了 10 分鐘 Demo 就直接購買。團隊 12 人，CTO 來自谷歌 YouTube 機器學(xué)習(xí)組。

Lucius 的三位創(chuàng)始人

趙赫從低代碼行業(yè)轉(zhuǎn)型而來，曾在函子科技做到 40 萬用戶。他對「交付結(jié)果」有近乎執(zhí)念的堅持——Lucius 提供的每個角色都有明確 SLA，出了問題按約賠付。

以下是 Founder Park 與趙赫的對話，經(jīng)編輯整理。

產(chǎn)品官網(wǎng)：https://luciusai.com/

采訪 | 萬戶

編輯 | 夏天

??關(guān)注 Founder Park，最及時最干貨的創(chuàng)業(yè)分享

Founder Park 正在持續(xù)尋找值得被看見的 AI 團隊與項目。

我們將通過「AI 產(chǎn)品市集」、內(nèi)容報道、社群分發(fā)等方式，幫你觸達早期用戶、獲得真實反饋，以及建立關(guān)鍵連接。

如果你正在做 AI 相關(guān)的事，歡迎和我們聊聊。

01真正可以獨立做事的 AI 員工

Founder Park：簡單介紹一下團隊和個人經(jīng)歷？

趙赫：我們團隊現(xiàn)在 12 個人。部分成員來自美國大廠機器學(xué)習(xí)一線核心部門，其他工程師來自 AI 數(shù)據(jù)分析公司和客服創(chuàng)業(yè)公司。我屬于從上一代低代碼行業(yè)轉(zhuǎn)型到 AI 的。

Lucius 團隊合影

兩個合伙人。CTO 林勁超，之前在谷歌 YouTube 組做用戶異常行為檢測的機器學(xué)習(xí)組 leader。增長合伙人劉宇成，最早在 Wayfair 做用戶分析相關(guān)的機器學(xué)習(xí)，后來在國內(nèi)做了出海去孵化器 (chuhaiqu.club)。

我自己的經(jīng)歷：2017 年本科畢業(yè)后在甲骨文做了兩年售前交付工程師。當(dāng)時總結(jié)的經(jīng)驗就是要去交付結(jié)果，不是去交付工具。2019 年第一次創(chuàng)業(yè)，加入函子科技，跟著產(chǎn)品從 0 做到 40 萬用戶，做過上千個客戶的交付。所以我算是從上一時代的傳統(tǒng) SaaS、工具型 SaaS 這樣的行業(yè)轉(zhuǎn)型過來的。

2025 年 5 月份，Manus 出來前后，我當(dāng)時人在美國，跟林勁超、宇成在美國認識，大家一起聊合作做這個事情。我們都相信接下來組織協(xié)作的范式會變化，這里面會撕開很多新的普遍的需求。

當(dāng)時的起手方向就是做社區(qū)運營，跟客服比較相關(guān)。往 Context Layer 這個方向轉(zhuǎn)，是大概 2025 年底到 2026 年初，我們才把重心徹底轉(zhuǎn)到 Context 層這個方向上來。

Founder Park：當(dāng)時是怎么考慮切入這個場景的？

趙赫：最早在低代碼行業(yè)的時候就感受到，用戶操作低代碼主要涉及兩種方式：一種是自己配置工作流，第二種是自己手寫文檔。我覺得這比較反人性。當(dāng)時就在想，如果 AI 能夠很好地降低這個摩擦，真正讓用戶只用自然語言表達意圖就能構(gòu)建，那傳統(tǒng)低代碼的范式是不是就可以改變了？

當(dāng)時我覺得最適合做這個事情的場景是客服。這個場景有一個很明顯的特征：模型可以越用越聰明，能做持續(xù)學(xué)習(xí)。另外一個考慮是，我們原來在 SaaS 工具預(yù)算里廝殺，行業(yè)已經(jīng)卷得非常厲害了。看到大模型出來，第一個設(shè)想就是能不能爭取 BPO 那部分對人力的預(yù)算，做 AI labor 的交付。

2024 年 8 月份左右我離開函子。當(dāng)時關(guān)注比較多的產(chǎn)品像 Pylon 這類聚合回復(fù)平臺。本來想起手做聚合回復(fù)，但因為早期團隊人少，各種平臺兼容性問題——那時候還沒有 OpenClaw 這種 Gateway 管理多平臺的方式，所以我們決定早期先收斂到一個場景，先驗證自學(xué)習(xí)、持續(xù)學(xué)習(xí)這個東西能不能跑通。

我們當(dāng)時做過很多行業(yè)的嘗試，比如保險、傳統(tǒng)行業(yè)，還做過櫥柜平臺。平臺也很多樣，微信、郵箱、Discord、飛書，早期都試過。但最后選擇把早期精力聚焦打穿一個場景，所以起步時只做 Discord 這一個場景。

Founder Park：為什么首先選了 AI 客服這個賽道？

趙赫：過去做 AI 客服，大家只是把過去 NLP 的方式加上了 RAG。那時候客服還沒有特別深入地做成 Agent，范式還是挺像 n8n 那種傳統(tǒng)客服工作流加 NLP 檢索召回的方式。

比如 Intercom 的 Fin AI，主要是把知識庫的召回和向量化方式加上去，把答案生成從過去的固定答案匹配改成大模型召回模式。我認為這只是一個過渡狀態(tài)，不會是最終的范式。

當(dāng)時我覺得技術(shù)到了一個比較好的拐點，各種抽取模型已經(jīng)出來了，圖譜的基建也出來了，整個數(shù)據(jù)的結(jié)構(gòu)化處理和清洗已經(jīng)到了可用的狀態(tài)。

但回顧來看當(dāng)時其實有點樂觀。模型真正滿足我們想做的事情的最低要求，大概是在 Claude Opus 4.6 出來之后。因為我們大部分工作是 Context 層的收集、處理和清洗，對人的意圖識別和知識沖突冗余的去除要求比較高。早期模型在意圖識別的準(zhǔn)確率上沒那么高，幻覺率也比較高，執(zhí)行任務(wù)的成功率也不夠。

Founder Park：所以你們切的點不只是替代傳統(tǒng)客服答疑，而是更主動地把運營的事情承擔(dān)住？

趙赫：對。傳統(tǒng)客服工具的主要作用是一個管道，把客戶在隊列里排上隊，最終還是需要人去服務(wù)。我們要做的是真正意義上的 AI 員工，買回來就不需要人坐在后面。把 AI 勞動力放上去，就可以把大部分客服工作 cover 掉，最大區(qū)別就在這。

02Lucius 交付的是結(jié)果，不是提效

Founder Park：會怎么向客戶介紹 Lucius？

趙赫：如果面向終端消費者，我一般會說：一個能裝進你 IM 里的、能自主學(xué)習(xí)、能跨時間跟進事情的 AI 客服和 AI 運營。

我們今年更多強調(diào)的是幫你管理組織的 Context 層。把散落在每一次服務(wù)、每一次對話、每一次協(xié)作當(dāng)中的隱性知識或 SOP 沉淀下來，變成一個可復(fù)用的層。這個時候我們的場景就不只是客服了，客服、項目管理、數(shù)據(jù)分析都能帶起來。

Founder Park：當(dāng)時怎么判斷產(chǎn)品的 PMF？

趙赫：從三個角度來看。

第一，后面的客戶是通過看到前面客戶的案例主動找過來的。比如我們最早服務(wù)的是 Tripo、Medeo、Fellou 這些客戶，后面的 PEXO 就是因為看到前面的客戶自己主動找過來。

第二，客戶的決策周期有很大變化。早期我們跟客戶介紹的時候需要很多 Demo 和解釋價值。但從今年開始整個解釋成本比較低了，客戶看了 Demo 就能快速做決策，決策周期變得很短。

第三，老客戶出了第二條產(chǎn)品線也會繼續(xù)找我們，或者介紹身邊其他項目。在正式發(fā)布之前客戶大部分都是靠轉(zhuǎn)介紹、看案例主動過來的。我們當(dāng)時連官網(wǎng)都沒有。

Founder Park：所以其實還存在一個市場教育的階段？

趙赫：對。我覺得 Manus 是一個很好的啟蒙。「在團隊里邀請一個組織級的 AI 員工進來」這個想法的教育周期，在 OpenClaw 出來之后就降下去了。大家對什么是 AI 員工、什么是組織里的 AI Agent 有了基本了解，不用花很多時間解釋了。

OpenClaw 出來之后，我們快速擴展到三十幾個客戶，基本都是這一波帶來的。而且更重要的是，很多客戶自己嘗試過 OpenClaw 但沒有用起來。他對 Context 管理、記憶管理、分布式管理、安全性控制等知道很難之后，再看到我們的效果，接受度就很高了。

我們春節(jié)之后最快的案例，客戶聯(lián)系過來，看了 10 分鐘別的客戶在 Discord 里的案例就直接買了。

Founder Park：你們現(xiàn)在的用戶畫像是什么樣的？

趙赫：正式發(fā)布之前灰度階段面向的客戶都是初創(chuàng)公司，行業(yè)是 AI 應(yīng)用和 Web3。因為他們足夠新，對這個事的接觸程度非常高，幾乎沒有太高的教育成本。

新產(chǎn)品發(fā)出來以后，我會更面向"普通人"，比如本地的小生意，小診所、小律所這樣的生意，沒有能力 Build 的人。這些人很焦慮，很想用 AI，但用不起來。目標(biāo)用戶都是美國的，不是國內(nèi)的。

Founder Park：AI 員工和今天很多 AI Agent 產(chǎn)品的區(qū)別是什么？

趙赫：我們是交付結(jié)果的。我交付的每個角色出去都是因為我們控制好了 SLA，為這個結(jié)果負責(zé)。我們保證數(shù)據(jù)不泄露。

而能力這個東西是不確定的。你給能力強的人一個效果，給能力弱的人另一個效果。交付 Build 能力的話，「交付勞動力、交付結(jié)果」這個命題就是偽命題。你都沒有 1-2-3 的范圍，怎么交付？

這跟我們當(dāng)年低代碼最悲慘的經(jīng)歷一樣：一個項目 100 萬，我們收 2 萬，咨詢公司收 98 萬。因為能不能成功看的是售前咨詢工程師（現(xiàn)在叫 FDE）對場景有沒有理解、最終方案能不能閉環(huán)。如果是 Building Tool，主要的錢還是付給最終為結(jié)果負責(zé)的人，不是付給工具公司。

Founder Park：所以你給用戶提供的不是純粹工具，而是能交付結(jié)果的東西。

趙赫：這也是我現(xiàn)在承擔(dān)的一種壓力。投資人會問，用戶也會問：通用 AI 員工啥都能干，為啥還在干這些土場景？我不想選看起來秀肌肉的、炫酷的、好賣的場景。我知道交付增長、離錢近的東西肯定更好賣，但好賣不等于能交付。我經(jīng)常跟團隊講，低級的生意賣參數(shù)，高級的生意賣情懷。我跟客戶講的從來不是參數(shù)，我跟他說：用了我們的東西，你過節(jié)的時候就不用看手機了。

03要給 AI 員工簽一份「勞動合同」

Founder Park：選擇切入不同崗位和角色的判斷標(biāo)準(zhǔn)是什么？

趙赫：我們有一個顯式的判斷框架：生命周期長、有持續(xù)狀態(tài)更新、能閉環(huán)、Context 能被多次消費。滿足這四條的場景我們就會認真考慮。

另外還有幾個維度。第一是數(shù)據(jù)的敏感度，我們最早做客服是因為早期選的是外部數(shù)據(jù)。第二是這個場景目前客戶對出錯的容忍度。第三是整個任務(wù)的跨周期長度和閉環(huán)程度。第四是這個任務(wù)的 Scope 是不是可控。

Founder Park：這里面崗位角色的主動性會有提升變化嗎？

趙赫：肯定有。去年的 Context 層比較單薄，只有 Knowledge 這一層，就是企業(yè)的靜態(tài)知識、事實性的東西和偏好性的東西。去年沒有狀態(tài)機，不會記錄每個用戶說了什么、每個用戶當(dāng)前所處的狀態(tài)、每個任務(wù)的狀態(tài)。

今年有了狀態(tài)機之后又加了一個調(diào)度器。調(diào)度器能做的事情：第一是主動性，你可以設(shè)計一些「當(dāng)什么情形、什么狀態(tài)就執(zhí)行后續(xù)連續(xù)動作」的規(guī)則，這在去年做不了。第二是有了狀態(tài)機就可以做過程分析，比如某件事做了之前 7 天和之后 7 天的效果對比，去年也做不了。相當(dāng)于 Context 層的厚度比去年厚了很多。

Founder Park：隨著拓展的崗位不同，角色承擔(dān)的職能和被授權(quán)的權(quán)限會越來越多？

趙赫：對。對我來講 Context 有三個階段：第一階段只有外部數(shù)據(jù)；第二階段有內(nèi)部數(shù)據(jù)，更敏感的、更重要的角色；第三階段最重要的是權(quán)限和輸出格式的控制。

一個理想狀態(tài)是，比如以后你跟我做訪談，你可以不約我的時間，直接約我們公司的 Agent。我把它授權(quán)了，哪部分你能知道，你直接問 Agent。它基于我授權(quán)的范圍輸出一個 PR 給你。因為它最了解我整個公司當(dāng)前狀態(tài)，每個員工、項目、客戶的進度，所有上下文都在我們的 Context 層里。

Founder Park：如果不同人類員工之間對 AI 的表述互相矛盾，怎么處理？

趙赫：最現(xiàn)實的情況就是前腳一個人說了一個標(biāo)準(zhǔn)，后腳又一個人說了另一個標(biāo)準(zhǔn)。我們以后面的那個人為準(zhǔn)，然后后續(xù)被下一個人意識到錯了，就再糾正、再覆蓋。你問它「這個怎么來的」，它就會告訴你：最早是他說的，后來他又這么說的，現(xiàn)在是你這么說的，我就按這個干。每個知識塊都有完整的來源歷史和證據(jù)鏈。

我們之前想做一個權(quán)重機制，CEO 說的話更可信、權(quán)重更高，新來的員工權(quán)重低。后來發(fā)現(xiàn)沒有意義，CEO 說錯的比例比普通員工太多了。所以就是以時間為維度，最新為準(zhǔn)。

Founder Park：如果公司內(nèi)部知識本身混亂，AI 員工的狀態(tài)也混亂嗎？

趙赫：企業(yè)里面混亂的原因一般不是口徑不一致，張三賣 10 塊、李四賣 15 塊這種情況其實不常見。混亂更多是責(zé)任邊界不清晰。所以我們的控制就是角色邊界清晰。你讓我干不屬于我職能的事，我就說「不好意思，我沒這個角色，我沒這個職能，你讓我干這個我不干」。

學(xué)習(xí)抽取的 Context 也是有選擇性的，一定跟這個角色正相關(guān)，不是什么東西都抽進去。

Founder Park：有點像給 AI 簽了一個很明確的勞動合同。

趙赫：對。我們把 Lucius 裝進客戶工作群的時候，同事最先問的問題就是「你是誰？你能做什么？」Lucius 一定會給他說一個很清楚的邊界。如果你想讓它干額外的事，它就說「麻煩你到客戶端去開權(quán)限」。

為什么要去客戶端開？因為開權(quán)限的過程就是簽約的過程，跟勞動合同一個道理。你別想起一出是一出，要讓我干就給我簽勞動合同，我以后就干。想一出是一出讓我干，我就沒法保證交付。

Founder Park：很好奇，給 AI 太多約束會讓主動性降低嗎？

趙赫：會出現(xiàn)這個問題。一般是規(guī)則引擎里的主動性動作和底層權(quán)責(zé)之間有沖突。你告訴它是客服，主要工作是回答客戶問題、解決情緒；但同時又約束某些情況下必須閉嘴。這是典型的互斥。

目前這種問題沒有特別好的解決辦法。主要依賴基礎(chǔ)模型和提示詞工程，告訴它規(guī)則優(yōu)先于角色。比如廣告刪除會偏向更安全，模棱兩可先刪再說，但會打報告出來。踢人就更謹慎。通過被誤刪的情況來推動人去維護規(guī)則。

在更主動和更安全之間，我們選擇更安全，控制好交付的 scope。

04「完全取代」不是 Context 問題，是制度問題

Founder Park：Lucius 到今天是實習(xí)生還是正式員工？

趙赫：綜合來看，部分任務(wù)像正式員工，整體上是實習(xí)生，但趨勢明確。

我定義的標(biāo)準(zhǔn)是：第一，能獨立閉環(huán)半數(shù)以上的任務(wù)，不需要人兜底。比如退款這種情況還是個實習(xí)生。但對于使用問題咨詢，很明顯比正式員工還強。

第二，有主動性，不只是被動響應(yīng)。正式員工會主動發(fā)現(xiàn)問題、提前預(yù)警、推進事情，而不是等人問才動。這塊我們隨著 3 月上了狀態(tài)機和調(diào)度器剛開始。第三，從解決問題到消滅問題——目前還在解決問題這個層面。

3 月之后有明顯被當(dāng)成正式員工的跡象。有客戶已經(jīng)開始讓 Lucius 銳評自己產(chǎn)品最近的更新，或者問接下來更新的優(yōu)先級是什么。

Founder Park：所以你對「完全替代」這件事的判斷是漸進式的？

趙赫：系統(tǒng)是分階段的。

人一開始能接受 AI 占 30% 或 60% 的決策權(quán)重，系統(tǒng)就長那樣，該點的審批、該做的 confirm 都得有。隨著制度完善、人慢慢接受，很多東西就不用確認了。會過渡過去，但不能一口氣過。不能因為最終目標(biāo)是全自動，就跳過了信任構(gòu)建的過程。

Founder Park：你們支持的崗位都會是這樣的模式嗎？

趙赫：一定是這樣的。我們灰度測了很多崗位，不是決定做一個就突然開始，而是在客戶內(nèi)部跑灰度測試，觀察能不能實現(xiàn) AI in the Loop 的效果。如果實現(xiàn)不了，暫時不碰。

我們不碰 Coding 的原因就是：我不認為 Coding 能實現(xiàn) AI in the Loop 的效果。Coding 還是 Human in the Loop，人做主要控制，AI 做賦能，幫人實現(xiàn)架構(gòu)設(shè)計里具體要實現(xiàn)的部分。邏輯跟我們不一樣。

Founder Park：有跟 Coding 類似的你們不碰的場景嗎？

趙赫：內(nèi)容運營最難做。它需要人看了各種東西、揣摩別人心理、有能打動別人的 Brief、有所謂的 Taste 引起共鳴。這些東西大模型做得非常不好。靠量化驅(qū)動的東西在這類場景效果不好。它沒辦法成為 Plan 的制定者，有一定創(chuàng)造屬性的場景，這是特征。

Founder Park：除了隱性知識，還有哪些問題會讓"完全替代"遇到挑戰(zhàn)？

趙赫：底層原因還是上下文不足。

舉個例子：有個用戶聯(lián)系官方說網(wǎng)站訪問不了，后來從別的平臺知道他們網(wǎng)站被某個國家封了，需要掛 VPN。那個用戶花了四十幾歐買了 VPN，然后一直跟 AI 抱怨，突然 AI 就說「算了，把你的 VPN 購買的 invoice 發(fā)出來，我給你報銷」。

這種涉及到預(yù)算、折扣、輸出口徑的東西，沒辦法跳過人的權(quán)限那一環(huán)。因為成本控制的責(zé)任、最終利潤率的責(zé)任一定是有人托底的。只要這個人要托底，你就沒辦法實現(xiàn) 100% 的自動。

Founder Park：如果 Context 足夠了，這些問題能解決嗎？

趙赫：我覺得制度變了才能解決，不是技術(shù)變。跟自動駕駛一個道理，為什么允許自動駕駛？因為人類對汽車碰撞的風(fēng)險控制已經(jīng)有一套制度配套了。現(xiàn)在的 AI 就像一輛很牛的賽車，安全帶、方向盤可能有了，但保險杠、配套保險這些都還沒有。

05Context Layer 解決的是，「系統(tǒng)現(xiàn)在該怎么做」

Founder Park：最開始 Context 不夠多的時候，給用戶提供 Aha Moment 的場景是什么？

趙赫：Aha Moment 就是，它不會亂答，它拿不準(zhǔn)就來問客戶了。客戶看到的是一個很主動的、明確說「我該怎么回答」的 AI。

我們有個客戶，后來入職的員工一直以為那是個真人，「一個永遠不見面的同事在問他問題」。客戶普遍反映的 Aha Point 是「它怎么連這個都知道」，因為這些東西公司文檔里都沒有，就是不知道哪個同事順口交待的。

還有客戶說這個東西會學(xué)我說話，他覺得它會進化。管理層給我們的反饋也不是問應(yīng)答率、轉(zhuǎn)人工率這些數(shù)據(jù)，而是看到知識庫里今天有 11 個更新，過去這些碎片東西應(yīng)該就丟掉了，現(xiàn)在都在庫里躺著，管理層就已經(jīng)覺得很舒服了。

甚至有客戶問我們：能不能讓產(chǎn)品不說話，就裝在里面做 Context 抽取清洗就完了？想要的時候開個 MCP 接口、有權(quán)限控制，直接把 Context Share 給別的 Agent 用。我覺得很合理，我們產(chǎn)品不應(yīng)該只是人類友好，完全可以 Agent 友好。

Founder Park：你們會收集哪些 Context？

趙赫：內(nèi)部對 Context 收集邊界有些部分沒有確定答案。糾結(jié)的主要是交易數(shù)據(jù)和行為數(shù)據(jù)，要碰的話涉及甲方要施工，要接到他 Stripe 或應(yīng)用里。我們不太想碰，因為沒辦法一竿子捅到底。

還有代碼，有些客戶覺得代碼比文檔更好地解釋產(chǎn)品。如果我們連代碼都能讀到，故障分析會更清楚。但這是接受程度的問題。

我們現(xiàn)在是所有跟客戶的外部對話，網(wǎng)頁、郵箱、IM 都會接上去。如果比較信任就裝到內(nèi)部群，連內(nèi)部協(xié)作對話也能看見，再加上內(nèi)部文檔。

Founder Park：支撐這套 Context 層的底層技術(shù)是什么架構(gòu)？

趙赫：核心技術(shù)叫「知識引擎」。它是一個獨立服務(wù)，不依賴主 Agent 把信息推送進來，而是會主動抓取、理解和沉淀 Context。需要調(diào)用知識時，系統(tǒng)也不是簡單從向量庫里召回，而是向知識引擎里的 Agent 發(fā)起請求，由它判斷該取什么信息、如何取，以及哪些信息可信。

知識引擎的一個關(guān)鍵能力，是處理 Context 里的沖突和去重。比如同一個規(guī)則，早上有人說是 1 分鐘，下午又更新成 2 分鐘，系統(tǒng)不能把兩條矛盾信息同時保留下來，而要判斷哪一條是最新、有效的。企業(yè)里的 Context 本來就是流動的，如果不處理這些變化，AI 拿到的上下文越多，反而越容易出錯。

這套架構(gòu)和主流 Agent 最大的區(qū)別在于「解耦」。我們的 Context 層、知識引擎和調(diào)度器都是獨立的微服務(wù)，可以分別更新。主 Agent 只負責(zé)執(zhí)行，知識引擎只負責(zé)理解、推理和進化，不直接做動作。請求進來后，系統(tǒng)會先由知識引擎判斷是否需要調(diào)用 Agent；如果只是群里在慶祝，最好的處理可能就是不說話，而不是啟動完整推理鏈。

另一個關(guān)鍵點是「組合搜索」。很多產(chǎn)品把 memory 層等同于 knowledge base，什么問題都走向量召回。但其實「這個人昨天說了什么」這類問題，更適合直接查數(shù)據(jù)庫、走 SQL；只有需要模糊語義匹配時，才應(yīng)該走向量召回。知識引擎的價值就在于，它會判斷當(dāng)前任務(wù)該從哪類數(shù)據(jù)源取信息、用什么方式取，而不是每次都把整個知識庫翻一遍。

Founder Park：Context Layer 跟知識庫、Wiki、企業(yè)搜索比，到底多了什么？

趙赫：品類差異，不是程度差異。知識庫、Wiki、企業(yè)搜索解決的是「系統(tǒng)知道什么」；Context Layer 解決的是「系統(tǒng)現(xiàn)在該怎么做」。

打個比方：知識告訴你世界上有幾扇門，Context 告訴你哪扇門現(xiàn)在開著、哪扇門關(guān)著、你該走哪扇。

具體來說，Context Layer 比傳統(tǒng)知識系統(tǒng)多出四個維度。第一，從客觀知識到帶狀態(tài)的理解，不只有 Knowledge Store，還有 User Profile、Flow & Policy、Workspace State 四個 Store 協(xié)同組裝。第二，從被動檢索到主動沉淀，知識庫需要人養(yǎng)，Context Layer 在真實任務(wù)流中自己長。第三，從信息層到執(zhí)行層，Glean 幫你找到答案，Lucius 帶著完整上下文直接把事情做了。第四，從靜態(tài)知識到狀態(tài)機，沒有狀態(tài)，AI 只能描述世界；有了狀態(tài)，AI 才能參與判斷。

企業(yè)真正卡住的不是 AI 知不知道答案，而是 AI 拿到答案之后能不能在具體場景下做出正確的判斷和動作。這就是 Context 要解決的事。

Founder Park：你覺得未來個人的 Context 管理會怎么演變？

趙赫：我甚至在想我們要不要推出一個個人版產(chǎn)品。隨著 Agent 用得多了，個人就有 Context 管理的需求了。大家現(xiàn)在用 OpenAI 或者 Claude，時間長了會發(fā)現(xiàn)它模式固定。想重組你的 Context 很困難，本質(zhì)上你沒有一個 Context 組織層。

更有意思的，沒有 Agent、沒有用 Agent 的人，會去找那些長期用 Agent 的人幫他代為完成任務(wù)。比如萬老師，我想用你本地的 OpenClaw 幫我完成一個任務(wù)，因為上面有你寫文章的 taste，有你的經(jīng)驗、有你的 Context。我就愿意貢獻我的 Context 和需求給你，因為你的 Context 能幫到我。

最理想狀態(tài)應(yīng)該是：個人有 Context 管理層，組織也有 Context 管理層。組織是為了把散的東西管在一起為一個大目標(biāo)走；個人是為了管自己、更好地表達自我。

06未來的組織里，每個人都是「飛行員」

Founder Park：現(xiàn)階段你們預(yù)期的是，AI 員工完全等同于人類員工，還是與人類員工互補的關(guān)系？

趙赫：我在這個問題上糾結(jié)過。我最初的設(shè)想是完全取代人。但實際上碰到比如獎勵發(fā)放、退款這種問題，我們做不好。機器人做不好的是人能做好的 Trade-off，還有很多隱性的 Context 我們采集不到。比如這個公司發(fā)放獎勵，短期有損失但換長期收益，這種判斷我們做不了，不能替他做。

但機器能做好而人做不好的是量化。AI 可以做到第 100 次比第一次做得明顯好很多，因為它能看到前面 99 次的例子。但人記不住，沒有這個量化的辦法。

所以我現(xiàn)在想的最終畫面跟一開始不一樣了。一開始想的是：原來有個崗位是人干的，現(xiàn)在雇個 AI 100% 把人替下來。現(xiàn)在我想的是，它是一個系統(tǒng)。這個系統(tǒng)進去以后，人和 AI 的關(guān)系變成：人接單。你上班就三個任務(wù)，這三個任務(wù)會告訴你明確的上文 Context、需要做什么。丟給人的是 AI 跟物理世界連接不了的東西。這種系統(tǒng)整體是反脆弱的，把 Trade-off 收到系統(tǒng)里面了。

Founder Park：你們所說的 AI in the Loop 和 Human in the Loop 有什么核心區(qū)別？在你看來，最終組織形態(tài)會長什么樣？

趙赫：我覺得最終組織形態(tài)就是，大部分白領(lǐng)變成監(jiān)督者。每個人都是飛行員，飛機越來越自動化，飛行員從「駕駛飛機」變成「監(jiān)控系統(tǒng)、處理異常」。

我認為好的 AI 系統(tǒng)的最終效果應(yīng)該就是這樣。人的要求會變得兩極分化：要么就是個基礎(chǔ)人類，能接 AI 給我的單、能處理物理事件；要么就是管理者，決定什么樣的生意要做、賦予東西意義。

在這種系統(tǒng)里，人的培訓(xùn)成本就很低。任務(wù)都是 AI 給你明確上下文之后派出來的，甚至不需要勞動合同，我就是臨時過來做 10 個單子然后走了。而且一旦有系統(tǒng)，你做過的單子都有評價體系在里面，你不好好做以后接不到這種單子。

AI 能夠把服務(wù)成本降到極低，實現(xiàn)真正的個性化。比如給本地餐廳推銷，你可以直接用 AI 幫他量身定制好菜單發(fā)過去，根本不用等他來注冊，直接把結(jié)果給他說這已經(jīng)是你公司的員工了你要不要？400 次免費，用好了你就付錢。這在以前根本不可能。

但它是分階段的，沒有辦法一竿子捅到底。隨著制度完善和人的接受度提升，系統(tǒng)里很多東西會逐步變成次拋的，人要確認的東西越來越少。

07每個人都能 Build 自己的東西」是不現(xiàn)實的

Founder Park：定價策略是怎么考慮的？

趙赫：Lucius 推出了免費版本，助力早期社區(qū)做好出海用戶運營。收費按 Action 計價，不管是知識清洗還是 Context 清洗，我們也算成 Action。

三個版本：第一個完全免費，400 個 Action 以下隨便用；最便宜的是 199 美金/月；最貴的目前是 499 美金/月，3000 個 Action，可以 0.15 美金一個 Action 進行增購。

定價是平衡了美國當(dāng)?shù)馗鞣N BPO 的價格設(shè)計的。之后會出現(xiàn) 1500、2000 這種價格的角色，必須有更高級角色出現(xiàn)時才設(shè)置。

買傳統(tǒng)客服可能需要自己配工作流、手寫文檔上傳才能開始用。買我們的客服什么都不用干，直接裝進去，安裝即開始，零起手配置。

Founder Park：如果通縮持續(xù)、人力價格被壓下來，AI 員工的定價空間會不會被人力價格倒掛？

趙赫：會的。所以要加快向 Context Layer 靠近。如果只賣「替人干活」，人便宜了你就得跟著便宜。但如果賣的是「組織的 Context 積累」，這個東西越用越厚，換不掉，那定價邏輯就不一樣了。

Founder Park：交付結(jié)果的產(chǎn)品和增強人類能力的工具，未來誰會更強？

趙赫：最后會分層。目前 AI 服務(wù)的 Builder 大概幾千萬，在能享受 AI 生產(chǎn)力提升的群體里面是非常少的一部分人。技術(shù)跑得很快，但普通人追不上來，他有自己的生意，沒時間去 Build。所以大部分人只能買結(jié)果。

最終的狀態(tài)應(yīng)該是：通用性的東西專門服務(wù)有能力構(gòu)建的 Builder；能交付結(jié)果的服務(wù)沒有能力構(gòu)建的大多數(shù)人。

用上一時代的例子：我們是做低代碼的，低代碼理論上學(xué)會了什么都能 Build。但這樣的產(chǎn)品不影響有贊、微盟上市，也不影響 Shopify、Wix 占大份額。Builder 型工具一直沒有占特別大的份額。

Founder Park：這么說的話，"每個人都能 Build 自己的東西"這個場景是不是太理想化了？

趙赫：太理想。之前有人問我 AI Coding 這么牛了，是不是所有應(yīng)用都次拋，需要什么就現(xiàn)場生成？這個前提是 AI 有足夠多的常識能輸出最優(yōu)解。但最優(yōu)解是 It Depends，要基于你此時此刻的狀態(tài)給你一個最優(yōu)解。

最優(yōu)解沒有通用解，最優(yōu)解和唯一解不是一回事。

而且普通人有沒有成本做試錯？讓 AI Build 一個東西，一遍不行兩遍不行十遍不行，有這個時間成本和機會成本嗎？只要進入盈利性的生意，對時間成本容忍度極低。To B 的世界就是：買過來就必須行。

但 To C 不一樣。To C 主要是好玩，Build 的過程就是滿足欲望。當(dāng)年函子有統(tǒng)計數(shù)據(jù)，超大比例的應(yīng)用搭建出來沒有任何實際意義，搭建的過程就是它的意義。大學(xué)生是 AI Coding 的主流群體，當(dāng)年低代碼時就是。做最多的項目是二手交易商城和表白墻，到了 AI Coding 還是這兩個。有意義嗎？沒有。但他很快樂，為快樂付錢就是意義。

有人跟我說「我不玩游戲了，直接用 AI Coding，每天 Build 東西比玩游戲快樂多了」。跟沙盒游戲、我的世界一樣的探索感。但最后發(fā)現(xiàn)投到生產(chǎn)里不能用，還是去買了產(chǎn)品。很多人嘴上罵產(chǎn)品簡單，Manus 剛出來大家都說"這東西好簡單我自己也能做"，但即便做成那樣子也是很困難的，里面有大量經(jīng)驗和 Prior。

08Harness 是核心本體和真正壁壘

Founder Park：技術(shù)上來看，你們跟 OpenClaw 這類開源框架的本質(zhì)區(qū)別在哪？

趙赫：OpenClaw 解決了一個很重要的問題——讓 AI 能動手。它證明了 Agent 可以連接工具、跑多步驟任務(wù)、調(diào)用 API。但企業(yè)場景里有三件事它解決不了。

第一，多租戶隔離。OpenClaw 是「一個人用一個 Agent」的架構(gòu)。但我們要同時服務(wù)幾十個客戶，每個客戶有自己的知識庫、規(guī)則、用戶畫像，數(shù)據(jù)必須完全隔離。這不是在外面包一層就能解決的，要求從數(shù)據(jù)模型到上下文組裝到權(quán)限控制，全鏈路都按租戶隔離。

第二，企業(yè)級治理。OpenClaw 的安全策略寫在 prompt 里，意味著用戶可以通過 prompt injection 繞過去。我們的安全底線是寫在代碼里的，模型根本看不到那層邏輯，不存在繞過的可能。另外企業(yè)要的是「什么角色能做什么事、什么情況必須轉(zhuǎn)人工、誰來負責(zé)」，這一整套治理框架，開源框架完全沒有。

第三，被動沉淀 Context 的能力。開源框架的記憶基本是個人級的，記住你喜歡什么格式、上次說了什么。但企業(yè)需要的是組織級的 Context 積累：知識盲區(qū)自動追蹤、用戶畫像跨會話沉淀、處理模式越用越厚。這不是一個記憶模塊能解決的，它需要知識引擎、用戶畫像系統(tǒng)、狀態(tài)機、反饋環(huán)路整個閉環(huán)跑起來。

一句話總結(jié)：OpenClaw 給了你一個很強的發(fā)動機。但我們需要造的是一輛能在企業(yè)高速公路上合規(guī)行駛的車，有安全帶、有保險、有導(dǎo)航、還得記得路。發(fā)動機只是其中一個部件，而且它還是可以換的。真正不可替代的是外面那一整套 Harness。

Founder Park：你們是怎么搭建 Harness 的？

趙赫：結(jié)合我們的實踐，Harness 至少包含四層?xùn)|西。

第一，上下文組裝，誰在問、問的是什么、這個人之前經(jīng)歷了什么、公司的規(guī)矩是什么，全靠 Harness 在調(diào)用 LLM 之前組裝好塞給它。

第二，行為約束，哪些話絕對不能說、哪些情況必須轉(zhuǎn)人工，這一層不是靠 prompt 實現(xiàn)的，是代碼級強制執(zhí)行的。

第三，狀態(tài)管理和任務(wù)調(diào)度，模型是無狀態(tài)的，但企業(yè)場景里的任務(wù)有連續(xù)性，Harness 負責(zé)維護這些狀態(tài)。

第四，可觀測性和評估，模型做了什么決策、調(diào)了哪些工具、回復(fù)質(zhì)量怎么樣，全要被記錄，可追溯、可審計、可改進。

對 Lucius 來說，Harness 不是一個附加功能，它就是我們產(chǎn)品的核心本體。LLM 是可以換的，Claude 換 GPT，用戶無感，但 Harness 換不了，因為里面沉淀的是對企業(yè)場景的理解、對用戶行為的建模、對治理邊界的定義。這些才是真正的壁壘。

09最怕的不是跑不夠快，而是跑錯了

Founder Park：團隊的壁壘是什么？

趙赫：最核心是工程能力。怎么保證在復(fù)雜的分布式交付情況下的交付質(zhì)量。競品想學(xué)的話需要很長時間，領(lǐng)頭的人底子必須有大型系統(tǒng) Infra 構(gòu)建經(jīng)驗。需求誰都看見了，但沒人構(gòu)建，本質(zhì)上是大型系統(tǒng)構(gòu)建的工程管理難度不低。

另外一個軟性的東西是「示能」，最近紅杉有個分享提到的概念叫「示能」（Affordance），就是做出來的東西別人一看就知道干什么的、怎么用。產(chǎn)品設(shè)計上能不能讓人一看就知道怎么用，這是一種很難復(fù)制的能力。

最傳統(tǒng)的說法是數(shù)據(jù)和品牌，只有這兩個能跨周期。采集數(shù)據(jù)、消費數(shù)據(jù)的閉環(huán)必須順暢，市占率推動速度要快。

Founder Park：如果 Discord 或 Slack 官方下場，直接內(nèi)置類似 Lucius 的 AI 員工，你們怎么辦？

趙赫：Lucius 解決的是信息散落的問題，它要做我這個層，也得支持多平臺。聚水潭不害怕電商自己的 ERP，它存在本身就是因為有多平臺和多店鋪以及多倉庫的管理，平臺方的 ERP 很難撼動它的位置。單一平臺做自己的 AI 也一樣，你的 Context 不可能只在一個平臺上。

Founder Park：會擔(dān)心你們在模型公司的主干道上嗎？

趙赫：模型現(xiàn)在做的記憶層主要管理用戶跟 AI 之間的 Conversation，不是業(yè)務(wù)流轉(zhuǎn)中的狀態(tài)數(shù)據(jù)。模型確實在轉(zhuǎn)向 To B，OpenAI 和 Anthropic 跟 PE 公司成立合資公司，但走的是 FDE 路線、塔尖的 KA 客戶。

用朱嘯虎的話說：這種臟活他們不愿意做，影響估值。從最底層踩碎片做清洗，這個活又臟又累。模型廠合資搞 FDE，本質(zhì)也是為了擴大 API 的銷售量。Context 層能幫模型進入之前進不去的最后一公里場景，我們可以幫模型更下沉。

Founder Park：你覺得你們是這個賽道的引領(lǐng)者嗎？

趙赫：在 Context 層的沉淀和清洗這一塊當(dāng)下絕對算。但引領(lǐng)者能保持的周期越來越短了，一旦我們 PR 了，出現(xiàn)類似產(chǎn)品的周期就可以倒計時了。

最怕的不是跑不夠快，而是跑錯了，一步踩空三個月身位就沒了。下一個角色選錯了、Context 方向不對，市占率就被趕超。

正確的邏輯是：把 Context Layer 采集和消費做好的最小場景，但夠普及、速度快。切進來拿到 Context 了，可以慢慢加功能。先把信任構(gòu)建起來，他信你，才敢把 Context 放你這。

Founder Park：你今年會焦慮什么？

趙赫：團隊跑的速度上有些焦慮。最焦慮的問題是消費者期待過高，市場被各種 AI 產(chǎn)品挑動得很高，有人認為買個 AI 員工下個月就可以裁員了，這種不正確的期待需要有教育成本。

團隊速度方面：我們推出來的已經(jīng)是內(nèi)部第四版。每次版本切換做遷移很頭疼，測試工程量幾何倍增長，系統(tǒng)一變測過的都要重新測。犯過的最大的錯就是沒更早做 Test Infra。

另外一個點是現(xiàn)在招來的工程師比較浮躁，AI Coding 賦予了很大能力后想做大東西，讓他蹲下來打磨工程化的東西就沒耐心。每次看到 OpenClaw 或 Hermes 出來，團隊也會有情緒，擔(dān)心被吃掉市場。但我個人戰(zhàn)略定位比較穩(wěn)，不會跳來跳去。

還有代碼 Review 比以前更難，代碼產(chǎn)出快了，但工程化組合出結(jié)果的速度沒有預(yù)想那么快。提交上來的 PR 還是要人審，一個功能四五小時做完，測試加推上去可能要兩周。

Founder Park：如果兩年后這個事沒做成，你覺得是什么原因？

趙赫：應(yīng)該是市占率滲透速度不夠快。商業(yè)化增長速度不夠快。

轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.