網易首頁 > 網易號 > 正文申請入駐

字節、階躍之后，張心皓押注Human Loop：Agent Loop贏家通吃，創業要走另一條路

2026-04-28 16:58:39　來源: FounderPark

北京舉報

分享至

張心皓在字節跳動待了 10 年。

參與了今日頭條從幾百萬 DAU 做到接近一億的過程，從零開始建起皮皮蝦。2023 年出來創業，公司被階躍星辰并購，在里面做了兩年 ToC 產品合伙人，把冒泡鴨和躍問都經歷了一遍。

去年 6 月，他出來做了 Jovida。

Jovida 的產品目標只有一句話：「Zero Friction from Desire to Action，從愿望到行動之間，零摩擦。」區別于以「自動完成任務、Agent 替代白領工作」為方向的 Agent Loop 路線，Jovida 想做的是「Agent in the Human Loop」，讓 Agent 真正進入用戶的生活。

「Claude Code 定義了純 Agent Loop 的智能上限，它會越來越全能，正在把所有工具效率類產品的天花板一個接一個打穿。」

「到今年年底，我判斷人類在 Agent Loop 中干的事情接近 0%。那人類真正剩下的東西，就只有自己的體驗和行為了。」

工作效率是大廠和頂級創業公司的戰場。工作之外的 16 個小時，那些想做但沒做的事、想要但還沒發生的改變，依然沒有人好好解決。Jovida 想做的，就是這件事。

以下是 Founder Park 與張心皓的對話，經編輯整理。

產品官網：https://jovida.ai/

采訪 | 萬戶

編輯 | 夏天

??關注 Founder Park，最及時最干貨的創業分享

Founder Park 正在持續尋找值得被看見的 AI 團隊與項目。

我們將通過「AI 產品市集」、內容報道、社群分發等方式，幫你觸達早期用戶、獲得真實反饋，以及建立關鍵連接。

如果你正在做 AI 相關的事，歡迎和我們聊聊。

01純陪伴產品不成立，但陪伴的價值是存在的

Founder Park：先聊聊你的個人經歷？

張心皓：嚴格來說這是我第三次工作經歷。第一段在字節跳動，待了差不多十年，2014 年到 2023 年。最開始以應屆生身份加入今日頭條，當時頭條只有幾百萬 DAU，大家一起做到了將近一億。之后在字節內部一直在探索各種內容平臺、UGC 平臺，從 0 到 1 做了皮皮蝦。

皮皮蝦峰值做到差不多 10 億左右的營收，團隊有上百號人。基本上是短視頻大浪潮之前，做得比較成功的一款偏娛樂社區的產品。但短視頻來了之后，天花板比較受限，我就把產品交給別人，重新加入教育這邊負責一款 ToB 產品，最后在字節人力那邊做了一年半，負責組織改革和創新，這十年參與或見證了字節跳動幾乎所有產品與組織從 0.5-1-100 的所有過程。

2023 年初出來創業，做了一個招聘方向的 Agent，三個多月后公司與階躍星辰合并，在里面做了兩年 ToC 產品合伙人。先探索了冒泡鴨，之后轉到躍問。去年六七月出來，創業做了 Jovida。

Founder Park：字節這 10 年，給現在做 AI 產品，哪些東西還在復用？哪些東西反而成了束縛？

張心皓：反而是對人才的判斷上面幫助最大。AI 時代很多具體做產品的思路甚至是束縛，或者要反著來，但字節很鼓勵的是看人看本質，EGO 要小，Context not Control，這些非常本質的關于人的判斷，我覺得是一直受用的。

但具體到很多做產品的套路或策略，很多時候甚至要故意反著想。

Founder Park：階躍兩年最大的收獲是什么？

張心皓：在大廠做移動互聯網，更像是在別人給出解題思路的環境中去解特定的題。字節那套解題思路是張一鳴給點撥的，足夠先鋒、足夠第一性，圍繞組織、人才、一系列 APP 進行的綜合訓練。到了階躍，更像是在一個完全不同的解題框架內，從 0 開始學習。

從階躍出來還有一個原因：階躍作為大模型公司，核心是服務于大模型本身的提升。對于偏產品、偏業務的同學，基本上沒有能力去提升模型智能的上限。但當我出來的時候，整個行業范式已經從大模型進化到了 Agent 范式。Agent 最近有個更時髦的詞叫 Agent Harness，它更像是大模型時代的操作系統。這個操作系統一旦成熟，對所有業務同學來說就有了非常多機會去開發各種應用。

包括我跟行業里很多大模型公司的業務同學交流，會發現大家好像都有點有勁使不出，但 Agent 時代到來之后，大家又充分可以釋放每個人的想象力做出各種各樣的產品。

Founder Park：2023 年底大家都在做 AI 陪伴，現在回頭來看，那一輪探索給你們留下了什么？

張心皓：更多的是在平衡確定性和探索模型邊界。那個節點行業內能用的產品，一個是 Perplexity 把搜索結合進去，第二塊就是 AI 陪伴。

一系列探索下來，冒泡鴨的留存非常好，日活用戶時長將近兩個小時，但最大的幾個問題在于：第一，它沒法幫助模型智能提升，純閑聊對模型智能幫助不大。第二，用戶天花板有限，對虛擬角色陪伴感興趣的用戶天然是一小撮。

但我們團隊從一開始就明確，純 IP 或純角色陪伴一定不行。所以做了一個轉變：把角色陪伴融入到互動故事和互動游戲中。單純跟角色聊天，時長越長 Token 消耗越高；但如果模型生成一系列互動故事，Token 的邊際成本是遞減的。做了一兩個月就轉型了，產品路線跟星野、Character.AI 也不完全一樣。

最核心的收獲是對陪伴價值的認知。很多人可能因為純陪伴類產品天花板有限，就否定了整個「陪伴」這個屬性的價值。但我們現在做的是服務于人個體變好的產品，會發現陪伴價值非常大。把陪伴作為 100% 要素做成一個產品形態，在那個節點不成立。但陪伴的價值如果融合到更多產品場景中，比純工具效率類產品的價值大得多。

以前更像是基于對話的 chatbot 式陪伴，上下文就是你說的話；現在更像是你身邊真實社交關系的陪伴，它了解你更多的上下文，能干更多的活，在過程中交付某種陪伴價值。

02不做工作效率 Agent，做工作之外的個人 Agent

Founder Park：去年 6 月出來，為什么是那個時機？

張心皓：發現 Agent 的機會變得非常確定了。相比 LLM，Agent 離用戶場景更近。基于 LLM 能做的事情有限，但 Agent 一旦出來，解鎖的機會太多了。對做業務、做產品的人來說，這是一個極好的武器。回頭來看，天時地利人和都到了一個很好的擊球點。

而且創業是一個更充分地跟市場競爭的狀態。塔勒布有本書叫 Skin in the Game，讓自己的肌膚之痛參與到市場競爭中。自己創業讓身心都能感受到市場風險，這反而是創業非常重要的要素。

Founder Park：方向一開始就定了？

張心皓：都確定了。我在 2023 年 3 月到 6 月就創業做過一個招聘 Agent，那時就在探索 Agent 的可能性了，只是技術更不成熟。2025 年更像是 Agent 技術成熟之后的確定性方向。

方向確定之后，我們沒經過太多討論就把「幫助個人健康」敲定了。我們團隊里的產品合伙人，通過一個營養師減肥，三個月瘦了 40 斤。我們覺得營養師這個角色是一個非常好的可以被 Agent 化的工種，而且大部分交付都在純線上。

從這個原點出發，我們思考：從減肥到各種泛健康，這些領域背后都有一個「教練」角色可以被 Agent 化。我們始終在思考：現實生活中一個人怎么做好這件事，我們就應該努力讓 Agent 像人一樣做好這件事。

Founder Park：為什么不做工作效率？

張心皓：我天然不太希望陷進一個所有人都在卷的紅海。整個工作效率賽道，不管去年還是今年，都是巨頭的主戰場。真正沒有被滿足的，是非工作時間的 16 個小時。

往兩個方向看：一類是幫人更好地消磨時間、獲得某種體驗和情緒價值；另一類是幫人改善生活狀態，讓想要的東西真正發生變化。我們更偏后者。從冒泡鴨到 Jovida，更像是一點點把一個模糊的「個人生活方向」收斂成了當下更具體的命題。

Jovida 上的目標可以很自由

Founder Park：所以你在找弱共識的賽道？

張心皓：共識不是不對，共識往往意味著確定性很高。但作為創業公司，你要想好你的結構性優勢是什么。如果你沒法確保自己在和大廠、和其他創業公司的廝殺中取得競爭優勢，那就逼著你去思考那些當下弱共識、但長期會成為共識的事情。我們希望更早地占據時間優勢。

在冒泡鴨的時候就是這樣，23 年我們在角色陪伴上做了一個弱共識的探索：內容互動和游戲互動。24 年在躍問做了一個 Vibe Coding 創意板，回過頭來看類似于現在 Loopit 那種 AI 生成小游戲。我不希望去跟別人卷 chatbot 或卷工作效率。

Founder Park：有沒有擔心做得太早？

張心皓：提前一步是先鋒，提前兩步就是先烈了。最大的關鍵是 ready 的技術會不會在未來 6 個月內到來。

從 Deep Research 開始，OpenAI 已經把第一代 agent 能力解鎖出來了。模型不只是會 chat，它真的可以圍繞一個目標去規劃、檢索、調用工具、整理結果。之后 Manus 和 Claude Code 又把這種能力覆蓋到越來越多場景。

如果穿透到底層去看，這個方向的確定性已經很高。它可能在模型、上下文、記憶管理上還有很多閾值要提升，但 agent 技術本身已經成熟。

用戶教育當然是更大的風險。但在 AI 產品層出不窮的階段，誰先讓用戶知道一個場景，誰就能更早取得認知優勢。承擔教育用戶的成本，本身也是獲得先發收益的方式。

Founder Park：所以你的意思是，技術成熟度差不多了，如果市場和用戶教育還沒有被做好，反而是你們的機會，因為先下場的人能更早拿到用戶認知？這會不會有點像先占住用戶心智？

張心皓：這確實是一個更大的問題。很多 Agent 產品出來之后，用戶還沒有很好地適應產品背后的場景。但教育市場本身就是誰先搶到先機、誰就獲得最大收益。它是風險最大、但收益也最大的事情，Manus 就是典型，出來之后既完成了教育用戶，又獲得了大量用戶。

在 Agent 產品層出不窮的時間段內，誰最先讓用戶在你的場景中了解你，就可能取得相當大的用戶認知。認知在當前節點是非常重要的事情，當然比認知更重要的肯定還是產品體驗以及用戶粘性。

03從愿望到行動，產品目標是消除中間的摩擦

Founder Park：Jovida 這個名字怎么來的？

張心皓：首先比較務實，先看有沒有人注冊商標。AI 時代產品名字本身沒那么重要了。Vida 來自 Vita，代表生命和活力。Joy 是快樂。太多的人關注工作效率能不能提升，但我們希望用戶能在生活中感受到更多快樂。Joy 和健康是人類長久以來希望獲得的兩種東西，合二為一，就是 Jovida。

Founder Park：你們產品的核心價值是什么？

張心皓：從第一天就定義得很清楚，而且回頭看也沒太大變化。Zero Friction from Desire to Action，從愿望到行動之間的零摩擦。

我們想幫助用戶把從「想要一個事情」到「真的去做」之間所有摩擦消除。

過去我們經常用工具價值或陪伴價值概括產品，但在我看來，要分清楚目標和手段。我們的目標是消除愿望到行動之間的摩擦；工具價值和陪伴價值都是手段，而且兩者都要用好。

工作效率類產品已經有越來越多純 agent loop 產品在解決，Claude Code 是典型代表。它可以非常好地解決大量工作和執行類問題。

但在工作之外的 16 個小時里，有非常多想做但沒做的事。比如你在 B 站或小宇宙刷到一個播客，真正把這兩個小時的播客內容轉成行動，中間有大量摩擦。你在小紅書刷到一個演唱會信息，從計劃搶票，到機酒安排，每一步也都是摩擦。你刷到一個旅游目的地，從向往到規劃，也需要有人推著你，才更大概率完成。

單純工具或單純陪伴都搞不定這件事。不同愿望和目標是動態變化的。有的用戶更需要情緒支持，有的用戶更在乎結果交付。產品應該根據不同場景、不同需求，用工具價值和陪伴價值幫用戶抵達真正想要的結果。

Founder Park：降低摩擦，但不是改變行為。這個邊界怎么把握？

張心皓：改變人是反人性的，幾乎不可能。我們做的是讓人們本來就想做的事更容易發生。

這里有一個學界理論叫福格行為模型。一個行為為什么發生，背后有三個要素：motivation，動機；ability，能力；prompt，觸點。

任何一個行為，都是動機、能力和觸點共同作用的結果。抖音、美團外賣、多鄰國這些產品，都可以用這個模型解釋。只要把這三個點做到某個閾值，用戶行為一定會發生。

比如減肥。首先用戶要有動機。如果一個人完全沒有動機，我們很難喚醒他。其次是能力，能不能降低行動門檻。比如用戶要減肥，agent 能不能直接通過外賣 API，把健康餐送到用戶面前？很多人真正痛苦的地方，往往不在吃不吃健康餐，更多在選外賣、找健康餐廳這一步消耗了大量摩擦。

第三是觸點。傳統工具是定時提醒。我們希望基于 context，在合適時刻提醒。比如知道你今天晚上 8 點在涮羊肉店坐下，就告訴你今天涮肉可以把麻醬換成海鮮汁，多吃蛋白質和蔬菜。

agent 擅長這三件事：它能營造個性化外部動機，能用工具降低行動門檻，也能知道 context，在合適時機觸達。

Founder Park：這套行為模型是你們一開始做產品時就在參考的嗎？

張心皓：是的。我自己很早就在關注福格行為模型，甚至在它還沒有被翻譯成中文版的時候，就已經在思考這套理論到底有多少可實施性和科學性。

我們從做這件事的第一天開始，就在尋找一種跟人類行為、跟人性不對抗的理論方式。字節給我的產品教育里，很重要的一點就是做符合人性的產品，或者做符合人性的機制。很多人一聽減肥，會覺得它逆人性，但逆人性的地方往往來自過度關注意志力，或者強求一個沒有動機的人去減肥，這些都不符合行為科學。

04不去定義人，去定義場景

Founder Park：你們會有明確的用戶畫像嗎？

張心皓：我在思考「用戶畫像」這個概念是不是也是古法做產品的思路。你要先框定一個很具體的用戶畫像，幾十到幾十歲的男生或女生、收入多少、是不是白領。但 Agent 天然是更通用的東西，你在思考用戶畫像的時候不應該再圍繞古法畫像去思考，而是思考你的產品能不能圈定一部分用戶價值，再把這些價值搭配上一個又一個場景 sell 給不同的人，而不是一上來就框定到特定畫像的人群。

所以我們更關注的不是他是誰、什么樣子，而是他現在有沒有一個想做但沒做的事。只要有這么一個 gap，我們就有機會創造價值。不去定義人，去定義場景。甚至這個場景可以有非常多，而不是一個很 niche 的很小的場景。

Founder Park：那 PMF 怎么判斷？

張心皓：PMF 這個概念在 agent 時代也要重新思考。

過去 PMF 意味著，一個產品在一段時間內，用相對穩定的方式滿足用戶一種相對穩定的需求。但 agent 時代，模型能力、工具能力、交互范式都在變化。

如果一個產品過早定義甚至以為自己找到了 PMF，就意味著它跟用戶穩定需求極為匹配。但另一端，agent 能力在指數級提升。過早相信自己找到了 PMF，團隊就會在一個確定的 PMF 上做局部最優，反而錯失下一輪能力躍遷帶來的機會。

AI 創業最大的風險，不在沒找到 PMF，風險在過早以為自己找到了 PMF。

我們現在的策略，是每個階段都達到一個還不錯的匹配狀態，但同時更早為下一代 agent 能力做好準備。在光譜上，我們會稍微偏離用戶穩定需求一點點，離模型智能上限更近一點點。

Founder Park：那你們怎么確認需求是確定的？

張心皓：上一代產品已經驗證了很多需求。

語言學習有多鄰國，月活 1.5 億左右。減肥、睡眠、禱告提醒，每個品類在移動互聯網時代都有大幾百萬甚至上千萬 DAU 的產品。這些產品都在單點場景下驗證了需求，只是它們用純工程化方式解決問題。

我們今天做的是，用 agent 方式覆蓋更多場景，更好地滿足這些需求。

比如抖音替代了看電視，刷視頻和換臺，本質上滿足的是同一類需求。我們也能從上一代產品里看到，用戶需求已經存在，只是產品表現形式會變。

Founder Park：單就學英語這個場景，你們產品跟多鄰國對用戶來說有什么區別？

張心皓：多鄰國是個挺偉大的產品，我們核心是看能不能把多鄰國的核心理念 AI native 化。具體來說有三個維度的差異：

第一是動機層面。Jovida 允許用戶自己創造陪伴自己的 IP，可以是知名角色，也可以是自己喜歡的角色，千人千面地提升動機。多鄰國的 IP 是團隊運營多年的最大公約數形象，但一定不適合所有人。

第二是能力層面。多鄰國的內容是人工定義的填空題、連線題；Jovida 可以讓用戶自定義學習方式。比如你想學大模型相關的英語，可以把一個海外發布會視頻直接扔給 Jovida，它就能把視頻變成語言學習的材料。這種定制性多鄰國做不到。

第三是觸點層面。多鄰國的觸點是固定時間推送，非常死板。我們知道用戶的日歷和日程，知道某段時間有 5 分鐘空隙，就引導用戶來看 5 分鐘感興趣的語言材料。

但我們更大的優勢在于關聯性。多鄰國學英語和學法語的 context 之間沒有什么互相促進的作用。但對我們來說，知道了你的演唱會意圖、睡眠意圖、護膚意圖，這些意圖之間完全可以互相關聯，讓 Agent 幫你挖掘更多意圖，也讓單個意圖表現更好。

Founder Park：用戶在什么時候會體驗到 aha moment？

張心皓：短期的 aha moment 一定來源于最淺層的陪伴價值。包括我們每天學多鄰國的時候，最 aha 的其實不來源于你把題做對了，而是做對之后給你的特殊動效、當天的連勝。

但還有一種 aha moment 來源于多個目標之間的涌現效應。比如我知道你要去看演唱會，就把你喜歡的明星的歌詞轉成今天英語測試的題。你并不是在學一門枯燥的語言，而是模型自動幫你準備好了你喜歡的明星演唱會歌詞的英語版讓你來測試。

或者你的一個目標是想要更好的穿搭，我把國外服裝品牌推薦給你，把品牌名當成英語練習的詞匯，怎么發音、什么意思、起源是什么。五一要去東南亞旅游，今天練習的詞匯就是旅游相關的；6 月要去硅谷了解 AI 創業，提前兩周幫你準備和 AI 創業者交流的詞匯。

我們的 aha moment 不來源于單點場景做得多好，而來源于 Agent 知道了你足夠多的上下文之后，能把這些上下文之間互相聯系起來。

Founder Park：更像是打通了多點意圖之后涌現出來的一些新的驚喜。

張心皓：「涌現」這個詞非常準確。而這一切的前提是用戶愿意把生活中的意圖分享給我們，我們創造了足夠強的動機，整個事情就循環起來了。

05Claude Code 之后，創業公司要做 Agent in Human Loop

Founder Park：你怎么看 Claude Code 這類產品的 PMF？？

張心皓：Claude Code 基本上定義了純 Agent Loop 的智能上限，而且這種上限能夠吃掉非常多的垂類 Agent。以前有 PPT Agent、表格 Agent、各種垂類 Agent，現在 Claude Code 全都能搞定了；你用 Claude Code 編輯視頻、生成圖片、做調研，甚至當成簡單的 chatbot，都可以。

而且這里面還有個額外的優勢：在工具效率場景下，上下文之間是可以互通并解鎖新場景的。我們公司內部把代碼、設計稿、產品文檔，甚至飛書文檔都融到一個 context 里面，從數據分析再到產品分析，再到 bug 查找，整個鏈路全都被 Claude Code 覆蓋了。

工作中整體是一個需要重協作的完整鏈路，一方面從能力角度會發現贏家通吃，另一方面從上下文角度也是贏家通吃。如果有另外一個數據分析 Agent，它只能拿到數據分析相關的上下文，哪怕效果優化得足夠好，也完全無法像 Claude Code 一樣貫穿整個鏈路。

我們最近在對比 Claude Code 生成 PPT 和 Gamma 這種在 PPT 領域沉淀了很久的老牌產品，完全降維打擊。

Founder Park：這豈不是意味著工具效率賽道創業者沒什么機會了？

張心皓：如果一個團隊做的是純粹的 Pure Agent Loop，有機會的概率會很小。可能做成一個生意，但很難做成一個大賽道。因為通用的 Claude Code 會變得越來越全能越完善。

到今年年底我判斷，在純 Agent Loop 中人類做的事情幾乎等于 0% 了，它已經遠遠超過大多數人能做的事。

Founder Park：你們提到 Agent in Human Loop，跟 Human in the Agent Loop 最大的差別是什么？

張心皓：最大的差別在于到底是以 Agent 為本還是以人為本。我們起步是希望幫助人變得更健康，所以天然更在意人。Agent Loop 可以沒有人，但 Agent in Human Loop 無法把人取代。

在 Claude Code 變得越來越強之后，我們會發現這種純 Agent Loop 會替代越來越多的工作崗位。當越來越多工作崗位被取代之后，人類真正剩下的東西其實就只有自己的體驗和自己的行為了。足夠大基數的市場只有 Agent in Human Loop。

而且 Agent Loop 的用戶只能作用一小撮高凈值用戶或公司，幫公司節約人力成本，訂閱費也很貴。但 Human Loop 的用戶基數不是少數人，是作用于更多用戶的。我們越來越覺得，能不能也讓大多數人享受到 Agent 進步帶來的紅利？因為大多數人其實只能感受到 Agent 進步帶來的對自己工作的威脅，體驗不到紅利。

Agent in Human Loop 一方面用戶基數足夠大，第二方面它是我們的產品起點，第三方面它又有非常多不同的細分場景，天然適合創業公司去找到用戶價值點。長期看來，對創業公司來說選這條路風險更低，也更有可能形成護城河，而且跟大廠的利益完全不沖突。

大廠天然的業務激勵函數跟用戶利益不完全一致。比如一個用戶可能不希望沉迷 YouTube，但谷歌不會讓 AI 幫用戶少刷 YouTube，那會影響廣告業務。Apple 也不會做一個 AI 讓用戶減少屏幕時間。Human Loop 中間的獎勵函數跟大廠的獎勵函數是不一樣的。

Founder Park：這兩條路線會互相吃掉對方嗎？

張心皓：不太會。Agent Loop 吃的是工作大盤，Human Loop 吃的是生活大盤。生活場景足夠多，用戶需求足夠分散，背后沒有像 Agent Loop 那種清晰的 Benchmark 來衡量，融入了太多個體感受層面的東西。兩個東西更多是互補的。Agent Loop 越強，Agent 就越能有效幫助 Human Loop。但純粹的 Agent Loop 不需要人參與，也吃不掉 Human Loop 的生活盤子。

06上下文飛輪是「Agent 時代真正唯一的壁壘」

Founder Park：Jovida 會怎么獲取生活場景里的 Context？

張心皓：很多人一談上下文，會去尋找更花哨的技術路徑，比如強迫用戶授權，或者做一個新硬件獲取上下文。這些事情有價值，但對偏生活化、personal 的上下文來說，更大的阻力不在技術，而在于能不能創造一個場景，讓用戶有動機把上下文喂給你。

創造場景和動機，比用某種技術獲取獨特上下文更重要。

如果一個產品足夠泛，用戶不知道你拿上下文干什么，就沒有動機分享。但如果產品明確能幫你減肥，你自然會分享體重、身高、每天吃的東西。如果你想看某個明星演唱會，把小紅書帖子分享給 Jovida，它就知道你喜歡這個演唱會，知道你在哪個城市，知道你想什么時候去。

場景創造了上下文。

Founder Park：現在你們會收集哪些上下文？

張心皓：一類是手機系統能開放的東西，比如日歷、健康、運動信息等。

另一類更重要，是用戶在外部平臺看到的東西。比如小紅書、B 站、小宇宙，海外可能是 YouTube、Instagram、Twitter。用戶可以把看到的內容一鍵分享給 Jovida，我們幫他學習、拆解，轉成每天的 action。

未來我們還會有電腦端、郵件、電話、WhatsApp 等即時通信軟件的上下文，圍繞用戶 personal context 構筑完整的低摩擦獲取渠道。

Founder Park：最重要的上下文是什么？

張心皓：用戶意圖。

用戶意圖是最重要的上下文。意圖背后就是動機。只要捕獲了用戶短期動機和愿望，就能延展出很多可能性。

比如用戶有護膚意圖，我們能不能進一步幫他推薦睡眠相關目標？用戶有旅游愿望，能不能推薦旅游服裝、防曬霜？一旦獲取了用戶的欲望或目標，就可以延展出非常多可能性。

Founder Park：是不是也意味著，你們越早下場、越早建立用戶認知，就能越早拿到用戶更多上下文；上下文積累得越多，越能給用戶更多驚喜？

張心皓：我覺得 AI agent 創業時代，真正的護城河是上下文飛輪。

移動互聯網時代大家講數據飛輪，但現在數據飛輪這個詞已經過時了。大模型沒有壁壘，agent 編排也沒有太多壁壘，創業公司唯一可能擁有的，就是你創造了某個場景，并且把這個場景體驗滿足得極好，讓用戶愿意在這個場景下源源不斷地分享上下文，然后因此形成壁壘。

站在用戶角度，他會感覺 agent 越來越懂我，越來越能幫我干更多事，也越來越能在合適時機像一個人一樣觸達我。我們評判產品場景的時候，也主要看三個標準：第一，agent 有沒有真的越來越懂我，是不是知道我更多上下文之后，能給我更個性化的東西；第二，agent 能不能真的幫我干很多事，而不是只在那里說兩句話，最后還是讓我自己干；第三，它能不能在合適觸點給我一個恰當提示，讓我在那個時間點真的往前走一步。

Founder Park：但如果站在這個點上，像微信或者蘋果這種天然擁有更多上下文的公司，它們如果自己做一個類似產品呢？

張心皓：這是一個很好的問題。但站在我的角度看，微信和蘋果更多要做的是平臺，平臺的核心目的更偏向讓自己的生態足夠強，讓底層能力更強，讓整體生態之間的聯動足夠好，不會天然聚焦在消除愿望到結果之間的摩擦。所以這里面會引出一個問題：平臺的激勵函數，或者說激勵目標，跟我們這個消除摩擦的 agent 并不完全對應。

比如蘋果一定不會天然希望用戶少買幾個訂閱，蘋果更希望自己的訂閱生態越來越豐富；但用戶在 Jovida 這里可能會提出完全相反的目標，比如我每個月 AI 支出太高了，能不能幫我合并訂閱、降低 AI 支出、降低總訂閱支出。所以平臺的定義、模式和商業目標，天然跟我們不一樣。

反過來，當蘋果、微信這類平臺給第三方產品提供更多基礎能力，比如日歷、健康、跨 APP 消息、微信小程序里的接口和載體，我們其實會更受益，因為我們能夠拿到更豐富的 context、更底層的權限接口，以及更順滑的用戶觸達。所以我覺得我們跟平臺并不是簡單替代關系，很多時候，兩邊會互相促進。

07ARR 不是目標，用戶愿不愿意持續「付工資」才是

Founder Park：你們怎么考慮商業化？

張心皓：現在大家都講 ARR，但 ARR 是結果，不是目標。

移動互聯網時代沉淀下來的不變東西，是先讓用戶離不開你，充分滿足用戶價值，形成穩定日常使用節奏。商業化應該是自然發生的結果。

當然，AI agent 產品天然成本更高，所以商業化節奏要更激進。但節奏激進，不代表順序倒置。

形式上，我們也會是訂閱制。但訂閱這個詞不本質。我們一直按照「人」或者「勞動力」的方式打造這個 agent。Jovida 更像一個幫你從愿望到行動之間消除摩擦的生活秘書。更本質的形式，是用戶愿意為 agent 付工資，讓這個生活秘書陪著、帶著自己完成一些事。

Claude Code 像公司招了一個 AI 程序員，幫公司干很多事。Jovida 更像用戶招了一個生活秘書，陪著、帶著他達成生活中的愿望和目標。

Founder Park：如果產品目標是消除摩擦，不直接承諾最終結果，這和付費之間會不會有 gap？

張心皓：會有 gap，因為我們做的是 human loop，不是純 agent loop。

純 agent loop 可以追求把 gap 消成 0。但以人為本的產品里，人這一環繞不過去。我們能做的是用行為科學，讓 gap 足夠小，讓用戶不需要太多意志力，也能更接近自己的目標。

每個人對最終價值的定義不一樣。用戶想減肥，但最后可能發現自己真正需要的是建立自我認同。只要達成用戶自己認可的價值曲線，也是一種結果。

但如果一個目標完全依賴人的意志力，軟件 agent 很難做到。早期我們不會選擇太硬核的場景，而會選擇用戶動機天然比較強的場景，比如旅行、社交、禱告、學習等。

Founder Park：那你們看哪些指標？

張心皓：ARR 如果考慮續費率，是一個綜合指標。它代表用戶愿意持續為某種結果或價值付費。

但幾個指標不能過度追求。比如 DAU，agent 產品成本結構已經變了，DAU 越高，未必對公司財務模型越好。再比如單次 ARR，很多折扣、年付都會讓它變得虛榮。

更本質的是兩個指標：用戶愿不愿意持續用你，以及用戶愿不愿意持續付錢。

拆到過程指標，我們更關心用戶愿不愿意持續貢獻 context，愿不愿意每天打開產品。相比 token 消耗，這兩個指標更關鍵。很多 token 消耗是低價值消耗，甚至是 agent 空轉。

如果用戶設了一個定時任務，agent 每天消耗很多 token，但用戶根本不看，那這種消耗沒有太大價值。

08端云一體，參考鴻蒙系統的分布式架構

Founder Park：你們的 Agent 架構跟 Manus 或 Claude Code 那種會有大的區別嗎？

張心皓：完全不一樣。我們設計 Agent 架構時發現市面上幾乎沒有可參考的范式。

Claude Code 完全是在本地端的 Agent 架構，一旦你關了電腦，Agent 就停了。Manus 基于云端虛擬機，手機端更多只負責交互。我們是端云一體。

當前只在手機端，未來會擴展到電腦端、智能硬件終端、郵件、電話。各個端都會有一個節點，核心目的不只是負責交互，而是感知不同端的能力和 context：手表端感知手表數據，電腦端感知電腦數據，手機端感知手機系統數據。各端節點感知到不同端的數據后，匯總到云端的 Agent 大腦，由云端做執行。

我們設計架構時參考的是鴻蒙系統：完全分布式的操作系統，手機端、電腦端甚至汽車端都可以有不同呈現。既不是 Manus 那種純云端的，也不是 Claude Code 那種純本地端的。因為我們是 Personal Agent，要 7×24 小時陪著用戶，就得能 7×24 小時感知不同端的數據。

我們不用沙盒制。沙盒一般為單任務服務，任務完成就銷毀。我們是終身陪著用戶、24 小時在線的，所以給每個用戶在云端建了獨立的長期狀態管理系統。

Founder Park：記憶這塊你們和其他產品區別大嗎？

張心皓：短期、長期和持久化的狀態劃分，差異不特別大。但我們的記憶更核心的不是用戶的靜態記憶，而是怎么把用戶持續的 context 轉化成持久化的目標記錄，把用戶的動機、訴求當成持久化的目標去管理。

我們 APP 上的數據是互相打通的，不是單向的 markdown 文件去記憶。你今天瘦了一斤、明天瘦了兩斤，每一個字段的數據也是記憶的重要一環。

所有記憶系統圍繞著怎么讓用戶動機變得更強、能力門檻降低、合適觸點去搭建，而不只是跟模型 chat 的時候能回憶起某兩句話。

Founder Park：在你們場景里，chat 不是高頻交互？

張心皓：用戶主動 chat 不是高頻的，但我們的 Agent 會主動高頻地跟用戶 chat。Agent 不停地感知今天用戶的時間、睡眠時間、步數、在小紅書看的東西，自己在那里思考、干活、說話。用戶也可以選擇不看。只有重要的消息才會提醒給用戶，不重要的消息你也可以當成一個對楚門世界的觀察，看它怎么存活。我們就是在按照活的、很有活人感的東西在打造它。

Founder Park：模型選擇會成為 Jovida 的瓶頸嗎？

張心皓：完全不是。

現在模型，包括國產模型，都在不斷出現 SOTA。模型本身沒有什么壁壘，更重要的是怎么平衡經濟性，以及不同場景適配不同模型。

讓一個極聰明的模型干非常簡單的活，是算力浪費，也會讓經濟性變差。所以我們要先定義好業務場景，在 agent 編排層兼容不同通用模型。

從第一天開始，模型和我們的編排就是解耦的。我們考慮的是內部 Benchmark 能不能達成。

Founder Park：也就是說，難點變成怎么把合適任務分配給合適模型？

張心皓：是的。

這里還涉及組織。不能用純體感拉齊 AI 工程師和非工程師，因為大家體感差異非常大。

我們從大模型公司學到的經驗，是用 Benchmark 連接用戶需求表達和研發實現。什么場景下用什么模型，怎么交付結果，要用 Benchmark 對齊。這個 Benchmark 可能涵蓋經濟性、吐字延時、agent 編排能力等。

現在對 agent 公司來說，Benchmark 和具象產品 Demo，可能已經取代了上一個時代的產品需求文檔，以及產品和研發之間的溝通方式。

我們內部做產品，基本上是產品或設計師先生成一個可交互、可感受的產品 Demo，再有同學出一個 Benchmark。這兩個東西加起來，就足夠驅動研發理解我們想做什么。

09AI 創業，每個維度做到極致才有可能活下來

Founder Park：字節做產品有些很經典的理念，到了 Agent 時代哪些變了？

張心皓：舉個比較具體的例子：字節做產品之前，華巍在飛書上有個簽名叫「別煮大海」，Don't Boil the Ocean。說產品從 0 到 1 的時候，你不應該煮大海，要從一個更 niche 的方向或場景切入，不要想著面面俱到把所有事都做好。這個在移動互聯網時代非常非常重要，因為大部分人會更貪婪，更想做大，沒有想著從一個細節去出發把產品做好。

但到了 Agent 時代，前兩天 YC 的 CEO Garry Tan 發了一篇文章，恰恰反過來叫 Boil the Ocean。他提到在 Agent 時代做產品，你要煮大海。不是說泛泛地做通用的東西跟大廠競爭，而是在思考之初就應該去想你這個產品的 Agent 能不能給你提供多大的紅利，能讓你覆蓋多少用戶場景。

很多做產品的具體切入點都發生了變化。反觀我這次創業就會發現，知道了這么多道理，還是在不停犯錯。但唯一沒犯錯的，就是只要對人才的本質足夠洞察、足夠深刻，字節說的都還是對的。

Founder Park：對比移動互聯網時代，除了范式變了之外，今天的產品想活下來是不是也變得更難了？

張心皓：100% 變得更難了。因為競爭維度變多了。以前我剛加入字節的時候，公司對今日頭條這款產品的期待，其實是相對低調地發育，在市場還沒有充分關注到的時候，慢慢滲透到更多人那里；但現在產品想法已經變得很廉價了，更重要的是你怎么能夠把組織、agent 能力、產品體驗和用戶認知，每一方面都做到足夠極致，這樣整個團隊才有更大的突破概率。

站在創業公司角度看，Manus、Cursor 這些公司其實是在這些方面都做得足夠極致的狀態，反過來看，還有很多公司或多或少會在某個角度有短板。所以我覺得現在這個階段是全方位的競爭，每一個維度都要做到極致，才會有存活下去的勝率。

Founder Park：有點像你既要有足夠長的長板，短板也不能太短。因為今天做產品變容易了，面臨的又是全世界有創造力的人一起競爭，所以短板太短，很容易被別人從那個地方打穿。

張心皓：是的，因為有了 agent 自身的加強，每個人創業和做產品的門檻都大幅降低，從市場競爭角度看，一定會有相同或相似的產品來攻擊你，而且它的短板可能比你更少，長板可能和你差不多，甚至比你更長。所以這里面更多是一個數學概率問題，你的短板越多，成功概率就會大幅降低。

移動互聯網時代當然競爭也很激烈，但遠沒有現在 AI 產品這么激烈。現在是全世界所有聰明人都在下場創業，剛工作的 00 后創業者、大廠出來的創業者、學校教授，甚至投資人，都在做 AI 產品。在競爭激烈程度高一個數量級的前提下，你暴露出來的風險越多，數學概率上成功機會就越低。除非你選的場景完全沒人競爭，同時又有一撮確定用戶需要這個產品，否則只要場景足夠大，一定會有無數聰明人涌上來競爭，這時候你沒有足夠長的長板肯定不行，短板太多也不行。

Founder Park：你今年最焦慮什么？

張心皓：最焦慮的是，怎么在古法做產品和過于通用的 agent 產品之間，找到正確位置。

確定的是，古法做產品不對。但過去的路徑依賴、過去的思考方式，很容易沉淀下來，你要不斷自我糾偏，甚至否定之前的自己。

同時，你也不能過于激進地追尋最先進、最前沿、大家最共識的東西。沒有經過時間沉淀，思考不本質，也會出問題。

所以最關鍵的是在這個光譜上找準位置。跟上技術變化、競爭變化、確定性打法，都是基礎能力。方向偏了，很多努力都會浪費。

Founder Park：如果明年或后年 Jovida 沒有做到目標，你覺得最可能因為什么？

張心皓：按概率排，第一是通用和垂直這個光譜上位置沒找準。

做得太垂直，可能被更通用的東西降維覆蓋；做得太通用，用戶在某個場景上又沒有被很好激發需求。這是最大風險。

第二，是錯過某次 agent 范式躍遷窗口。agent 新概念太多，如果新范式來了，沒有及時捕捉，還沉浸在上一輪 PMF 里，就會出問題。

第三，是護城河沒有建立起來。比如上下文飛輪沒有建立起來，端云一體架構沒有很好落地。

Founder Park：如果給字節、階躍出來創業的人一條建議，會是什么？

張心皓：蘋果有個廣告叫 Think Different。如果套用這句話，我覺得今天應該是 Think Agentic。

不管怎么在光譜上找準位置，有一個確定結果是：它一定更 agentic。還是要以 agent 為中心去思考每一件事。

我們希望 agent 融入 human loop，結果上是幫助 human，但過程中要以 agent 為中心思考問題、思考組織。

最怕的是沉浸在過去的成功經驗、過去的思考方式、過去的工作方式和組織方式里。這是失敗風險最大的地方。

轉載原創文章請添加微信：founderparker

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.