這篇文章主要講什么:從一個游戲策劃的視角,串起 llm → vibe coding → agent → skill → harness 這條線,再聊到游戲開發,ai native,組織變革,社會影響。 寫給誰:愿意上手實踐 ai 的人,特別是產品,設計,內容,管理崗。 本文手工編寫后由claude code優化調整。 大概 10000 字,30 分鐘。
最近半年,我花了大量時間在 ai 上。給團隊搭工作流,拉朋友一起做實驗,自己也寫了一堆 skill 和 harness。我影響了一些人,也被一些人影響。
這是 ai 爆發以來我第一次手打寫文章,以前的稿子大多是讓 ai 寫的。所以這一篇,是用我自己腦子里還沒有被 ai 替代掉的部分,整理出的脈絡和判斷,給同樣在嘗試的人做參考。
![]()
最近發生了什么
簡單說:llm 是大腦,agent 給了它手腳,skill 是工作手冊,harness 是工作環境。
這一節梳理過去兩年大致發生了什么。不一定準確,是我自己經歷,感受到的。
llm 時代——大模型作為外腦
llm時代 主要的價值是它自身帶來的龐大的知識量,以及它帶來的基礎邏輯能力。我們嘗試使用很多技巧來提升我們對llm使用的能力。
我們常用的技巧有這幾個。
啟發式學習
:基于大模型超大的知識量,把大模型當作基礎知識庫使用。但是使用方法不是直接給出問題,而是基于目標,讓大模型給出問題,來擴展你可能不足的知識面。
歸納
(邏輯學之一):常用但非常消耗精力。讓大模型幫我們歸納,尋找問題背后的"真需求",找到第一性原理。先確定問題,這是非常重要的一步。
推演
(邏輯學之二):演繹法是另一個重要的邏輯學方法,同樣消耗精力。讓大模型對已經確定的信息進行推演,過程中討論我們關注的其他基礎問題,從而得出非常有價值的結論,幫我們解決問題。
基于上面這幾個方法,在 llm 時代,大模型可以成為我們的外腦,幫我們解決很多問題,給出各種 idea,建議,方案。
這些都是要基于一點,就是大模型邏輯能力的提升。但是這依然是大模型最差的能力,雖然它依然在不斷提升中。
vibe coding 時代
很多大模型公司對大模型的代碼能力進行了專門的訓練,甚至有一些論文認為,因為大量的代碼訓練,讓大模型本身的邏輯能力得到了巨大的提升。代碼本身就是抽象度很高的精確的邏輯語言。大家開始大規模的使用llm來寫代碼,這個過程被稱為vibe coding。我也不例外。
大約2年前,我每隔一段時間都會測試一下ai的能力,我每年都會嘗試用ai嘗試做一些小游戲,以測試ai的能力。大約1.5年前,我用現在被叫作 vibe coding 的方式做了 2 個樣例。
可以看得出來這個非常粗制濫造。基本算不上游戲,甚至算不上 demo。幾乎只能算個玩具。這些東西大概做了幾個小時,就會陷入維護地獄。進一步提高游戲復雜度就會指數型的提升成本。我們還測試了一些非常簡單的其他小游戲。諸如塔防,臺球。雖然算不上游戲,但是在自然語言編程的情況下,一個可運行的項目,依然給我們大量的驚喜。
大約半年多前,我又嘗試了一次。這次效果就提升了很多,甚至可以算得上一個demo了。下面也是大約2天內的工作量完成的demo。
第一個游戲是一個掛機桌面游戲,前后甚至有10來個子系統。帶有一些矢量圖來優化美術體驗。這在我看來是一個巨大的提升。幾乎讓做獨立游戲的門檻大大降低。但是這依然是在vibe coding的領域。
這是 ai 第一次讓"想法"和"可運行的代碼"之間的距離,短到可以無視。agent 時代 從對話到執行:精確輸出 + 長任務循環
我們不滿足于一次對話解決一個小問題,我們希望它能解決更復雜的問題。于是一個非常簡單的方法出現了,循環的進行,拆解問題,反復詢問進度,要求 llm 繼續工作。這在很多 agent 工具中的代碼只有幾十行,但是構成了 agent 工具的核心。讓我們有機會讓大模型解決稍微復雜的問題。
這就是 agent 工具最樸素的內核。簡單到看一眼源碼就能復刻,但是它把"對話"變成了"工作"。
在這之前,llm 雖然已經非常強大,但是依然基本上處于方案給予的層面。我們非常不知足,我們希望大模型可以幫我們做更多的事情,例如"執行"。想要完成執行,就需要銜接程序來執行,就需要非常精確的,穩定的輸出,來降低執行本身帶來的風險,提高實際可行性。tools 使用的訓練為這個帶來可能。
隨著大模型的邏輯能力和輸出穩定性的提升,讓它穩定輸出 json schema 變成了可能。一旦擁有這個能力,就相當于擁有使用 tools 的能力。這預示著 agent 時代的到來。當大模型可以穩定輸出 json schema 之后,我們就可以使用程序讀取這部分數據,來執行指令。
最早能執行的指令基本上是基礎的文件操作,增刪改查。早期的各類 ai 開發工具,比如 Cursor,實際上已經實現了這點,讓大模型來增刪查改代碼文件。隨著 tools 能力的提升,它不斷擴展自己的能力邊界。
從代碼到現實世界:bash + mcp
精確輸出讓大模型有技能可以實現對 bash 指令的精確輸出,從而引導程序執行 bash 指令。外加它的文件的增刪改查的能力,讓大模型可以生成代碼,然后通過 bash 指令來執行代碼。至此,它幾乎可以做任何數字層面的工作。因為幾乎所有的數字資產的生產,本質上都是代碼的執行。幾乎任何我們在電腦上進行的工作,都可以轉化為,生產一段代碼,然后執行這段代碼。至此,大模型擁有了執行能力,就像大腦擁有了手腳。
隨著這部分能力的提升,人類還是不夠滿足。我們發現我們大部分的工作時間,實際上是和特定的軟件進行交互工作,office 系列,adobe 系列,等等。它們并不開源,不能直接通過指令來完成,但是大部分工具開放了一些 api,或者是文件系統開放了一些 api,我們可以通過一些橋接程序來完成大模型的指令來操作這些 api。為了讓這些能力通用且可插拔,誕生了 MCP(Model Context Protocol,由 Anthropic 在 2024 年 11 月發布的開放協議)的概念。讓不同的 agent 遵循同一套規則,就可以操作對應的軟件。隨著這個概念的普及,大量的軟件的 mcp 被開發,分享,大量閉源軟件也開始開放接口,或者提供自己的 mcp 來迎接大模型對自己的操作和使用。大模型的能力得到史詩級的提升。至此,我們可以用大模型來幫我們閱讀文件,編寫文件,編寫表格,寫程序,執行程序。
到這里,我們把擁有這些能力的程序,叫做 agent 工具。幾乎每一家大模型公司都提供了自己的工具,Codex、Claude Code、Gemini CLI,也有第三方或者開源的工具層出不窮,OpenCode、CodeBuddy。agent 工具不是這個時候才誕生,而是這個時候才真正能用,并且從編碼擴散到了幾乎所有領域。
skill 時代
Skill 是人工作方法的蒸餾。能說清楚的方法論,ai 幾乎都能替你做。
skill 本質上是對人工作方法的蒸餾。只要能說清楚方法的部分,都可以以 skill 文檔的形式展現出來,它徹底改變了我們的工作方法。方法論以前是一個非常虛幻的詞匯,但是在這個階段,它是一切工作的重中之重,只要能說清楚的方法論,ai 幾乎就能幫我們完成。
那 skill 是怎么來的?
至此,大模型轉化為了 agent,agent 就像腦子擁有了手腳,它已經可以幫我們做大量的工作。對于 ai 的愛好者來說,agent 正在一步一步的吞噬掉我們重復的工作。
但是人類的懶惰是無限的。
我們在使用 agent 工具的時候,每次依然要一遍一遍提需求,說很多重復的話,并且在每個環節都溝通。還是太累啦。于是我們事先準備好一些工作流程文檔,存下來,每次執行相同的工作的時候,就把這個文檔發給它。文檔中告訴大模型,要注意哪些問題,走那些步驟,按照什么樣的順序執行,這就是早期的提示詞工程。
但是提示詞工程依然很麻煩,我們要手動儲存這些文檔,手動去發。我們希望 agent 工具能夠自己判斷什么時候去讀什么樣的文檔。在這個需求下,Skill 誕生了(Anthropic 于 2025 年 10 月正式發布)。
我們準備大量的提示詞文檔,每個文檔都有名稱和描述。在 agent 工具中,每次對話的時候,都把我們所有用的文檔的名稱和描述發過去,讓 llm 自己判斷是否需要加載對應的文檔,這就是 skill。
這樣,我們就可以提前準備好大量我們常用的工作流程,工作方法,并且整理命名。當大模型在進行這些工作的時候,發現有需要用的文檔,就自主的去閱讀(加載到上下文),然后按照方法執行。這就節約了大量的我們的重復勞動,我們只要說明目標,它就可以按照需求執行。
skill 的概念是非常簡單的,但是理念是非常先進的。引發了所有 ai 愛好者的思考,讓我們嘗試盡可能的整理我們的工作方法變成文檔,就像很多公司有的 km(知識管理),它其實和我們培訓新人的方法非常相似。讓我們和 ai 溝通,實際上就像是在教一個新人工作方法。
llm 是大腦,agent 工具是身體,而 skill 是工作手冊。至此,我們可以讓大模型按照我們自己的思路執行很多工作。
但是我們發現,依然有大量無法完成的,說不清楚的工作。例如藍色好,還是紅色好,是賽博朋克好,還是中世紀好。在沒有足夠多上下文和方法的指導下,這些問題依然要人類來完成。這部分,我們叫做"審美"注入。沒錯,"審美"這個詞被提高到一個無比高的角度。甚至可能是人對比 ai 最后的留守地。
你那獨特的 xp,可能是你這個人最有價值的部分。Skill 歸屬:我的靈魂值多少錢?
這個時代的沖擊非常大,輿論也非常多,誕生了很多沖突。諸如,我的 skill 是屬于公司,還是屬于個人,公司能不能要求我上交 skill 文件?我把我的工作方法都寫成 skill 之后,公司是不是就可以把我開除?我的個人價值是什么?skill 代表著我的靈魂,公司應該出多少錢來購買我的靈魂?
同時,這部分也會誕生對人才的重新思考。什么樣的人能夠足夠好的把自己的 skill 寫清楚來引導 ai 工作?這種人應該具備什么能力?這些人是不是價值被大量的放大了,是不是應該升職加薪?這些我們后面再討論。但是直接影響的,就是大量的執行崗位的裁員。因為越是重復工作,就越可以被 ai 替代。總之,skill 時代到來了。
harness 時代
harness 沒有通用解。每個項目都得自己搭腳手架,這就是它最難的地方。
我前面說到,人類的懶惰推動著科技的進步。到了 skill 這個大爆發的時代之后,人類還是不可能滿足。人們在思考一個問題,如果有足夠多的 skill,是不是 ai 就可以獨立完成一個非常復雜的工作?我們是否可以把整個項目,都以 skill 的方式寫出來,讓 ai 獨立完成整個項目的開發,比如做完一整款獨立游戲?
非常多人發起了嘗試,我也不例外。此外我拉動了很多朋友做這方面的嘗試,哪怕到今天,我們依然在嘗試這部分的事情。但是我們遇到了非常多的問題。我們遇到了很多邊界。
我們發現 llm 雖然擁有無人能比的知識面,但是它依然有幻覺。邏輯能力不斷增強,但是依然比不過人類的智力水平。強大到可以整本書閱讀,但是上下文依然不夠解決最復雜的問題。
我們給 agent 提供了大量的 tools,skill,非常多的上下文,為了讓它按照我們理想的方式工作,很快就遇到了上下文瓶頸。前面的 200k,現在的 1m,依然不夠我們這些貪心的人類使用。如何管理上下文,就變得非常復雜。一個至關重要的理念被提出。
漸進式披露
這是為了解決上下文這種稀缺的資源的問題,我們不能一次性加載太多的內容,而是盡可能的把llm當前最需要的信息提供給它。這幾乎就是提示詞工程最重要的事情。為了解決這個問題人類做了很多很多工作。
subagent
首先被想到的方法是,使用子 agent 來解決。如果一個主 agent 解決不了的問題,我們能不能給 llm 進行分工,就像人類一樣工作。我們不能指望老板一個人解決所有問題,我們希望老板把工作層層拆解,交給下屬去執行,子 agent 不行,再拆解交給子 agent,層層嵌套,來解決上下文不足的問題。
我經常舉的例子是,給你無數個大學生,但是這些大學生每 5 個小時就會失憶,你有機會用他們來蓋一座摩天大樓么?你應該如何組織這些大學生工作?
采用 subagent 甚至還順手得到了一個非常好的次級優勢,就是 subagent 是可以并發的,甚至可以提高執行效率。這個方法非常有效,很快就被各種 agent 工具采用,到今天,它基本變成了基礎建設。但是這依然不夠。
知識庫建設
我們在進行復雜的項目開發的時候,很多時候有很多重要的前置信息,我們要想辦法在合適的時候把這些前置的信息傳遞給 agent,讓它保持工作上的一致性。我們可能要建立龐大的知識庫,把這個項目已經存在的,信息,方法進行傳遞。目前采用的方法是建立向量數據庫,rag,通過語義搜索,來給 agent 提供信息。但是這個過程很麻煩,因為首先準備數據庫就很麻煩。如果你恰好項目有足夠的規范的文檔積累,你就可以開心一下,但是你依然要小心你的文檔的時效性,準確性。
隨著知識庫建設的另一個領域也就出現了,記憶系統。記憶系統的難點在于判斷什么信息應該存儲,什么信息應該讀取,應該在什么時候讀取,這部分甚至到現在還沒有成熟的解決方案。OpenClaw、Hermes 這些項目,都是因為有了記憶系統,看起來像是有了生機活過來啦。但是最熟悉 ai 的朋友還是很清楚,依然不夠好用,依然需要持續探索。
harness 工程
當我們擁有了一大堆 tools,subagent,skills,rag,我們還要教會 ai 去開發一個項目,我們要思考的最重要的就是,什么部分應該人介入,什么部分應該相信 agent,什么部分應該需要驗收。這個問題就變得非常困難。因為現在我們在開發的復雜項目,人類做的都不足夠好,可以說,人類也沒有找出最佳實踐,怎么讓 ai 來做?到這個層面,我們進入了最復雜的項目問題解決。至此,我們把這個東西叫做 harness 工程。
harness 原意是挽具/馬具(套在馬身上拉車的整套裝置),在工程語境里也常被叫作腳手架/運行環境,在這里抽象的表達是為 agent 工作提供一切必要的工作環境,runtime。harness 這個詞很抽象,不過很正常,ai 領域的很多東西都是新的,vibe coding 也很抽象,我們很難從以前有的詞匯表達清楚現在在做什么。
這個時候,我們就開始思考基于當前項目,我們到底有哪些重復工作,哪些審美工作,哪些重要,哪些不重要。每個項目都完全不同,harness 的重點千差萬別,幾乎無法找到真正共用的東西。harness 就很難成為通用工具,它更像是一個"樣板房",給其他項目做參考,但是每個項目都要建立自己的 harness。
但是在這個環境下,想要邏輯清晰的把 harness 構建起來,本身就是一個復雜的系統工程,難度就很高。很多情況下,我們構建 harness 的效率甚至不如直接開發,很容易陷入非常虛無的方法和哲學討論中去,這部分依然沒有準確的答案。
這里有個真正的分歧。
model 派說:模型還在指數級變強,等下一代出來,你今天搭的 harness 全是技術債,模型自己就可以解決了。
harness 派說:模型再強也需要環境,就像再聰明的工人也需要工具和工位。harness 和模型不沖突,是乘法關系,任何時候 harness 都能對大模型有效的增強。
我自己偏 harness 派,但是保持 model 派的警覺。我對這個東西的思考就是優先解決當前,或者即將遇到的問題,不要追求完美的框架,世界變化太快了,先把 ROI 為正的干了。除非你有非常長期的規劃,或者有足夠的堅信,那就按照你相信的試試。都是在猜測未來,做自己相信的事情就好。
游戲開發和 ai
我是一個游戲從業者,游戲策劃。我對 ai 的所有思考和應用,都是基于游戲開發的。所以這一章來聊游戲開發中對 ai 的使用。
游戲是一個非常復雜的工程,涉及多個部門,每個部門對 ai 的使用都不太相同。我們從主要的職能來聊。
程序。ai 最早影響的是程序,vibe coding 也是最早出現的概念,所以程序的 ai 覆蓋度極高。llm 幾乎是為代碼訓練的,對程序最為友好,早期工具都面向程序。程序幾乎只用到一個東西,就是 spec,定義項目開發規范,編碼規范,把規范定清楚,給 llm 的輸出方式束縛下來,效果就很好。服務器代碼基本能完成得不錯,但是客戶端代碼靠視覺驗收,llm 對時間和空間的理解還不夠,所以更麻煩,不同 llm 寫出來的界面有些就是很丑,似乎都沒有很好的方法。我覺得這個問題可能要在更前面的環節解決,在 ui 環節,甚至在策劃環節解決。
策劃。策劃早期對 llm 的使用幾乎是停留在 idea 支持和知識查詢,agent 工具爆發之后,又陷入了各類執行,諸如填表,做 ppt 的活。但是真正的難點,是策劃的設計方法,游戲策劃被認為是創意要求最高的序列,大家對 llm 完全解決創意問題是不夠有信心的,但是 ai 也在這個領域大規模的覆蓋,雖然有很多講不清楚的方法,但是能講清楚的部分依然不斷的在增多。游戲設計本身就沒有成熟的方法論,是一個失敗率極高的領域,而不同的策劃對于游戲的理解完全不同,認知,看法方向也不同,互相也不一定認可,這部分很難統一。
每一個策劃都有自己的 harness 工程。這就是為什么策劃比程序更難被 ai 替代:沒有統一的方法論可以蒸餾。
但是實際上創意的設計只是一部分。大部分的執行工作在被廣泛的代替,執行的效率成倍的提高。
美術。美術領域是最困難的。美術工具鏈重度且復雜,往往是大型閉源工具,美術工種很多時候靠直覺和審美,無法系統講清楚自己的設計方法,agent 的覆蓋最為困難。而且美術資產種類繁多,每個資產領域幾乎都要單獨的大模型,做圖片要圖片模型,做模型要模型的模型,做動作,特效等甚至沒有什么成熟的模型(有些有,沒有真正行業的廣泛運用),這些單獨的模型,我們叫做資產模型。好在最近資產模型的迭代是很快的,持續的給出驚喜,我相信不遠的未來,美術的 ai 覆蓋率也會持續提高。
qa。qa 是非常重要的領域,qa 其實是兩部分,一部分是自動化測試,通過單元測試,讓 ai 寫大量的測試代碼來執行,一部分是讓 agent 模擬人工操作,來進行測試。但是 agent 沒有游戲體驗感受,所以只能做最兜底的 bug 類測試。
但是 qa 真正的問題是,不敢只讓 ai 測試。不管 ai 測試的多好,總要有人工審核,也就是真正的驗收環節,是不敢交給 ai 的,未來也許可以。
ai 不能幫你背鍋,不能幫你坐牢。
這才是 ai 落地的真正天花板:問責權屬。再準確的 ai 測試,也得有人簽字負責。所以 qa 的工作依然是繁重的,甚至是整個鏈路最難的,ai 只能不斷提高 qa 的質量,但是不太能減少 qa 的時間。我們甚至得出來一些悲觀的預期,就是未來最好的測試可能還是用先遣服的方式,或者灰度,交給玩家測試。
tdd 和 sdd
人最重要的工作是首尾——定需求,做驗收。中間交給 ai。
我對 tdd 和 sdd 也有過思考,為什么這兩個重要?因為這兩個環節,一個是需求環節,一個是驗收環節,是無法離開人類的環節。人類盡可能的要把人類工作的部分前置,不要讓人來等 ai,可以讓 ai 等人。人的工作時間是更寶貴的,所以人最重要的工作是首尾。
討論完游戲開發過程中 ai 的運用后,我們就得到了這兩個非常重要的概念,tdd 和 sdd。這兩個概念幾乎是貫穿我們的工作全部環節。TDD 是 Test-Driven Development(測試驅動開發),SDD 是 Spec-Driven Development(規范驅動開發),就是測試和規范。我們在所有的開發環節要求,規范和測試先行,沒有 spec 就不要開發,沒有測試,就不能驗收。只有做好這兩個部分,我們才敢讓 ai 真正的落地到項目。但是這兩個理念是一個理解起來容易,執行起來非常復雜的事情。要把對它們的認知和思考刻入骨子里,當作自己的 ai 工作法則。
ai 原生游戲
隨著ai的發展,我們越來越多的工作使用ai執行,很快我們就遇到一個問題,我們是否可以把游戲內容在游戲運行時生成,是否直接基于ai來設計一款游戲?這個答案很顯然是成立的。
基于大模型生產內容,基于大模型創造新的游戲規則。基于大模型創造新的游戲體驗。我是否可以在游戲中實時設計我的服裝, 我的地圖,游戲世界?當然是可以的,這里其實我做了很多思考,但是需要另起一篇了。但是總結下來可能還是就那幾個俗套的關鍵詞:
千人千面
:可以針對玩家行為定制游戲體驗。
萬物有靈
:游戲中的很多npc,元素,物品,都可以擁有靈魂,給出情感體驗。
無限世界
:運行時生成,沒有限制的內容。
但是我們做ai原生游戲,要考慮到ai的發展速度和情況,我們對于未來的ai的邏輯,資產質量,速度,都有樂觀的預期,但是要基于價格,時間,體驗,設計商業化匹配的游戲,這個任務依然是艱巨的。我相信ai游戲一定會顛覆游戲體驗,但是能不能賺到錢,哪一款能最先賺到錢,我是不知道的。
ai native
在經過這些事情之后,ai native 這個詞就經常出現在視野中。什么是 ai native,其實就是讓我們拋棄原來的路徑依賴,完全重新思考,在 ai 時代,我們應該怎么做這個事情。有很多 ai native 的案例出現。
文件的 ai native
我們的文件,現在的主要的閱讀者變成了 ai,而不是人類,所以要找一個 ai 和人類都好讀的文件,甚至是 ai 優先。那 md 文件這時候就變成了寵兒。而那些復雜的,ai 不方便閱讀,不方便生產的文件,都變成了落后生產力。我經常說,ai 時代,office 系列都是垃圾,什么 figma 都是落后生產力——不是說 ai 完全讀不進寫不出,而是它們的接口不夠開放,操作起來很不方便,遠不如純文本和開放格式直接。雖然我們以往有太多重資產依賴于這些文件,但是未來它們都會被淘汰。其實就是不夠 native。
工具的 ai native
人類的發展其實就是工具的發展。我們大量的軟件,如果沒有提供足夠多的 api,或者 mcp,cli 來給 agent 使用,這些工具在 ai 時代就是不夠好用,我們就會尋找替代工具,那這些工具就不夠 ai native。有個典型的例子,我其實是 notion 的深度用戶,它很努力的提供了很多 ai 工具,提供了 mcp,但是對于 ai 來說,依然不夠方便,我就快速的轉向了 obsidian。ai 工作需要復雜的版本管理,svn 的方式就不夠 native,那我們就盡可能轉向 git。ppt 至今沒有足夠多的接口,我們直接使用 html 來實現模擬演示,很方便。
工作習慣的 ai native
你的工作還有多少是通過操作工具,軟件,來執行,有多少直接通過 agent 來執行?你下載一個文件,是自己去網頁尋找么?你進行一個操作,是去搜索引擎搜索么?都可以交給 agent 工具來執行,可以 all in one。甚至我覺得未來,社交,工具,娛樂,都應該使用 agent 來執行。
組織的 ai native
其實在這個 ai 時代,企業的架構,組織的方式是否應該調整,是否有很多崗位根本不應該存在,我們是否應該向 agent 回報?數據全部打通之后,是否可以更簡單的項目管理?隱私,項目,個人的邊界,權限管理在哪里,都值得思考。但是企業架構有巨大的組織慣性,所有的既得利益者都會阻止這個事情發生,從長期來說是毫無意義的。匹配 ai native 的組織架構是怎樣的?我們也不知道。那是老板應該思考的問題。你們在這個時代,如何管理員工?或者是?不需要員工?
agent 即服務
如果我們可以實時生成游戲內容,那么我們也就可以實時生成幾乎所有的用戶體驗。我們日常所有的線上服務,都可以使用 agent 進行重構。
以"刷短視頻"為例。現在的抖音 b 站,是平臺決定推什么,你被動消費。agent 即服務版本是什么樣?甚至不一定是你告訴 agent 你今晚想看什么,而是 agent 根據你最近的工作狀態,作息,情緒,主動給你提建議。它知道你這周加班太多,知道你最近在追的題材,知道你睡前 30 分鐘刷視頻是為了放松,于是它跨平臺幫你抓取,甚至生成定制的內容流。
你甚至不需要主動提需求,agent 已經基于你的綜合數據知道你想要什么。在這種重構下,平臺從內容方變成了原料方。
agent 工具是否可以提供實時渲染的可視化界面,當然是可以的,我們是否可以使用 agent 工具來完成音樂播放,當然可以,是否可以使用 agent 工具來刷短視頻,當然可以的,是否可以使用 agent 工具來購物(千問已經有),是否可以使用 agent 工具來啟動游戲,甚至實時生成游戲?是否可以使用 agent 工具來瀏覽新聞?是否可以使用 agent 工具來社交溝通?我認為都是可以的而且可以提供更好的服務。
在這個階段,agent 即服務,任何服務都可以使用 agent 重構。
在這個環境下,我們只需要重新思考一個問題,人,agent,system(代碼實現的軟件服務),應該以什么樣的全新方式去服務?
終極愿景
當agent即服務已經完成之后,未來的世界是什么樣的?
會有一個或者多個平臺來提供基礎agent服務,其他的所有服務,都可以"以skill的方式"提供服務,我們將會在同一個agent平臺,完成我們所有的線上需求,那是一個比互聯網更加豐富的ai時代。這個構想很像是 OpenClaw 的終極版本。每個人都有一個私人ai助理,而這個ai助理,將會為你提供一切服務。人人都會擁有自己的賈維斯,我們通過賈維斯來實現我們所有的服務。
甚至這個未來將會很快到來。我看到很多企業正在提供這樣的服務,把自己的 服務,向agent開放。
而這個平臺,也不一定依托于硬件,當我們只想聽音樂的時候,耳機就是那個agent,當我們想要看視頻,那眼鏡,顯示器就提供服務,一個不依賴硬件,不依賴場景,只有一個帳號,在所有的場景,所有的硬件上運行,這就是未來的agent os。基于云服務,llm服務的,all in one的agent平臺。 我很期待這一天的到來。
ai 生態問題
在這個終極愿景下,未來的企業生態是怎樣的?
很顯然,電力和芯片公司將會成為最上層的基建,然后是大模型公司,然后是agent平臺公司,然后是眾多的服務公司。
所有的公司都應該思考,面向這樣的未來,如何準備好,提供這樣的服務。如何在這個愿景下,更好的服務。或者說,在這個終極愿景下,如何找到自己的生態,持續的賺錢。
基于這樣的愿景,大模型公司依然會創造最大的價值,持續的投入,就是找到未來的鑰匙。而如何建立agent平臺,就是最終面向用戶的方法,就是流量入口。所以面向 C 端的超級 agent 平臺(如豆包、元寶)極有可能是最終的流量入口。
人才問題
未來將會很快到來,我們這些牛馬,應該做好什么樣的準備來適應這個未來?
首先,我們要主動的擁抱 ai,學習 ai。這就要求很強的主動學習能力,背后是自驅力。每周花幾個小時 follow ai 進展,不是負擔,是基本功。
然后是工程能力。沒有工程能力,你就無法教會 ai 幫自己做事情。能把模糊需求拆成 spec,能調試 agent 的行為,能搭自己的 harness,這是上一代不需要,但是 ai 時代必須要的新通用技能。
然后是審美。審美可能最后也會被替代掉,但是可能是最晚被替代掉的能力,成為領域的審美大師,可能是未來最值錢的部分之一。在 ai 輸出無限的世界里,"選對"比"做出來"更值錢。
ai 會重新洗牌企業對人才的要求,改變這部分能力是這個階段獲得高薪的彎道超車。企業如何快速建立對新型人才的招聘方式,獎懲規則,將是企業最重要的課題之一。
組織問題
ai不只是會調整對人才的需求,而且會徹底改變組織的運作方式。如何改變組織架構,重新創建ai native 組織是非常非常困難的事情,將會改變很多人的利益,一定會迎來企業陣痛,但是這個陣痛在歷史的潮流下,會被逐步淹沒。如何建立ai native的組織我不知道,但是肯定要完全忘掉以前的組織結構,給足夠 ai native 的人足夠多嘗試的機會。生產力將會告訴大家,什么樣的組織是ai native的。但是如果依賴當前的組織形式,肯定是會低效,被時代淘汰。
社會問題
這是最后一個問題了。ai 改變了生產力,生產力改變了生產關系,那就會重塑社會結構。貧富差距將會進一步拉大,更少的人可以完成更多的工作。會不會進一步的造成新的失業潮,引起社會穩定風險,這是政府應該考慮的事情。
但是我們看歷史。每一次科技革命都引發過同樣的恐慌。蒸汽機讓手工業者失業,但是誕生了產業工人;電力讓油燈產業消失,但是誕生了整個現代電氣和家電產業;互聯網讓報紙式微,但是創造了我們今天大部分的新職業。從歷史的潮流下,這是無法阻擋的。
ai 時代會消失的崗位,大概率是大量的執行型工作。客服,初級文員,基礎設計,初級編碼,重復性內容生產,這些崗位的消失會非常快。新出現的職業現在還沒法準確命名,但是大概率是 skill 工程師,agent 訓練師,ai 審美總監,ai 倫理審查官,這一類。
政府要做的事情也會更復雜。教育系統要重構,從教知識轉向教方法和審美。再就業培訓要跟上,但是培訓速度大概率追不上替代速度。可能要討論 ubi(無條件基本收入),討論 ai 稅,討論新的勞工保護制度。新的行政方式,新的社會政策,會隨之誕生。
但是說到底,這些都是宏觀敘事。對個人來說,最重要的還是先把自己的位置搞清楚:你在食物鏈的哪一層,你最不可被替代的部分是什么,你為這個未來準備好了多少。
我沒法回答你的所有問題。但是有幾個問題,你最好今晚想想:
我的工作里,哪 30% 可以馬上寫成 skill?
我的"xp"是什么?誰付得起這個錢?
5 年后我要在食物鏈的哪一層?
答案不在文章里,在你接下來的實踐里。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.