網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

楊植麟、張鵬、羅福莉等齊聚一堂，他們關(guān)于OpenClaw的觀點值得一聽。

2026-03-27 14:25:52　來源: 數(shù)字生命卡茲克

天津舉報

分享至

今天是2026中關(guān)村論壇的人工智能主題日。

我也定了個一早的鬧鐘準(zhǔn)時起來看。

這個活動海淀已經(jīng)辦了第三年，但今年的議程密度確實有點夸張。

一上午塞進了開源聯(lián)盟成立、主權(quán)大模型白皮書發(fā)布、北京市人工智能協(xié)會揭牌，外加兩場圓桌。

大模型和具身智能各一場。嘉賓陣容從Eclipse基金會到智譜、小米MiMo、無問芯穹，再到一眾具身智能公司的創(chuàng)始人，幾乎把當(dāng)下AI產(chǎn)業(yè)鏈上最活躍的角色都拉到了同一個舞臺上。

在我看來，信息密度最高的，還是第一場小龍蝦與AI開源圓桌。

這場圓桌由楊植麟主持，嘉賓是智譜的張鵬、無問芯穹的夏立雪、小米MiMo的羅福莉，還有港大的黃超。

從模型層到算力基礎(chǔ)設(shè)施層再到Agent應(yīng)用層，剛好覆蓋了當(dāng)下AI產(chǎn)業(yè)鏈的幾個關(guān)鍵環(huán)節(jié)。

張鵬解釋了智譜GLM5 Turbo提價的邏輯，模型從聊天轉(zhuǎn)向干活，完成任務(wù)消耗的token量可能是簡單問答的十倍甚至百倍，提價本質(zhì)上是在回歸商業(yè)價值。

羅福莉談了中國團隊在模型結(jié)構(gòu)創(chuàng)新上的優(yōu)勢，尤其是長上下文架構(gòu)和推理效率。

黃超拆解了Agent在planning、memory、skill三個維度上的技術(shù)痛點。

最后讓每人用一個詞總結(jié)未來12個月的趨勢，黃超說的是 生態(tài) ，羅福莉說的是 自進化 ，夏立雪說的是 可持續(xù)token ，而張鵬直接點了一個最樸素的問題：算力。

幾位嘉賓的圓桌對話，干貨含量極高，幾乎沒有什么客套和PR話術(shù)，聊的都是非常實在的問題。

所以，我也把這場圓桌的內(nèi)容做了一個完整的文字整理，分享給大家。

【圓桌對話-人類校對版】

楊植麟（主持人） ：很榮幸今天能邀請到各位重磅的嘉賓，各位的背景覆蓋了不同的層面，從模型層到底層的算力層，再到上面的Agent層。很高興今天能和大家一起探討，主要的關(guān)鍵詞是開源和Agent。我們從第一個問題開始，這個問題是給所有人的。現(xiàn)在OpenClaw是最流行的產(chǎn)品，大家在日常使用OpenClaw或類似產(chǎn)品的過程中，覺得最有想象力或者印象最深刻的是什么？從技術(shù)角度來看，如何看待今天OpenClaw和相關(guān)Agent的演進？我們先從張鵬這邊開始。

張鵬：好，首先感謝植麟的邀請，也感謝主辦方給這次機會跟大家交流。其實我很早就開始自己玩這個東西了，當(dāng)時還不叫OpenClaw，最早叫Claude Bot。畢竟我是程序員出身，折騰這些東西有一些自己的體驗。我覺得它帶給大家最大的突破點，在于這件事情不再是程序員或者極客們的專利，普通人也可以比較方便地使用頂尖模型的能力，尤其是在編程和智能體方面。所以到現(xiàn)在為止，我在跟大家交流的過程中，更愿意把OpenClaw這件事稱作一個腳手架，它提供的是一種可能性。在模型的基礎(chǔ)之上搭起一個牢固、方便又靈活的腳手架，大家可以按照自己的意愿去使用底層模型提供的很多新奇的東西。原來自己的一些想法，受限于不會寫代碼或者缺乏某些技能，今天終于可以通過很簡單的交流就把它完成。這對我來說是一個非常大的沖擊，讓我重新認(rèn)識了這件事情。

夏立雪 ：我最開始用OpenClaw的時候其實不太適應(yīng)，因為我習(xí)慣于和大模型聊天的那種交流方式，結(jié)果發(fā)現(xiàn)OpenClaw反應(yīng)好像比較慢。但后來我意識到一個關(guān)鍵的不同，它不是一個聊天機器人，而是一個能夠幫我完成大型任務(wù)的助手。當(dāng)我開始給它提交更復(fù)雜的任務(wù)之后，發(fā)現(xiàn)它其實能做得很好。這件事給我一個很大的感觸，就是AI從最開始按token聊天，到現(xiàn)在能夠作為一個Agent幫你完成任務(wù)，對整個AI的想象力空間做了一個很大的提升。但與此同時，它對整個系統(tǒng)的能力要求也變得很高，這也是我一開始用會覺得卡頓的原因。

作為基礎(chǔ)設(shè)施層的廠商，我看到OpenClaw為整個AI后續(xù)的大型系統(tǒng)和生態(tài)帶來了更多機遇和挑戰(zhàn)，因為現(xiàn)在所有能用到的資源，想要支撐起這樣一個快速增長的時代是不夠的。就拿我們公司來說，從一月底開始，基本上每兩周token用量就翻一番，到現(xiàn)在已經(jīng)翻了十倍。上次見到這種速度，還是當(dāng)年3G時代手機流量增長的那種感覺。現(xiàn)在的token用量，就像當(dāng)年每個月只有一百兆手機流量的那個時代一樣，所有資源都需要更好的優(yōu)化和整合，讓每一個人都能把OpenClaw這樣的AI能力用起來。所以作為基礎(chǔ)設(shè)施領(lǐng)域的從業(yè)者，我對這個時代非常激動，認(rèn)為其中有很多值得去探索和嘗試的優(yōu)化空間。

羅福莉 ：我把OpenClaw視為Agent框架上一個非常革命性和顛覆性的事件。雖然我知道身邊深度使用編程工具的人，第一選擇可能還是Claude Code，但我相信只有用過OpenClaw的人才能獨特地感受到，這個框架在設(shè)計上有很多地方是領(lǐng)先于Claude Code的，包括最近Claude Code的很多更新，其實都是在向OpenClaw靠近。對我自己來說，OpenClaw這個框架帶來更多的是一種隨時隨地的想象力延伸。Claude Code可能最開始只能在桌面上延展創(chuàng)意，但在OpenClaw里我可以隨時隨地延展想法。

我后來發(fā)現(xiàn)，OpenClaw核心價值在于兩點：第一是它開源，開源對整個社區(qū)深度參與、持續(xù)改進Agent框架是一個非常重要的前置條件。第二，像OpenClaw這樣的Agent框架，它很大的價值在于把國內(nèi)水平接近但略遜于閉源模型的這一賽道上的模型上限拉得非常高，在絕大部分場景里任務(wù)完成度已經(jīng)非常接近Claude最新的模型。同時它又通過Harness系統(tǒng)或者Skills體系等諸多設(shè)計，把下限保證得非常好。從基座大模型的角度來說，它保證了下限，同時也拉升了上限。此外，我認(rèn)為它給整個社區(qū)帶來的更大價值，是點燃了大家對模型之外的那一層的熱情，讓大家發(fā)現(xiàn)Agent這一層有非常多的想象力和空間可以發(fā)揮。這也讓社區(qū)里越來越多除研究員以外的人參與到AGI的變革當(dāng)中，更多人接觸到更強的Agent框架，一定程度上在替代自己重復(fù)性的工作，釋放時間去做更有想象力的事情。

黃超：從交互模式上來講，我覺得OpenClaw這次爆火，首先是因為給大家一種更有活人感的感覺。我們其實做Agent也有一兩年了，但之前包括Cursor、Claude Code這些Agent，大家感受到的更多是一種工具感。OpenClaw第一次以IM軟件嵌入的交互方式，讓大家更有一種活人感，更接近于自己想象中的個人賈維斯那樣的概念，這是交互模式上的突破。另外它給大家?guī)淼囊粋€啟發(fā)是，Agent Loop這種非常簡單但高效的框架，再次被證明是行之有效的。同時它也讓我們重新思考，究竟是需要一個all-in-one的非常強大的智能體幫我們做很多事情，還是需要一個像輕量級操作系統(tǒng)或腳手架一樣的小管家。OpenClaw的答案是，通過這樣一個輕量級的操作系統(tǒng)生態(tài)，去撬動整個生態(tài)里所有的工具。隨著Skills和Harness這些機制的普及，越來越多的人可以設(shè)計面向OpenClaw這類系統(tǒng)的應(yīng)用，賦能各行各業(yè)。這與整個開源生態(tài)天然結(jié)合得非常緊密，我覺得這兩點是它帶給我們最大的啟發(fā)。

楊植麟（主持人） ：順著這個話題，剛才一直在討論OpenClaw。想問一下張鵬，看到最近智譜也發(fā)布了新的GLM5 Turbo模型，我理解在Agent能力上也做了很大的增強，能不能給大家介紹一下這個新模型和其他模型的不同之處？另外我們也觀察到有一個提價的策略，這反映了什么樣的市場信號？

張鵬：這是個很好的問題。前兩天我們確實緊急做了一波更新，這其實是我們整個發(fā)展路線中的一個階段，提前把它放出來了。這件事最主要的目的，是從原來簡單的對話轉(zhuǎn)向真正的干活。正如各位剛才說的，OpenClaw真的讓大家覺得大模型不再只是聊天，而是能幫我干活。但干活背后對能力的要求是非常高的，它需要自主進行長程任務(wù)規(guī)劃，不斷壓縮上下文、debug、處理多模態(tài)信息等等，這和傳統(tǒng)面向?qū)υ挼耐ㄓ媚Ｐ偷囊笥泻艽蟮牟煌Ｋ訥LM5 Turbo在這方面做了專門的加強，尤其是長程任務(wù)如何能夠持續(xù)自主loop而不中斷，這里做了很多工作。

另外，大家也提到了token消耗的問題。讓一個聰明的模型去完成復(fù)雜任務(wù)，token消耗量是非常巨大的，可能一般人體會不到，只會看到賬單上的錢在不停地往下掉。所以我們在這方面也做了優(yōu)化，面臨復(fù)雜任務(wù)時用更高效的token效率來完成。模型架構(gòu)上本質(zhì)還是多任務(wù)協(xié)同的通用架構(gòu)，只是在能力上做了一些偏向性的加強。至于提價這件事，其實也很順暢地能跟大家解釋。現(xiàn)在不再是簡單的一問一答，背后的思考鏈路很長，還要通過寫代碼的方式跟底層基礎(chǔ)設(shè)施打交道、隨時debug和糾錯。完成一個任務(wù)需要的token量，可能是原來回答一個簡單問題的十倍甚至百倍。模型變得更大，推理成本相應(yīng)提高，所以我們把價格回歸到正常的商業(yè)價值上。長期靠低價競爭不利于整個行業(yè)發(fā)展，這樣才能持續(xù)在商業(yè)化路徑上形成良性閉環(huán)，不斷優(yōu)化模型能力，持續(xù)給大家提供更好的模型和相應(yīng)的服務(wù)。

楊植麟（主持人） ：非常好的分享。現(xiàn)在開源模型和推理算力已經(jīng)開始形成一個生態(tài)，各種開源模型可以在不同的推理算力上為用戶提供更多價值。隨著token量的報價變化，我們可能也正在從訓(xùn)練時代逐漸進入推理時代。想請教一下立雪，從infra的層面來看，推理時代對于無問芯穹意味著什么？

夏立雪 ：我們是一家誕生在AI時代的基礎(chǔ)設(shè)施廠商，現(xiàn)在在為Kimi、智譜提供服務(wù)，也在跟MiniMax合作，幫助大家更高效地用好我們這個token工廠。我們也在和很多高校、科研院所合作，所以一直都在思考一個問題：AGI時代所需要的基礎(chǔ)設(shè)施，究竟應(yīng)該是什么樣的？我們怎么能夠一步步地在這個過程中去實現(xiàn)它、推演它。

我們已經(jīng)做好了充分的準(zhǔn)備，也看清了短期、中期、長期不同階段需要解決的問題。當(dāng)前最緊迫的問題，就是像Claude這類模型帶動的整個token量的暴增，對我們系統(tǒng)效率提出了更高的優(yōu)化需求，價格的增長也是在這個需求壓力下的一種應(yīng)對方式。

我們一直以來都是從軟硬件打通的方式來布局和解決這個問題。我們接入了幾乎所有種類的計算芯片，把國內(nèi)十幾種芯片和幾十個不同的算力集群統(tǒng)一連接起來。這樣，當(dāng)資源不足時，我們能做到兩件事：第一，把能用的資源都用起來；第二，讓每一個算力都用在刀刃上，發(fā)揮出最大的轉(zhuǎn)化效率。所以當(dāng)前階段我們要解決的核心問題，就是如何打造一個更高效的token工廠。為此我們做了很多優(yōu)化，包括讓模型與硬件在顯存等方面實現(xiàn)最優(yōu)適配，也在探索在最新的模型結(jié)構(gòu)和硬件結(jié)構(gòu)下能否產(chǎn)生更深度的化學(xué)反應(yīng)。

不過，解決當(dāng)前的效率問題，我們只是打造了一個標(biāo)準(zhǔn)化的token工廠。面向Agent時代，這還遠遠不夠。就像剛才說的，Agent更像一個人，你可以交給他一項任務(wù)。我堅定地認(rèn)為，當(dāng)前云計算時代的很多基礎(chǔ)設(shè)施，是為服務(wù)程序、服務(wù)人類工程師而設(shè)計的，而不是為AI設(shè)計的。現(xiàn)在的狀態(tài)有點像：我們搭了一套基礎(chǔ)設(shè)施，上面留了一個為人類工程師設(shè)計的接口，然后在這上面再包一層去接入Agent。這種方式實際上是用人類操作的能力邊界，限制了Agent的發(fā)揮空間。

舉個例子，Agent能夠在秒級甚至毫秒級思考并發(fā)起任務(wù)，但我們之前的底層K8S這些能力并沒有為此做好準(zhǔn)備，因為人類發(fā)起任務(wù)大概是分鐘級別的。所以我們需要進一步構(gòu)建我們稱之為Agentic Infra的能力，打造一個更智慧化的算力投放工廠。這是無問芯穹現(xiàn)在正在做的事情。

從更長遠的未來來看，真正AGI時代到來的時候，我們認(rèn)為連基礎(chǔ)設(shè)施本身都應(yīng)該是一個智能體，應(yīng)該能夠自我進化、自我迭代，形成一個自主的組織。相當(dāng)于有一個CEO，這個CEO是一個Agent，比如一個Claude在管理整個基礎(chǔ)設(shè)施，根據(jù)AI客戶的需求自己提需求、迭代自己的基礎(chǔ)設(shè)施。只有AI與AI之間才能更好地形成耦合。所以我們也在做一些讓Agent與Agent之間更好通信的事情，比如cache to cache這樣的復(fù)制能力。

我們一直認(rèn)為，基礎(chǔ)設(shè)施與AI的發(fā)展不應(yīng)該是隔離的狀態(tài)，而應(yīng)該產(chǎn)生非常豐富的化學(xué)反應(yīng)。這才是真正的軟硬協(xié)同，真正的算法與基礎(chǔ)設(shè)施協(xié)同。這也是無問芯穹一直想實現(xiàn)的使命。

楊植麟（主持人） ：接下來想問問福莉。小米最近發(fā)布了新的模型，也開源了一些背后的技術(shù)，我覺得對社區(qū)做出了很大的貢獻。想請問一下，小米在做大模型方面有什么獨特的優(yōu)勢？

羅福莉：我想先把這個問題稍微拓展一下，不只聊小米的優(yōu)勢，而是聊聊中國做大模型的團隊在這件事上的優(yōu)勢，我覺得這個話題有更廣泛的價值。

大概兩年前，我就觀察到中國的基座大模型團隊已經(jīng)開始了一個非常好的突破。這個突破是：在有限算力的條件下，尤其是在互聯(lián)帶寬受限的情況下，如何突破這些低端算力的限制，并由此催生了一些看似是為效率妥協(xié)的模型結(jié)構(gòu)創(chuàng)新，比如DeepSeek v2、v3系列的細粒度MoE等等。但我們后來能看到，這些創(chuàng)新引發(fā)的是一場變革，也就是在算力一定的條件下，如何發(fā)揮出最高的智能水平。我覺得DeepSeek給了國內(nèi)所有技術(shù)大模型團隊一份勇氣和信心。

雖然今天我們自己的國產(chǎn)芯片，無論是推理芯片還是訓(xùn)練芯片，已經(jīng)不再像以前那樣受到嚴(yán)重限制，但我們能看到，正是那些限制催生了我們對更高訓(xùn)練效率、更低推理成本的模型結(jié)構(gòu)的全新探索。比如最近出現(xiàn)的hybrid sparse或linear attention結(jié)構(gòu)，有DSA、NSA，Kimi有KSA，小米也有面向下一代結(jié)構(gòu)的high sparse架構(gòu)。這區(qū)別于MiMo這一代結(jié)構(gòu)，是我們面向Agent時代去思考的，如何在Agent時代做出更好的模型結(jié)構(gòu)創(chuàng)新。

我為什么認(rèn)為結(jié)構(gòu)創(chuàng)新如此重要？因為我們剛才聊到了long context這個話題。如果大家真實地去用OpenClaw就會發(fā)現(xiàn)，越用越好用，越用越聰明。它的前提是推理的context足夠長。long context是一個談?wù)摿撕芫玫脑掝}，但真正能做到在超長context下表現(xiàn)強勁、推理成本足夠低的模型，其實并不多。很多模型不是做不到百萬甚至千萬token的context，而是推理成本太高、速度太慢。只有當(dāng)你能在百萬甚至千萬context下做到成本夠低、速度夠快，才會有真正高生產(chǎn)力價值的任務(wù)被交給這個模型，從而激發(fā)模型在long context場景下完成更高復(fù)雜度的任務(wù)。我們可能需要在這樣千萬甚至億級context的規(guī)模下，才能實現(xiàn)模型的自迭代。所謂模型的自迭代，就是它可以在復(fù)雜的環(huán)境里依靠超長context完成對自我的進化，這個進化可能是對Agent框架本身的，也可能是對模型參數(shù)本身的，因為我們認(rèn)為long context本身就是對參數(shù)的一種進化。

所以，怎么實現(xiàn)long context efficient的架構(gòu)，以及在推理側(cè)做到long context efficient，是一個全方位的競爭。這是我們大約一年前就開始探索的問題。而如今，怎么在真實的長程任務(wù)上實現(xiàn)穩(wěn)定性和高上限的效果，是我們現(xiàn)在在持續(xù)迭代的創(chuàng)新方向。我們在思考如何構(gòu)造更有效的學(xué)習(xí)算法，如何采集到真實的、在百萬乃至千萬上下文里具有長距依賴的文本，以及結(jié)合復(fù)雜環(huán)境產(chǎn)生的trajectory，這是我們正在經(jīng)歷的事情。

但我能看到更長期的事情是，大模型本身在飛速進步，加上Agent框架的加持，推理需求已經(jīng)在過去一段時間內(nèi)增長了近十倍。那今年整個token的增長會不會達到百倍？這又將我們帶入另一個維度的競爭，那就是算力，推理芯片，乃至往下到能源層面。這是我對這個問題的判斷，也期待從大家身上學(xué)到更多。

楊植麟（主持人） ：非常有insight的分享。下面想問一下黃超，因為你也開發(fā)了一些非常有影響力的agent項目，包括nano bot，在社區(qū)里也有很多粉絲。想問一下，從agent的harness或者說應(yīng)用層面，接下來你覺得有哪些技術(shù)方向是比較重要、大家需要去關(guān)注的？

黃超：感謝。我覺得首先可以從agent的幾個關(guān)鍵技術(shù)模塊來拆解，包括planning、memory和tool use。

從planning來講，現(xiàn)在面向長鏈路任務(wù)或者非常復(fù)雜上下文的場景，比如說五百步甚至更長的任務(wù)，很多模型不一定能做好planning，我覺得本質(zhì)上是模型不具備這方面的隱性知識，尤其是在一些復(fù)雜垂直領(lǐng)域。未來可能需要把各類復(fù)雜任務(wù)的知識固化到模型里，這是一個方向。當(dāng)然，skill和harness這種機制，在一定程度上也是在緩解planning層面的錯誤，因為它提供了比較高質(zhì)量的skill，本質(zhì)上是在幫助模型去完成一些較難的task。

關(guān)于memory，我的感受是它永遠存在信息壓縮不準(zhǔn)確、召回不準(zhǔn)的問題。當(dāng)整個長鏈路任務(wù)和復(fù)雜場景展開時，memory會急劇膨脹，這對整個memory架構(gòu)造成很大壓力。目前包括各類agent框架基本上都采用最簡單的文件系統(tǒng)、Markdown格式來做memory，通過文件共享來協(xié)作。我覺得未來memory應(yīng)該走向分層設(shè)計，并且需要解決通用性的問題，因為coding場景、deep research場景、多媒體場景的數(shù)據(jù)模態(tài)差異很大，如何對這些memory做好檢索索引、提升效率，這永遠是一個trade off。

另外，現(xiàn)在agent框架讓大家創(chuàng)建agent的門檻大幅降低，未來可能不止一個agent，我也看到有些產(chǎn)品推出了Agent Swarm這樣的機制，相當(dāng)于每個人會擁有一群龍蝦。一群龍蝦相比一個龍蝦，上下文的暴增是可以想象的，這對memory帶來的壓力非常大。如何管理一群龍蝦帶來的上下文，目前還沒有很好的機制，尤其是在復(fù)雜coding、科研發(fā)現(xiàn)這類場景下，對模型和整個agent架構(gòu)都是不小的挑戰(zhàn)。

關(guān)于tool use，當(dāng)年MCP存在的問題，比如質(zhì)量沒有保障、存在安全隱患，現(xiàn)在在skill里依然存在。目前看似有很多skill，但高質(zhì)量的skill其實比較少，低質(zhì)量的skill會嚴(yán)重影響agent完成任務(wù)的完成度。另外skill也存在惡意注入的風(fēng)險。所以我覺得tool use這塊可能需要整個社區(qū)共同努力，把skill生態(tài)發(fā)展得更好，甚至探索如何在執(zhí)行過程中進化出新的skill。以上這些，是我認(rèn)為當(dāng)下agent在planning、memory、skill三個維度上存在的痛點，以及未來潛在的方向。

楊植麟（主持人） ：可以看到剛才兩位嘉賓從不同視角討論了同一個問題，隨著任務(wù)復(fù)雜度增加，上下文會急劇膨脹。從模型層面可以去提升原生的上下文處理能力，從agent harness層面，則是通過planning、memory，包括multi-agent的harness，在模型能力一定的情況下支持更復(fù)雜的任務(wù)。我覺得這兩個方向接下來會有更多的化學(xué)反應(yīng)，共同提升完成復(fù)雜任務(wù)的能力上限。

那最后我們來一個開放式展望，請各位用一個詞來描述接下來十二個月大模型發(fā)展的趨勢以及你的期望。這次我們先從黃超開始。

黃超：十二個月在AI領(lǐng)域看起來好遙遠，真的不知道十二個月之后會發(fā)展成什么樣子。

楊植麟（主持人） ：這里原來寫的是五年，我給改成十二個月了。

黃超：對，我這邊的關(guān)鍵詞應(yīng)該是生態(tài)。未來agent要真正從個人助手轉(zhuǎn)化為打工人，這一步很重要。現(xiàn)在大家玩agent很多時候還停留在新鮮感階段，覺得好玩，但未來真正要讓agent沉淀下來，成為大家真正的搬磚工具，或者說真正的co-worker。這需要整個生態(tài)的共同努力，把所有相關(guān)的技術(shù)探索和模型技術(shù)都開源出來，不管是模型迭代、skill平臺迭代還是各類工具，都需要面向agent打造更好的生態(tài)。

從我自己的感受來說，未來的很多軟件可能不再是面向人類的。人類需要GUI，但很多軟件可能會是面向agent原生設(shè)計的，人類只會去使用讓自己快樂的GUI，其他的交給agent。所以現(xiàn)在整個生態(tài)從GUI、MCP又轉(zhuǎn)向了CLI這樣的模式。我覺得需要整個生態(tài)把不管是軟件系統(tǒng)、數(shù)據(jù)還是各種技術(shù)，都變成Agent Native的模式，這樣才能讓整個agent的發(fā)展更加豐富。

羅福莉 ：我覺得把這個問題縮小到一年非常有意義，因為五年這個時間跨度，從我心目中對AGI的定義來看，我覺得已經(jīng)實現(xiàn)了。所以如果要用一個詞來描述接下來一年AGI歷程里最關(guān)鍵的事情，我認(rèn)為會是自進化。這個詞雖然聽起來有點玄幻，過去一年大家也多次提到，但我最近才對它有了更深的體會，也對如何具體落地這件事有了更務(wù)實可行的方案。

借助非常強大的模型，我們在過去chat范式下其實根本沒有發(fā)揮出預(yù)訓(xùn)練模型的上限，而這個上限現(xiàn)在被agent框架激活了。我們現(xiàn)在觸到了一個現(xiàn)象，當(dāng)模型執(zhí)行更長時間的任務(wù)時，它可以自己去學(xué)習(xí)和進化。一個很簡單的嘗試是，在現(xiàn)有的agent框架里疊加一個可以verify的條件約束，再設(shè)置一個loop，讓模型持續(xù)迭代優(yōu)化目標(biāo)，我們就能發(fā)現(xiàn)模型會持續(xù)拿出更好的方案。這種自進化現(xiàn)在已經(jīng)能跑一兩天了，國內(nèi)的模型基本上能支撐，當(dāng)然和任務(wù)難度有關(guān)。我們發(fā)現(xiàn)在一些科學(xué)研究上，比如去探索更好的模型結(jié)構(gòu)，因為有評估標(biāo)準(zhǔn)，比如更低的PPL，在這類目標(biāo)明確的任務(wù)上，模型已經(jīng)能自主運行和執(zhí)行兩三天了。

從我的角度看，自進化是唯一能創(chuàng)造出新東西的地方，它不是去替代我們?nèi)祟惉F(xiàn)有的生產(chǎn)力，而是像頂尖科學(xué)家一樣去探索這個世界上還沒有的東西。一年前我會覺得這個時間歷程需要三到五年，但就在最近，我覺得這個時間線應(yīng)該縮短到一兩年，大模型疊加一個非常強的自進化agent框架，至少能實現(xiàn)對科學(xué)研究的指數(shù)級加速。我們組內(nèi)做大模型研究的同學(xué)，workflow高度不確定且需要大量創(chuàng)造力，但借助頂尖模型，基本上已經(jīng)能把我們自己的研究效率加速近十倍了。我很期待這樣的范式輻射到更廣泛的學(xué)科和領(lǐng)域。

夏立雪 ：我的關(guān)鍵詞叫可持續(xù)token。我看到整個AI的發(fā)展仍然處于長期持續(xù)的過程中，我們也希望它能有長久的生命力。從基礎(chǔ)設(shè)施的視角來看，我們面臨的一個很大問題是資源終究是有限的，就像當(dāng)年我們講可持續(xù)發(fā)展一樣。我們作為一個token工廠，能否給大家提供持續(xù)穩(wěn)定、大規(guī)模可用的token，讓頂尖的模型真正能夠繼續(xù)服務(wù)更多的下游，是我們看到的一個非常重要的問題。

所以我們現(xiàn)在需要把視角放寬到整個生態(tài)，從最早的能源到算力，再到token，最終轉(zhuǎn)換成GDP，讓這條鏈路能夠進行持續(xù)的經(jīng)濟化迭代。我們不只是把國內(nèi)的算力用起來，也在把這些能力輸出到海外，讓全球的資源能夠打通整合。所以我認(rèn)為可持續(xù)這個詞，也包含了我們想把中國特色的token經(jīng)濟學(xué)做起來的愿望。過去那個時代叫Made in China，我們把低價的制造能力轉(zhuǎn)化成好的商品輸出到全球。現(xiàn)在我們想做的有點像AI Made in China，把中國在能源上的優(yōu)勢，通過token工廠可持續(xù)地轉(zhuǎn)化為優(yōu)質(zhì)的token輸出到全球，成為世界的token工廠。這是我希望在今年看到的，中國為世界人工智能帶來的價值。

張鵬：我就簡短一點，大家都在仰望星空，我就落地一點。未來十二個月面臨的最大問題，我覺得可能就是算力。剛才也說了，所有的技術(shù)，包括智能體框架，讓很多人創(chuàng)造力爆發(fā)、效率提升十倍，但前提條件是大家用得起、用得起來。不能因為算力不夠，一個問題提出去讓它思考半天都得不到答案，這肯定不行。也正是因為這樣的原因，我們很多研究進展和想要做的事情其實都受阻了。前兩年記得中關(guān)村論壇有人提過這么一句話，叫沒卡沒感情，談卡傷感情。今天又回到了這個處境，但情況又不一樣了，我們現(xiàn)在轉(zhuǎn)向推理階段，是因為需求真的在爆發(fā)，十倍百倍地爆發(fā)。剛才也說到過去增長了十倍，背后其實是一百倍的需求，還有大量的需求沒有被滿足，這需要大家一起來想辦法。

楊植麟（主持人） ：好，感謝各位的精彩分享，謝謝大家。

最后，這兩天海淀五道口的AI原點社區(qū)也在舉辦原點Party Nights活動，有興趣的可以去玩玩，說不定咱們還能一起面?zhèn)€基。

以上，既然看到這里了，如果覺得不錯，隨手點個贊、在看、轉(zhuǎn)發(fā)三連吧，如果想第一時間收到推送，也可以給我個星標(biāo)?～謝謝你看我的文章，我們，下次再見。

>/ 作者：卡茲克，tashi

>/ 投稿或爆料，請聯(lián)系郵箱：wzglyay@virxact.com

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.