今天是2026中關(guān)村論壇的人工智能主題日。
我也定了個一早的鬧鐘準(zhǔn)時起來看。
![]()
這個活動海淀已經(jīng)辦了第三年,但今年的議程密度確實有點夸張。
一上午塞進了開源聯(lián)盟成立、主權(quán)大模型白皮書發(fā)布、北京市人工智能協(xié)會揭牌,外加兩場圓桌。
大模型和具身智能各一場。嘉賓陣容從Eclipse基金會到智譜、小米MiMo、無問芯穹,再到一眾具身智能公司的創(chuàng)始人,幾乎把當(dāng)下AI產(chǎn)業(yè)鏈上最活躍的角色都拉到了同一個舞臺上。
在我看來,信息密度最高的,還是第一場小龍蝦與AI開源圓桌。
![]()
這場圓桌由楊植麟主持,嘉賓是智譜的張鵬、無問芯穹的夏立雪、小米MiMo的羅福莉,還有港大的黃超。
從模型層到算力基礎(chǔ)設(shè)施層再到Agent應(yīng)用層,剛好覆蓋了當(dāng)下AI產(chǎn)業(yè)鏈的幾個關(guān)鍵環(huán)節(jié)。
張鵬解釋了智譜GLM5 Turbo提價的邏輯,模型從聊天轉(zhuǎn)向干活,完成任務(wù)消耗的token量可能是簡單問答的十倍甚至百倍,提價本質(zhì)上是在回歸商業(yè)價值。
羅福莉談了中國團隊在模型結(jié)構(gòu)創(chuàng)新上的優(yōu)勢,尤其是長上下文架構(gòu)和推理效率。
黃超拆解了Agent在planning、memory、skill三個維度上的技術(shù)痛點。
最后讓每人用一個詞總結(jié)未來12個月的趨勢,黃超說的是 生態(tài) ,羅福莉說的是 自進化 ,夏立雪說的是 可持續(xù)token ,而張鵬直接點了一個最樸素的問題: 算力 。
幾位嘉賓的圓桌對話,干貨含量極高,幾乎沒有什么客套和PR話術(shù),聊的都是非常實在的問題。
所以,我也把這場圓桌的內(nèi)容做了一個完整的文字整理,分享給大家。
【圓桌對話-人類校對版】
楊植麟(主持人) :很榮幸今天能邀請到各位重磅的嘉賓,各位的背景覆蓋了不同的層面,從模型層到底層的算力層,再到上面的Agent層。很高興今天能和大家一起探討,主要的關(guān)鍵詞是開源和Agent。我們從第一個問題開始,這個問題是給所有人的。現(xiàn)在OpenClaw是最流行的產(chǎn)品,大家在日常使用OpenClaw或類似產(chǎn)品的過程中,覺得最有想象力或者印象最深刻的是什么?從技術(shù)角度來看,如何看待今天OpenClaw和相關(guān)Agent的演進?我們先從張鵬這邊開始。
張鵬 :好,首先感謝植麟的邀請,也感謝主辦方給這次機會跟大家交流。其實我很早就開始自己玩這個東西了,當(dāng)時還不叫OpenClaw,最早叫Claude Bot。畢竟我是程序員出身,折騰這些東西有一些自己的體驗。我覺得它帶給大家最大的突破點,在于這件事情不再是程序員或者極客們的專利,普通人也可以比較方便地使用頂尖模型的能力,尤其是在編程和智能體方面。所以到現(xiàn)在為止,我在跟大家交流的過程中,更愿意把OpenClaw這件事稱作一個腳手架,它提供的是一種可能性。在模型的基礎(chǔ)之上搭起一個牢固、方便又靈活的腳手架,大家可以按照自己的意愿去使用底層模型提供的很多新奇的東西。原來自己的一些想法,受限于不會寫代碼或者缺乏某些技能,今天終于可以通過很簡單的交流就把它完成。這對我來說是一個非常大的沖擊,讓我重新認(rèn)識了這件事情。
夏立雪 :我最開始用OpenClaw的時候其實不太適應(yīng),因為我習(xí)慣于和大模型聊天的那種交流方式,結(jié)果發(fā)現(xiàn)OpenClaw反應(yīng)好像比較慢。但后來我意識到一個關(guān)鍵的不同,它不是一個聊天機器人,而是一個能夠幫我完成大型任務(wù)的助手。當(dāng)我開始給它提交更復(fù)雜的任務(wù)之后,發(fā)現(xiàn)它其實能做得很好。這件事給我一個很大的感觸,就是AI從最開始按token聊天,到現(xiàn)在能夠作為一個Agent幫你完成任務(wù),對整個AI的想象力空間做了一個很大的提升。但與此同時,它對整個系統(tǒng)的能力要求也變得很高,這也是我一開始用會覺得卡頓的原因。
作為基礎(chǔ)設(shè)施層的廠商,我看到OpenClaw為整個AI后續(xù)的大型系統(tǒng)和生態(tài)帶來了更多機遇和挑戰(zhàn),因為現(xiàn)在所有能用到的資源,想要支撐起這樣一個快速增長的時代是不夠的。就拿我們公司來說,從一月底開始,基本上每兩周token用量就翻一番,到現(xiàn)在已經(jīng)翻了十倍。上次見到這種速度,還是當(dāng)年3G時代手機流量增長的那種感覺。現(xiàn)在的token用量,就像當(dāng)年每個月只有一百兆手機流量的那個時代一樣,所有資源都需要更好的優(yōu)化和整合,讓每一個人都能把OpenClaw這樣的AI能力用起來。所以作為基礎(chǔ)設(shè)施領(lǐng)域的從業(yè)者,我對這個時代非常激動,認(rèn)為其中有很多值得去探索和嘗試的優(yōu)化空間。
羅福莉 :我把OpenClaw視為Agent框架上一個非常革命性和顛覆性的事件。雖然我知道身邊深度使用編程工具的人,第一選擇可能還是Claude Code,但我相信只有用過OpenClaw的人才能獨特地感受到,這個框架在設(shè)計上有很多地方是領(lǐng)先于Claude Code的,包括最近Claude Code的很多更新,其實都是在向OpenClaw靠近。對我自己來說,OpenClaw這個框架帶來更多的是一種隨時隨地的想象力延伸。Claude Code可能最開始只能在桌面上延展創(chuàng)意,但在OpenClaw里我可以隨時隨地延展想法。
我后來發(fā)現(xiàn),OpenClaw核心價值在于兩點:第一是它開源,開源對整個社區(qū)深度參與、持續(xù)改進Agent框架是一個非常重要的前置條件。第二,像OpenClaw這樣的Agent框架,它很大的價值在于把國內(nèi)水平接近但略遜于閉源模型的這一賽道上的模型上限拉得非常高,在絕大部分場景里任務(wù)完成度已經(jīng)非常接近Claude最新的模型。同時它又通過Harness系統(tǒng)或者Skills體系等諸多設(shè)計,把下限保證得非常好。從基座大模型的角度來說,它保證了下限,同時也拉升了上限。此外,我認(rèn)為它給整個社區(qū)帶來的更大價值,是點燃了大家對模型之外的那一層的熱情,讓大家發(fā)現(xiàn)Agent這一層有非常多的想象力和空間可以發(fā)揮。這也讓社區(qū)里越來越多除研究員以外的人參與到AGI的變革當(dāng)中,更多人接觸到更強的Agent框架,一定程度上在替代自己重復(fù)性的工作,釋放時間去做更有想象力的事情。
黃超 :從交互模式上來講,我覺得OpenClaw這次爆火,首先是因為給大家一種更有活人感的感覺。我們其實做Agent也有一兩年了,但之前包括Cursor、Claude Code這些Agent,大家感受到的更多是一種工具感。OpenClaw第一次以IM軟件嵌入的交互方式,讓大家更有一種活人感,更接近于自己想象中的個人賈維斯那樣的概念,這是交互模式上的突破。另外它給大家?guī)淼囊粋€啟發(fā)是,Agent Loop這種非常簡單但高效的框架,再次被證明是行之有效的。同時它也讓我們重新思考,究竟是需要一個all-in-one的非常強大的智能體幫我們做很多事情,還是需要一個像輕量級操作系統(tǒng)或腳手架一樣的小管家。OpenClaw的答案是,通過這樣一個輕量級的操作系統(tǒng)生態(tài),去撬動整個生態(tài)里所有的工具。隨著Skills和Harness這些機制的普及,越來越多的人可以設(shè)計面向OpenClaw這類系統(tǒng)的應(yīng)用,賦能各行各業(yè)。這與整個開源生態(tài)天然結(jié)合得非常緊密,我覺得這兩點是它帶給我們最大的啟發(fā)。
楊植麟(主持人) :順著這個話題,剛才一直在討論OpenClaw。想問一下張鵬,看到最近智譜也發(fā)布了新的GLM5 Turbo模型,我理解在Agent能力上也做了很大的增強,能不能給大家介紹一下這個新模型和其他模型的不同之處?另外我們也觀察到有一個提價的策略,這反映了什么樣的市場信號?
張鵬 :這是個很好的問題。前兩天我們確實緊急做了一波更新,這其實是我們整個發(fā)展路線中的一個階段,提前把它放出來了。這件事最主要的目的,是從原來簡單的對話轉(zhuǎn)向真正的干活。正如各位剛才說的,OpenClaw真的讓大家覺得大模型不再只是聊天,而是能幫我干活。但干活背后對能力的要求是非常高的,它需要自主進行長程任務(wù)規(guī)劃,不斷壓縮上下文、debug、處理多模態(tài)信息等等,這和傳統(tǒng)面向?qū)υ挼耐ㄓ媚P偷囊笥泻艽蟮牟煌K訥LM5 Turbo在這方面做了專門的加強,尤其是長程任務(wù)如何能夠持續(xù)自主loop而不中斷,這里做了很多工作。
另外,大家也提到了token消耗的問題。讓一個聰明的模型去完成復(fù)雜任務(wù),token消耗量是非常巨大的,可能一般人體會不到,只會看到賬單上的錢在不停地往下掉。所以我們在這方面也做了優(yōu)化,面臨復(fù)雜任務(wù)時用更高效的token效率來完成。模型架構(gòu)上本質(zhì)還是多任務(wù)協(xié)同的通用架構(gòu),只是在能力上做了一些偏向性的加強。至于提價這件事,其實也很順暢地能跟大家解釋。現(xiàn)在不再是簡單的一問一答,背后的思考鏈路很長,還要通過寫代碼的方式跟底層基礎(chǔ)設(shè)施打交道、隨時debug和糾錯。完成一個任務(wù)需要的token量,可能是原來回答一個簡單問題的十倍甚至百倍。模型變得更大,推理成本相應(yīng)提高,所以我們把價格回歸到正常的商業(yè)價值上。長期靠低價競爭不利于整個行業(yè)發(fā)展,這樣才能持續(xù)在商業(yè)化路徑上形成良性閉環(huán),不斷優(yōu)化模型能力,持續(xù)給大家提供更好的模型和相應(yīng)的服務(wù)。
楊植麟(主持人) :非常好的分享。現(xiàn)在開源模型和推理算力已經(jīng)開始形成一個生態(tài),各種開源模型可以在不同的推理算力上為用戶提供更多價值。隨著token量的報價變化,我們可能也正在從訓(xùn)練時代逐漸進入推理時代。想請教一下立雪,從infra的層面來看,推理時代對于無問芯穹意味著什么?
夏立雪 :我們是一家誕生在AI時代的基礎(chǔ)設(shè)施廠商,現(xiàn)在在為Kimi、智譜提供服務(wù),也在跟MiniMax合作,幫助大家更高效地用好我們這個token工廠。我們也在和很多高校、科研院所合作,所以一直都在思考一個問題:AGI時代所需要的基礎(chǔ)設(shè)施,究竟應(yīng)該是什么樣的?我們怎么能夠一步步地在這個過程中去實現(xiàn)它、推演它。
我們已經(jīng)做好了充分的準(zhǔn)備,也看清了短期、中期、長期不同階段需要解決的問題。當(dāng)前最緊迫的問題,就是像Claude這類模型帶動的整個token量的暴增,對我們系統(tǒng)效率提出了更高的優(yōu)化需求,價格的增長也是在這個需求壓力下的一種應(yīng)對方式。
我們一直以來都是從軟硬件打通的方式來布局和解決這個問題。我們接入了幾乎所有種類的計算芯片,把國內(nèi)十幾種芯片和幾十個不同的算力集群統(tǒng)一連接起來。這樣,當(dāng)資源不足時,我們能做到兩件事:第一,把能用的資源都用起來;第二,讓每一個算力都用在刀刃上,發(fā)揮出最大的轉(zhuǎn)化效率。所以當(dāng)前階段我們要解決的核心問題,就是如何打造一個更高效的token工廠。為此我們做了很多優(yōu)化,包括讓模型與硬件在顯存等方面實現(xiàn)最優(yōu)適配,也在探索在最新的模型結(jié)構(gòu)和硬件結(jié)構(gòu)下能否產(chǎn)生更深度的化學(xué)反應(yīng)。
不過,解決當(dāng)前的效率問題,我們只是打造了一個標(biāo)準(zhǔn)化的token工廠。面向Agent時代,這還遠遠不夠。就像剛才說的,Agent更像一個人,你可以交給他一項任務(wù)。我堅定地認(rèn)為,當(dāng)前云計算時代的很多基礎(chǔ)設(shè)施,是為服務(wù)程序、服務(wù)人類工程師而設(shè)計的,而不是為AI設(shè)計的。現(xiàn)在的狀態(tài)有點像:我們搭了一套基礎(chǔ)設(shè)施,上面留了一個為人類工程師設(shè)計的接口,然后在這上面再包一層去接入Agent。這種方式實際上是用人類操作的能力邊界,限制了Agent的發(fā)揮空間。
舉個例子,Agent能夠在秒級甚至毫秒級思考并發(fā)起任務(wù),但我們之前的底層K8S這些能力并沒有為此做好準(zhǔn)備,因為人類發(fā)起任務(wù)大概是分鐘級別的。所以我們需要進一步構(gòu)建我們稱之為Agentic Infra的能力,打造一個更智慧化的算力投放工廠。這是無問芯穹現(xiàn)在正在做的事情。
從更長遠的未來來看,真正AGI時代到來的時候,我們認(rèn)為連基礎(chǔ)設(shè)施本身都應(yīng)該是一個智能體,應(yīng)該能夠自我進化、自我迭代,形成一個自主的組織。相當(dāng)于有一個CEO,這個CEO是一個Agent,比如一個Claude在管理整個基礎(chǔ)設(shè)施,根據(jù)AI客戶的需求自己提需求、迭代自己的基礎(chǔ)設(shè)施。只有AI與AI之間才能更好地形成耦合。所以我們也在做一些讓Agent與Agent之間更好通信的事情,比如cache to cache這樣的復(fù)制能力。
我們一直認(rèn)為,基礎(chǔ)設(shè)施與AI的發(fā)展不應(yīng)該是隔離的狀態(tài),而應(yīng)該產(chǎn)生非常豐富的化學(xué)反應(yīng)。這才是真正的軟硬協(xié)同,真正的算法與基礎(chǔ)設(shè)施協(xié)同。這也是無問芯穹一直想實現(xiàn)的使命。
楊植麟(主持人) :接下來想問問福莉。小米最近發(fā)布了新的模型,也開源了一些背后的技術(shù),我覺得對社區(qū)做出了很大的貢獻。想請問一下,小米在做大模型方面有什么獨特的優(yōu)勢?
羅福莉 :我想先把這個問題稍微拓展一下,不只聊小米的優(yōu)勢,而是聊聊中國做大模型的團隊在這件事上的優(yōu)勢,我覺得這個話題有更廣泛的價值。
大概兩年前,我就觀察到中國的基座大模型團隊已經(jīng)開始了一個非常好的突破。這個突破是:在有限算力的條件下,尤其是在互聯(lián)帶寬受限的情況下,如何突破這些低端算力的限制,并由此催生了一些看似是為效率妥協(xié)的模型結(jié)構(gòu)創(chuàng)新,比如DeepSeek v2、v3系列的細粒度MoE等等。但我們后來能看到,這些創(chuàng)新引發(fā)的是一場變革,也就是在算力一定的條件下,如何發(fā)揮出最高的智能水平。我覺得DeepSeek給了國內(nèi)所有技術(shù)大模型團隊一份勇氣和信心。
雖然今天我們自己的國產(chǎn)芯片,無論是推理芯片還是訓(xùn)練芯片,已經(jīng)不再像以前那樣受到嚴(yán)重限制,但我們能看到,正是那些限制催生了我們對更高訓(xùn)練效率、更低推理成本的模型結(jié)構(gòu)的全新探索。比如最近出現(xiàn)的hybrid sparse或linear attention結(jié)構(gòu),有DSA、NSA,Kimi有KSA,小米也有面向下一代結(jié)構(gòu)的high sparse架構(gòu)。這區(qū)別于MiMo這一代結(jié)構(gòu),是我們面向Agent時代去思考的,如何在Agent時代做出更好的模型結(jié)構(gòu)創(chuàng)新。
我為什么認(rèn)為結(jié)構(gòu)創(chuàng)新如此重要?因為我們剛才聊到了long context這個話題。如果大家真實地去用OpenClaw就會發(fā)現(xiàn),越用越好用,越用越聰明。它的前提是推理的context足夠長。long context是一個談?wù)摿撕芫玫脑掝},但真正能做到在超長context下表現(xiàn)強勁、推理成本足夠低的模型,其實并不多。很多模型不是做不到百萬甚至千萬token的context,而是推理成本太高、速度太慢。只有當(dāng)你能在百萬甚至千萬context下做到成本夠低、速度夠快,才會有真正高生產(chǎn)力價值的任務(wù)被交給這個模型,從而激發(fā)模型在long context場景下完成更高復(fù)雜度的任務(wù)。我們可能需要在這樣千萬甚至億級context的規(guī)模下,才能實現(xiàn)模型的自迭代。所謂模型的自迭代,就是它可以在復(fù)雜的環(huán)境里依靠超長context完成對自我的進化,這個進化可能是對Agent框架本身的,也可能是對模型參數(shù)本身的,因為我們認(rèn)為long context本身就是對參數(shù)的一種進化。
所以,怎么實現(xiàn)long context efficient的架構(gòu),以及在推理側(cè)做到long context efficient,是一個全方位的競爭。這是我們大約一年前就開始探索的問題。而如今,怎么在真實的長程任務(wù)上實現(xiàn)穩(wěn)定性和高上限的效果,是我們現(xiàn)在在持續(xù)迭代的創(chuàng)新方向。我們在思考如何構(gòu)造更有效的學(xué)習(xí)算法,如何采集到真實的、在百萬乃至千萬上下文里具有長距依賴的文本,以及結(jié)合復(fù)雜環(huán)境產(chǎn)生的trajectory,這是我們正在經(jīng)歷的事情。
但我能看到更長期的事情是,大模型本身在飛速進步,加上Agent框架的加持,推理需求已經(jīng)在過去一段時間內(nèi)增長了近十倍。那今年整個token的增長會不會達到百倍?這又將我們帶入另一個維度的競爭,那就是算力,推理芯片,乃至往下到能源層面。這是我對這個問題的判斷,也期待從大家身上學(xué)到更多。
楊植麟(主持人) :非常有insight的分享。下面想問一下黃超,因為你也開發(fā)了一些非常有影響力的agent項目,包括nano bot,在社區(qū)里也有很多粉絲。想問一下,從agent的harness或者說應(yīng)用層面,接下來你覺得有哪些技術(shù)方向是比較重要、大家需要去關(guān)注的?
黃超 :感謝。我覺得首先可以從agent的幾個關(guān)鍵技術(shù)模塊來拆解,包括planning、memory和tool use。
從planning來講,現(xiàn)在面向長鏈路任務(wù)或者非常復(fù)雜上下文的場景,比如說五百步甚至更長的任務(wù),很多模型不一定能做好planning,我覺得本質(zhì)上是模型不具備這方面的隱性知識,尤其是在一些復(fù)雜垂直領(lǐng)域。未來可能需要把各類復(fù)雜任務(wù)的知識固化到模型里,這是一個方向。當(dāng)然,skill和harness這種機制,在一定程度上也是在緩解planning層面的錯誤,因為它提供了比較高質(zhì)量的skill,本質(zhì)上是在幫助模型去完成一些較難的task。
關(guān)于memory,我的感受是它永遠存在信息壓縮不準(zhǔn)確、召回不準(zhǔn)的問題。當(dāng)整個長鏈路任務(wù)和復(fù)雜場景展開時,memory會急劇膨脹,這對整個memory架構(gòu)造成很大壓力。目前包括各類agent框架基本上都采用最簡單的文件系統(tǒng)、Markdown格式來做memory,通過文件共享來協(xié)作。我覺得未來memory應(yīng)該走向分層設(shè)計,并且需要解決通用性的問題,因為coding場景、deep research場景、多媒體場景的數(shù)據(jù)模態(tài)差異很大,如何對這些memory做好檢索索引、提升效率,這永遠是一個trade off。
另外,現(xiàn)在agent框架讓大家創(chuàng)建agent的門檻大幅降低,未來可能不止一個agent,我也看到有些產(chǎn)品推出了Agent Swarm這樣的機制,相當(dāng)于每個人會擁有一群龍蝦。一群龍蝦相比一個龍蝦,上下文的暴增是可以想象的,這對memory帶來的壓力非常大。如何管理一群龍蝦帶來的上下文,目前還沒有很好的機制,尤其是在復(fù)雜coding、科研發(fā)現(xiàn)這類場景下,對模型和整個agent架構(gòu)都是不小的挑戰(zhàn)。
關(guān)于tool use,當(dāng)年MCP存在的問題,比如質(zhì)量沒有保障、存在安全隱患,現(xiàn)在在skill里依然存在。目前看似有很多skill,但高質(zhì)量的skill其實比較少,低質(zhì)量的skill會嚴(yán)重影響agent完成任務(wù)的完成度。另外skill也存在惡意注入的風(fēng)險。所以我覺得tool use這塊可能需要整個社區(qū)共同努力,把skill生態(tài)發(fā)展得更好,甚至探索如何在執(zhí)行過程中進化出新的skill。以上這些,是我認(rèn)為當(dāng)下agent在planning、memory、skill三個維度上存在的痛點,以及未來潛在的方向。
楊植麟(主持人) :可以看到剛才兩位嘉賓從不同視角討論了同一個問題,隨著任務(wù)復(fù)雜度增加,上下文會急劇膨脹。從模型層面可以去提升原生的上下文處理能力,從agent harness層面,則是通過planning、memory,包括multi-agent的harness,在模型能力一定的情況下支持更復(fù)雜的任務(wù)。我覺得這兩個方向接下來會有更多的化學(xué)反應(yīng),共同提升完成復(fù)雜任務(wù)的能力上限。
那最后我們來一個開放式展望,請各位用一個詞來描述接下來十二個月大模型發(fā)展的趨勢以及你的期望。這次我們先從黃超開始。
黃超 :十二個月在AI領(lǐng)域看起來好遙遠,真的不知道十二個月之后會發(fā)展成什么樣子。
楊植麟(主持人) :這里原來寫的是五年,我給改成十二個月了。
黃超 :對,我這邊的關(guān)鍵詞應(yīng)該是生態(tài)。未來agent要真正從個人助手轉(zhuǎn)化為打工人,這一步很重要。現(xiàn)在大家玩agent很多時候還停留在新鮮感階段,覺得好玩,但未來真正要讓agent沉淀下來,成為大家真正的搬磚工具,或者說真正的co-worker。這需要整個生態(tài)的共同努力,把所有相關(guān)的技術(shù)探索和模型技術(shù)都開源出來,不管是模型迭代、skill平臺迭代還是各類工具,都需要面向agent打造更好的生態(tài)。
從我自己的感受來說,未來的很多軟件可能不再是面向人類的。人類需要GUI,但很多軟件可能會是面向agent原生設(shè)計的,人類只會去使用讓自己快樂的GUI,其他的交給agent。所以現(xiàn)在整個生態(tài)從GUI、MCP又轉(zhuǎn)向了CLI這樣的模式。我覺得需要整個生態(tài)把不管是軟件系統(tǒng)、數(shù)據(jù)還是各種技術(shù),都變成Agent Native的模式,這樣才能讓整個agent的發(fā)展更加豐富。
羅福莉 :我覺得把這個問題縮小到一年非常有意義,因為五年這個時間跨度,從我心目中對AGI的定義來看,我覺得已經(jīng)實現(xiàn)了。所以如果要用一個詞來描述接下來一年AGI歷程里最關(guān)鍵的事情,我認(rèn)為會是自進化。這個詞雖然聽起來有點玄幻,過去一年大家也多次提到,但我最近才對它有了更深的體會,也對如何具體落地這件事有了更務(wù)實可行的方案。
借助非常強大的模型,我們在過去chat范式下其實根本沒有發(fā)揮出預(yù)訓(xùn)練模型的上限,而這個上限現(xiàn)在被agent框架激活了。我們現(xiàn)在觸到了一個現(xiàn)象,當(dāng)模型執(zhí)行更長時間的任務(wù)時,它可以自己去學(xué)習(xí)和進化。一個很簡單的嘗試是,在現(xiàn)有的agent框架里疊加一個可以verify的條件約束,再設(shè)置一個loop,讓模型持續(xù)迭代優(yōu)化目標(biāo),我們就能發(fā)現(xiàn)模型會持續(xù)拿出更好的方案。這種自進化現(xiàn)在已經(jīng)能跑一兩天了,國內(nèi)的模型基本上能支撐,當(dāng)然和任務(wù)難度有關(guān)。我們發(fā)現(xiàn)在一些科學(xué)研究上,比如去探索更好的模型結(jié)構(gòu),因為有評估標(biāo)準(zhǔn),比如更低的PPL,在這類目標(biāo)明確的任務(wù)上,模型已經(jīng)能自主運行和執(zhí)行兩三天了。
從我的角度看,自進化是唯一能創(chuàng)造出新東西的地方,它不是去替代我們?nèi)祟惉F(xiàn)有的生產(chǎn)力,而是像頂尖科學(xué)家一樣去探索這個世界上還沒有的東西。一年前我會覺得這個時間歷程需要三到五年,但就在最近,我覺得這個時間線應(yīng)該縮短到一兩年,大模型疊加一個非常強的自進化agent框架,至少能實現(xiàn)對科學(xué)研究的指數(shù)級加速。我們組內(nèi)做大模型研究的同學(xué),workflow高度不確定且需要大量創(chuàng)造力,但借助頂尖模型,基本上已經(jīng)能把我們自己的研究效率加速近十倍了。我很期待這樣的范式輻射到更廣泛的學(xué)科和領(lǐng)域。
夏立雪 :我的關(guān)鍵詞叫可持續(xù)token。我看到整個AI的發(fā)展仍然處于長期持續(xù)的過程中,我們也希望它能有長久的生命力。從基礎(chǔ)設(shè)施的視角來看,我們面臨的一個很大問題是資源終究是有限的,就像當(dāng)年我們講可持續(xù)發(fā)展一樣。我們作為一個token工廠,能否給大家提供持續(xù)穩(wěn)定、大規(guī)模可用的token,讓頂尖的模型真正能夠繼續(xù)服務(wù)更多的下游,是我們看到的一個非常重要的問題。
所以我們現(xiàn)在需要把視角放寬到整個生態(tài),從最早的能源到算力,再到token,最終轉(zhuǎn)換成GDP,讓這條鏈路能夠進行持續(xù)的經(jīng)濟化迭代。我們不只是把國內(nèi)的算力用起來,也在把這些能力輸出到海外,讓全球的資源能夠打通整合。所以我認(rèn)為可持續(xù)這個詞,也包含了我們想把中國特色的token經(jīng)濟學(xué)做起來的愿望。過去那個時代叫Made in China,我們把低價的制造能力轉(zhuǎn)化成好的商品輸出到全球。現(xiàn)在我們想做的有點像AI Made in China,把中國在能源上的優(yōu)勢,通過token工廠可持續(xù)地轉(zhuǎn)化為優(yōu)質(zhì)的token輸出到全球,成為世界的token工廠。這是我希望在今年看到的,中國為世界人工智能帶來的價值。
張鵬 :我就簡短一點,大家都在仰望星空,我就落地一點。未來十二個月面臨的最大問題,我覺得可能就是算力。剛才也說了,所有的技術(shù),包括智能體框架,讓很多人創(chuàng)造力爆發(fā)、效率提升十倍,但前提條件是大家用得起、用得起來。不能因為算力不夠,一個問題提出去讓它思考半天都得不到答案,這肯定不行。也正是因為這樣的原因,我們很多研究進展和想要做的事情其實都受阻了。前兩年記得中關(guān)村論壇有人提過這么一句話,叫沒卡沒感情,談卡傷感情。今天又回到了這個處境,但情況又不一樣了,我們現(xiàn)在轉(zhuǎn)向推理階段,是因為需求真的在爆發(fā),十倍百倍地爆發(fā)。剛才也說到過去增長了十倍,背后其實是一百倍的需求,還有大量的需求沒有被滿足,這需要大家一起來想辦法。
楊植麟(主持人) :好,感謝各位的精彩分享,謝謝大家。
最后,這兩天海淀五道口的AI原點社區(qū)也在舉辦原點Party Nights活動,有興趣的可以去玩玩,說不定咱們還能一起面?zhèn)€基。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時間收到推送,也可以給我個星標(biāo)?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克,tashi
>/ 投稿或爆料,請聯(lián)系郵箱:wzglyay@virxact.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.