![]()
“AGI進度已達80%”
編譯整理 | 莘歆
來源 | 盒飯財經(ID:daxiongfan)
頭圖及封面來源 | YouTube@Alex Kantrowitz
最近幾個月,OpenAI的戰略動作讓人有些看不懂。
一方面,他們野心勃勃,自2月以來,收編了OpenClaw(龍蝦)創始人,完成了1220億美元的巨額融資,甚至有消息稱,他們正在秘密打造一款集成了ChatGPT、代碼能力和瀏覽器的超級應用(Super App)。但另一方面,他們又顯得異常克制——竟然主動叫停了曾驚艷全球的視頻生成模型 Sora。
一邊是高歌猛進,一邊是急剎車,OpenAI 到底在盤算什么?
就在外界猜測不斷時,OpenAI 聯合創始人兼總裁Greg Brockman在《Big Technology》播客中罕見地交了底。這場對談,堪稱OpenAI 近期最坦誠的一次對外發聲。
![]()
圖片來源:YouTube@Alex Kantrowitz
Brockman直言,關停Sora并非技術遇到瓶頸,而是在算力極度稀缺的現實面前,OpenAI 必須做出的“痛苦抉擇”——砍掉旁枝,死保主干。
這根主干,就是通往AGI的核心推理模型,以及那個即將把AI門檻徹底踩碎的Super App。
這次訪談的核心話題,主要圍繞四個純技術與產品維度:AI 自我進化、超級應用戰略、通往 AGI 的路徑,以及算力擴展與新模型“Spud”。對話中,Brockman 不僅回應了關于Super App的野心、新基座“Spud”的進展,還首次徹底揭開了OpenAI狂奔背后的算力賬本。
以下是對話全文(已編譯):
![]()
叫停 Sora,放棄做“AI界迪士尼”
Alex Kantrowitz:這會兒,OpenAI正在關閉視頻生成業務,并將精力集中在一個結合了商業和編程的SuperApp上。我想包括我自己在內的旁觀者都會覺得,OpenAI在消費者領域正在獲得越來越多的用戶,現在卻突然轉移資源。到底發生了什么?
Greg Brockman:我們開發深度學習(deep learning)技術,是為了真正去看它是否能產生我們一直設想的積極影響。它能不能用來開發幫助人們、改善他們生活的應用程序?
我們另外還有一個部門在說,不管是為了幫助維持業務,還是為了獲得一些在現實世界中能產生影響的實踐經驗,我們都可以真正嘗試部署這項技術。這一切都是為了這項技術真正成熟的那一天。
我認為我們現在正處在這樣一個階段:我們看到了這項技術的應用前景。現在我們正在走出基準測試及類似純智力能力展示的階段,進入到了實際應用的時候。
為了進一步開發這項技術,我們需要把它放到現實世界中去,并從人們在知識工作和各種應用中的使用方式獲取反饋。
因此,我會把它看作是由于技術發展而發生的一次更大的戰略轉變。這與其說我們在從消費者轉向B2B,不如說我們在問:我們可以專注的最重要的應用是什么?
我們不可能專注于所有事情。所以我們要考慮哪些是我們能夠付諸實踐的、在開發過程中能夠相互協同、并且能夠產生有意義影響的事情?
在消費者方面,你可以把它想象成很多東西,但其中一個是個人助理(person alassistant)。一個了解你、與你的目標一致、并且將幫助你實現生活中任何目標的助理。此外還有創意表達、娛樂以及許多其他應用。
在商業方面,如果你放眼全局,它看起來更像是一件事:你有一個艱巨的任務,AI能去完成嗎?它是否擁有完成這些事情的所有上下文?
對我們來說,如果按優先級排序,最重要的只有兩件事,一個是個人助理,另一個是能夠為你解決難題的AI。
當我們反觀自己擁有的算力時,我們甚至沒有足夠的算力來支持這兩件事。所以,一旦我們開始增加許多其他應用、許多AI,這可能對人們有一些幫助,但我們根本不可能面面俱到。
因此,這是對技術成熟度及其將迅速產生的巨大影響的認知,也是我們需要確定優先級、真正挑選出我們想要讓其大放異彩并帶給世界的應用的必然結果。
Alex Kantrowitz:我記得之前你談論OpenAI的各種押注時,你描述的一種方式是OpenAI可以成為某個版本的迪士尼。先在中心擁有這種核心的、令人信服的優勢,然后以不同的方式將其擴展開來。比如,迪士尼有米老鼠,然后它可以做電影、主題公園和Disney+。
而對于OpenAI,核心是模型,你可以做視頻生成、成為助理、然后協助企業和工作。那么,現在是否不再可能擁有這種中心優勢并將其向各個方向擴展了呢?你們是不是已經意識到該做出取舍了?
Greg Brockman:我認為在某些方面,這個故事比以往任何時候都更加真實。但必須認識到的一點是,在技術上,Sora模型與核心的推理GPT系列處于科技樹(tech tree)的不同分支。它們的開發方式非常不同。在某種程度
上,不得不承認,我們很難同時追求兩個分支。
現在我們實際上在機器人技術的背景下繼續推進Sora的研究項目,我認為這將是一個變革性的應用,但它仍處于研究階段。機器人技術還沒有真正成熟。在未來一年里,我們將看到AI技術在知識工作領域迎來真正的爆發,但目前的機器人技術還無法實現那種程度的落地部署。
所以這是一種認知,即在這個時刻,我們真的需要把主要精力放在開發GPT系列上。
這不僅僅意味著文本。它不僅是純智力的東西,例如,它還擁有雙向交互和出色的語音對語音接口(speech-to-speech interface)。這也是一項將使這項技術變得非常易用和非常有用的東西,但它不是科技樹的另一個分支。
它們都在同一個模型框架內,我們只是像你描述的那樣,以略微不同的方式對其進行調整。如果你分支得太遠,擁有兩個不同的產物,在算力有限的世界里是很難維持的。算力有限是因為人們需求太大了。人們想用我們創造的每一個模型做的事情太多了。
Alex Kantrowitz: 好的。那么請談談為什么你們的賭注沒有押在這個世界模型(Sora)上,即視頻能理解事物的運轉。它顯然對機器人技術很有用。既然看到視頻生成前三代的進展如此巨大,為什么你們還把賭注押在了GPT推理模型樹上?
Greg Brockman:這個領域的問題在于機會太多了。我們在OpenAI早期觀察到的一點是,我們能想象到的每一件事現在都能行得通,只是伴隨著不同程度的摩擦、不同的工程努力和算力要求。每一個不同的想法,只要在數學上是合理的,你實際上就能獲得一些相當好的結果。
這就是底層深度學習技術的威力,它能接受任何類型的問題并觸及問題的核心,讓AI真正理解生成數據的底層規則。所以這不是關于數據本身,而是關于理解底層過程,并能夠將其應用于新的上下文。你可以將其應用于世界模型、科學發現或編程。
當我們考慮推出這項技術時,一直有這樣的爭論:文本模型能走多遠?你能否對世界的運作方式有一個真實的認知?我們現在已經明確回答了這個問題:它確實會走向AGI(通用人工智能)。在這個時間點,我們看到了今年即將到來的這些更好的模型的清晰路徑。
為了決定如何分配算力,我們在OpenAI內部經歷的痛苦也是有增無減的。所以也許核心在于,這是一個關于順序和時機的問題。
在這個時刻,我們一直夢想的各種應用開始觸手可及。例如,解決未解的物理問題。我們最近有一個成果:一位物理學家研究一個問題已經有一段時間了,他把它交給了我們的模型。12小時后,我們得到了一個解決方案。
他說這是他第一次看到一個讓他覺得在思考的模型,感覺這可能是一個人類永遠無法解決的問題,而我們的AI解決了它。
當你看到這樣的事情時,你必須加倍甚至三倍下注,因為我們真的可以為人類釋放所有這些潛力。所以對我來說,這不是關于這些事情的相對重要性。更多的是關于OpenAI將AGI帶給世界的使命。我們有一棵科技樹,我們知道如何去推動它,如何做工程、做進一步的科學研究,讓它最終開花結果。
Alex Kantrowitz: 今年早些時候我與Google DeepMind的Demis Hassabis談過。有趣的是,他說對他來說感覺最接近AGI的是他們的圖像生成器NanoBanana。
原因在于,圖像生成器或視頻生成器要創造圖像和視頻,它必須理解對象之間的互動,并至少對世界是如何運作的有一定的概念。所以,這是一個巨大的賭注,如果情況確實如此,OpenAI在另一棵樹上加倍下注,是否可能會錯失一些東西?
Greg Brockman:有兩個答案。第一,絕對有可能。在這個領域,你仍然必須做出選擇,必須下注。這其實也是OpenAI的出發點,我們在問,我們相信的通向AGI的路徑是什么,并非常努力地專注于此。隨機向量的總和是零,但如果你對齊你的向量,你就能朝著一個方向前進。
第二個觀點是,實際上圖像生成在ChatGPT內部非常受歡迎,這也是我們繼續投資、繼續優先考慮的東西。我們能夠做到這一點,是因為它實際上并不在擴散模型(diffusion model)等世界模型的技術分支上,它實際上是基于GPT架構的。
所以盡管它的數據分布不同,但核心技術在底層堆棧上是同一個東西。這其實是AGI相當瘋狂的地方,有時候這些看起來非常不同的應用,比如語音到語音、圖像生成、文本(文本本身也包括科學、編程、個人健康等),所有這些你都可以在一個技術框架(technological envelope)內完成。
所以我正在關注的,也是我們作為一家公司正在關注的,是如何讓我們的技術努力盡可能地統一。
因為我們真的將這項技術視為將提升并推動整個經濟發展的動力。經濟是一個龐然大物,我們不可能涵蓋所有方面,但我們可以做好我們的部分,那就是人工智能中的“通用”部分。
![]()
Super App讓計算機“主動迎合”人類
Alex Kantrowitz:說到統一,這個Super App會是什么樣?是把編程、瀏覽器和ChatGPT結合在一起嗎?
![]()
圖片來源:KrASIA
Greg Brockman:沒錯。我們想要構建的是一個為你服務的終端應用程序,真正讓你體驗AGI的威力,體驗這種通用性。如果你在想今天的ChatGPT是什么,我認為它將成為你的私人助理、你的私人AGI。一個照顧你、了解你、與你的目標一致、值得信賴的AI,它在這個數字世界中代表你。
以前它主要是我們為軟件工程師構建的一個工具,但它正在成為面向所有人的Codex。任何人都可以使用它讓計算機去完成他們想做的事情。
現在已經不再僅僅是關于編寫軟件了,它幾乎涵蓋了計算機的所有使用。比如我用它來設置我筆記本電腦上的系統快捷鍵,Codex直接就做好了。這才是計算機本來該有的樣子:迎合人類,而不是讓人類去適應它們。
所以想象一下有這么一個應用,任何你想讓計算機做的事情,你都可以問它。它內置了計算機使用和瀏覽功能,允許AI實際使用網絡瀏覽器,而你可以監督AI正在做什么。
你所有的對話——無論是聊天、編程,還是常規知識工作——都統一起來,AI有記憶,了解你。這就是我們正在構建的東西。
但其實這只是冰山一角。
對我來說更重要的是技術上的統一。過去幾年真正改變的不僅是模型,而是關于工具鏈(harness)。模型如何獲取上下文?它如何連接到世界?它可以采取什么行動?與模型交互的循環是如何運作的?
所有這些我們曾經有多種不同的實現方式,而現在我們正在將其收斂為一個統一的版本。最終形成一個可以非常輕量級地指向特定應用程序的AI層。
這樣一來,你可以建立一個小插件或專門的UI來處理金融或法律,但通常不需要,因為這一個Super App將非常廣泛。
Alex Kantrowitz:這個應用是針對商業還是個人?
Greg Brockman:兩者都是。這才是真正的核心:就像你的筆記本電腦,它是個人用的還是商業用的?兩者都是。它是你的個人機器,為你提供與數字世界交互的接口。
Alex Kantrowitz:從非商業角度來看,我在個人生活中使用這個SuperApp,能用它來做什么?我的生活會發生怎樣的改變?
Greg Brockman:在個人生活中,就像你現在使用ChatGPT一樣。人們在各種場景都能用到它。
比如,“我要在婚禮上致辭,能幫我起草一下嗎?”“你能給我這個想法一些反饋嗎?”“我正在做個小生意,能給我一些點子嗎?”這或許就開啟了個人與工作之間的橋梁。
任何問題,你都能去Super App里問。
回想ChatGPT的過去,它一直在進化。它以前沒有任何記憶,就像在和一個陌生人說話。如果它能記住你們有過的互動,如果它連接到你的電子郵件和日歷,真正了解你的偏好,它就會強大得多。
比如現在的plus功能,每天都會根據對你的了解為你推送可能感興趣的內容。在個人層面,Super App能做所有的這些事情,并且將以更深入、更豐富的方式進行。
Alex Kantrowitz:你們計劃什么時候發布它?
Greg Brockman:我們正采取漸進的步伐來實現這一目標。我們將逐步發布我們在這里討論的完整愿景,不過它將是分塊到來的。比如,今天的Codex應用程序實際上是二合一的。它是一個可以使用工具的通用agent框架,也是一個知道如何編寫軟件的agent。
那個通用框架可以用于很多不同事情,你可以把它連接到電子表格或Word文檔,它能夠幫助你進行知識工作。我們將在常規知識工作方面使Codex變得更加易用。我們在OpenAI內部已經看到了大量自發將其用于此目的的案例。所以這將是第一步,接下來還會有更多。
Alex Kantrowitz:昨天我和你的一位同事交談,他提到有人讓Codex剪輯視頻。它為Adobe Premiere構建了一個插件,開始將其分為幾個章節并開始了剪輯。
Greg Brockman:這正是我們所期待的,我非常喜歡聽到這個。Codex應用程序最初是為軟件工程師構建的。對于非軟件工程師來說,它目前的可用性其實相當低,因為當你在設置時會遇到一堆開發人員才知道如何修復的小錯誤。
但盡管如此,我們依然看到那些從未寫過代碼的人開始使用它來搭建網站,自動化他們與不同軟件的交互,以獲得巨大的杠桿效用。
比如我們溝通團隊的成員用它連接到Slack和電子郵件,瀏覽大量反饋并出色地進行總結。非常有動力的人可以克服重重障礙并獲得巨大回報。
所以在某種程度上,我們已經完成了超級困難的部分,即打造一個非常聰明、能干、能實際完成你任務的AI。現在我們要完成的是更容易的部分:讓它廣泛可用,消除這些準入門檻。
![]()
坦言曾落后,OpenAI正在死磕“最后一公里”
Alex Kantrowitz:看看競爭格局。比如Anthropic有Claude應用程序。你可以使用Claude聊天機器人、Claude Co-work、Claude Code。他們也有自己版本的Super App。你認為Anthropic看到了什么讓他們更早地到達了這個位置?你認為你們趕上的機會有多大?
Greg Brockman:如果你倒退12到18個月,我們一直專注于編程這個領域。我們在各項編程競賽上的數據一直都是最好的。
但我們投入不夠的是最后一公里的易用性(last mile of usability)。我們沒有想到的是,這個AI能解決復雜的編程比賽,但它從未見過某人真實世界里混亂的代碼庫。我認為在這一點上我們是落后的。
但大概在去年年中,我們開始非常嚴肅地對待這個問題。對于差距在哪里?如何獲取訓練數據、構建訓練環境,讓AI體驗實際做軟件工程是什么感覺、以奇怪的方式被打斷是什么感覺等這些問題,我們專門有一個團隊在處理。
我想說,在這一點上,我們已經趕上了。當人們在前端直接把我們和競爭對手進行比較時,人們更喜歡我們。這是我們一直在采取的總體動作,即端到端地思考產品的可用性,而不僅僅是做一個模型然后再建一個獨立的東西。這是我們OpenAI內部一直在改變的一種模式。
今年全年都會有令人難以置信的階躍式模型(step-upmodels)問世。看著路線圖,未來可能實現的事情確實令人振奮。但現在的重點是讓我們把最后一公里的易用性也做好。
Alex Kantrowitz:自2022年以來,OpenAI就像是無可爭議的領導者,而現在競爭顯然非常激烈。你剛才用了“我們趕上了”這個詞。公司內部的氛圍是否有所不同?有報道稱,開會時強調OpenAI不再有“支線任務”(side quests),所有的重點都在這個上面。這里的環境發生了怎樣的變化?
Greg Brockman:個人而言,我覺得OpenAI最可怕的時刻實際上是我們發布ChatGPT之后。記得在假日派對上,我感覺到了這種“我們贏了”的氛圍,這是前所未有的。我當時想,不,我們是弱勢群體,我們一直都是。這個領
域的競爭對手擁有更多的資本、數據和資源。
為什么OpenAI還能競爭?
僅僅因為我們從不自滿。我們始終覺得自己是挑戰者。在市場上看到其他競爭對手出現并做得很好,實際上是一件非常好的事情。我認為這給了我們公司一種統一和對齊。
我們過去幾乎把研究和部署當作獨立的事情,而現在我們真的想把它們整合起來。我認為它一直非常穩定。而對于模型生產的核心以及我們的路線圖,我感到極其自信。在產品方面,我們擁有巨大的能量將這一切交付給世界。
![]()
揭開新基座“Spud”的面紗
Alex Kantrowitz:你已經好幾次預示了你們即將推出一些優秀的模型。Spud是什么?有報道說,你們已經完成了Spud的預訓練(pre-training)。OpenAI的CEO Sam Altman告訴員工,他們有望在幾周內獲得一個非常強大的模型。所以什么是好的模型?
Greg Brockman:我覺得這真的不在于任何一個特定的模型。我們開發流程的運作方式是先進行預訓練,生成一個新的基礎模型,然后在此基礎上改進。這始終是一項跨公司的巨大努力。
我過去18個月大部分精力都專注于我們的GPU基礎設施,支持負責訓練框架的團隊進行擴展。但之后還有一個強化學習(reinforcement learning)過程,以及后訓練(post-training)過程。
我把Spud看作是一個新的基礎,一個新的預訓練。我們在其中匯聚了長達兩年的研究成果。對我來說,這(優秀的模型)永遠不在于任何一次發布。因為我們發布任何一款模型,都只是我們未來成果的早期版本。我們擁有一個不斷加速的進步引擎,而Spud只是這條路上的一步。
Alex Kantrowitz:那么你認為它和現在的模型有什么不同?
Greg Brockman:我認為它將能夠解決更困難的問題。它會更加細致入微,更好地理解指令和上下文。
人們經常談論所謂的“大模型味”(big model smell),就是當這些模型真正變得更聰明時,它們會更多地迎合你。當你問一個問題但AI沒有完全理解時,你可能很失望。所以新的模型在定性上會有一些新東西出現,以前你不放心、絕不會用AI來做的事,現在你根本不怎么想就直接用了。
我很期待看到它如何提高上限。我們已經看到了那些物理應用,我們將能夠解決更開放、時間跨度更長的問題。同時我也非常興奮看到它如何提高下限,讓你想做的任何事情都變得如此有用。
Alex Kantrowitz:對于日常用戶來說,真正感受到這種變化可能有點困難。在接下來的這一系列模型中,你期望它在某些職業的一線被感受到,還是你認為它對所有人來說都是一個廣泛有形的進步?
Greg Brockman:當你發布它時,會有人嘗試它然后說:“這和我之前見過的都不一樣。”也會有一些應用領域,受限于智能瓶頸,你可能不會立刻感受到。
但隨著時間的推移,你會感受到的。我有個朋友用ChatGPT去了解治療他癌癥晚期的不同方法,并由此獲得了治療。這需要你相信AI會有所幫助,你才會真正投入精力。
我們將看到,在各種應用中,AI能提供幫助這一點將變得更加明顯。所以這既是技術在變得更好,也是我們對技術的理解和觀念在轉變。
![]()
讓AI自己研發AI
Alex Kantrowitz:你們在OpenAI內部也會更加依賴它。你們正在研發一個自動化AI研究員(Automated AI Researcher),據說今年秋天推出。這是什么?
Greg Brockman:我們正處于這項技術起飛(take off)的早期階段。隨著AI變得越來越好,這項技術將呈指數級增長。我們利用AI來使AI變得更好,所以我們的開發過程加快了。起飛也是關于它在現實世界中的影響。所有能量都在越聚越多,AI正在從某種邊緣角色變成經濟增長的主要驅動力。
Alex Kantrowitz:那么這個自動化AI研究員究竟會做什么?
Greg Brockman:可以這樣理解,我們正在開發的AI接手了更大比例的任務,它能夠自主運行。但這并不意味著我們就是把它放出去不管。我們會深入地參與管理它。
就像你有一位高級研究員,他們不一定懂那些機械的技能,但他們能夠提供反饋、進行審查,并在某些方面提供指導。因此,我把它看作是一個我們要開發的系統,它將極大加速我們生產模型、實現新研究突破的能力。
Alex Kantrowitz:所以它是要去尋找AGI嗎?
Greg Brockman:我想差不多是這樣。在實踐層面上,我認為它將接手我們一位研究科學家的全部端到端的工作,并在芯片中完成它。
![]()
AGI進度已達80%
Alex Kantrowitz:AI的進展從漸進式轉變為勢不可擋地走向比人類更聰明的智能。你是否擔心這個過程也有可能出現問題?
Greg Brockman:絕對的。獲得這項技術紅利的方法也是認真思考風險。我們在安全方面投入很大,一個例子就是提示詞注入(prompt injections)。如果你要擁有一個非常聰明、連接了許多工具的AI,你要確保它不會被奇怪的指令顛覆。我們在這上面投入了大量資金,并且取得了巨大成果。
有趣的是,人類也容易受到網絡釣魚攻擊或被欺騙。我們將這些類比引入到開發過程中,思考如何確保AI與人類價值觀一致。但也存在一些關于世界和經濟的更大問題,這些不單是技術問題,OpenAI靠自己是無法解決的。
Alex Kantrowitz:令人擔憂的是這是一場競賽,許多開源玩家在安全方面的邊界和保護要少得多。如果大家都同意停下來,我們就會停下來。但現在似乎沒有放緩的跡象。那么AI帶來的回報值得冒這個風險嗎?
Greg Brockman:我認為值得。OpenAI成立之初,我們就在問,這項技術如何真正提升每個人?一種是集中化的觀點,即只有一個參與者在構建它以確保安全。這在某些方面是一劑苦藥。
相反,我們認為應該通過“彈性”來思考。把AI看作是一個開放的系統,并構建能幫助這項技術順利發展的社會基礎設施。就像電力發展一樣,有很多人發電,它也存在風險,但我們以多種方式建立了安全標準和法規。
我們需要廣泛的對話,讓許多人知曉并參與其中,這不能是由某個集中的小組秘密完成的。所以我們認為,應該圍繞這項技術的發展形成一個具有彈性的生態系統。
Alex Kantrowitz:英偉達CEO黃仁勛最近表示,他相信AGI已經實現了。你同意嗎?
Greg Brockman:我認為AGI對許多人來說有不同的定義。許多人會認為我們現在擁有的就是AGI。但在我看來,目前的AGI是非常參差不齊的。在編寫代碼等許多任務上,它絕對是超人類的。但有一些非常基本的任務它仍然會遇到困難。
所以分界線劃在哪里?目前這更像是一種感覺而不是科學。如果你5年前向我展示今天的系統,我會說,“哦是的,這就是我們所說的東西。”但它與我們曾經描繪的畫面如此不同。
Alex Kantrowitz:所以你覺得還沒有達到。
Greg Brockman:我認為基本上已經達到70-80%了,所以我們非常接近了。我們將在未來幾年內實現AGI,它可能仍然會參差不齊,但在使用計算機進行各種智力任務的下限能力上,AI將能夠做到。
就我個人而言,我認為我們幾乎到了,但需要再進一步,我們才能算絕對達到。
Alex Kantrowitz:2025年12月發生了什么?那似乎是一個轉折點,讓機器不間斷編程數小時的想法從理論變成了現實。當時究竟發生了什么?
Greg Brockman:新模型的發布真的讓AI能夠完成的任務比例從大約20%飆升到了80%。它從一個“可有可無的附屬品”變成了你絕對需要圍繞它來重新配置工作流程的東西。
我自己有個測試提示詞是“給我建個網站”。過去,這可能需要花費四個小時,并使用一堆不同的提示詞。在12月份,只需要一次提示它就生成了,并且做得非常好。
Alex Kantrowitz:那么這些模型是如何實現這一飛躍的?
Greg Brockman:這很大程度上得益于更好的基礎模型。我們在改進預訓練技術方面已經投入了相當長的一段時間。另外我們不斷地在創新的每一個軸線上推進。在某些方面你會看到跳躍,而在某些方面一切都是連續的。
我們在推出的每一個小版本更新中都切實看到了這種改進。比如在52和53之間,和我合作的一位工程師的體驗就是,AI一開始根本無法完成他底層的系統工程,現在能夠添加監控指標、運行性能分析器,并且能夠產出完全是他想要的東西。這幾乎是一種“慢慢地、慢慢地、然后突然爆發”的過程。
Alex Kantrowitz:之前你說Codex是為軟件開發人員準備的。而在這場對話早些時候,你卻說每個人都能使用這些東西。是什么導致你改變了看法?
Greg Brockman:以前我們為自己開發工具,很容易形成思維慣性。但隨著技術進步,我們意識到底層技術其實大部分不是關于代碼的。它主要關乎解決問題、管理上下文和框架。
明白了這一點之后,寫代碼這件事也突然向所有人敞開了大門。你可以管理一個去幫你工作的工具。在操作Excel或制作演示文稿時有那么多機械性的要求,如果AI具備了這些上下文,憑借它現在的原始智能就能出色完成任務。只要讓它更平易近人,它就變成了“面向所有人的Codex”。
![]()
智能體時代,人人皆是CEO
Alex Kantrowitz:硅谷出現了另一個現象級事物OpenClaw。人們開始給AI機器人訪問電腦桌面的權限,讓它去管理生活。后來OpenAI把OpenClaw團隊招致麾下。這是你們的愿景嗎?
Greg Brockman:這項技術的核心難題在于:弄清楚它的用處、人們想怎么用它、Agent的愿景是什么,以及它將如何嵌入人們的生活。OpenClaw的創始人Peter是一個非常有遠見和創造力的人。
在這項技術的迭代中,那些全情投入、充滿好奇心和遠見的人擁有極具價值的新興技能。這不僅僅是技術問題,真正關乎的是我們如何利用這些能力并嵌入人們的生活。這是我們正在加倍努力和大量投資的領域。
Alex Kantrowitz:當這些AI智能體為你工作時,你就成為了由數十萬個agent組成的車隊的CEO,這種新的工作方式可能會讓你覺得正在失去對問題的脈絡把握。這算是件好事嗎?
Greg Brockman:我認為這喜憂參半。我們需要承認這些工具帶來的優勢并緩解劣勢。我們賦予人們杠桿和能動性。但說到底,總得有個責任方。如果你的智能體把事情搞砸了,那不是智能體的錯,是你的錯。
為了讓人們使用這些工具,你需要意識到人類的能動性和責任心是系統的核心部分。作為用戶,你不能推卸責任,不能僅僅說“反正AI會搞定的”。
Alex Kantrowitz:但是你提到你感覺自己對問題本身失去了脈絡把握。
Greg Brockman:這兩者實際上是相互關聯的。如果你是一個CEO,你離細節太遠,失去了對脈搏的把握,那將無法帶來出色的結果。有些細節你可以不操心,是因為你信任他們。
但有些細節錯了,你應該關心。你需要深入其中,真正去理解優勢和劣勢。當你從一些較低層次的細節中抽身時,那應該是你與一個能把工作做好的系統建立起了信任。
Alex Kantrowitz:模型的演進從預訓練到微調,再到強化學習和使用工具。這個演進過程的下一步是什么?
Greg Brockman:我們所處的世界是機器的能力和深度不斷增加的世界。現在我們也需要去開發真正優秀的工具。比如在企業環境中,憑證認證、審計跟蹤如何工作?有大量的技術建設需要趕上核心模型的能力。
發展方向包括一個出色的語音界面,讓你能夠自然地與計算機交談。比如你早晨醒來,它會為你提供智能體昨夜取得進展的報告。
另外,提升野心的上限,提升人類所能解決的挑戰的上限,也是下一步。就像AlphaGo的第37步,這將在科學、數學、醫療甚至文學等每一個領域發生,解鎖人類在創意理解和構思方面的能力。
Alex Kantrowitz:為什么你覺得這些還沒有發生?
Greg Brockman:因為模型的能力與人們使用它們的方式之間存在一種懸垂狀態(overhang)。我們對這些模型中包含的內容的理解仍在浮現階段。
我們之前非常擅長在可以被測量的任務上訓練模型(比如數學或編程),因為那里有完美的驗證器。而解決更開放的問題在于擴展能夠被創造的空間。
對于像創意寫作這樣的事情,很難評分。因此之前在教導AI體驗和嘗試方面受限較多。但這一切都在改變。
Alex Kantrowitz:PeterThiel(硅谷傳奇投資人)提到過,如果你是一個搞數學的人,你可能比那些搞文字的人面臨更深的麻煩。你以前是數學俱樂部的成員,你不擔心嗎?
Greg Brockman:人們總是更容易看到自己失去了什么。比如我過去參加數學競賽,現在AI也能參加了。但這從來不是關于數學競賽本身的,這并不是真正驅動人類的東西。
想想我們現在的工作方式,是在屏幕后敲擊鍵盤,這不自然,這不是人類存在的意義。
作為人類的意義在于存在、參與其中,與其他人建立聯系。我們將看到AI能夠為人類騰出大量時間用于增進人際交往。
Alex Kantrowitz:有討論說,究竟是否真的需要進行更大規模的訓練運行。你是負責擴展(scaling)的人,你怎么看?
Greg Brockman:這種觀點忽略了模型生產管道中的每一步都是具有乘數效應的。只要改進了預訓練,就會讓所有其他步驟變得容易得多。模型能學得更快,需要犯的錯誤更少。
以前我們只把這看成是對一個純粹理性系統進行訓練,現在這同時也關乎去嘗試各種事物,了解現實世界的使用并反饋到訓練中。這并沒有消除繼續研究的重要性。
另一個轉變是,過去我們只專注預訓練能力,現在我們意識到這是個平衡,你真的需要它具備良好的推理能力,這樣你才能為世界提供服務。你要認真考慮下游海量的使用需求,再去優化“智能乘成本”的指標。
Alex Kantrowitz:如果一切大多轉向推理階段,你們還需要英偉達的GPU嗎?
Greg Brockman:絕對需要。除了將算力集中在一個問題上之外,你沒有其他途徑能夠實現大規模的訓練。某些部署足跡將顯著上升,但在進行大規模預訓練時,還是希望將大量算力集中在那里。英偉達團隊非常不可思議,我
們與他們合作非常緊密。
Alex Kantrowitz:難道不會有一天大家說模型已經夠聰明了嗎?
Greg Brockman:我想這有點像“一旦人類解決了擺在面前的所有問題”。但過去50年里我們的雄心有些退縮了。
比如我們能否為所有人提供真正的預防性醫療保健?在疾病發生前發現隱患。這樣的問題可以通過更智能的模型來實現。可能到了某個階段你解決了這個問題,但還有其他問題會需要它。
![]()
一場不會破產的“算力豪賭”
Alex Kantrowitz:你們今年早些時候籌集了1100億美元。這背后的算賬邏輯是什么?
Greg Brockman:很簡單:擺在我們面前的巨大開銷就是算力。你可以把算力看成是一個收入中心,而不是成本中心。就像雇傭銷售人員,只要你能賣出產品,銷售越多收入越多。
我們不斷發現,算力擴容的速度根本無法跟上需求。現在我們必須就推出什么產品、算力如何分配做出痛苦的決定。問題將是:哪些問題將獲得這些龐大的算力?世界上的算力根本不足以讓每個人都擁有私人助理或使用Codex。
Alex Kantrowitz:這是一個全新的類別,你們如何確信它一定會成功?
Greg Brockman:現在已經有歷史先例了。從推出ChatGPT起,我們知道無論部署多少算力都無法滿足需求。算力購買必須提前18個月或更長時間鎖定,你需要向未來進行預測。
迄今為止我們的大部分收入來自消費者訂閱。但目前正在涌現的巨大機會是知識工作。每個意識到這項技術可行的企業都在采用它。付費意愿和收入增長非常明顯,你只要把它向未來推演即可。基于清晰的模型改進路線圖,經濟增長的最關鍵因素將是關于AI以及你可用的計算能力。
Alex Kantrowitz:消費者訂閱現在是最大收入來源,企業業務會成為最大的來源嗎?
Greg Brockman:企業的這種發展非常快。企業的含義也在改變,即真正使用它來進行生產性知識工作。隨著我們思考定價,它不會被明確界定為這個類別或那個類別。作為一個用戶,你將擁有這個通往數字世界的門戶,那才是收入的根本來源。
Alex Kantrowitz:Dario(Anthropic的聯合創始人兼CEO,OpenAI的前高管與“出走者”)曾說有些玩家正抱著孤注一擲的心態,把風險的撥盤拉得太滿,他對此非常擔憂。他指的可能是你們的基礎設施豪賭。你怎么看?
Greg Brockman:我完全不同意。我們深思熟慮過,極其清晰地看到了即將到來的東西。我們甚至會在今年看到每一個參與者都將受到算力的限制。其他玩家可能在去年底才意識到并開始尋找算力,而其實已經沒有多余的了。每個人都已意識到這項技術是在起作用的,我們從根本上受限于可用的計算能力。
Alex Kantrowitz:他還說如果預測出現偏差,公司可能會破產。你們也是如此嗎?
Greg Brockman:這里的回旋余地大得多。這個賭注壓的不是某一家公司,而是整個行業。它在于你是否相信這項技術能夠被生產出來并兌現巨大的價值。
軟件工程的改變很難用語言描述,人們會很快體驗到它。6個月后大家都會感受到這種痛苦:有一個超棒的模型卻不可用,因為算力不夠。
Alex Kantrowitz:去年年底有人預測2026年是大家都使用智能體的一年。我現在已經在用了。這能讓我們以更自然的方式與軟件互動嗎?
Greg Brockman:這就是關鍵。我們制造計算機的方式把我們拉進了一個數字世界,你花了大量時間點擊按鈕試圖連接不同的東西。AI是讓機器向你靠攏,為你提供個性化服務,理解你想完成什么。你可以與之交談并讓其辦事的計算機,正開始變成現實。
Alex Kantrowitz:民調顯示,認為AI對社會產生負面影響的美國人是預期產生積極影響的三倍。你擔心AI的品牌形象嗎?
Greg Brockman:我們需要向國家展示為什么AI對他們有好處。不僅是對宏觀經濟,更是它如何在人們實際生活中幫助他們。
我每天都能聽到真實的故事,比如一個家庭用ChatGPT研究癥狀,爭取到了MRI,從而發現了孩子的腦瘤,挽救了生命。這些故事還沒有流傳出去。90年代的流行文化對AI的看法非常負面。
但當人們真正使用AI時,他們會發現它的效用和價值。所以答案是會,我非常擔心我們還沒有成功地幫助人們理解這項技術將如何改善生活、增強人與人之間的聯系。這關乎國家安全和國家競爭力。
Alex Kantrowitz:民調顯示,認為數據中心對環境和生活質量產生負面影響的人,遠遠多于認為其有益的人。人們錯了嗎?
Greg Brockman:關于數據中心確實存在大量錯誤信息。比如我們的阿比林設施(OpenAI正在美國德克薩斯州阿比林市建設的一座超大型AI數據中心)的耗水量僅相當于一個普通家庭一年的用水量,可以忽略不計。
![]()
圖片來源:OpenAI官網
在電力方面,我們承諾自掏腰包支付費用,不會推高普通人的能源價格。我們深入當地社區了解情況發現,數據中心會帶來稅收和就業機會。
Alex Kantrowitz:即便電費不漲,引入電力可能意味著更多污染,不令人擔憂嗎?
Greg Brockman:你看看今天的電網,實際上有大量被閑置的清潔電力未被利用,因為需要升級輸電系統。把這個責任落在我們身上非常重要。這給了老化的電網一個真正的升級理由。在北達科他州,數據中心的入駐幫助改善了公共設施,人們的電費反而下降了。
Alex Kantrowitz:你向支持特朗普的MAGAInc.捐贈了2500萬美元。對于支持讓這項技術造福所有人的事,你說你都愿意做。一個更強大的國家難道不應該是政治活動的北極星嗎?這是那筆捐款的考量之一嗎?
Greg Brockman:我和妻子也曾向跨黨派的超級政治行動委員會捐贈過。這項技術在未來幾年內將迅速到來,成為經濟的基石,但它并不受歡迎。
我們想要支持那些真正傾向并愿意投入這項技術的政治家。我確實是一個單議題捐贈者(one-issuedonor),這是表達對這項技術的支持,作為一個國家,這是我們應該全力擁抱的東西。
Alex Kantrowitz:你對那些害怕AI的人想說些什么?他們可能覺得它會搶走工作、污染社區、讓世界變化太快。
Greg Brockman:去嘗試這些工具。只有親身體驗才能真正領悟。那些從未建過網站的人現在可以建網站了。做小生意的人現在能用AI解決后臺管理問題。
思考它如何幫助你的健康、幫你的家人、幫你賺錢省錢。看到未來會有什么變化,遠比看到你將會獲得什么要容易得多。值得去給它一個公平的機會。
Alex Kantrowitz:民調數據中,那些看別人用過但自己沒試過、或從未嘗試過AI的人,往往要負面得多。而深度用戶或偶爾使用的人總體上是非常積極的。
Greg Brockman:是的。我所看到的正在我們面前展開的景象,比我們曾經想象的要更驚人,并將產生更加積極的影響。
Alex Kantrowitz:最后一個問題。如果讓你提一些建議,那你會建議人們為未來做好哪些準備?
Greg Brockman:最重要的一點是理解這項技術。你必須帶著好奇心去接觸它,嘗試應用到你的工作流中,克服最初的障礙。比如,面對一個空白框,我該做什么?去培養“我能成為管理者、設定方向、委派任務并提供監督”的能力。
這項技術是為了幫助人類建立更多聯系,讓人類能花更多時間做自己想做的事。所以問題是你到底想要什么?借助這項技術去實現它,這是最重要的事情。
歡迎在評論區留言~如需開白請加微信:YPYP01234567
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.