<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      專訪前FAIR研究總監(jiān)田淵棟:Meta裁員之后,對AI的一些遺憾與思考

      0
      分享至

      在2025年10月22日,Meta首席執(zhí)行官扎克伯格批準(zhǔn)了對公司人工智能部門裁減約600名員工的計劃。這是Meta今年在AI領(lǐng)域的最大規(guī)模裁員,主要針對被稱為“超智能實驗室”的核心研發(fā)部門。

      本篇文章,我們也采訪了這次裁員風(fēng)波中的核心人物之一:前FAIR團隊研究總監(jiān)田淵棟。我們的采訪聊了不止Meta,還有在公司層面之外,這些資深A(yù)I科學(xué)家對AI路線和未來前沿研究的一些思考,包括LLM路線、開閉源、Research Lab的存在,以及AI人才對研發(fā)和工程的選擇等等話題,希望對大家所有幫助。

      至于Meta為什么要進行這次裁員,公司的AI開源路線是如何碰壁的,以及空降的新AI負責(zé)人Alex Wang將會如何重塑Meta的AI策略等等內(nèi)容,我們都在上一篇文章中都提到了,大家可以點擊圖片跳轉(zhuǎn)閱讀。

      01

      被裁并不意外只是一次被加速的個人選擇

      陳茜:

      我看你還穿著FAIR的衣服。

      田淵棟:

      哈哈哈哈,我覺得像我們這樣的人,一般也不是很在意穿著,公司發(fā)什么衣服就穿什么衣服。


      陳茜:

      過去幾天對你來說是什么樣子的?我知道很多人來聯(lián)系你,包括媒體還有很多公司都來找你,你自己是什么樣的一個心態(tài)?

      田淵棟:

      因為我在被裁之前已經(jīng)有offer了,我在被裁之前我已經(jīng)跟我那些上級說過:哎呀,我不是很爽,我可能要look around(到處看機會),他們是知道的,所以被裁我也沒有特別驚訝。

      所以我覺得無所謂,反正我有offer。當(dāng)然我拿了offer之后,后來我想想還是在Meta再待一陣子,因為畢竟還是有卡(GPU算力)嘛,還可以再做點東西。但是他們把我裁了的話,那就這樣了唄。

      過去這兩天有很多的人找我,很多人跟我聊天,想問有沒有什么機會什么的,包括各大公司,肯定你想到公司都聯(lián)系我了,而且都比較高級別的人。還有很多小公司有一些co-founding(聯(lián)合創(chuàng)始)的機會。

      總得來說有很多機會吧,所以現(xiàn)在應(yīng)該說還在考慮,還沒有決定。因為現(xiàn)在離裁員還不到一個禮拜,還不到168個小時,所以還是需要想一想,再考慮考慮。

      陳茜:

      裁員是你意料之中的嗎?你當(dāng)時感覺到裁員會來嗎?

      田淵棟:

      肯定在意料之中,不然的話我不會去找工作嘛。因為我在公司已經(jīng)待了10年多了,所以也許這個正好是個時機,可以出來看看,這是我的想法。

      至于那公司里面情況怎么樣,我現(xiàn)在還不太方便評論,但是反正這個可能是個人選擇,只是說這次裁員加速了這個個人選擇。本來可能還在公司里再待一會,比如再待個半年,然后再考慮一下,但是如果被裁員的話,反正現(xiàn)在都已經(jīng)出來了,那就出來吧。

      02

      AI行業(yè)趨勢未來“執(zhí)行層”的人會變少

      陳茜:

      裁600人,當(dāng)時看到這個數(shù)字的時候我還是挺震驚的,覺得有點多。雖然不是完全裁,他們可能有機會轉(zhuǎn)去其他的組。只是說這個AI部門,他們覺得沒有必要有這么多人的崗位在這邊了,需要把這個部門重新地restructure(重組)一下。


      圖片來源:CNBC

      田淵棟:

      對,大概是這樣子。我覺得(裁員)可以說是行業(yè)趨勢吧,我們不說Meta具體這幾次情況,因為我也不方便透露太多,但我覺得行業(yè)趨勢是如此。

      因為AI本身自動化的程度是最高的,比如我們今天有很多人標(biāo)數(shù)據(jù),可能明天模型強了,不需要那么多人標(biāo)數(shù)據(jù)了,后天模型更強了,那需要的人就會少。

      我以前聽說過各種消息,比如說以前on call說我這個模型傳到一半掛了,馬上打電話過來說:“掛了掛了,馬上起來?!比缓笠蕖⒁{(diào)參數(shù),看能不能把它救回來。但是現(xiàn)在因為有很多的自動化的工具,如果整個系統(tǒng)做得很好的話,這種事情也變得會很少。所以這樣的話你會相信,各種各樣的pipeline(項目流程)都慢慢變得成熟、變成自動化。那你覺得需要很多人嗎?也并不需要那么多人。所以我覺得大趨勢肯定是做這個事情的人會越來越少,應(yīng)該是這樣的一個狀態(tài)。

      陳茜:

      所以你覺得這次裁員不是Meta這一個公司的問題,而是大趨勢可能工程師或者是從事AI的人會越來越少。

      田淵棟:

      應(yīng)該是這么說,如果說得比較嚇人就是,大趨勢是總有一天大家都沒有工作,或者說沒有傳統(tǒng)意義上的工作。現(xiàn)在的情況是我受雇一個公司,然后我?guī)瓦@公司把事情做好,也許以后并不需要這樣。

      比如說如果我去當(dāng)CEO,或者我去當(dāng)一個小公司的領(lǐng)導(dǎo)者,或者我自己去創(chuàng)業(yè)的話,現(xiàn)在這些工具拿到手之后,我自己都會覺得我并不需要太多人做這事情。有很多事情可以自動化了,而且自動化的程度非常高。所以也許我本來是需要一個團隊,比如說需要幾百人、幾千人去做一件事情,現(xiàn)在也許不需要那么多人,很多事情可以自動化,可以用agent(智能體)來做。

      所以在這種情況下,我覺得總的來說做AI的人可能會越來越少,但是探索用AI來做工具、做其他東西的人會越來越多,大概是這樣的一個過程。

      陳茜:

      你覺得在foundation model(基礎(chǔ)模型)研究上面的人會越來越少嗎?

      田淵棟:

      應(yīng)該說對foundation mode(基礎(chǔ)模型)的探索性的研究會越來越多但是按照我們之前工程上的邏輯,把這個模型做出來、訓(xùn)練出來的這些人會越來越少。因為以后會發(fā)現(xiàn)大家都遵循同樣的邏輯,把這個模型訓(xùn)練出來,代碼都是可以跑的,然后都是能有效果的。那為什么還需要這么多人呢?肯定有更多人會說我們可以做研究,或者是做一些其他探索性的工作,這樣的人會越來越多。

      陳茜:

      做應(yīng)用的人也會越來越多。

      田淵棟:

      對,但是這個應(yīng)用不是那種一般性的應(yīng)用,很多時候可能會落地到某個具體的垂直領(lǐng)域,或者說用這個東西做一些你現(xiàn)在想做的事情,這樣的人應(yīng)該會越來越多。

      陳茜:

      但這是中間層的,做執(zhí)行的那部分人會變少。

      田淵棟:

      對,因為做執(zhí)行那些人,首先他們的工作比較重復(fù)的,可能很多事情是需要修或者需要處理,但是如果工具的自動化程度越來越高的話,重復(fù)性的勞動就會減少。


      陳茜:

      在這次裁員之前,你本來在FAIR里面在研究什么?

      田淵棟:

      在裁員之前,我們是今年1月份的時候去GenAI幫忙,這段時間之內(nèi),我們大部分時間沒有在做研究,而是在做各種比較救火的工作。

      陳茜:

      當(dāng)時就是Llama 4。

      田淵棟:

      對,當(dāng)然我個人還是會有一些其他工作,比如說和外面一些其他的一些朋友合作的一些工作,像我們今年四五月份有一篇文章是分析一下我們之前的連續(xù)思維鏈,它的一些理論上的比較厲害的地方。而且這篇文章至少影響力也挺大的,大家會覺得這篇文章給連續(xù)思維鏈Coconut加了一個備注。因為我們在理論上做了更深入的分析,這個分析能夠讓連續(xù)思維鏈這個思路,讓大家覺得可能更有道理,可能會有更多的工作再做下去。

      03

      開源仍會繼續(xù)

      模型的“用途”才是核心問題

      陳茜:

      你可以說一下,開源、閉源接下來的一個發(fā)展嗎?因為現(xiàn)在有很多外界認為開源在一個大公司的架構(gòu)里面就不可行了,因為現(xiàn)在前沿模型競爭太激烈了。別人都在閉源,你一個人開源你可能也堅持不下來。你覺得是不是接下來開源模型距離閉源模型的差距越來越遠?還有人會做開源嗎?

      田淵棟:

      我覺得硅谷這邊還是會有開源的,像我知道的一些公司,比如Reflection AI它們應(yīng)該就在做開源的模型,它們是有很多的要求、很多的想法想要做這些東西。像之前的OpenAI也做過一些,比如開源的GPT-oss model。所以我覺得開源還是會有的,而且一定會繼續(xù)發(fā)生,像Ai2也在做開源的工作。我覺得接下來更大的問題是:這些模型有什么用?


      硅谷101視頻節(jié)目截屏

      陳茜:

      你指的是開源的模型有什么用?

      田淵棟:

      不管開源還是閉源的,因為模型一旦出來之后,這個模型本身大家可以拿來當(dāng)聊天工具、搜索工具、效率工具,全部都可以,這些東西可能大公司會做。但還有很多的其他的方向,比如這個模型可以拿來做一些科學(xué)研發(fā)或者說做科學(xué)家的工作,或者說做垂直領(lǐng)域的一些工作,這個東西小公司就可以做。在一定程度之后,這個模型需要有多強能夠把這個問題做出來,可能是一個因人而異或者說因問題而異的問題。因為最終發(fā)現(xiàn),我真的需要一個模型在所有方面、在不同領(lǐng)域都很強嗎?不一定,可能只在你在意的方向上比較強,這個時候可能就開始分化了。每個人、每個模型可能都有自己的想法,每個公司做這個模型有自己的目的,會有各種各樣不同模型做不同的事情。在這種情況下,就可能會有一個不同的策略。

      可能有些模型希望開源,因為開源之后,大家用了之后,可以用來做一個社區(qū)作為工具、平臺,這個時候你開源是很說得通的。比如說我有一個模型,這個模型訓(xùn)練完之后可以調(diào)用某種標(biāo)準(zhǔn)工具集,然后我在標(biāo)準(zhǔn)工具集上,我可以再用這個模型去做一個平臺讓大家用著,那肯定要開源。如果是其他的一些領(lǐng)域,比如說如果這個模型是用來做個性化的搜索或者推薦,這種模型應(yīng)該說不太愿意開源吧?;蛘哒f每個人自己訓(xùn)練一個模型,但是不開源。所以最終看最終的目的是什么,而不是非常泛泛地說:開源和閉源哪個好、哪個不好。最終還是看公司的策略,因為每個公司和每個人其實都是不一樣的

      陳茜:

      所以你覺得就是在SOTA(最前沿模型)上面可能很難有一個開源的模型去跟閉源的模型直接地競爭,但是在很多小的垂類的這種模型上面,還是有非常非常多開源的機會的。

      田淵棟:

      應(yīng)該說是這樣。

      04

      LLM的最大問題:需海量數(shù)據(jù)

      陳茜:

      你覺得LLM(大語言模型)是正確的路線嗎?

      田淵棟:

      我覺得LLM是一個很有意思的路線,但我不知道會不會是正確的路線。


      陳茜:

      這一點你是同意Yann LeCun的嗎?

      田淵棟:

      這個不好說吧。我們大家都是做科學(xué)家的,有科學(xué)家想法的人都會希望找到一個更好的東西,而不是說我現(xiàn)在就滿足于現(xiàn)在的框架,然后我就在上面做到死,肯定不會這樣子。所以我總會說有各種各樣可能的問題,這些可能的問題怎么樣用別的方式來解決,這個是一個很大的問號。

      陳茜:

      現(xiàn)在大語言模型最大的問題是什么?

      田淵棟:

      最大的問題就是數(shù)據(jù)量需要很多。需要很多數(shù)據(jù)量,那么訓(xùn)練出來的模型質(zhì)量就肯定很好了,但是肯定沒有人那么高效,這個是很大的問題。因為對人來說能學(xué)完的樣本數(shù)非常少,人一生能學(xué)到的token的數(shù)目可能就只有最多最多100億的級別,特別是文本token,這個之前我也在一個演講分享上面算過,大概是這個數(shù)字。但是現(xiàn)在大語言模型訓(xùn)練的數(shù)據(jù)很輕易的能達到10萬億或者說30萬億這樣的大小,中間有1000倍的差距。這1000倍差距。怎么樣去用人類的學(xué)習(xí)能力去彌補?很難彌補,但人就是能學(xué)得很好。

      在人類歷史長河中,有各種各樣非常厲害的科學(xué)家,他們的思路和想法都是獨一無二的,他們那個時候也沒有看過那么多書,也沒有那么多的數(shù)據(jù),但他們就是能夠發(fā)現(xiàn)一個很有意思的新的定理、新的證明、新的發(fā)現(xiàn)或者新的發(fā)明。所以對他們來說,他們這些能力從哪來的?大語言模型現(xiàn)在那么多token放進去了之后,有沒有達到人的能力?這個其實是現(xiàn)在很大的一個問號。

      所以如果是這樣的話,其實也許我們現(xiàn)在訓(xùn)練算法并沒有達到最優(yōu)的,有可能有更好的算法、更好的邏輯,或者更好的方式去學(xué)習(xí)在數(shù)據(jù)中涌現(xiàn)出來的那些表征,用它來解決問題。也許梯度下降可能并不是一個特別好的方案。可能突然有一天也許不要做梯度下降了,可能別的方法來做,這是我的一個暴論吧。這樣的話也許我們整個訓(xùn)練的框架可能要改變。當(dāng)然這個不一定現(xiàn)在能出現(xiàn),但是我覺得以后可能是一個可以去實驗的比較有意思的方向。

      05

      強化學(xué)習(xí)與高級智能

      陳茜:

      我看最近業(yè)界對強化學(xué)習(xí)有一點爭論,特別是最近Andrej Karpathy接受了一個播客采訪,也發(fā)表了一些比較負面的一些觀點,你是怎么看RL(強化學(xué)習(xí))這條路線的?


      Andrej Karpathy,圖片來源:The Information

      田淵棟:

      對,我一直是做這個方向的,我也是這么覺得的。因為RL(強化學(xué)習(xí))本質(zhì)上來說是個搜索的過程,它的好處就是對于你給定的一些難的問題,讓它去搜出來,在搜索的過程中它學(xué)到的數(shù)據(jù)、獲得的信息的質(zhì)量要優(yōu)于被喂的數(shù)據(jù)。這個就相當(dāng)于有一個人是去老師那邊聽課,他就相當(dāng)于是Supervised Learning(監(jiān)督學(xué)習(xí))。還有一個人說我不去老師那邊聽課,我就自己去玩,然后把問題解決了。這兩種方式我覺得后者學(xué)習(xí)出來的能力應(yīng)該說更本質(zhì),解決問題能力更強。所以我覺得RL(強化學(xué)習(xí))在這方面應(yīng)該是優(yōu)于SFT(監(jiān)督式微調(diào))的。

      你看現(xiàn)在很多的文章,在很多問題上,尤其是推理問題是,確實強化學(xué)習(xí)的能力比SFT(監(jiān)督式微調(diào))能力要強。你知道你要做強化學(xué)習(xí)才能讓這個模型真的學(xué)會推理,如果你做SFT(監(jiān)督式微調(diào))的話,這個模型可能就記憶了,就是之前的那些推理的過程它并沒有產(chǎn)生泛化能力,或者在新的問題上可能泛化能力沒有那么強。特別是如果你做了大量的SFT,這個模型的質(zhì)量就可能會下降。所以這是這兩個的區(qū)別。

      但是強化學(xué)習(xí)它只是個范式,它不是說是有什么神秘東西在里面。因為它最終的目的還是改變權(quán)重,這跟SFT(監(jiān)督式微調(diào))是一樣的,只是說改變權(quán)重的方式不太一樣。所以其實最終也許存在一個方式可以統(tǒng)一強化學(xué)習(xí)和SFT(監(jiān)督式微調(diào))監(jiān)督式微調(diào)吧。因為最終目的都是改變權(quán)重,也許我有更好的方法來做這些問題。而強化學(xué)習(xí)對大家來說,就是一種不同的數(shù)據(jù)采集的方式而已。它是通過邊搜索邊采集,然后把這些數(shù)據(jù)放在一起再去做訓(xùn)練。這樣的方式相當(dāng)于是一個主動學(xué)習(xí)的方式,跟SFT(監(jiān)督式微調(diào))的方式是不一樣的。


      所以我覺得強化學(xué)習(xí)最大的好處是:它是主動學(xué)習(xí)的,它能對數(shù)據(jù)的分布產(chǎn)生很積極的影響,這是它最最核心的地方。而不是說是它的目標(biāo)函數(shù)不一樣,或者說它的訓(xùn)練算法不一樣,不是這樣子。我覺得最終還是看它采集的數(shù)據(jù),它的質(zhì)量是跟SFT(監(jiān)督式微調(diào))是不同的。所以它才能夠解決一些比較難的問題吧。

      Andrej Karpathy之前說的那些東西有些我也覺得挺好的,像關(guān)于AGI(通用人工智能)還有10年這樣的論斷,比如我們是進入了以十年為尺度的時代,而不是進入一個立即就能獲得AGI能力的這樣一個世界。對于這點我也是相信的。像我自己之前也是用過GPT-5幫我一起做一篇文章,我最近一篇文章其實是我和GPT-5通過self-play(自我博弈)做出來的。相當(dāng)于我沒有任何的學(xué)生,我就每天跟GPT-5去對話,我說我有這樣的問題要解決,這個問題我們怎么制定研究方法,然后它會給你規(guī)劃。

      但是你會發(fā)現(xiàn)如果你自己沒有domain knowledge(專業(yè)知識),這個規(guī)劃其實做出來了也是跟大家差不多的,沒有什么創(chuàng)新性、沒有什么原創(chuàng)性。但是作為研究員就是對這個問題有很深的理解,或者說我知道這個規(guī)劃或者說它的這個思考的方式是不對的,或者說它的規(guī)劃有致命的問題。把它指出來跟它說了之后,GPT-5就會在這方面更深入,最終得到一個比較好的結(jié)果。所以這種高層的human insights(人類洞察力)、human knowledge(人類知識)和對這個問題的獨到見解,這些東西現(xiàn)在的模型是缺的你必須有這些東西之后才能讓這個模型變得更強。所以你要說AGI沒有這些東西那就不能稱之為AGI。

      陳茜:

      但模型是不是永遠都沒有辦法獲得最頂尖的這種insight(洞察力)?因為insight還是永遠都是人來引領(lǐng)的。

      田淵棟:

      是的,跟以前自動駕駛是一樣的:一開始進展非??欤蠹視X得馬上就能取代人了,但是越往后走問題越大,為什么呢?因為好的洞察、好的數(shù)據(jù)越來越少、越來越難找、數(shù)據(jù)越來越少,那模型就訓(xùn)練不上去。人對于數(shù)據(jù)的獲取能力和人對于數(shù)據(jù)的深度挖掘能力永遠是超過計算機的、超過所有的模型。同樣的問題,可能人只要一兩個樣本就能看到本質(zhì),但是計算機或者說現(xiàn)在的大模型的話它可能需要比如說至少幾百、上千的樣本才能大概感覺到一個輪廓,預(yù)訓(xùn)練可能是需要更多的樣本。

      在這種情況下,如果樣本數(shù)不夠的話,人永遠是比現(xiàn)在的大模型要厲害的。特別是對一些小領(lǐng)域的專家,他們甚至自己也沒有辦法把自己學(xué)過的樣本吐出來給計算機看,因為這些樣本可能在他腦子里,就是他的經(jīng)驗,這些經(jīng)驗很難去量化成一些句子。如果是這樣的話,AI就只能永遠是跟著人后面走了。

      人通過某種比較好的信息處理的方式獲得一些洞察,然后灌給計算機、灌給AI,讓AI在這個方向上去做得更好,目前是這樣的一個狀態(tài)。

      06

      計算量不是全部

      Scaling Law是悲觀的未來

      田淵棟:

      我覺得這也是跟我之前的一些論斷是比較接近的,因為我以前也是接過采訪,我說:Scaling Law(縮放法則)是一個悲觀的未來。因為Scaling Law這個話題本身是一個很奇怪的話題。

      如果在以前跟大家說,我加指數(shù)級的樣本或者指數(shù)級的計算能力進去之后,我們的表現(xiàn)會上升而且上升的速度是線性的。我覺得以前的機器學(xué)習(xí)科學(xué)家會覺得這些事情是trivial(微不足道)的。因為不管什么模型,你都可以做出這樣的論斷:往里面塞數(shù)據(jù),然后就會有更好的結(jié)果。

      但是我覺得我們真正追求的是:什么樣的模型能夠在這條路線上走得更有效率、更高效、更快,而不是說是滿足于這個law(法則)是對的。因為這個law(法則)它給你通向的未來是一個比較悲觀的未來,你需要用指數(shù)級的樣本塞進去才能得到一個比較好的結(jié)果。如果是這樣的話,總有一天我們地球上所有的資源全部會被用完。地球上所有的能源、所有的電力全部都會被用來訓(xùn)練大模型。在這種情況下,我們是不是還要依賴于這個能力去改變我們這個世界?這個是一個很大的問題

      我覺得某個時候可能大家會意識到:計算量不是全部,我們可能需要對模型有更深的理解。而且這改變應(yīng)該會慢慢會發(fā)生,這是我的一個想法。

      陳茜:

      我們就需要一個更高效的方法來發(fā)展智能,你覺得需要花很長的時間才會找到這個解法嗎?

      田淵棟:

      我覺得大家也在努力吧,所以應(yīng)該會花一些時間去做這些事情。至少對于現(xiàn)在來說,大語言模型它的能力是很強的,就算我們這個模型能力現(xiàn)在停滯不前,它對于各行各業(yè)的影響也是非常大的。我覺得至少能夠自動化很大一部分東西,能讓很多人的能力變得更強。我都覺得我加大語言模型,已經(jīng)遠遠超過以前的我了。所以這讓我覺得,這上面有很多很多空間可以做。所以我有很大的一個感慨就是,我覺得本身是一個新時代的到來了,就算大語言模型的進展不夠快的話,未來至少兩到三年、三到五年這段時間之內(nèi),還有很多機會的。

      陳茜:

      所以你接下來還是想做前沿研究這一塊,還是想去嘗試一下application(應(yīng)用)這一塊?

      田淵棟:

      當(dāng)然最好是把兩個合起來,如果我能夠做一個前沿研究并且這個前沿研究是自動化的研究,那就很厲害了。我已經(jīng)感覺到我的研究范式,可能都會被自動化的pipeline(項目流程)所代替一部分。不一定是Agent(智能體),但是Agent(智能體)肯定是一個很重要的因素。

      用Agent(智能體)的話可以幫你做很多事情,比如說你也許不需要自己回郵件,或者說你不需要去管理自己的to-do list(待辦事項),或者說你不需要自己去做一些繁瑣的事情。這些東西都可以用計算機來幫你做一些自動化,問題是不大的,而肯定是會發(fā)生的。

      但是更重要的一個問題是,AI能不能代替人的一些高級活動?人的一些比較高級的思路,需要人的一些重要的insights(洞察)的活動,多大程度上能夠讓AI幫忙去做成了?有很多難的一些科學(xué)問題,AI能不能把這個事情做成?現(xiàn)在這個還不知道。如果能做成的話,反過來也可以對我的研究產(chǎn)生影響。

      研究上來說,也許我會成為一個超級研究員。加了很多AI之后,我一方面能做更好的研究。另一方面,這些工具本身也可以用來造福別的東西。如果是這樣的話,可能會很有意思。


      圖片來源:arxiv

      陳茜:

      你在被拉去救火Llama 4之前,手上在研究什么?

      田淵棟:

      我們這邊在做一些關(guān)于reasoning(推理)的一些研究,主要是關(guān)于思維鏈的形態(tài)和訓(xùn)練的方式做了一些研究。o1是去年9月份出來的,其實我們在o1出來之前我們就注意到:非常長的思維鏈它會對整個模型的Scaling Law(縮放法則)產(chǎn)生影響。

      如果處理一個問題時,你沒有那么長思維鏈的話,它的Scaling Law(縮放法則)是沒有那么理想的,你需要花很多很多樣本才能獲得一個比較好的結(jié)果。但是如果你有很長的思維鏈,你就會讓這個模型的Scaling Law的code(代碼)變得非常理想,我可以用比如十分之一的樣本、十分之一的parameter(參數(shù))獲得更好的效果。這個其實我們已經(jīng)發(fā)現(xiàn)了,但是然后我們接下來就在思維鏈上做一些各種各樣的變換、各種各樣的探索。包括我們?nèi)ツ昴甑鬃龅挠眠B續(xù)空間來做隱空間推理,這篇文章現(xiàn)在確實受到了不少的關(guān)注,可能半年就已大概有200多個引用,很多人愿意follow up(跟進)做一些探索性的工作,而且確實能看到一些進展。

      所以我覺得這些東西都是很有意思的,我們?nèi)ツ暌沧隽私蠨ualformer的這篇文章,比較早地提出來:怎么樣做混合思維模型,怎么樣長思維和短思維放在一起訓(xùn)練,發(fā)現(xiàn)這模型其實比單純訓(xùn)練長思維、單純訓(xùn)練短思維效果更好。現(xiàn)在其實這已經(jīng)成為標(biāo)配了,大家所有的思維模型都有這個長短思維自適應(yīng)的性質(zhì)。所以應(yīng)該說去年那些研究還是比較跟得上時代的。


      07

      回顧FAIR十年生涯

      遺憾與收獲

      陳茜:

      你在FAIR還有什么遺憾嗎?


      田淵棟:

      這個話很有意思。我覺得遺憾可能是我在FAIR工程工作應(yīng)該做更多一點,可能更好一點。

      我其實剛?cè)AIR的時候,大概在前幾年可能工程工作做得比較多,我之前的一些項目,像圍棋這些項目都是自己比較多地做工程化的工作。當(dāng)時我還被批評說,這個人過來是research scientist(研究科學(xué)家),怎么天天做工程。當(dāng)時有人跟我說:“別人打開屏幕全是文章,你打開屏幕全是代碼”。

      后來我就說,如果研究科學(xué)家不能做工程的話,那我多看看代碼、多看看文章。所以你會發(fā)現(xiàn),我在2015年到2018年這段時間之內(nèi),基本上工程比較多,2018年之后到現(xiàn)在其實研究比較多,大概是這樣的一個狀態(tài)。

      這當(dāng)然是跟FAIR當(dāng)時的指揮棒有關(guān)系,另外一方面就是說我自己也有一些研究上的興趣,想要做一些更多的研究,所以就切過去了。但是現(xiàn)在你會發(fā)現(xiàn),其實在現(xiàn)在這個時代,工程能力強的人反而更受歡迎。所以就很有意思,研究能力強的人也很受歡迎,但是最好是工程能力和研究能力都強,這樣是最好的。

      陳茜:

      那這也太難了。

      田淵棟:

      對,但是我覺得我可以做到這一點。所以我現(xiàn)在也在更多地做一些工程上的工作,我可以把很多東西再重新拾回來,然后把這些工程事情做好,這都是可以的。

      我覺得在FAIR做最大的收獲,應(yīng)該是2018年之后,我在這段時間之內(nèi)有很多的research taste(科研品位),就是對研究的一些品位和知道怎么做研究的一些方案。而且這些品位在最近幾年的一些文章里面就慢慢體現(xiàn)出來。

      所以有品位之后,這對將來的路有很大的幫助,這個是很重要的。因為如果一個只做工程的人,他有一個比較大的問題是,他可能會只做工程上一些難的問題,但是并不知道這東西有什么用。但是如果有研究的品位的話,意味著就是自己給自己設(shè)一條道路可以一直往前走。這個對于一個人的人生來說有非常好的好處。

      08

      談AI人才戰(zhàn)

      不要追逐“稀缺性”

      陳茜:

      我還有一個問題非常好奇,現(xiàn)在各個公司AI的競爭這么激烈,同時人才搶奪戰(zhàn)也很激烈,包括Meta最新的Lab,花很多很多錢在一個人的身上。你覺得現(xiàn)在這個階段,什么樣的AI人才是最稀缺的?

      田淵棟:

      我覺得這個完全看每個人的定位。首先我想糾正一個點:大家不要去想現(xiàn)在誰是最稀缺的,因為有可能過個兩年,這個稀缺的定義就發(fā)生變化。你想Yann LeCun坐了那么多年冷板凳,突然之間就拿圖靈獎。所以我是覺得大家應(yīng)該想一想什么才是自己最想要做的事情,而不是說是去做那些可能公司喜歡的事情,我覺得這個可能更重要。


      因為整個過程可能已經(jīng)跟以前不一樣了,對以前的情況來說,比如說市場發(fā)出個信號:我們需要什么方向的人才。這個信號可以通過大學(xué)的方式慢慢地往下傳播,比如說最近十年之內(nèi)什么樣的人才最吃香。然后這個信號傳到大學(xué),大學(xué)會擴招對應(yīng)的系、對應(yīng)的老師,一些學(xué)生就會去投報這個系,經(jīng)過四年或者更長時間的培養(yǎng)之后,這些學(xué)生最終滿足市場的要求,大概這樣的一個過程。以前這個循環(huán)是走得通的,因為整個邏輯、整個速度是比較慢的,整個行業(yè)周期可能以10年或者20年的周期來在波動

      但是現(xiàn)在可能整個周期變得非???,等到你想要學(xué)市場上火熱的技術(shù)之后,全世界的人都在學(xué)。你想到了,別人也想到了。這世界上總有學(xué)得比你快的,總有學(xué)得比你好的,總有馬上上手把事情做成的。所以你很有可能會發(fā)現(xiàn):你學(xué)了半年、一年之后,你做不過別人,你還是沒有辦法出頭。這樣的話,市場發(fā)生了變化,也許明年就不是某個方面能力最重要的一個時代了,可能換了別的東西。你這時候再去學(xué),就可能一直會跟在別人屁股后面走。

      所以也許以后大家會突然發(fā)現(xiàn):與其聽從市場的號令還不如說我自己做自己想做的事情。一個是做得很開心,另外就是說一旦這個東西被人發(fā)現(xiàn)了,它的收益是很大的。這個當(dāng)然是理想情況了,實際情況肯定是會兩邊要結(jié)合。你肯定會希望你自己判斷某個方向在將來一段時間之內(nèi)有沒有用,再加上你自己的愛好,最后兩個拼起來得到一個比較有意思的組合,之后你可以在上面多花功夫。所以說非常難去做判斷,因為完全要看你自己的能力。

      陳茜:

      我感覺你還是一個非常有理想主義的人,上一次播客也跟你聊過,感覺FAIR之前也是一個非常有理想主義的團隊。但是在當(dāng)下,我覺得市場有點扭曲了,因為競爭特別激烈的時候,可能很多的文化、很多的信仰就會出現(xiàn)一點的偏差。你覺得在現(xiàn)在的這樣的情況下,還存在說會有比較理想化的research lab(研究實驗室)嗎?可能Ilya Sutskever他的團隊、Mira的團隊被認為是比較有理想化主義的。他們的對面就是Sam Altman,非常的商業(yè)化、很激進。你怎么去看這之間的平衡呢?

      田淵棟:

      我覺得首先是不要把大廠當(dāng)成鐵板一塊,因為大廠里也有很多的組,他們里面也有研究團隊,這些團隊本身也會有一些科研精神和研究自由。FAIR只是一個非常出名的地方,但是其實有很多地方雖然沒有像FAIR那么有名,但是它們也有一個自由空間可以做研究。就算在Meta內(nèi)部也有不少的組,他們有做研究的空間。我有很多合作者在Meta里面,他們也做一些研究。所以這個問題我不覺得是個問題。

      也許就算FAIR可能因為這次的原因,或者另外原因?qū)е乱院罂赡軟]有再那么科研化了,但是還是會有很多地方可以做。因為這個問題很前沿,所以甚至你做startup(初創(chuàng)公司)的時候,你也肯定在有些地方上面會有些事情可以做。

      我們在討論研究的時候,是指這個過程本身:找到一些新的難題的解決方案,這叫研究。也可以叫Re-Search(研究) ,其實它是search(探索),不是一個抽象的概念。所以我覺得有很多地方可以做,不是鐵板一塊說:大廠不能做了,小廠可以做,不是那么簡單。是完全取決于哪個組、哪個人、有什么樣的資源、什么樣的東西,這些人放在一起會有什么樣產(chǎn)生化學(xué)反應(yīng)等等??赡芙裉炜梢宰?、明天不能做。或者說一段時間之內(nèi)它有這個空間,換一個其他時間就沒有這個空間。所以無數(shù)人都在思考這個問題。也許會在這段時間之內(nèi),肯定出一篇新的工作,去影響整個領(lǐng)域。

      所以研究永遠是會繼續(xù)進行的,只是說它的形式可能會變成更像游擊戰(zhàn)這種形式。并不是說只有一些非常知名的研究機構(gòu)他們會做研究,他們會說:我付出我們所有的時間和精力做研究??赡懿皇沁@樣,你總會發(fā)現(xiàn)有很多有理想的人、有理想的小的組織在繼續(xù)做他們想做的事情。不是0或1,會有很多灰色的地方


      硅谷101視頻節(jié)目截屏

      陳茜:

      最后一個問題是:你的下一步是什么?

      田淵棟:

      下一步我剛才說了還沒確定,所以還在討論中。因為現(xiàn)在離被裁還沒到一個禮拜,所以也會有一些考慮和想法。

      剛才問的是我想去做應(yīng)用,還是想去繼續(xù)做我的一些科研研究,我回答當(dāng)然是最好兩個拼起來。我們能找一個辦法,能夠賦能我的科研研究的同時,本身也是能夠做很多別的事情。

      陳茜:

      有這樣的機會存在嗎?

      田淵棟:

      我不知道,但是一般來說是這樣的:我們先設(shè)定一個高的目標(biāo),然后再去看。因為一般來說人會比較現(xiàn)實,說有這樣的機會我就不用想了。但其實應(yīng)該是倒過來,你先想一個不可能實現(xiàn)的目標(biāo),然后再去想有什么東西可以去支撐,這可能會讓你有更好的方向可以走

      陳茜:

      好的,那就期待你接下來宣布你的下一步動向了。

      以上就是我們對田淵棟的采訪全部內(nèi)容,我們也期待他的下一步動向,我非常希望他能夠找到滿足前沿研究和工程應(yīng)用兩者平衡的新角色,我想,這也是AI的前沿工程師們都在探尋的路。祝他好運。

      你們認為這樣的AI工作存在嗎?歡迎大家在評論區(qū)留下你的想法。

      視頻有視覺和音樂的加持,更能呈現(xiàn)出這些精彩的故事細節(jié)。請?zhí)D(zhuǎn)至硅谷101【視頻號】收看完整版

      【視頻播放渠道】

      國內(nèi):B站|騰訊|視頻號|西瓜|頭條|百家號|36kr|微博|虎嗅

      海外:Youtube

      聯(lián)系我們:video@sv101.net

      【創(chuàng)作團隊】

      監(jiān)制|泓君 陳茜

      撰稿/主持 |陳茜

      剪輯|橘子

      動效|踹 AK12

      運營|王梓沁 孫澤平 朱婕

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      深圳一渣土車撞倒電動車致1死1傷,當(dāng)?shù)亟逃郑菏軅⑼敌W(xué)一年級學(xué)生,經(jīng)搶救無效去世

      深圳一渣土車撞倒電動車致1死1傷,當(dāng)?shù)亟逃郑菏軅⑼敌W(xué)一年級學(xué)生,經(jīng)搶救無效去世

      大象新聞
      2026-05-20 20:52:30
      今天,A股沖高回落,跡象很明顯,不出意外,下午很可能這樣走

      今天,A股沖高回落,跡象很明顯,不出意外,下午很可能這樣走

      虎哥閑聊
      2026-05-21 11:20:23
      汪涵和《監(jiān)獄來的媽媽》片方:10年深度合作,5部電影都不簡單

      汪涵和《監(jiān)獄來的媽媽》片方:10年深度合作,5部電影都不簡單

      光影新天地
      2026-05-20 14:01:57
      以為八竿子打不著,沒想到是親戚,這15對明星的關(guān)系太讓人意外了

      以為八竿子打不著,沒想到是親戚,這15對明星的關(guān)系太讓人意外了

      上官晚安
      2026-05-20 07:11:53
      光刻機重大突破,俄羅斯或正走出一條光刻機的破壞式突圍路子

      光刻機重大突破,俄羅斯或正走出一條光刻機的破壞式突圍路子

      王新喜
      2026-05-21 07:58:58
      “泡水楊梅”被曝光后 楊梅滯留樹上 70歲奶奶崩潰到哭

      “泡水楊梅”被曝光后 楊梅滯留樹上 70歲奶奶崩潰到哭

      閃電新聞
      2026-05-20 22:23:28
      周薪35萬鎊!34歲曼聯(lián)巨星確定與邁阿密簽約3年,興奮將輔佐梅西

      周薪35萬鎊!34歲曼聯(lián)巨星確定與邁阿密簽約3年,興奮將輔佐梅西

      我愛英超
      2026-05-21 07:05:36
      重磅!卡塞米羅告別曼聯(lián),即將加盟邁阿密國際聯(lián)手梅西蘇亞雷斯

      重磅!卡塞米羅告別曼聯(lián),即將加盟邁阿密國際聯(lián)手梅西蘇亞雷斯

      仰臥撐FTUer
      2026-05-21 07:50:45
      蘇州小伙娶小7歲俄羅斯美女,洋媳婦熱衷生娃,說至少要生4個

      蘇州小伙娶小7歲俄羅斯美女,洋媳婦熱衷生娃,說至少要生4個

      丁羂解說
      2026-04-11 22:40:59
      南昌大媽廣場舞成癮,丈夫病重不管不問,丈夫去世后過戶時卻傻眼了

      南昌大媽廣場舞成癮,丈夫病重不管不問,丈夫去世后過戶時卻傻眼了

      黃家湖的憂傷
      2025-03-09 20:52:35
      Shams:過去一年中的所有跡象都表明,詹姆斯會再打一個賽季

      Shams:過去一年中的所有跡象都表明,詹姆斯會再打一個賽季

      懂球帝
      2026-05-21 08:15:08
      男孩煮食蝙蝠后全身出血而亡,身體像從內(nèi)部融化……致命病毒近日再奪136條人命

      男孩煮食蝙蝠后全身出血而亡,身體像從內(nèi)部融化……致命病毒近日再奪136條人命

      呼吸界
      2026-05-20 18:42:25
      停車5分鐘收費4960元?女子憤怒報警,最后卻傻眼了

      停車5分鐘收費4960元?女子憤怒報警,最后卻傻眼了

      燦爛夏天
      2025-02-11 23:16:52
      實探上海農(nóng)產(chǎn)品批發(fā)市場:價格暴跌,商家不敢貿(mào)然拿貨;當(dāng)?shù)毓r(nóng):爛樹上也不會泡藥;官方通報“泡藥楊梅”事件

      實探上海農(nóng)產(chǎn)品批發(fā)市場:價格暴跌,商家不敢貿(mào)然拿貨;當(dāng)?shù)毓r(nóng):爛樹上也不會泡藥;官方通報“泡藥楊梅”事件

      新民晚報
      2026-05-21 09:04:44
      乾隆臨終告訴嘉慶:你叔叔弘晝,一輩子裝瘋賣傻是為了讓朕放心

      乾隆臨終告訴嘉慶:你叔叔弘晝,一輩子裝瘋賣傻是為了讓朕放心

      別人都叫我阿腈
      2026-05-20 21:17:07
      山西一位14歲女孩被活生生配冥婚,警察找到時發(fā)現(xiàn),已與死者合葬

      山西一位14歲女孩被活生生配冥婚,警察找到時發(fā)現(xiàn),已與死者合葬

      莫地方
      2026-05-20 01:40:03
      誰炸了以色列核基地?48 小時驚天反轉(zhuǎn),特朗普不打伊朗了

      誰炸了以色列核基地?48 小時驚天反轉(zhuǎn),特朗普不打伊朗了

      面包夾知識
      2026-05-20 18:34:32
      “小馬云”范小勤談戀愛全網(wǎng)看傻:真想吃互聯(lián)網(wǎng)這碗飯

      “小馬云”范小勤談戀愛全網(wǎng)看傻:真想吃互聯(lián)網(wǎng)這碗飯

      小椰的奶奶
      2026-05-21 00:16:01
      380億罰單驚醒馬斯克,連夜終止建廠:再待印度,遲早步蘋果后塵

      380億罰單驚醒馬斯克,連夜終止建廠:再待印度,遲早步蘋果后塵

      有范又有料
      2026-05-20 12:36:12
      為什么國宴上只有馬斯克敢“擺爛”?因為他在上海有個“印鈔機”

      為什么國宴上只有馬斯克敢“擺爛”?因為他在上海有個“印鈔機”

      李砍柴
      2026-05-20 13:52:14
      2026-05-21 13:19:00
      硅谷101 incentive-icons
      硅谷101
      從這里駛向未來
      179文章數(shù) 110關(guān)注度
      往期回顧 全部

      科技要聞

      好到離譜也不夠!英偉達交出816億美元營收

      頭條要聞

      杭州女嬰在月嫂喂奶后嗆死 網(wǎng)友用孩子肖像造謠并惡評

      頭條要聞

      杭州女嬰在月嫂喂奶后嗆死 網(wǎng)友用孩子肖像造謠并惡評

      體育要聞

      常住人口7000的小鎮(zhèn),擁有了一支德甲球隊

      娛樂要聞

      同行吐槽汪涵野心重 爆雷37萬人受損

      財經(jīng)要聞

      英偉達業(yè)績超預(yù)!指引再新高仍不夠亮眼

      汽車要聞

      26.98萬起步 看小鵬GX如何詮釋一車多能以及滿配的科技與豪華

      態(tài)度原創(chuàng)

      數(shù)碼
      房產(chǎn)
      家居
      游戲
      軍事航空

      數(shù)碼要聞

      4K巨幕“吃掉”滿血性能:iQOO Pad6 Pro引領(lǐng)平板手游4K時代!

      房產(chǎn)要聞

      順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學(xué)之約

      家居要聞

      風(fēng)格碰撞 個性與藝術(shù)

      《Arc Raiders》官方解釋游戲匹配系統(tǒng)改善公平判定

      軍事要聞

      俄媒盛贊中國軍人:身姿挺拔 站如松柏

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 伊人久久大香线蕉综合AV| 精品人妻少妇| youjizz日本视频| 一本一本久久A久久精品综合不卡| 成人无码区免费视频 | 欧美?日韩?人妻?高清?中文| 精品国产免费人成在线观看| 人妻精品一区| 亚洲精品麻豆一区二区| 亚洲无码中出| 天天婷婷爱好| 久久精品免视看国产盗摄| 好爽要高潮了在线观看 | 福利一区二区不卡国产| 99久久99这里只有免费费精品| 一本大道综合伊人精品热热| 18禁裸体自慰免费观看网站| 尤物导航| 三上悠亚久久精品| 亚洲一区二区精品另类| 少妇放荡的呻吟干柴烈火动漫| 波多野结衣AV一区二区三区中文| 狠狠综合久久综合鬼色| 日本中文字幕在线| 久久亚洲国产品一区二区| 日本一区中文字幕| 超碰人人草人人色| SM精品国产网站| 日本亚洲精品色婷婷在线影院| jizzjizzjizzjizz| 日韩成人性视频在线观看| 日韩精品国产二区三区| 少妇人妻精品无码专区视频 | 亚洲精品欧美日本中文字幕| 4hu44四虎www在线影院麻豆| av天堂久久天堂av| jizz麻豆| 无码2区| 精品在免费线中文字幕久久| 国产色婷婷视频在线观看| 色窝窝免费一区二区三区|