<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      GPT之父把AI扔回1930年:沒見過一行代碼,卻「發(fā)明」了Python!

      0
      分享至


      新智元報道

      編輯:桃子

      【新智元導(dǎo)讀】你敢信?一個活在95年前的AI,竟寫出了Python代碼。GPT之父下場,用2600億Token煉出了一個「老古董」AI。

      一個從未見過電腦的AI,竟寫出了現(xiàn)代編程語言!

      這可不是什么科幻的設(shè)定。

      就在今天,GPT之父Alec Radford帶隊發(fā)布了震撼全網(wǎng)的「talkie」——

      總參數(shù)130億,一個只讀過1931年之前舊文獻(xiàn)的大模型。


      talkie的「世界觀」(全部訓(xùn)練數(shù)據(jù)),被凍結(jié)在了1930年12月31日。

      那個時代,沒有互聯(lián)網(wǎng),沒有維基百科,更沒有任何現(xiàn)代代碼。

      它讀過的最「新」的東西,是近百年前的專利書、科學(xué)期刊、禮儀手冊和私人書信。


      但就是這樣一個「活在95年前」的AI,居然能寫出Python代碼。




      沒學(xué)過編程,

      卻寫出了Python,理解了「逆函數(shù)」

      talkie最炸裂的發(fā)現(xiàn),藏在一組編程測試?yán)铩?/p>

      Alec Radford團(tuán)隊突發(fā)奇想,用HumanEval去測試talkie的編程能力——

      給它幾個Python函數(shù)作為上下文示例,然后讓它解決新的編程問題。

      要知道,talkie的訓(xùn)練數(shù)據(jù)中,沒有任何一行現(xiàn)代代碼。連數(shù)字計算機(jī)的概念,都不存在于它的「知識體系」中。


      但結(jié)果令人震驚,通過少樣本學(xué)習(xí),它竟然能寫出正確的Python程序。

      雖然目前只能完成簡單的單行程序,比如兩個數(shù)相加,或者對上下文示例做微小修改。


      Alec Radford:GPT、CLIP、Whisper背后核心大佬

      但其中一個案例讓人印象深刻:給定一個旋轉(zhuǎn)密碼的編碼函數(shù)encode_shift,它的邏輯是把每個字母在字母表中向后移動5位。

      talkie自己寫出了對應(yīng)的解碼函數(shù),整個修改只有一個字符:把+5改成了-5,加號換成了減號。

      它真正理解了「逆函數(shù)」:加密是加,解密就是減」這個逆運(yùn)算的概念。


      傳送門:https://talkie-lm.com/chat

      2600億Token,專喂百年前的紙

      Alec Radford團(tuán)隊為什么要費(fèi)這么大勁,手動OCR近百年前的物理文獻(xiàn),來訓(xùn)練一個「老古董」?

      因為他們要回答AI領(lǐng)域最核心的一個問題:LLM的能力,到底是推理,還是背誦?

      talkie可以寫出Python,證明了——

      LLM可以用19世紀(jì)的知識做推理,并非只是檢索。不得不說,這才是真正意義上的「泛化」!


      再來看talkie的訓(xùn)練語料庫,可以稱得上是一個龐大的「考古工程」。

      它的訓(xùn)練語料達(dá)到了2600億token,全部來自1931年之前的英語文本,包括書籍、報紙、期刊、科學(xué)論文、美國專利、判例法。

      要知道,這么多文本皆需要從實體文檔掃描并OCR轉(zhuǎn)錄。


      而選擇1930年作為截止日期,原因很實際:這是美國公共版權(quán)法(public domain)的分界線。

      不過,這帶來了一個意想不到的瓶頸:數(shù)據(jù)質(zhì)量。

      團(tuán)隊做了一組對照實驗:用傳統(tǒng)OCR系統(tǒng)轉(zhuǎn)錄的舊文本訓(xùn)練模型,和用人工轉(zhuǎn)錄的同一批文本訓(xùn)練模型相比,前者的學(xué)習(xí)效率只有后者的30%。

      簡單的正則清洗能把這個數(shù)字提升到70%,但仍然有巨大的差距。


      在評估talkie性能實驗中,團(tuán)隊又打造了一個「現(xiàn)代孿生體」(talkie-web-13b-base)。

      后者用FineWeb的現(xiàn)代網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練,兩款模型用了「相同的算力」。

      顯而易見,在核心語言理解、數(shù)學(xué)推理任務(wù)上,talkie的表現(xiàn)與現(xiàn)代孿生體相當(dāng)。

      但在通用知識評測上,即使剔除了對1930年視角來說「穿越」的題目,talkie仍然落后。


      團(tuán)隊?wèi)岩桑@跟數(shù)據(jù)質(zhì)量有很大關(guān)系。

      為此,Radford團(tuán)隊計劃從零開始訓(xùn)練「復(fù)古OCR系統(tǒng)」,專門用于重新轉(zhuǎn)錄1931年前的文本。

      用最現(xiàn)代的Claude 4.6

      訓(xùn)練最古老的AI

      talkie的「后訓(xùn)練」方案也很有意思。

      要把一個只讀過舊書的「基礎(chǔ)模型」變成能對話的聊天機(jī)器人,根本沒有現(xiàn)成的指令微調(diào)的數(shù)據(jù)可用。


      團(tuán)隊的做法是,從1930年之前的結(jié)構(gòu)化參考書中提取指令-回答對:禮儀手冊、書信寫作指南、菜譜、百科全書、詩歌集。

      然后,再用這些「復(fù)古教材」做第一輪SFT。

      在接下來的RLAIF階段,團(tuán)隊用在線DPO來提升talkie的指令遵循能力,Claude Sonnet 4.6作為裁判。

      一個2026年最先進(jìn)的AI,給一個「活在」1930年的AI打分。

      最終的精調(diào)階段,團(tuán)隊甚至用Claude Opus 4.6生成多輪對話數(shù)據(jù),來打磨talkie的對話能力。

      訓(xùn)練過程中,Claude對talkie指令遵循能力的評分從2.0提升到了3.4(滿分5分)。

      最后一步,用Claude Opus 4.6與talkie進(jìn)行多輪合成對話,再做一輪拒絕采樣+SFT,打磨對話能力。

      團(tuán)隊也坦承了一個諷刺之處:用現(xiàn)代大模型訓(xùn)練一個本該凍結(jié)在1930年的模型,本身就是一種「時間污染」。

      他們的長期目標(biāo)是用復(fù)古基座模型自身作為裁判,實現(xiàn)完全「自舉式」的后訓(xùn)練流水線。

      值得一提的是,talkie的7B版本在RL訓(xùn)練后出現(xiàn)了一個搞笑的副作用——

      它開始用列表體說話,純屬是被現(xiàn)代AI的「壞習(xí)慣」傳染了。

      AI界最干凈的一次「開卷考試」

      研究團(tuán)隊還做了另一個有趣的實驗。

      他們從《紐約時報》的「歷史上的今天」欄目中提取了近5000條歷史事件描述,計算talkie對每條事件的「驚訝度」。


      結(jié)果非常清晰,1930年之前的事件,talkie不太驚訝。1930年之后的事件,驚訝度開始攀升。

      到了1950年代和1960年代達(dá)到峰值,然后趨于平穩(wěn)。

      這條曲線本身就是一個關(guān)于預(yù)測能力的實驗。隨著模型規(guī)模增大,這條曲線會怎么變化?

      谷歌DeepMind CEO Demis Hassabis曾提出一個思想實驗——

      一個只訓(xùn)練到1911年的模型,能不能像愛因斯坦在1915年那樣獨立發(fā)現(xiàn)廣義相對論?

      talkie目前當(dāng)然做不到。但它提供了一條路徑,往上Scale就行了。

      今夏擴(kuò)展到GPT-3級別

      talkie目前是130億參數(shù),團(tuán)隊的路線圖相當(dāng)激進(jìn)——

      今年夏天,發(fā)布GPT-3級別的復(fù)古模型。


      更遠(yuǎn)期的目標(biāo):將語料擴(kuò)展到超過一萬億token,理論上足夠訓(xùn)練一個GPT-3.5級別的模型,能力接近初代ChatGPT。

      一個凍結(jié)在1930年的ChatGPT。

      參考資料:

      https://x.com/status_effects/status/2048878495539843211?s=20

      https://talkie-lm.com/introducing-talkie

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      澤連斯基亮出絕密證據(jù):俄內(nèi)部文件泄露,俄軍60%精銳已打殘

      澤連斯基亮出絕密證據(jù):俄內(nèi)部文件泄露,俄軍60%精銳已打殘

      矚望云霄
      2026-05-02 21:15:38
      后背發(fā)涼!新司機(jī)被父親要求80時速占快車道,稱他人有本事飛過去

      后背發(fā)涼!新司機(jī)被父親要求80時速占快車道,稱他人有本事飛過去

      火山詩話
      2026-05-04 13:02:18
      全票通過!莎拉遭政治清洗!菲律賓親美勢力借彈劾清除務(wù)實派

      全票通過!莎拉遭政治清洗!菲律賓親美勢力借彈劾清除務(wù)實派

      浪子阿邴聊體育
      2026-05-03 10:46:32
      豆包新增付費(fèi)訂閱,標(biāo)準(zhǔn)版每月68元、加強(qiáng)版200元、專業(yè)版500元,官方回應(yīng):始終提供免費(fèi)服務(wù),相關(guān)方案細(xì)節(jié)還在測試階段

      豆包新增付費(fèi)訂閱,標(biāo)準(zhǔn)版每月68元、加強(qiáng)版200元、專業(yè)版500元,官方回應(yīng):始終提供免費(fèi)服務(wù),相關(guān)方案細(xì)節(jié)還在測試階段

      深圳晚報
      2026-05-04 13:26:59
      郭焱:國乒男隊問題不是一天兩天了!封訓(xùn)練的啥?林詩棟被牽著走

      郭焱:國乒男隊問題不是一天兩天了!封訓(xùn)練的啥?林詩棟被牽著走

      念洲
      2026-05-04 13:13:42
      許家印終于交代:月薪3萬60名女團(tuán)員,養(yǎng)了恒大歌舞團(tuán),提供3服務(wù)

      許家印終于交代:月薪3萬60名女團(tuán)員,養(yǎng)了恒大歌舞團(tuán),提供3服務(wù)

      貓叔東山再起
      2026-05-04 09:35:09
      好奇怪,他年輕帥得一塌糊涂,老了丑得一言難盡了

      好奇怪,他年輕帥得一塌糊涂,老了丑得一言難盡了

      東方不敗然多多
      2026-05-04 02:27:10
      李賽鳳的亂倫,床縫摸出個用過的套,衣柜里還藏著個半裸的干兒子

      李賽鳳的亂倫,床縫摸出個用過的套,衣柜里還藏著個半裸的干兒子

      西樓知趣雜談
      2026-04-26 10:18:11
      世界杯轉(zhuǎn)播費(fèi)看人下菜碟:印度降到2億元,咱們提升到17億元

      世界杯轉(zhuǎn)播費(fèi)看人下菜碟:印度降到2億元,咱們提升到17億元

      歪歌社團(tuán)
      2026-05-04 04:46:10
      突發(fā)!以色列發(fā)動空襲

      突發(fā)!以色列發(fā)動空襲

      新浪財經(jīng)
      2026-05-04 12:02:42
      巴基斯坦打破美軍封鎖,連開六條路直通伊朗,大批貨物暢通無阻

      巴基斯坦打破美軍封鎖,連開六條路直通伊朗,大批貨物暢通無阻

      第一軍情
      2026-05-04 12:15:03
      男子自爆在高鐵上拍風(fēng)景,被大媽懷疑是間諜,因此遭警方調(diào)查

      男子自爆在高鐵上拍風(fēng)景,被大媽懷疑是間諜,因此遭警方調(diào)查

      可達(dá)鴨面面觀
      2026-05-04 10:09:10
      手機(jī)正在打敗中國的大學(xué)教育制度

      手機(jī)正在打敗中國的大學(xué)教育制度

      回旋鏢
      2026-05-04 12:19:32
      廳級干部已經(jīng)成為了高危職業(yè)

      廳級干部已經(jīng)成為了高危職業(yè)

      風(fēng)向觀察
      2026-05-04 14:17:07
      上市6年下跌6年,股價從未漲停過!有人被套后死扛虧33.5萬

      上市6年下跌6年,股價從未漲停過!有人被套后死扛虧33.5萬

      財經(jīng)智多星
      2026-05-04 11:15:27
      艾倫最新采訪:決賽打滿4階段,吳宜澤會奪冠!回應(yīng)了1局100分鐘

      艾倫最新采訪:決賽打滿4階段,吳宜澤會奪冠!回應(yīng)了1局100分鐘

      求球不落諦
      2026-05-04 14:44:56
      1946年,張靈甫拿下兩淮,看到繳獲的華中野戰(zhàn)軍軍裝后,嘆氣:唉

      1946年,張靈甫拿下兩淮,看到繳獲的華中野戰(zhàn)軍軍裝后,嘆氣:唉

      浩渺青史
      2026-05-03 17:36:15
      臺灣老兵帶妻子回大陸見原配,苦等50年相談1小時,原配:無話說

      臺灣老兵帶妻子回大陸見原配,苦等50年相談1小時,原配:無話說

      蔣南強(qiáng)讀歷史
      2026-05-04 06:00:11
      咱先不看臉,胸都松垮的垂到腰上了,真是老了,那有什么不老女神

      咱先不看臉,胸都松垮的垂到腰上了,真是老了,那有什么不老女神

      動物奇奇怪怪
      2026-05-04 10:37:19
      硅谷華裔工程師回國兩周后,反而更看好美國了?

      硅谷華裔工程師回國兩周后,反而更看好美國了?

      回旋鏢
      2026-05-04 11:10:15
      2026-05-04 17:12:49
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      15129文章數(shù) 66835關(guān)注度
      往期回顧 全部

      科技要聞

      OpenAI“復(fù)活”了QQ寵物,網(wǎng)友直接玩瘋

      頭條要聞

      宇樹機(jī)器人在美坐飛機(jī)電池超標(biāo)被拆卸暫扣 致航班延誤

      頭條要聞

      宇樹機(jī)器人在美坐飛機(jī)電池超標(biāo)被拆卸暫扣 致航班延誤

      體育要聞

      騎士破猛龍:加雷特·阿倫的活力

      娛樂要聞

      張敬軒還是站上了英皇25周年舞臺

      財經(jīng)要聞

      魔幻的韓國股市,父母給嬰兒開戶買股票

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態(tài)度原創(chuàng)

      家居
      房產(chǎn)
      數(shù)碼
      教育
      藝術(shù)

      家居要聞

      靈動實用 生活藝術(shù)場

      房產(chǎn)要聞

      五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

      數(shù)碼要聞

      聯(lián)想來酷“W3259PS”31.5英寸顯示器發(fā)售:4K 240Hz,5499元

      教育要聞

      小升初附加題,求四邊形面積,難倒了不少人

      藝術(shù)要聞

      300米!重慶解放碑區(qū)在建第一高樓,沖刺竣工!

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 免费A级毛片无码A∨蜜芽试看| 国产精品综合| 女人18毛片水真多| 国产午夜精品成人在线| 欧美成人精精品一区二区三区| 在线a人片免费观看| 撸啊撸激情久久| 亚洲精品无码专区| 欧美19综合中文字幕| 国产白嫩漂亮美女在线观看| 欧洲人妻丰满av无码久久不卡| 久久综合偷拍视频五月天| A毛片终身免费观看网站| 少妇无码一区二区三区免费 | 国产精品嫩模大尺度视频| 亚洲第一尤物视频在线观看导航| 亚洲精品一区二区三天美| 夜夜国自一区| 五月天激情婷婷婷久久| 欧美小视频AAAAAA| 中日韩欧美成人免费播放| 国产一区二区日韩经典| 三级网站视频在在线播放| 黑人强伦姧人妻久久| 成人深爱网| 国内精品伊人久久久久7777| 久久爱伊人| 日韩欧美一区二区精品久久| 精品av天堂毛片久久久| 国产普通话对白刺激| 国产无遮挡无码视频在线观看| 88久久久久无码国产精品| 99中文视频| 色欲AV无码一区二区人妻| 亚洲欧洲自拍拍偷午夜色| 性欧美老人牲交xxxxx视频| 亚洲精品综合久中文字幕| A毛片终身免费观看网站| 美女不带套日出白浆免费视频| 人妻a?v| 精品亚洲男人天堂av|