<ruby id="9ue20"></ruby>

国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线

^{<del id="ezcbh"></del>}

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴(yán)選
郵箱大師
網(wǎng)易云課堂

注冊免費(fèi)郵箱

注冊VIP郵箱（特權(quán)郵箱，付費(fèi)）
免費(fèi)下載網(wǎng)易官方手機(jī)郵箱應(yīng)用

移動端
網(wǎng)易公開課
網(wǎng)易嚴(yán)選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

GPT之父把AI扔回1930年：沒見過一行代碼，卻「發(fā)明」了Python！

2026-04-29 11:33:57　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：桃子

【新智元導(dǎo)讀】你敢信？一個活在95年前的AI，竟寫出了Python代碼。GPT之父下場，用2600億Token煉出了一個「老古董」AI。

一個從未見過電腦的AI，竟寫出了現(xiàn)代編程語言！

這可不是什么科幻的設(shè)定。

就在今天，GPT之父Alec Radford帶隊發(fā)布了震撼全網(wǎng)的「talkie」——

總參數(shù)130億，一個只讀過1931年之前舊文獻(xiàn)的大模型。

talkie的「世界觀」（全部訓(xùn)練數(shù)據(jù)），被凍結(jié)在了1930年12月31日。

那個時代，沒有互聯(lián)網(wǎng)，沒有維基百科，更沒有任何現(xiàn)代代碼。

它讀過的最「新」的東西，是近百年前的專利書、科學(xué)期刊、禮儀手冊和私人書信。

但就是這樣一個「活在95年前」的AI，居然能寫出Python代碼。

沒學(xué)過編程，

卻寫出了Python，理解了「逆函數(shù)」

talkie最炸裂的發(fā)現(xiàn)，藏在一組編程測試?yán)铩?/p>

Alec Radford團(tuán)隊突發(fā)奇想，用HumanEval去測試talkie的編程能力——

給它幾個Python函數(shù)作為上下文示例，然后讓它解決新的編程問題。

要知道，talkie的訓(xùn)練數(shù)據(jù)中，沒有任何一行現(xiàn)代代碼。連數(shù)字計算機(jī)的概念，都不存在于它的「知識體系」中。

但結(jié)果令人震驚，通過少樣本學(xué)習(xí)，它竟然能寫出正確的Python程序。

雖然目前只能完成簡單的單行程序，比如兩個數(shù)相加，或者對上下文示例做微小修改。

Alec Radford：GPT、CLIP、Whisper背后核心大佬

但其中一個案例讓人印象深刻：給定一個旋轉(zhuǎn)密碼的編碼函數(shù)encode_shift，它的邏輯是把每個字母在字母表中向后移動5位。

talkie自己寫出了對應(yīng)的解碼函數(shù)，整個修改只有一個字符：把+5改成了-5，加號換成了減號。

它真正理解了「逆函數(shù)」：加密是加，解密就是減」這個逆運(yùn)算的概念。

傳送門：https://talkie-lm.com/chat

2600億Token，專喂百年前的紙

Alec Radford團(tuán)隊為什么要費(fèi)這么大勁，手動OCR近百年前的物理文獻(xiàn)，來訓(xùn)練一個「老古董」？

因為他們要回答AI領(lǐng)域最核心的一個問題：LLM的能力，到底是推理，還是背誦？

talkie可以寫出Python，證明了——

LLM可以用19世紀(jì)的知識做推理，并非只是檢索。不得不說，這才是真正意義上的「泛化」！

再來看talkie的訓(xùn)練語料庫，可以稱得上是一個龐大的「考古工程」。

它的訓(xùn)練語料達(dá)到了2600億token，全部來自1931年之前的英語文本，包括書籍、報紙、期刊、科學(xué)論文、美國專利、判例法。

要知道，這么多文本皆需要從實體文檔掃描并OCR轉(zhuǎn)錄。

而選擇1930年作為截止日期，原因很實際：這是美國公共版權(quán)法（public domain）的分界線。

不過，這帶來了一個意想不到的瓶頸：數(shù)據(jù)質(zhì)量。

團(tuán)隊做了一組對照實驗：用傳統(tǒng)OCR系統(tǒng)轉(zhuǎn)錄的舊文本訓(xùn)練模型，和用人工轉(zhuǎn)錄的同一批文本訓(xùn)練模型相比，前者的學(xué)習(xí)效率只有后者的30%。

簡單的正則清洗能把這個數(shù)字提升到70%，但仍然有巨大的差距。

在評估talkie性能實驗中，團(tuán)隊又打造了一個「現(xiàn)代孿生體」（talkie-web-13b-base）。

后者用FineWeb的現(xiàn)代網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練，兩款模型用了「相同的算力」。

顯而易見，在核心語言理解、數(shù)學(xué)推理任務(wù)上，talkie的表現(xiàn)與現(xiàn)代孿生體相當(dāng)。

但在通用知識評測上，即使剔除了對1930年視角來說「穿越」的題目，talkie仍然落后。

團(tuán)隊?wèi)岩桑@跟數(shù)據(jù)質(zhì)量有很大關(guān)系。

為此，Radford團(tuán)隊計劃從零開始訓(xùn)練「復(fù)古OCR系統(tǒng)」，專門用于重新轉(zhuǎn)錄1931年前的文本。

用最現(xiàn)代的Claude 4.6

訓(xùn)練最古老的AI

talkie的「后訓(xùn)練」方案也很有意思。

要把一個只讀過舊書的「基礎(chǔ)模型」變成能對話的聊天機(jī)器人，根本沒有現(xiàn)成的指令微調(diào)的數(shù)據(jù)可用。

團(tuán)隊的做法是，從1930年之前的結(jié)構(gòu)化參考書中提取指令-回答對：禮儀手冊、書信寫作指南、菜譜、百科全書、詩歌集。

然后，再用這些「復(fù)古教材」做第一輪SFT。

在接下來的RLAIF階段，團(tuán)隊用在線DPO來提升talkie的指令遵循能力，Claude Sonnet 4.6作為裁判。

一個2026年最先進(jìn)的AI，給一個「活在」1930年的AI打分。

最終的精調(diào)階段，團(tuán)隊甚至用Claude Opus 4.6生成多輪對話數(shù)據(jù)，來打磨talkie的對話能力。

訓(xùn)練過程中，Claude對talkie指令遵循能力的評分從2.0提升到了3.4（滿分5分）。

最后一步，用Claude Opus 4.6與talkie進(jìn)行多輪合成對話，再做一輪拒絕采樣+SFT，打磨對話能力。

團(tuán)隊也坦承了一個諷刺之處：用現(xiàn)代大模型訓(xùn)練一個本該凍結(jié)在1930年的模型，本身就是一種「時間污染」。

他們的長期目標(biāo)是用復(fù)古基座模型自身作為裁判，實現(xiàn)完全「自舉式」的后訓(xùn)練流水線。

值得一提的是，talkie的7B版本在RL訓(xùn)練后出現(xiàn)了一個搞笑的副作用——

它開始用列表體說話，純屬是被現(xiàn)代AI的「壞習(xí)慣」傳染了。

AI界最干凈的一次「開卷考試」

研究團(tuán)隊還做了另一個有趣的實驗。

他們從《紐約時報》的「歷史上的今天」欄目中提取了近5000條歷史事件描述，計算talkie對每條事件的「驚訝度」。

結(jié)果非常清晰，1930年之前的事件，talkie不太驚訝。1930年之后的事件，驚訝度開始攀升。

到了1950年代和1960年代達(dá)到峰值，然后趨于平穩(wěn)。

這條曲線本身就是一個關(guān)于預(yù)測能力的實驗。隨著模型規(guī)模增大，這條曲線會怎么變化？

谷歌DeepMind CEO Demis Hassabis曾提出一個思想實驗——

一個只訓(xùn)練到1911年的模型，能不能像愛因斯坦在1915年那樣獨立發(fā)現(xiàn)廣義相對論？

talkie目前當(dāng)然做不到。但它提供了一條路徑，往上Scale就行了。

今夏擴(kuò)展到GPT-3級別

talkie目前是130億參數(shù)，團(tuán)隊的路線圖相當(dāng)激進(jìn)——

今年夏天，發(fā)布GPT-3級別的復(fù)古模型。

更遠(yuǎn)期的目標(biāo)：將語料擴(kuò)展到超過一萬億token，理論上足夠訓(xùn)練一個GPT-3.5級別的模型，能力接近初代ChatGPT。

一個凍結(jié)在1930年的ChatGPT。

參考資料：

https://x.com/status_effects/status/2048878495539843211?s=20

https://talkie-lm.com/introducing-talkie

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

敦煌鳴沙山駱駝五一“全員加班”，隊伍綿延數(shù)里堪比“春運(yùn)”，整座山化身演唱會巨型看臺，游客：來了才知道人比沙子多

極目新聞 2026-05-03 22:54:27
4865 跟貼 4865
景區(qū)裝電梯無痛爬山被質(zhì)疑過度開發(fā)

極目新聞 2026-05-02 17:18:12
4162 跟貼 4162

內(nèi)江動物園老虎瘦成皮包骨，游客直呼可憐

荔枝新聞 2026-05-03 19:36:20
287 跟貼 287

美國將啟動引導(dǎo)被困霍爾木茲海峽船只駛離行動

央視新聞客戶端 2026-05-04 05:54:45
4839 跟貼 4839
洛陽白馬寺發(fā)布鄭重聲明：不少游客因通過非官方第三方渠道購買非法倒賣的預(yù)約門票，導(dǎo)致無法正常入寺，切勿輕信

極目新聞 2026-04-29 18:10:47
2728 跟貼 2728

德國1965億歐元打造"歐洲最強(qiáng)軍" 萬噸護(hù)衛(wèi)艦將成主力

澎湃新聞 2026-05-04 14:54:13
59 跟貼 59

全線爆發(fā)！中國資產(chǎn)，大漲！

證券時報 2026-05-04 10:32:18
457 跟貼 457
"張雪機(jī)車"車手德比斯突然退賽前一天剛絕殺奪冠

極目新聞 2026-05-03 20:26:03
1427 跟貼 1427

花幾百萬，換17歲男孩的血？

中國新聞周刊 2026-05-04 12:36:50
1 跟貼 1
俄列寧格勒州遭到“密集攻擊”

參考消息 2026-05-03 18:32:07
1447 跟貼 1447
游客在廣西紅水河玩槳板突遇暴風(fēng)雨，天空瞬間變黑“度假如渡劫”，文旅局：救援及時，無人員傷亡

極目新聞 2026-05-04 11:59:26
0 跟貼 0
莫氏雞煲上線湯料包5分鐘售罄4000多份，累計賣出4萬多份，總銷售額破160萬元，記者實測：1分鐘搶到兩包

極目新聞 2026-05-04 09:46:46
1 跟貼 1
廣州樓市“穗八條”落地：售樓處再現(xiàn)排隊看房，二手房已連續(xù)兩個月網(wǎng)簽破萬套

澎湃新聞 2026-05-04 10:42:29
0 跟貼 0
假日江山麗旅途活力足——“五一”假期掀起出游熱潮

新華社 2026-05-02 20:33:08
2257 跟貼 2257
貝恩：我們距離奇跡只差一場勝利真不想就這么結(jié)束這個賽季

北青網(wǎng)-北京青年報 2026-05-04 13:37:04
18 跟貼 18
想賺大陸錢又抹黑？臺演員稱高德是“監(jiān)控”，反被扒出用大陸軟件

大魚簡科 2026-05-04 16:53:16
0 跟貼 0
女子擼串喂狗后續(xù)：已道歉認(rèn)慫，老板哭著毀簽求原諒更多細(xì)節(jié)被扒

米果說識 2026-05-04 16:55:19
0 跟貼 0
銅陵女子表演天女散花時摔落！涉事商場：已送醫(yī)檢查未受傷

南方都市報 2026-05-04 16:57:26
0 跟貼 0

澤連斯基亮出絕密證據(jù)：俄內(nèi)部文件泄露，俄軍60%精銳已打殘

澤連斯基亮出絕密證據(jù)：俄內(nèi)部文件泄露，俄軍60%精銳已打殘

矚望云霄

2026-05-02 21:15:38

后背發(fā)涼！新司機(jī)被父親要求80時速占快車道，稱他人有本事飛過去

后背發(fā)涼！新司機(jī)被父親要求80時速占快車道，稱他人有本事飛過去

火山詩話

2026-05-04 13:02:18

全票通過！莎拉遭政治清洗！菲律賓親美勢力借彈劾清除務(wù)實派

全票通過！莎拉遭政治清洗！菲律賓親美勢力借彈劾清除務(wù)實派

浪子阿邴聊體育

2026-05-03 10:46:32

豆包新增付費(fèi)訂閱，標(biāo)準(zhǔn)版每月68元、加強(qiáng)版200元、專業(yè)版500元，官方回應(yīng)：始終提供免費(fèi)服務(wù)，相關(guān)方案細(xì)節(jié)還在測試階段

豆包新增付費(fèi)訂閱，標(biāo)準(zhǔn)版每月68元、加強(qiáng)版200元、專業(yè)版500元，官方回應(yīng)：始終提供免費(fèi)服務(wù)，相關(guān)方案細(xì)節(jié)還在測試階段

深圳晚報

2026-05-04 13:26:59

郭焱：國乒男隊問題不是一天兩天了！封訓(xùn)練的啥？林詩棟被牽著走

郭焱：國乒男隊問題不是一天兩天了！封訓(xùn)練的啥？林詩棟被牽著走

念洲

2026-05-04 13:13:42

許家印終于交代：月薪3萬60名女團(tuán)員，養(yǎng)了恒大歌舞團(tuán)，提供3服務(wù)

許家印終于交代：月薪3萬60名女團(tuán)員，養(yǎng)了恒大歌舞團(tuán)，提供3服務(wù)

貓叔東山再起

2026-05-04 09:35:09

好奇怪，他年輕帥得一塌糊涂，老了丑得一言難盡了

好奇怪，他年輕帥得一塌糊涂，老了丑得一言難盡了

東方不敗然多多

2026-05-04 02:27:10

李賽鳳的亂倫，床縫摸出個用過的套，衣柜里還藏著個半裸的干兒子

李賽鳳的亂倫，床縫摸出個用過的套，衣柜里還藏著個半裸的干兒子

西樓知趣雜談

2026-04-26 10:18:11

世界杯轉(zhuǎn)播費(fèi)看人下菜碟：印度降到2億元，咱們提升到17億元

世界杯轉(zhuǎn)播費(fèi)看人下菜碟：印度降到2億元，咱們提升到17億元

歪歌社團(tuán)

2026-05-04 04:46:10

突發(fā)！以色列發(fā)動空襲

突發(fā)！以色列發(fā)動空襲

新浪財經(jīng)

2026-05-04 12:02:42

巴基斯坦打破美軍封鎖，連開六條路直通伊朗，大批貨物暢通無阻

巴基斯坦打破美軍封鎖，連開六條路直通伊朗，大批貨物暢通無阻

第一軍情

2026-05-04 12:15:03

男子自爆在高鐵上拍風(fēng)景，被大媽懷疑是間諜，因此遭警方調(diào)查

男子自爆在高鐵上拍風(fēng)景，被大媽懷疑是間諜，因此遭警方調(diào)查

可達(dá)鴨面面觀

2026-05-04 10:09:10

手機(jī)正在打敗中國的大學(xué)教育制度

手機(jī)正在打敗中國的大學(xué)教育制度

回旋鏢

2026-05-04 12:19:32

廳級干部已經(jīng)成為了高危職業(yè)

廳級干部已經(jīng)成為了高危職業(yè)

風(fēng)向觀察

2026-05-04 14:17:07

上市6年下跌6年，股價從未漲停過！有人被套后死扛虧33.5萬

上市6年下跌6年，股價從未漲停過！有人被套后死扛虧33.5萬

財經(jīng)智多星

2026-05-04 11:15:27

艾倫最新采訪:決賽打滿4階段，吳宜澤會奪冠！回應(yīng)了1局100分鐘

艾倫最新采訪:決賽打滿4階段，吳宜澤會奪冠！回應(yīng)了1局100分鐘

求球不落諦

2026-05-04 14:44:56

1946年，張靈甫拿下兩淮，看到繳獲的華中野戰(zhàn)軍軍裝后，嘆氣：唉

1946年，張靈甫拿下兩淮，看到繳獲的華中野戰(zhàn)軍軍裝后，嘆氣：唉

浩渺青史

2026-05-03 17:36:15

臺灣老兵帶妻子回大陸見原配，苦等50年相談1小時，原配：無話說

臺灣老兵帶妻子回大陸見原配，苦等50年相談1小時，原配：無話說

蔣南強(qiáng)讀歷史

2026-05-04 06:00:11

咱先不看臉，胸都松垮的垂到腰上了，真是老了，那有什么不老女神

咱先不看臉，胸都松垮的垂到腰上了，真是老了，那有什么不老女神

動物奇奇怪怪

2026-05-04 10:37:19

硅谷華裔工程師回國兩周后，反而更看好美國了？

硅谷華裔工程師回國兩周后，反而更看好美國了？

回旋鏢

2026-05-04 11:10:15

AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代

15129文章數(shù) 66835關(guān)注度

往期回顧全部

科技要聞

OpenAI“復(fù)活”了QQ寵物，網(wǎng)友直接玩瘋

頭條要聞

宇樹機(jī)器人在美坐飛機(jī)電池超標(biāo)被拆卸暫扣致航班延誤

頭條要聞

宇樹機(jī)器人在美坐飛機(jī)電池超標(biāo)被拆卸暫扣致航班延誤

體育要聞

騎士破猛龍：加雷特·阿倫的活力

娛樂要聞

張敬軒還是站上了英皇25周年舞臺

財經(jīng)要聞

魔幻的韓國股市，父母給嬰兒開戶買股票

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

房產(chǎn)

數(shù)碼

教育

藝術(shù)

家居要聞

靈動實用生活藝術(shù)場

寂然無界簡潔風(fēng)格
江景風(fēng)格流動的秩序
自然肌理溫潤美學(xué)

房產(chǎn)要聞

五一樓市徹底明牌！塔尖人群都在重倉凱旋新世界

數(shù)碼要聞

聯(lián)想來酷“W3259PS”31.5英寸顯示器發(fā)售：4K 240Hz，5499元

教育要聞

小升初附加題，求四邊形面積，難倒了不少人

藝術(shù)要聞

300米！重慶解放碑區(qū)在建第一高樓，沖刺竣工！

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權(quán)投訴

無障礙瀏覽進(jìn)入關(guān)懷版主站蜘蛛池模板：免费A级毛片无码A∨蜜芽试看| 国产精品综合| 女人18毛片水真多| 国产午夜精品成人在线| 欧美成人精精品一区二区三区| 在线a人片免费观看| 撸啊撸激情久久| 亚洲精品无码专区| 欧美19综合中文字幕| 国产白嫩漂亮美女在线观看| 欧洲人妻丰满av无码久久不卡| 久久综合偷拍视频五月天| A毛片终身免费观看网站| 少妇无码一区二区三区免费 | 国产精品嫩模大尺度视频| 亚洲第一尤物视频在线观看导航| 亚洲精品一区二区三天美| 夜夜国自一区| 五月天激情婷婷婷久久| 欧美小视频AAAAAA| 中日韩欧美成人免费播放| 国产一区二区日韩经典| 三级网站视频在在线播放| 黑人强伦姧人妻久久| 成人深爱网| 国内精品伊人久久久久7777| 久久爱伊人| 日韩欧美一区二区精品久久| 精品av天堂毛片久久久| 国产普通话对白刺激| 国产无遮挡无码视频在线观看| 88久久久久无码国产精品| 99中文视频| 色欲AV无码一区二区人妻| 亚洲欧洲自拍拍偷午夜色| 性欧美老人牲交xxxxx视频| 亚洲精品综合久中文字幕| A毛片终身免费观看网站| 美女不带套日出白浆免费视频| 人妻a?v| 精品亚洲男人天堂av|