<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      GPT之父把AI扔回1930年:沒見過一行代碼,卻「發明」了Python!

      0
      分享至


      你敢信?一個活在95年前的AI,竟寫出了Python代碼。GPT之父下場,用2600億Token煉出了一個「老古董」AI。

      一個從未見過電腦的AI,竟寫出了現代編程語言!

      這可不是什么科幻的設定。

      就在今天,GPT之父Alec Radford帶隊發布了震撼全網的「talkie」——

      總參數130億,一個只讀過1931年之前舊文獻的大模型。


      talkie的「世界觀」(全部訓練數據),被凍結在了1930年12月31日。

      那個時代,沒有互聯網,沒有維基百科,更沒有任何現代代碼。

      它讀過的最「新」的東西,是近百年前的專利書、科學期刊、禮儀手冊和私人書信。


      但就是這樣一個「活在95年前」的AI,居然能寫出Python代碼。




      沒學過編程,

      卻寫出了Python,理解了「逆函數」

      talkie最炸裂的發現,藏在一組編程測試里。

      Alec Radford團隊突發奇想,用HumanEval去測試talkie的編程能力——

      給它幾個Python函數作為上下文示例,然后讓它解決新的編程問題。

      要知道,talkie的訓練數據中,沒有任何一行現代代碼。連數字計算機的概念,都不存在于它的「知識體系」中。


      但結果令人震驚,通過少樣本學習,它竟然能寫出正確的Python程序。

      雖然目前只能完成簡單的單行程序,比如兩個數相加,或者對上下文示例做微小修改。


      Alec Radford:GPT、CLIP、Whisper背后核心大佬

      但其中一個案例讓人印象深刻:給定一個旋轉密碼的編碼函數encode_shift,它的邏輯是把每個字母在字母表中向后移動5位。

      talkie自己寫出了對應的解碼函數,整個修改只有一個字符:把+5改成了-5,加號換成了減號。

      它真正理解了「逆函數」:加密是加,解密就是減」這個逆運算的概念。


      傳送門:https://talkie-lm.com/chat

      2600億Token,專喂百年前的紙

      Alec Radford團隊為什么要費這么大勁,手動OCR近百年前的物理文獻,來訓練一個「老古董」?

      因為他們要回答AI領域最核心的一個問題:LLM的能力,到底是推理,還是背誦?

      talkie可以寫出Python,證明了——

      LLM可以用19世紀的知識做推理,并非只是檢索。不得不說,這才是真正意義上的「泛化」!


      再來看talkie的訓練語料庫,可以稱得上是一個龐大的「考古工程」。

      它的訓練語料達到了2600億token,全部來自1931年之前的英語文本,包括書籍、報紙、期刊、科學論文、美國專利、判例法。

      要知道,這么多文本皆需要從實體文檔掃描并OCR轉錄。


      而選擇1930年作為截止日期,原因很實際:這是美國公共版權法(public domain)的分界線。

      不過,這帶來了一個意想不到的瓶頸:數據質量。

      團隊做了一組對照實驗:用傳統OCR系統轉錄的舊文本訓練模型,和用人工轉錄的同一批文本訓練模型相比,前者的學習效率只有后者的30%。

      簡單的正則清洗能把這個數字提升到70%,但仍然有巨大的差距。


      在評估talkie性能實驗中,團隊又打造了一個「現代孿生體」(talkie-web-13b-base)。

      后者用FineWeb的現代網絡數據訓練,兩款模型用了「相同的算力」。

      顯而易見,在核心語言理解、數學推理任務上,talkie的表現與現代孿生體相當。

      但在通用知識評測上,即使剔除了對1930年視角來說「穿越」的題目,talkie仍然落后。


      團隊懷疑,這跟數據質量有很大關系。

      為此,Radford團隊計劃從零開始訓練「復古OCR系統」,專門用于重新轉錄1931年前的文本。

      用最現代的Claude 4.6

      訓練最古老的AI

      talkie的「后訓練」方案也很有意思。

      要把一個只讀過舊書的「基礎模型」變成能對話的聊天機器人,根本沒有現成的指令微調的數據可用。


      團隊的做法是,從1930年之前的結構化參考書中提取指令-回答對:禮儀手冊、書信寫作指南、菜譜、百科全書、詩歌集。

      然后,再用這些「復古教材」做第一輪SFT。

      在接下來的RLAIF階段,團隊用在線DPO來提升talkie的指令遵循能力,Claude Sonnet 4.6作為裁判。

      一個2026年最先進的AI,給一個「活在」1930年的AI打分。

      最終的精調階段,團隊甚至用Claude Opus 4.6生成多輪對話數據,來打磨talkie的對話能力。

      訓練過程中,Claude對talkie指令遵循能力的評分從2.0提升到了3.4(滿分5分)。

      最后一步,用Claude Opus 4.6與talkie進行多輪合成對話,再做一輪拒絕采樣+SFT,打磨對話能力。

      團隊也坦承了一個諷刺之處:用現代大模型訓練一個本該凍結在1930年的模型,本身就是一種「時間污染」。

      他們的長期目標是用復古基座模型自身作為裁判,實現完全「自舉式」的后訓練流水線。

      值得一提的是,talkie的7B版本在RL訓練后出現了一個搞笑的副作用——

      它開始用列表體說話,純屬是被現代AI的「壞習慣」傳染了。

      AI界最干凈的一次「開卷考試」

      研究團隊還做了另一個有趣的實驗。

      他們從《紐約時報》的「歷史上的今天」欄目中提取了近5000條歷史事件描述,計算talkie對每條事件的「驚訝度」。


      結果非常清晰,1930年之前的事件,talkie不太驚訝。1930年之后的事件,驚訝度開始攀升。

      到了1950年代和1960年代達到峰值,然后趨于平穩。

      這條曲線本身就是一個關于預測能力的實驗。隨著模型規模增大,這條曲線會怎么變化?

      谷歌DeepMind CEO Demis Hassabis曾提出一個思想實驗——

      一個只訓練到1911年的模型,能不能像愛因斯坦在1915年那樣獨立發現廣義相對論?

      talkie目前當然做不到。但它提供了一條路徑,往上Scale就行了。

      今夏擴展到GPT-3級別

      talkie目前是130億參數,團隊的路線圖相當激進——

      今年夏天,發布GPT-3級別的復古模型。


      更遠期的目標:將語料擴展到超過一萬億token,理論上足夠訓練一個GPT-3.5級別的模型,能力接近初代ChatGPT。

      一個凍結在1930年的ChatGPT。

      參考資料:

      https://x.com/status_effects/status/2048878495539843211?s=20

      https://talkie-lm.com/introducing-talkie

      文章來源:新智元。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      昆明4個老板赴泰考察,剛落地就失聯!熟人介紹的,竟是奪命陷阱

      昆明4個老板赴泰考察,剛落地就失聯!熟人介紹的,竟是奪命陷阱

      奇思妙想草葉君
      2026-05-18 09:39:47
      1942海南慰安所,21個少女的一天:日軍排隊到天明,大部分沒出來

      1942海南慰安所,21個少女的一天:日軍排隊到天明,大部分沒出來

      瘋狂的小歷史
      2026-05-18 10:47:33
      7年敗光2個億,鄒市明冉瑩穎共同發文,終究還是踏出了這一步

      7年敗光2個億,鄒市明冉瑩穎共同發文,終究還是踏出了這一步

      林輕吟
      2026-02-11 11:29:40
      歐洲,終將沒落

      歐洲,終將沒落

      經濟學教授V
      2026-04-13 08:05:32
      湖北荊州遇極端暴雨天氣,荊州站候車大廳大量漏水,進展:沒漏了,車站已恢復正常運營

      湖北荊州遇極端暴雨天氣,荊州站候車大廳大量漏水,進展:沒漏了,車站已恢復正常運營

      瀟湘晨報
      2026-05-18 12:25:30
      東部第一出局3大罪人!坎寧安啞火哈里斯6中0,杜倫2.4億肥約告吹

      東部第一出局3大罪人!坎寧安啞火哈里斯6中0,杜倫2.4億肥約告吹

      李喜林籃球絕殺
      2026-05-18 12:23:03
      71.5%!歷史性暴跌,以貸養貸的泡沫崩了

      71.5%!歷史性暴跌,以貸養貸的泡沫崩了

      月滿大江流
      2026-04-16 13:54:38
      買Hotmail賬號的生意:誰在批量收購二十年老郵箱

      買Hotmail賬號的生意:誰在批量收購二十年老郵箱

      碼上閑敘
      2026-05-17 02:56:48
      2014年,中國高鐵總設計師被判死刑,法庭現場落淚:我對不起人民

      2014年,中國高鐵總設計師被判死刑,法庭現場落淚:我對不起人民

      鳥兒飛上枝頭
      2024-09-22 13:42:46
      61歲郭富城推掉工作陪妻子千里奔喪,戴紅孝帽跪拜沒一點天王架子

      61歲郭富城推掉工作陪妻子千里奔喪,戴紅孝帽跪拜沒一點天王架子

      觀魚聽雨
      2026-05-17 23:18:56
      女性的臀部和胸部,為何會對男性產生強烈的“性吸引力”?

      女性的臀部和胸部,為何會對男性產生強烈的“性吸引力”?

      宇宙時空
      2026-05-15 22:15:06
      真不能怪祖院長,就曾醫生這顏值、這才華和魅力,誰遭的住?

      真不能怪祖院長,就曾醫生這顏值、這才華和魅力,誰遭的住?

      吃瓜局
      2025-11-11 16:23:49
      中超第13輪,成都蓉城-上海海港,前瞻:難以抗衡

      中超第13輪,成都蓉城-上海海港,前瞻:難以抗衡

      足壇超短波
      2026-05-18 10:45:11
      一位日本網友在居酒屋點了一份“200日元”的炸雞,上菜后驚覺:我可能看錯了!!

      一位日本網友在居酒屋點了一份“200日元”的炸雞,上菜后驚覺:我可能看錯了!!

      花小貓的美食日常
      2026-05-17 20:54:24
      紅利曼失守!俄軍砸碎談判桌,用大炮給歐洲上了一堂“清零課”

      紅利曼失守!俄軍砸碎談判桌,用大炮給歐洲上了一堂“清零課”

      咣當地球
      2026-05-17 06:24:58
      兒子說想給自己做床蠶絲被,一家三口網購了1萬粒蠶卵!如今12000條蠶寶寶每天要吃30斤桑葉……媽媽:崩潰并快樂著

      兒子說想給自己做床蠶絲被,一家三口網購了1萬粒蠶卵!如今12000條蠶寶寶每天要吃30斤桑葉……媽媽:崩潰并快樂著

      都市快報橙柿互動
      2026-05-19 00:29:55
      主角:帥氣有才的封瀟瀟,是怎么自甘墮落,毀掉一生的?

      主角:帥氣有才的封瀟瀟,是怎么自甘墮落,毀掉一生的?

      容妃
      2026-05-18 16:15:40
      2016年撒貝寧和妻子李白的一張結婚照,感覺李白真的太白了

      2016年撒貝寧和妻子李白的一張結婚照,感覺李白真的太白了

      手工制作阿殲
      2026-05-18 11:54:08
      大蒜被關注!醫生發現:肺結節病人吃大蒜,不用多久或迎來5變化

      大蒜被關注!醫生發現:肺結節病人吃大蒜,不用多久或迎來5變化

      阿兵科普
      2026-05-17 22:37:24
      中國社會的5大圈層揭秘:你被困在哪一層?換圈子=換人生!

      中國社會的5大圈層揭秘:你被困在哪一層?換圈子=換人生!

      遇見洞見
      2026-02-20 20:20:03
      2026-05-19 01:12:49
      算法與數學之美 incentive-icons
      算法與數學之美
      分享知識,交流思想
      5547文章數 64624關注度
      往期回顧 全部

      科技要聞

      同一公司,有人獎金是6年工資,我卻只有半年

      頭條要聞

      賴清德要求美國繼續向臺出售武器 外交部表態

      頭條要聞

      賴清德要求美國繼續向臺出售武器 外交部表態

      體育要聞

      58順位的保羅,最強第三中鋒

      娛樂要聞

      票房會破14億!口碑第一電影出現了

      財經要聞

      中國芯片,怎么突然不便宜了?

      汽車要聞

      40.98萬起!充電5分鐘純電續航420km 騰勢N9閃充版勝算有多少?

      態度原創

      教育
      游戲
      旅游
      公開課
      軍事航空

      教育要聞

      新鮮出爐!今年各區公辦高中招生計劃變化匯總!

      《GTA6》多個取景地在現實已消失!開發太久的弊端

      旅游要聞

      2億人次之后,南京“十五五”期間放出文旅大招

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      莫斯科遭一年多來最大規模無人機襲擊 3死18傷

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲成亚洲成网中文字幕| 欧洲亚洲国内老熟女超碰| 午夜福利日本一区二区无码| 欧美人与牲动交a欧美精品| 亚洲国产成人无码AV在线影院L | 久久精品亚洲成在人线AV麻豆| 国产91精品一区二区亚洲| 国产精品天天干| 国产色视频网免费| 99riav精品免费视频观看| 日日网| 日韩欧美亚洲综合久久影院| 成人小说一区| 亚洲无线码在线一区观看| 国产精品久久精品第一页| 无码精品黑人一区二区三区 | 日韩精品二区三区四区| 亚洲国产精品久久久久婷婷老年| 婷香五月| 国产自国产在线无毒不卡| 丰满少妇被猛烈进出69影院| 污污内射在线观看一区二区少妇| 亚洲综合国产| 久久精品这里只有国产中文精品| 国产不卡一区二区在线视频 | 欧美性爱在线免费观看| 亚洲卡1卡2卡新区网站| 欧洲无码精品| 极品人妻一区| 国产欧美日韩另类精彩视频| 久久被窝亚洲精品爽爽爽| 国内少妇人妻偷人精品| 潮喷在线播放| 婷婷丁香六月| 亚洲乱人伦中文字幕无码| 国产不卡一区二区四区| 操穴AV| 国产精品污双胞胎在线观看| 色欲久久久天天天综合网精品| 亚洲天堂男人影院| 最近2019中文字幕大全第二页|