網易首頁 > 網易號 > 正文申請入駐

幾張GPU干翻超算！耶魯AI顛覆化學合成，實驗成功率71%

2026-05-19 16:00:21　來源: DeepTech深科技

北京舉報

分享至

近日，美國耶魯大學博士畢業生李昊特和合作者開發了一套叫 MOSAIC 的 AI 系統，把化學合成知識分成了 2,498 個專業領域，每個領域訓練一個專家模型。

這套系統在測試中對超過 35 種全新化合物的合成成功率達到了 71%，甚至幫研究人員完成了之前文獻報道失敗的化學反應和前所未見的新反應。

使用時給定 AI 一個化學結反應式，它不光告訴你這物質形態，還直接給你一份可以進實驗室操作的詳細步驟，包括用什么試劑、加多少量、加熱多久、怎么提純，甚至連每一步的注意事項都寫好了。日前，相關論文發表于《自然》。

圖 | 李昊特（來源：https://scholar.google.com/citations?use）

這項研究的出發點，來自于研究人員對化學學科現狀的觀察。化學是一門以實驗為基礎、經驗性極強的學科。人們學到的知識和技巧大多來自前人的積累，這本來是好事，但問題在于，今天每年有上百萬篇化學論文發表，沒有任何一個化學家能讀完所有文獻，更不用說記住其中的細節了。

化學滲透在生活的方方面面，從制藥、材料、催化到農業和消費品，新藥物的開發、新材料的合成都需要大量的試錯。

一個有機化學反應的優化往往涉及多個參數：溶劑、濃度、反應順序、時間、溫度曲線，而且這些參數還會相互影響。探索一個新反應，通常需要大量的時間投入和試錯成本。

在這樣的背景下，研究人員想做一個系統：輸入一個目標分子，系統不僅告訴你能不能合成，還能給出可以直接進實驗室操作的詳細步驟。

然而，通用大模型雖然能聊天，但你要讓它給出一個具體化學反應的實驗步驟，它經常說得驢唇不對馬嘴。它會用看起來很專業的術語編造一套方案，溫度不對、試劑不對、順序也不對，按照它說的去做很可能什么都得不到，甚至炸掉反應瓶。

（來源：《自然》）

MOSAIC 的做法則是把整個化學合成知識空間分割成 2,498 個小區域，每個區域選一個專家。比如某個專家專門負責一種叫 Buchwald-Hartwig 的偶聯反應，尤其是氯代芳香環的那種。

當你輸入一個新的化學反應時，系統先在知識空間里找到離它最近的專家，然后讓這個專家來回答。

為了判斷哪個專家離得近，研究人員先訓練了一個叫 KMN 的神經網絡。這個網絡能把化學反應轉化成 128 維的數字向量，專業上叫反應特異性指紋。向量之間的距離越近，說明兩個反應越相似。

有了這個空間，他們用了一個叫 FAISS 的高效檢索工具，把知識庫聚類成 2,498 個沃羅諾伊單元，每個單元就是一個專家的地盤。

訓練的時候，先讓一個基礎模型把所有數據都學一遍，再針對每個專家所在的子集做二次微調。對一個新反應做預測時，系統先算出它的向量，找到最近的幾個沃羅諾伊單元，激活對應的專家，然后讓專家輸出完整的實驗方案。

研究人員最初嘗試了訓練一個完整的大模型，但很快意識到需要的計算資源太大了，幾百上千張 GPU 卡，大多數實驗室無法長期測試。

后來他們轉換思路，從最基礎的做起，只把模型在單個類型反應上微調。結果發現，簡單的辦法反而取得了好的效果。

傳統方法需要幾百上千張 GPU 卡，MOSAIC 只需要幾張卡就能跑，而且是可持續生長的。新數據來了不需要重新訓練整個系統，只需要在知識空間里加新的沃羅諾伊單元，訓練新的專家，已經存在的專家不受影響。

搜索的時候系統會同時從已有和新索引里找結果，合并排序后輸出。這種去中心化的設計對資源有限的學術實驗室非常友好。對大多數研究者來說，用單個或幾個 A100 GPU 就能讓這個架構持續進步。

研究人員用 MOSAIC 預測了 37 種新化合物的合成路線，其中有 35 種在第一次嘗試時就成功了。更讓人意外的是一個 5-氮雜吲哚衍生物的合成，這類化合物在之前文獻報道中被標注為是難以用現有方法制備的。

而 MOSAIC 給出的預測距離最近的專家中心距離是 320，遠高于通常的置信閾值 150，這意味著這個反應在知識庫里幾乎找不到相近的先例。

但是，研究人員完全按照預測做了實驗并成功實現了產物，同時 MOSAIC 找到了一個之前未被報道過的環化方法。這說明這套系統不只是照搬已有知識，它有一定的泛化能力，能在已有知識的邊緣組合出新的方法。

研究人員強調，最重要的實驗結果就來自于這種全新機理的反應預測。僅僅完全參照模型給出的預測，他們就取得了實驗上的成功，而且讓之前已報道過的相同底物上失敗案例得以實現。論文審稿人對這一點也贊賞有加，認為全新反應的創新是本次論文的一大亮點。

他們還發現了一個很有意思的規律，他們把所有合成嘗試的結果和預測的置信度做了對比。當預測距離小于 100 時，實驗成功率超過 75%。當距離大于 200 時，成功率降到 50% 左右。

這個置信度指標成了實驗優先級排序的有效工具，高置信度的反應可以大膽嘗試，低置信度的反應值得探索但也需要留更多容錯空間。

論文審稿人特別認可這個可信度指標，認為它彌補了一個長期存在的瓶頸，過去只有專家才能評估大模型預測的好壞，現在有了一個可量化的指標。

在預測試劑和溶劑時，單次預測的精確匹配率只有 22.4% 和 29.8%，但如果讓三個專家一起投票，精確匹配率幾乎翻倍到 43% 和 32.8%，部分匹配的成功率更是達到了 94.8%，這說明聯合多個專家的意見能大幅提升預測可靠性。

（來源：《自然》）

李昊特告訴 DeepTech，這項研究剛開始的時候，有共同作者一度懷疑它的價值，理由是已經有像 Chemcrow 這樣的架構，直接通過給 GPT-4 語言指令的方式完成一系列化學操作，看起來已經涵蓋了研究目標。

但團隊里有人從不同視角觀察，發現商業模型本身存在隱藏的缺點，對化學的理解還有非常大的提升空間。研究人員通過實驗數據證明了這一點，這個插曲讓團隊深刻體會到獨立思考的重要性，不能因為存在可行方案，就停止尋找更好的方法。

雖然 MOSAIC 可以以較高概率解決實際化學問題，但模型目前還不能解釋自己的預測。可解釋性是當前研究的重點，研究人員希望下一步的模型不僅能給出高成功率的方案，還能說清楚為什么選擇這個條件、為什么這個反應能成功，而這也是真正讓 AI 理解化學的關鍵一步。

研究人員認為這項技術在藥物合成、材料發現等方向有著優秀的轉化前景。MOSAIC 最直接的應用就是全自動機器合成平臺，它可以生成高成功率的實驗方案，然后直接交給機器人平臺去執行，用來探索新藥物、新材料。

另外，MOSAIC 可以和現有的大型化學搜索平臺，比如 Reaxys 和 SciFinder 結合起來。過去在這些平臺上搜索一個反應，可能會返回成千上萬條相似的文獻，讓人無從下手，MOSAIC 可以把這些結果整理成最少、最直接可用的方案。

在實驗室里時間是最貴的成本，MOSAIC 旨在幫助化學領域的研究人員快速篩選有希望的實驗方向，把搜索成千上萬篇文獻的時間縮到幾分鐘。

目前，研究人員已經將 MOSAIC 開源，所以感興趣的人士均可使用。

參考資料：

相關論文 https://doi.org/10.1038/s41586-026-10131-4

運營/排版：何晨龍

注：封面/首圖由 AI 輔助生成

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

國產GPU開始造世界！國內首個全棧具身智能仿真平臺來了

量子位 2026-05-19 14:58:44
0 跟貼 0
799元寵語翻譯器被質疑是智商稅

極目新聞 2026-05-18 22:47:24
1749 跟貼 1749

馬斯克訴OpenAI案終落幕：1500億索賠因“告晚了”被駁回

DeepTech深科技 2026-05-19 16:27:41
0 跟貼 0

10萬token自然語言推理，讓30B-A3B模型站上奧賽金牌線

機器之心Pro 2026-05-19 16:04:46
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

科研必備｜130 種實驗室試劑配制大全

生物學霸 2026-04-30 12:13:47
0 跟貼 0

武漢一公司推出“包車送學”服務，一個月398元另需承擔實時打車費

南陽日報 2026-05-18 18:21:29
302 跟貼 302
化學老師掉水里，要怎么救？學生們回答太有趣了

廣州交通電臺 2026-05-16 21:13:51
2 跟貼 2

研究生被實驗逼急了會干什么？半夜看見師兄在親離心機

畢導 2026-05-19 17:15:40
0 跟貼 0
2026新房除甲醛就認準這幾款產品，附CMA檢測報告認證

印象重慶網 2026-05-19 12:50:30
0 跟貼 0
化學反應的自發進行：焓變與熵變的雙重考量

宗老師化學知識學習 2026-05-19 10:42:35
0 跟貼 0
這就是層流現象的奇特之處

科學大搜索 2026-05-18 19:56:54
9 跟貼 9
跑了十年膠，這套電泳系統讓我重新愛上做 WB 實驗

生物學霸 2026-05-18 17:25:54
0 跟貼 0
高質量發展｜為“人造太陽”造條超級產業鏈核聚變前沿技術集中在天府新區發布

每日經濟新聞 2026-05-19 17:41:37
0 跟貼 0
技術永遠不會消失

市井中人 2026-05-18 13:31:13
1 跟貼 1
飛刀老師展示飛鏢，嚇得游客癱坐在地，技術果真是精湛！

爆笑神惡搞 2026-05-19 14:20:26
1 跟貼 1
網傳“河南蒜薹滯銷棄收”，真相究竟如何？

環球網資訊 2026-05-19 14:37:17
0 跟貼 0
三個經典案例告訴你，如何實現真正的跨學科整合

校長派 2026-05-19 06:36:53
0 跟貼 0
深圳實驗教育集團首屆班主任專業能力大賽總決賽圓滿收官

南方都市報 2026-05-19 07:42:29
0 跟貼 0
福晶科技：2025年度公司精密光學元件業務營收占比達39.30%

每日經濟新聞 2026-05-19 16:37:58
0 跟貼 0
孫華軍回應比亞迪電池技術單一質疑：多路線同步研發不局限磷酸鐵鋰

快科技 2026-05-19 11:47:11
11 跟貼 11
阻尼器的作用，小哥現場實驗，其中的原理我不懂！

搞笑著哥 2026-05-16 13:52:28
0 跟貼 0
抓住比自己還大的山羚，黑雕媽媽成功率很高

數位科學世界 2026-05-16 12:32:34
1 跟貼 1
優品推薦：雙鍵 HANERCHEMMBI 衣康酸單丁酯提升漆膜多項性能

新浪財經 2026-05-19 17:09:45
0 跟貼 0
艾司唑侖立大功！老人吃艾司唑侖，不止助眠，還有5大獲益

健康之光 2026-05-19 16:58:40
0 跟貼 0
Mol Psychiatry丨針對重度抑郁癥的不同治療模式比較研究

BioArtMED 2026-05-19 14:35:12
0 跟貼 0
美國的性別重塑實驗有多殘酷？兩歲男孩成實驗品，結局令人嘆息

雄韜偉略 2026-05-18 18:53:15
1 跟貼 1
物理老師利用柱狀光柵，讓學生實現隱身效果，網友：原來隱形衣是這么來的

星沙時報 2026-05-19 16:48:15
1 跟貼 1
智翔金泰GR1803皮下劑型獲臨床批準

全球財說 2026-05-19 15:22:35
0 跟貼 0
螺絲釘放入水中后，居然瞬間變換了顏色，陽極氧化的原理是什么？

地球科普記 2026-05-15 17:22:43
1 跟貼 1
老板倒霉了，是不是給人浪費材料

奇觀趣聞 2026-05-18 18:31:14
0 跟貼 0
張雪機車奪本賽季第五冠張雪：計劃有變準備奪冠

大象新聞 2026-05-18 20:51:07
303 跟貼 303
這墻自己會發光，到底什么原理？

好奇的老八 2026-05-19 11:27:48
1 跟貼 1
西瓜的種植技術

我是汪汪妹 2026-05-18 09:02:40
1 跟貼 1
中老年人必看：骨化三醇該怎么吃才安全？

PSM藥盾公益 2026-05-19 16:57:08
0 跟貼 0
深度長文：植物為什么沒進化出大腦？（超10000字）

宇宙時空 2026-05-19 17:05:29
0 跟貼 0
高盛：對騰訊控股AI策略進展感到鼓舞重申“買入”評級

財聯社 2026-05-19 16:46:11
0 跟貼 0
化學藥品存放問題剖析

宗老師化學知識學習 2026-05-17 22:56:59
1 跟貼 1
要命的電弧

小渣愛酒 2026-05-18 09:14:11
1 跟貼 1
2026年哪款NMN品牌抗衰效果最明顯？衰老7個節點

食品安全與法律網 2026-05-19 14:15:29
0 跟貼 0

DeepTech深科技

麻省理工科技評論獨家合作

16721文章數 514968關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

時尚

本地

手機

健康

手機 / 數碼

房產 / 家居

幾張GPU干翻超算！耶魯AI顛覆化學合成，實驗成功率71%

馬斯克敗訴，法院判他起訴OpenAI太晚了

武大全面開放校園后一棵梧桐樹被刻字 校方回應

武大全面開放校園后一棵梧桐樹被刻字 校方回應

文班亞馬1比0雷霆：凌駕MVP的史詩價值

姚晨刪博難平眾怒，為什么她還能蹦噠

從賣流量到賣Token，運營商算力生意破局

配置全家桶 全新海獅05這次升級全在點上

態度原創

青少年情緒問題的主因是高自戀的家庭教育

休閑闊腿褲怎么穿才美？看看這些穿搭公式，解鎖不重樣的造型

別搜晉江小說了，去看真的晉江

紅魔姜超詳談第五代驍龍8至尊領先版芯片的誕生

專家揭秘干細胞回輸的安全風險

武大全面開放校園后一棵梧桐樹被刻字校方回應

武大全面開放校園后一棵梧桐樹被刻字校方回應

配置全家桶全新海獅05這次升級全在點上