![]()
近日,美國耶魯大學博士畢業生李昊特和合作者開發了一套叫 MOSAIC 的 AI 系統,把化學合成知識分成了 2,498 個專業領域,每個領域訓練一個專家模型。
這套系統在測試中對超過 35 種全新化合物的合成成功率達到了 71%,甚至幫研究人員完成了之前文獻報道失敗的化學反應和前所未見的新反應。
使用時給定 AI 一個化學結反應式,它不光告訴你這物質形態,還直接給你一份可以進實驗室操作的詳細步驟,包括用什么試劑、加多少量、加熱多久、怎么提純,甚至連每一步的注意事項都寫好了。日前,相關論文發表于《自然》。
![]()
圖 | 李昊特(來源:https://scholar.google.com/citations?use)
這項研究的出發點,來自于研究人員對化學學科現狀的觀察。化學是一門以實驗為基礎、經驗性極強的學科。人們學到的知識和技巧大多來自前人的積累,這本來是好事,但問題在于,今天每年有上百萬篇化學論文發表,沒有任何一個化學家能讀完所有文獻,更不用說記住其中的細節了。
化學滲透在生活的方方面面,從制藥、材料、催化到農業和消費品,新藥物的開發、新材料的合成都需要大量的試錯。
一個有機化學反應的優化往往涉及多個參數:溶劑、濃度、反應順序、時間、溫度曲線,而且這些參數還會相互影響。探索一個新反應,通常需要大量的時間投入和試錯成本。
在這樣的背景下,研究人員想做一個系統:輸入一個目標分子,系統不僅告訴你能不能合成,還能給出可以直接進實驗室操作的詳細步驟。
然而,通用大模型雖然能聊天,但你要讓它給出一個具體化學反應的實驗步驟,它經常說得驢唇不對馬嘴。它會用看起來很專業的術語編造一套方案,溫度不對、試劑不對、順序也不對,按照它說的去做很可能什么都得不到,甚至炸掉反應瓶。
![]()
(來源:《自然》)
MOSAIC 的做法則是把整個化學合成知識空間分割成 2,498 個小區域,每個區域選一個專家。比如某個專家專門負責一種叫 Buchwald-Hartwig 的偶聯反應,尤其是氯代芳香環的那種。
當你輸入一個新的化學反應時,系統先在知識空間里找到離它最近的專家,然后讓這個專家來回答。
為了判斷哪個專家離得近,研究人員先訓練了一個叫 KMN 的神經網絡。這個網絡能把化學反應轉化成 128 維的數字向量,專業上叫反應特異性指紋。向量之間的距離越近,說明兩個反應越相似。
有了這個空間,他們用了一個叫 FAISS 的高效檢索工具,把知識庫聚類成 2,498 個沃羅諾伊單元,每個單元就是一個專家的地盤。
訓練的時候,先讓一個基礎模型把所有數據都學一遍,再針對每個專家所在的子集做二次微調。對一個新反應做預測時,系統先算出它的向量,找到最近的幾個沃羅諾伊單元,激活對應的專家,然后讓專家輸出完整的實驗方案。
研究人員最初嘗試了訓練一個完整的大模型,但很快意識到需要的計算資源太大了,幾百上千張 GPU 卡,大多數實驗室無法長期測試。
后來他們轉換思路,從最基礎的做起,只把模型在單個類型反應上微調。結果發現,簡單的辦法反而取得了好的效果。
傳統方法需要幾百上千張 GPU 卡,MOSAIC 只需要幾張卡就能跑,而且是可持續生長的。新數據來了不需要重新訓練整個系統,只需要在知識空間里加新的沃羅諾伊單元,訓練新的專家,已經存在的專家不受影響。
搜索的時候系統會同時從已有和新索引里找結果,合并排序后輸出。這種去中心化的設計對資源有限的學術實驗室非常友好。對大多數研究者來說,用單個或幾個 A100 GPU 就能讓這個架構持續進步。
研究人員用 MOSAIC 預測了 37 種新化合物的合成路線,其中有 35 種在第一次嘗試時就成功了。更讓人意外的是一個 5-氮雜吲哚衍生物的合成,這類化合物在之前文獻報道中被標注為是難以用現有方法制備的。
而 MOSAIC 給出的預測距離最近的專家中心距離是 320,遠高于通常的置信閾值 150,這意味著這個反應在知識庫里幾乎找不到相近的先例。
但是,研究人員完全按照預測做了實驗并成功實現了產物,同時 MOSAIC 找到了一個之前未被報道過的環化方法。這說明這套系統不只是照搬已有知識,它有一定的泛化能力,能在已有知識的邊緣組合出新的方法。
研究人員強調,最重要的實驗結果就來自于這種全新機理的反應預測。僅僅完全參照模型給出的預測,他們就取得了實驗上的成功,而且讓之前已報道過的相同底物上失敗案例得以實現。論文審稿人對這一點也贊賞有加,認為全新反應的創新是本次論文的一大亮點。
他們還發現了一個很有意思的規律,他們把所有合成嘗試的結果和預測的置信度做了對比。當預測距離小于 100 時,實驗成功率超過 75%。當距離大于 200 時,成功率降到 50% 左右。
這個置信度指標成了實驗優先級排序的有效工具,高置信度的反應可以大膽嘗試,低置信度的反應值得探索但也需要留更多容錯空間。
論文審稿人特別認可這個可信度指標,認為它彌補了一個長期存在的瓶頸,過去只有專家才能評估大模型預測的好壞,現在有了一個可量化的指標。
在預測試劑和溶劑時,單次預測的精確匹配率只有 22.4% 和 29.8%,但如果讓三個專家一起投票,精確匹配率幾乎翻倍到 43% 和 32.8%,部分匹配的成功率更是達到了 94.8%,這說明聯合多個專家的意見能大幅提升預測可靠性。
![]()
(來源:《自然》)
李昊特告訴 DeepTech,這項研究剛開始的時候,有共同作者一度懷疑它的價值,理由是已經有像 Chemcrow 這樣的架構,直接通過給 GPT-4 語言指令的方式完成一系列化學操作,看起來已經涵蓋了研究目標。
但團隊里有人從不同視角觀察,發現商業模型本身存在隱藏的缺點,對化學的理解還有非常大的提升空間。研究人員通過實驗數據證明了這一點,這個插曲讓團隊深刻體會到獨立思考的重要性,不能因為存在可行方案,就停止尋找更好的方法。
雖然 MOSAIC 可以以較高概率解決實際化學問題,但模型目前還不能解釋自己的預測。可解釋性是當前研究的重點,研究人員希望下一步的模型不僅能給出高成功率的方案,還能說清楚為什么選擇這個條件、為什么這個反應能成功,而這也是真正讓 AI 理解化學的關鍵一步。
研究人員認為這項技術在藥物合成、材料發現等方向有著優秀的轉化前景。MOSAIC 最直接的應用就是全自動機器合成平臺,它可以生成高成功率的實驗方案,然后直接交給機器人平臺去執行,用來探索新藥物、新材料。
另外,MOSAIC 可以和現有的大型化學搜索平臺,比如 Reaxys 和 SciFinder 結合起來。過去在這些平臺上搜索一個反應,可能會返回成千上萬條相似的文獻,讓人無從下手,MOSAIC 可以把這些結果整理成最少、最直接可用的方案。
在實驗室里時間是最貴的成本,MOSAIC 旨在幫助化學領域的研究人員快速篩選有希望的實驗方向,把搜索成千上萬篇文獻的時間縮到幾分鐘。
目前,研究人員已經將 MOSAIC 開源,所以感興趣的人士均可使用。
參考資料:
相關論文 https://doi.org/10.1038/s41586-026-10131-4
運營/排版:何晨龍
注:封面/首圖由 AI 輔助生成
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.