![]()
編輯丨&
在藥物研發的漫長鏈條中,找到蛋白質上能與小分子藥物結合的口袋(結合位點),是關鍵的起點。傳統方法要么依賴已知結構的同源比對,要么從頭訓練神經網絡。但前者受限于已知數據,后者則常因訓練數據不足而泛化能力有限。
而現在,哈佛醫學院、MIT 與達納-法伯癌癥研究所等提供了一個全新的思路:與其從頭訓練,不如從 AlphaFold2 這個已經「學富五車」的蛋白質結構預測模型中,直接提取它學會的關于蛋白質相互作用的「內部語言」。
這個名為 AF2BIND 的工具,僅用一個簡單的邏輯回歸模型,就實現了對小分子結合位點的高精度預測,并構建了一個包含上萬個人類蛋白質組中全新結合位點的數據庫,為藥物發現提供了寶貴的資源。
相關研究以「AF2BIND: predicting small-molecule binding sites using the pair representation of AlphaFold2」為題,于 2026 年 3 月 11 日發布在《Nature Methods》。
![]()
論文鏈接:https://www.nature.com/articles/s41592-026-03011-2
AF2BIND
AlphaFold2(AF2)本是為了預測蛋白質的單鏈結構而訓練的。但研究團隊敏銳地意識到,AF2 在訓練過程中,「見過」成千上萬個包含小分子的蛋白質復合物結構。這些知識,很可能已經內化在其網絡內部的對表示(pair representation)中。問題就在于,如何「喚醒」這部分沉睡的知識?
AF2BIND 的巧妙之處在于:它給 AF2 輸入目標蛋白的結構(作為模板),同時在其序列末尾,像「釣魚」一樣接上20個「誘餌氨基酸」——每個標準氨基酸類型各一個,且彼此之間用很大的殘基索引間隔隔開。
![]()
圖 1:AF2BIND 利用 AlphaFold2 的特征預測靶蛋白中的小分子結合殘基。
AF2 會嘗試「完成折疊」,在這個過程中,誘餌氨基酸會與目標蛋白的潛在結合位點產生注意力交互。而 AF2BIND,則截取目標蛋白每個殘基與這 20 個誘餌氨基酸之間的初始注意力,并將對表示拼接后,輸入一個邏輯回歸模型進行訓練,目標是預測該殘基是否是小分子結合位點。
![]()
圖 2:AlphaFold2 的對表示被用作邏輯回歸模型 AF2BIND 的輸入,用于預測配體結合殘基。
這種方法優雅地避開了從頭訓練深度網絡所需的海量標注數據,直接利用了 AF2 強大的預訓練知識。同時,邏輯回歸模型的選擇,也為后續的可解釋性埋下了伏筆。
訓練與成果
為了避免數據泄漏(即測試集與訓練集存在同源蛋白),團隊建立了一個極為嚴苛的拆分標準。們不僅按序列相似性(30% identity)聚類,還結合了結構相似性(Foldseek)、進化分類(ECOD)、結構域注釋(CATH, PFAM)乃至結合口袋本身的形狀相似性(TM-score)。
最終的測試集包括 67 個不同小分子結合蛋白的結構,這些結構與訓練集或驗證集中的任何蛋白質在結構、序列或口袋上均無相似性。
結果顯示,僅用 AF2 的 pair 特征,AF2BIND 就達到了 66% 的結合殘基恢復率,ROC-AUC 為 0.936。將多種特征結合,性能略有提升,但 AF2 無疑是信息最豐富的單一來源。
![]()
圖 3:AF2 的配對表示在結合-殘基預測方面最為有效。
驗證算法性能后,研究團隊將 AF2BIND 應用于一個更宏大的目標:整個人體蛋白組。他們利用 AlphaFold2 已預測的結構數據庫,對所有蛋白進行系統分析。
結果顯示:共有 20,302 個潛在結合位點,分布于 13,686 個蛋白質中。更重要的是,其中 15,755 個位點 在已有數據庫中完全沒有對應記錄。換句話說,這些位點是此前幾乎無法通過同源結構轉移或傳統方法識別的。
![]()
圖 4:AF2BIND 預測了人類蛋白質組中未通過同源建模(AlphaFill)或 P2Rank 發現的可藥物位點。
高質量的藥物地圖
AF2BIND 證明了預訓練模型的「知識遷移」能力:一個為結構預測而訓練的模型,其內部表示竟能如此有效地遷移到預測蛋白質-小分子相互作用這一看似正交的任務上。這為未來利用這些強大模型解決更廣泛的生物醫藥問題(如配體設計、蛋白質設計)提供了范例。
AF2BIND 不僅指出位點在哪里,還通過誘餌分析,提供了關于「什么樣的分子可能適合這里」的線索。
如論文作者所言,AF2BIND 的預測可以與能處理小分子的新一代結構預測工具(如AlphaFold3、Boltz-1)協同,其識別的位點可以作為「口袋條件」,引導這些工具進行更精準的共結構預測或分子對接。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.