你還記得2024年諾貝爾化學獎頒給了誰嗎?其中之一,是一項“跨界”的技術——一個叫AlphaFold的預測蛋白質結構的人工智能。當時很多人驚呼:AI竟然搶了化學家的飯碗?但事實上,這場革命才剛剛開始。
最近,這位“諾獎選手”AlphaFold又進化了:它不再僅僅盯著單個蛋白質,而是開始成千上萬地預測它們是如何“成雙成對”工作的。
![]()
2024諾貝爾化學獎(圖片來源:Science)
AlphaFold 幫我們認清生命的“零件”
在理解AlphaFold最近的突破之前,我們先來回顧一下它過去的成就。
在生命科學界,蛋白質被稱為“生命的積木”。你身體里的每一個動作——從呼吸、消化到免疫系統對抗病毒,全靠蛋白質在支撐。
蛋白質由一長串氨基酸組成,但它們并不是簡單的“繩子”,而是會扭曲、折疊成極其復雜的立體形狀。蛋白質的結構決定了它的功能,如果蛋白質的折疊產生錯誤,人就會生病,比如阿爾茲海默癥。
蛋白質結構的四個層次(圖片來源:BYJU’S)
所以,只有知道了一個蛋白質的精確形狀,科學家才能理解它是如何工作的,或者如何研制藥物來干預它的行為。過去50年,科學家為了看清一個蛋白的形狀,往往要耗費數年時間和數百萬人民幣。
直到 AlphaFold 橫空出世,這個局面才徹底被改變。
2024年諾貝爾化學獎得主德米斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John Jumper)開發的這個AI,它采用了一種名為“Transformer”的神經網絡架構,這也是ChatGPT等大語言模型背后的核心技術。AlphaFold學習了人類已知的所有蛋白質結構數據,學會了像“翻譯語言”一樣去“預測結構”。
AlphaFold創始人Demis Hassabis和John Jumper(圖片來源:chessbase)
它預測的精度已能夠達到原子級水平,與耗時耗錢的實驗結果幾乎一致。但以前需要人工用數月完成的工作,現在只需幾小時。目前,AlphaFold已經預測了約 2億個蛋白質的結構,幾乎涵蓋了科學界已知的所有蛋白質。這相當于為人類建立了一個“生命零件倉庫”,從此找零件只需要“一鍵搜索”。
零件夠了,但“組裝說明書”呢?
然而,想要解決更復雜的生命科學問題,光有零件倉庫是不夠的。
在真實的細胞工廠里,蛋白質很少“單打獨斗”。它們更像是齒輪、連桿或剪刀的刀片。
如果你只拿到了剪刀的一個刀片,你根本沒法裁剪東西;如果你只看到了半個齒輪,你也不知道機器是怎么轉動的。
很多關鍵的蛋白質,必須由兩個或多個分子“合體”后才能工作。比如臭名昭著的HIV-1蛋白酶(艾滋病病毒攻擊人體的關鍵武器),它必須由兩個完全一樣的蛋白分子像“照鏡子”一樣扣在一起,形成一個有功能的酶,才能破壞免疫系統。
HIV-1蛋白酶(圖片來源:維基百科)
此前,AlphaFold的數據庫里大多是這些蛋白的“單身照片”。而現在,升級版的AlphaFold開始提供它們的“雙人合照”。
最新突破:170萬個“雙胞胎”合體
近日,由Google DeepMind、英偉達(NVIDIA)和歐洲分子生物學實驗室(EMBL-EBI)等機構組成的“科研夢之隊”宣布:AlphaFold數據庫完成了重磅升級。
這次更新最核心的內容是加入了170萬個“同源二聚體”。
什么是“同源二聚體”?簡單理解,就是兩個一模一樣的蛋白質分子“成雙成對”結合在一起的形態。
含轉錄延伸因子 Eaf N 端結構域蛋白的同源二聚體(圖片來源:AlphaFold)
這聽起來簡單,預測起來卻極其困難。預測兩個分子如何咬合,計算量呈指數級增長。這不僅需要AI有極其聰明的算法,還需要英偉達提供的強大的算力支持。
科學家們先是從人類、細菌、酵母等20種最重要的物種入手,預測了3000萬種可能的組合,最后精挑細選出170萬個高準確度的結構放入數據庫。
為什么這次升級能讓新藥研發“加速”?
這次升級不僅僅是增加了數據,更是為新藥開發打開了新大門。
以前,藥企想要針對某個病毒蛋白研發藥物,就像是給鎖配鑰匙。如果AI只給了你半個鎖的形狀,你配出的鑰匙大概率是打不開門的。
現在,有了AlphaFold提供的“組裝好”的復合體結構,科學家可以直接看準兩個蛋白結合的“縫隙”,設計藥物把它們“拆散”,讓病毒無法組裝成完整的機器。
![]()
AI讓新藥的研發加速(圖片來源:SELMAN DESIGN)
更令人興奮的是,這只是個開始。不久后,數據庫還將加入“異源二聚體”——即兩個不同零件之間的配對。那將是更大規模的“生命社交網絡圖譜”。
雖然AlphaFold已經拿了諾獎,且在不斷進化,但科學家們依然保持著一份冷靜。
AI的預測雖然“神速”,但偶爾也會產生幻覺。這些預測出的模型更像是給科學家的“導航地圖”,指引我們要去哪里探索,但最后的真相,依然需要科學家在實驗室里通過真實的生物實驗來驗證。
從“認清零件”到“看懂組裝”,AI正在幫我們一頁頁翻譯那本深奧的《生命說明書》。也許在不遠的將來,人類對抗疾病的方式,將因為這些“成雙成對”的蛋白質模型而改變。
撰稿\\張一凡
參考資料:
[1]. 《自然》雜志Nature → AlphaFold database hits ‘next level’: the AI system now includes protein pairing
[2]. 麻省理工科技評論 → What’s next for AlphaFold: A conversation with a Google DeepMind Nobel laureate
[3]. AlphaFold
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.