引言
自然界的蛋白質經過數億年的漫長進化,才打磨出支撐生命的復雜功能。然而,面對癌癥、新發傳染病以及日益嚴峻的氣候危機,我們已無法再等待下一個百萬年的自然選擇。
4月30日,《Nature》的重磅綜述“The past, present and future of de novo protein design”,系統總結了基于深度學習(Deep Learning)的計算方法如何引發蛋白質工程領域的范式轉變。從頭設計蛋白質(De novo protein design)正從隨機篩選走向理性的定制化構建。
![]()
告別盲人摸象:生成式大模型重構分子設計法則
設計一個全新蛋白質的難點究竟在哪里?
從上世紀90年代到幾年前,計算蛋白質設計的底層邏輯一直深植于物理化學模型。研究人員的出發點是著名的安芬森假說(Anfinsen's hypothesis),即蛋白質的折疊狀態處于其氨基酸序列的全局自由能最低點。為了找到這個“最低點”,像 Rosetta 這樣的軟件試圖通過計算范德華力、氫鍵、靜電相互作用等物理量來評估數以億計的可能結構。這種方法雖然極其嚴謹,但也極度耗時,且極易陷入局部最優解的陷阱。
如今,這場革命性的突破得益于深度學習模型的引入。AlphaFold 和 RoseTTAFold 等結構預測工具的成熟,提供了一種從序列空間到結構空間的全新映射方式。研究人員不再單純追求“能量最低”,而是轉向尋找“概率最高”的序列-結構對。這種概率計算的底氣,源于全球結構生物學領域歷經 60 年、耗資數十億美元、由成千上萬名研究人員共同構建的蛋白質數據庫(PDB)。大模型通過學習這些已知結構的底層概率分布,掌握了生命的“語法”。
隨后,基于擴散模型(Diffusion models)的生成式人工智能(AI)工具如RFdiffusion 徹底顛覆了設計流程。在設計之初,模型面對的只是一團完全隨機的氨基酸殘基“噪聲”,通過逐步去噪,這些殘基最終組織成具有高度互補性和特定功能的蛋白質結構。一旦骨架確定,ProteinMPNN 等序列設計工具就能迅速填補合適的氨基酸序列。這種骨架生成與序列設計的解耦與協同,讓蛋白質設計擺脫了天然序列的束縛,真正實現了從功能需求出發的“逆向工程”。
突破天然界限:定制多維空間結構的組裝模塊
掌握了底層規律后,研究人員首先挑戰的是設計全新的蛋白質折疊和組裝形式。
早在2003年,世界上第一個具有原子級精度的全新折疊蛋白質 Top7 問世,證明了計算方法能夠無中生有地創造出穩定結構。而如今,這種能力已經擴展到了極具挑戰性的跨膜蛋白領域。研究人員成功設計了包含α-螺旋和 β-折疊的跨膜孔道和通道。例如,定制尺寸和內襯屬性的 β-桶狀孔道,為基于納米孔的單分子 DNA 測序技術及廣譜生物傳感技術提供了更為理想的物理通道。
在微觀尺度上,設計技術已經能夠突破傳統20種天然氨基酸的限制。通過引入非天然氨基酸,研究人員設計出了長度在 7 到 14 個殘基之間的主鏈環化肽(Macrocyclic peptides),不僅在溶液中具有明確的結構,還展現出跨膜穿透和口服生物利用的潛力。甚至更小巧的 4 到 5 個殘基組成的寡酰胺(Oligoamides)大環化合物也被成功合成,將蛋白質設計的邊界直接拓展到了小分子藥物的范疇。
在宏觀組裝層面,計算設計賦予了材料前所未有的對稱性和規模。從最初的簡單二聚體,到如今利用四個相互正交的組分,研究人員能夠設計出直徑高達 100 nm 的偽對稱(Pseudosymmetric)納米籠結構。這種模塊化的設計思路,讓蛋白質像樂高積木一樣可以無縫拼接。以此技術為基礎研發的二十面體納米顆粒,已經促成了全球首個從頭設計并獲批臨床使用的 COVID-19 疫苗(SKYCovione)。可以預見,通過設計對 pH 敏感的解離組分或整合具有靶向信號的亞基,未來的納米疫苗和藥物遞送系統將具備極高的組織特異性。
靶向深水區:高親和力結合蛋白的降維打擊
自然界中,抗體是執行識別和結合任務的主力軍。但在臨床應用中,抗體體積龐大、穩定性差且生產成本高昂。那么,能否用更小、更穩定的從頭設計蛋白質來替代甚至超越抗體呢?
答案是肯定的。如今,結合蛋白(Protein binders)的設計已經接近被徹底解決的邊緣。研究人員通過 RFdiffusion 和 Bindcraft 等工具,已成功設計出針對 200 多個不同蛋白質靶點的高親和力結合蛋白。
在抗病毒領域,設計的微型蛋白質能夠精準結合 SARS-CoV-2、流感病毒的刺突蛋白,甚至能中和致命的肉毒桿菌毒素和蛇毒。這些結合蛋白在經過部分擴散優化后,達到了皮摩爾(Picomolar)級別的結合親和力。更為關鍵的是,由于其結構高度緊湊且具有極高的熱穩定性,這類蛋白藥物無需冷鏈運輸,甚至可以制成鼻噴霧劑供大眾日常預防使用。
不僅如此,計算設計還攻克了傳統制藥領域公認的“不可成藥”靶點——內部無序區(Intrinsically disordered regions, IDRs)。這些區域缺乏固定的三維結構,傳統的鎖鑰模型在此完全失效。研究人員利用誘導契合(Induced fit)的概念,讓設計的蛋白質在結合過程中迫使 IDRs 采取特定的穩定構象。利用這一策略,針對致癌基因產物(如 β-連環蛋白)以及引發神經退行性疾病的 β-淀粉樣蛋白的結合蛋白已被成功開發出來。
在免疫調控方面,通過設計針對細胞因子受體的高親和力激動劑或拮抗劑(如 IL-2 和 IL-21 的模擬物),研究人員在動物模型中觀察到了極其強效的抗腫瘤活性。不僅如此,通過構建 EndoTags 等靶向溶酶體降解的標簽系統,結合蛋白可以精準招募 E3 泛素連接酶,實現對致病膜蛋白或胞外蛋白的靶向清除。
跨越能壘的煉金術:打造極高活性的定制酶引擎
如果說結合蛋白質是在玩“拼圖”,那么設計具備催化活性的酶(Enzymes)則是在挑戰化學反應的能量極限。
傳統的酶工程主要依賴對天然酶的定向進化,但這往往受限于天然骨架的原始屬性。從頭計算設計的最終目標,是為一個全新的化學反應從零開始定制完美的催化位點。這就要求設計的蛋白質結構必須能夠在原子級別精確排列催化基團,以極致的精度穩定化學反應的過渡態。
隨著大模型技術引入,我們看到了令人振奮的突破。研究人員不僅能夠設計針對特定小分子(如心臟病藥物地高辛 Digoxigenin 或抗癌藥物甲氨蝶呤 Methotrexate)的高親和力傳感器,還能直接針對酶的過渡態幾何形態進行骨架生成。
具體的數據令人驚嘆:以往針對模型化學反應(如 retro-aldol 反應)設計的酶,其催化效率(kcat/KM)僅為 180 M-1s-1。而借助新型生成工具(如 PLACER 深度學習方法)對催化位點預組織的篩選,新設計的熒光素酶(Luciferase)達到了 1400 M-1s-1,絲氨酸水解酶達到了 3800 M-1s-1。更引人矚目的是,一款從頭設計的鋅水解酶催化效率飆升至53000 M-1s-1,而在一些高度優化的絲氨酸水解酶設計中,這一數值甚至突破了 2.2 × 105 M-1s-1。
不僅如此,結合血紅素(Haem)等多核金屬簇輔助因子的酶也被成功設計。對于那些需要克服極高能壘的非自然化學反應,比如降解難降解塑料,基于全新骨架的金屬水解酶已經展現出了強大的應用潛力。
邏輯門與動態齒輪:喚醒未來的智能分子納米機器
掌握了靜態結構設計、分子結合以及化學催化之后,從頭蛋白質設計正在邁向它的終極形態:構建能夠對外界刺激做出動態響應、具備多穩態和邏輯運算能力的分子納米機器。
生命的底層邏輯往往伴隨著信息處理和能量轉換。研究人員設計出了名為LOCKR 的智能系統。這是一種能夠執行布爾邏輯(Boolean logic)運算的蛋白質開關。在嵌合抗原受體 T 細胞(CAR-T)療法中,它可以被設計成只有當靶細胞表面同時存在兩種特定的標志物(即執行“與”邏輯,AND logic)時,才會解除一段多肽的隱藏狀態,進而招募效應蛋白殺傷癌細胞,從而最大限度地減少對健康組織的誤傷。
在動態調控層面,研究人員開發出了由效應物(如特定肽段或鈣離子)驅動的變構組件。通過在一個遠離作用中心的位置結合效應肽,可以誘導整個蛋白質復合體解離或改變其寡聚狀態。動力學數據顯示,在這種變構肽的控制下,細胞因子信號的持續時間可以從原來的 1 小時精準縮短至 40 分鐘。
更具科幻色彩的,是這種定制能力正延伸向材料科學與可持續發展領域。研究人員設計出了能夠精確引導無機晶體成核的蛋白質模板,例如控制碳酸鈣(CaCO3)的多晶型結晶過程,以探索一種全新的二氧化碳(CO2)固定方案。在人工光合作用方向,成功設計出能夠容納且維持葉綠素特殊對(Chlorophyll special pairs)激子耦合的同源二聚體蛋白質,這為未來利用太陽能驅動的高效多電子化學反應奠定了物理基礎。
在這個領域,當前的核心挑戰已經不再是“如何設計”,而是“應該設計什么”。雖然在免疫原性驗證、大規模生物制造等方面仍有現實問題需要克服,但從頭蛋白質設計已經不可逆轉地重構了我們與分子世界的交互方式。可以預見,在接下來的十年中,整合了結合、催化和動態構象變化的智能生物材料,將帶領我們走向一個全面定制分子的新紀元。
參考文獻
Yang W, Wang S, Lee GR, Zhang JZ, Courbet A, Juergens D, Wang X, Schlichthaerle T, Abedi M, Ragotte R, An L, Kalvet I, Pellock S, Mihaljevic L, Glasscock C, Pillai A, Broerman A, Ennist N, Haefner E, McNamara-Bordewick N, Haydon I, Stewart L, Bhardwaj G, Baker D. The past, present and future of de novo protein design. Nature. 2026 Apr;652(8112):1139-1152. doi: 10.1038/s41586-026-10328-7. Epub 2026 Apr 29. PMID: 42056544.
轉載請注明來源于【游離的DNA】
聲明:本文僅用于分享,不代表平臺立場,如涉及版權等問題,請盡快聯系我們,我們第一時間更正,謝謝!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.