![]()
如果生物學不再只是我們研究的對象,而是成為我們主動設計的材料,會怎樣?這正是Adrian Woolfson新書《物種的未來:借助人工生物智能創作生命》的核心命題。該書于4月28日由MIT出版社出版。他認為,AI與DNA合成技術的進步正在推動生物學走向一種工程化范式——科學家可以生成全新的基因序列,并最終按需構建生命體。他將這種新興能力稱為"人工生物智能"(ABI),這是一個涵蓋設計、構建并最終"啟動"生命體的系統的統稱。
然而,這一愿景面臨一個根本性難題:進化并沒有產生整潔、模塊化的系統,而是經過數十億年的漸進變化,塑造出功能相互交疊、結構混亂的基因組,與工程師所依賴的清晰架構相去甚遠。部分合成生物學研究者已嘗試對遺傳密碼進行"重構"——就像工程師重組計算機代碼一樣,對基因組進行重新整理,使其更易于理解和操控。但這種方法能走多遠?要讓生物學變得足夠可預測以供工程化應用,又需要什么條件?在與IEEE Spectrum的對話中,Woolfson闡述了設計生命的前景與局限。
您將基因組描述為進化產生的"意大利面條代碼"。是什么讓生物學天然與傳統工程原則格格不入?
Adrian Woolfson:在人造機器中,各組件通常是相互獨立的,每個組件都有預定功能。一旦某個組件損壞,你可以直接替換,或在某些情況下修復它。但遺憾的是,生物學并非如此。生物學涉及的是一個具有涌現行為的復雜網絡,這些行為建立在無數組件的微小貢獻之上。
生物系統需要具備魯棒性,能夠高效應對損傷,而且它始終必須在已有架構的基礎上繼續構建,永遠無法從頭重新發明。生物機器是歷史積淀與當前設計的復雜交織,其中包含許多工程師看來荒謬的設計組件。如果你從工程學角度審視人類基因組,你會說:"天哪,這簡直是一團亂麻。"因為它是以機會主義、漸進式的方式構建起來的,沒有任何預見性或主動設計。
合成生物學家如何改進這套"代碼"?研究人員是如何對基因組進行重構的?
Woolfson:Drew Endy是這一領域的先驅。他以一種噬菌體為對象,提出:"如果我們把它當作一段意大利面條代碼,對其進行清理、重構,重新整理成更易用的形式,會怎樣?"遺憾的是,他提出這個想法的時候,相關技術還遠未成熟,無法輕松實現。但他開創了將計算機代碼思維應用于基因組的先河,提出了基因組可以被重構的理念。基因組已經大約四十億年沒有經過重構了——想象一下,如果有一段計算機代碼四十億年都沒有被重構過,會是什么狀態。
這項工作目前進展如何?
Woolfson:最好的例子可能是由Jef Boeke在紐約主導的合成酵母基因組項目Sc2.0。這個項目歷時約15年,他一直在將各條合成染色體逐步組裝進同一個生命體中。他所做的不僅僅是重構,更是真正意義上的重新設計。例如,酵母菌有16條染色體,而他構建了一條全新的第17條合成染色體。在另一項獨立研究中,他還證明可以將這16條染色體合并為兩條超大染色體,這是對遺傳物質存儲方式的重大重組。
但當你開始對這些基因組進行改動和重新配置時,不可避免地會引入代碼錯誤,而這些錯誤往往會損害功能和生長。這并不意味著重新設計必然會造成生長障礙,只是需要投入時間去找到最優方案。當然,Boeke起步時AI還不存在,而AI的出現讓這一切變得容易得多。AI將對我們把DNA轉化為可預測工程材料的能力產生深遠影響。
說到AI,您提出了"人工生物智能"(ABI)這一概念。AI將賦予我們哪些目前尚不具備的能力?
Woolfson:在AI出現之前,我們沒有能力大規模設計DNA,無法憑空創造出能在生命體層面執行功能的全新DNA序列。現在,我們有了所謂的基因組語言模型,它有點像我們用來處理文本的聊天機器人,但操作的不是英文字母表的26個字母,而是DNA語言的4個堿基字母。
在操控DNA語言時,我們需要非常寬的上下文窗口,因為與文本不同——文本的大部分含義集中在句子或段落中——DNA中相距遙遠的區域之間也可以相互"對話"。因此,我們需要能夠識別這種遠程作用關系的AI。以基因組語言模型Evo 2為例,它采用的架構擁有一百萬個堿基對的上下文窗口,這意味著它能夠識別相距一百萬個堿基的堿基對之間的相互作用。
設計代碼只是成功的一半。研究人員如何解決大規模物理合成DNA的瓶頸問題?
Woolfson:另一個過去所缺乏的關鍵能力,是以低成本、高速度、高效率大規模合成任意復雜度DNA的能力。當設計與構建這兩種能力結合在一起,你就成為了一名工程師。一項名為Sidewinder的技術實現了成本的大幅降低,它能夠以高度并行的方式構建DNA,從而極大地降低了DNA合成的成本,并提升了可擴展性。僅憑這一點,就使得將DNA作為工程材料的設想變得更加可行。
完成DNA的設計與合成之后,如何"啟動"一個活的生命體?
Woolfson:這可能是最困難的部分。因為目前我們完全不知道如何構建一個人工細胞。Craig Venter曾證明,可以破壞細菌中的基因組并植入一個新的基因組——換句話說,細胞的行為類似于一臺納米計算機,而基因組則類似于軟件。但將基因組導入細胞并非易事。
ABI這一概念涵蓋了設計能力和構建能力,同時也包括將其啟動為活體生命的能力。如果你同時具備這三種能力,你就完全掌握了作為技術的生物學。到那時,DNA將成為一種可編程材料,可以以可預測的方式加以操控。
如果研究人員真正掌握了這種能力,將會實現什么?
Woolfson:我的預測是,在未來50年內,生物學將成為首選的工程材料,許多讀到這篇文章的人將成為生物工程師。生物學能夠實現大多數材料所具備的功能,例如蜘蛛絲的抗拉強度堪比鋼鐵。當我們用AI對其進行重新設計后,其抗拉強度或許能達到鋼鐵的五倍。而且生物學還有一個額外優勢——它能夠生成智能材料。試想,如果你能擁有一種智能形態的鋼鐵,工程師將如何在建筑中加以應用?
從零開始設計一個功能性多細胞生命體,最難突破的技術瓶頸是什么?
Woolfson:我認為是我們對"生命語法"的認知還遠遠不夠。AI恰好是解析這些語法規則的利器,它能夠分析海量數據庫,從中識別規律。在我們能夠更流利地"說"DNA語言之前,我們無法設計出復雜的多細胞生命體;而要做到這一點,我們需要理解其語法;要理解語法,我們需要挖掘更復雜、更細致的數據庫。我們需要成為"語法獵人"。每當我們讓一個物種滅絕,就是在銷毀這本語法書中的一頁。我們需要將所有信息匯聚成一本完整的語法書。
最后,在踏上工程化生命這段旅程之初,現實中可能出現哪些失敗模式?
Woolfson:我可以從兩個角度來理解"失敗模式"。一是機械性失敗:當你剝離掉所有這些非正交性時,系統會變得脆弱,因為生物機器本是為了不失敗而設計的,內置了大量相互重疊的故障保護機制。
另一種失敗方式是變得危險。我們對生態系統的理解還遠遠不夠,它們極難進行計算模擬。如果我們將工程化生命體釋放到復雜的生態系統中,可能會造成嚴重破壞。而且,這些技術本身一旦落入錯誤的手中,就具有內在的危險性。因此,我們需要學會以安全、負責任、合乎倫理、透明且公平的方式使用它們,使其真正造福社會。
Q&A
Q1:什么是人工生物智能(ABI)?它和普通AI有什么區別?
A:人工生物智能(ABI)是Adrian Woolfson提出的概念,指能夠設計、構建并最終"啟動"活體生命的系統。與通用AI不同,ABI專門針對生物學領域,結合了基因組語言模型、大規模DNA合成技術以及將基因組導入細胞的能力。普通AI處理文本或圖像,而ABI操控的是DNA的四個堿基字母,目標是讓生物學成為像軟件一樣可編程的工程材料。
Q2:合成酵母基因組項目Sc2.0取得了哪些成果?
A:Sc2.0由Jef Boeke在紐約主導,歷時約15年。項目不僅對酵母基因組進行了重構,更實現了真正意義上的重新設計:在原有16條染色體的基礎上,構建了全新的第17條合成染色體;另一項研究還證明可以將16條染色體合并為兩條超大染色體,實現了遺傳物質存儲方式的重大重組。但重新配置基因組不可避免地會引入錯誤,影響功能和生長,需要持續優化。
Q3:基因組語言模型Evo 2有什么特別之處?
A:Evo 2是一種專門處理DNA序列的AI模型,其最大特點是擁有一百萬個堿基對的超大上下文窗口。這一設計至關重要,因為DNA中相距遙遠的區域之間也存在相互作用,普通的小上下文窗口無法捕捉這種遠程調控關系。Evo 2能夠識別相距一百萬個堿基的堿基對之間的相互作用,為大規模基因組設計提供了關鍵的技術支撐。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.