![]()
編輯丨%
2026 年 4 月 16 日,為支持生物學、藥物發現和轉化醫學研究,OpenAI 推出了他們專門打造的前沿推理模型 GPT-Rosalind。生命科學模型系列針對科學工作流程進行了優化,結合了工具的改進與對化學、蛋白質工程和基因組學的深入理解。
在美國,從靶點發現到新藥獲得監管批準,平均大約需要 10~15 年時間。生命科學的進步不僅受限于基礎科學的難度,還受限于研究工作流程本身的復雜性。科學家必須跨越大量文獻、專業數據庫、實驗數據和不斷演變的假設,以產生和評估新想法。這些工作流程通常耗時、分散且難以擴展。
OpenAI 相信先進的人工智能系統可以幫助研究人員更快地完成這些工作流程——不僅通過提高現有工作效率,還幫助科學家探索更多可能性,揭示可能被忽視的聯系,并更早得出更好的假設。
通過支持證據綜合、假設生成、實驗規劃及其他多步驟研究任務,該模型旨在幫助研究人員加速早期發現階段。隨著時間推移,這些系統可以幫助生命科學組織發現原本不可能實現的突破,成功率也會大幅提升。
GPT-Rosalind 現已作為研究預覽版,通過團隊的可信訪問計劃,在 ChatGPT、Codex 及 API 中向合格客戶開放。此外,更有可免費訪問的生命科學研究插件,幫助科學家將模型連接到 50 多個科學工具和數據源。
![]()
圖示:看看 GPT-Rosalind 套件如何轉化為可衡量的研究工作流程改進。
性能與評估
團隊評估了 GPT-Rosalind 在科學發現和工業研究基礎上的多項能力。這些評估衡量了跨科學子領域的核心推理,包括化學反應機制;蛋白質結構、突變效應和相互作用;以及 DNA 序列的系統發育解釋。
他們還通過解讀實驗結果、識別專家相關模式,并綜合外部信息評估模型是否能支持真實的研究工作流程,設計后續實驗。最后,他們測試模型是否能夠選擇并使用合適的計算工具、數據庫和領域特定能力來增強推理。綜合來看,這些評估顯示了科學研究全過程的進展,表明他們更有效地幫助研究人員完成具有挑戰性的發現任務。
![]()
圖示:GPT-Rosalind 提升核心生物和化學基準。
此外,團隊提供了部分可供參考的提示詞,分別對應了有機化學、蛋白質理解、基因組學、實驗設計與分析、工具使用等方面。
![]()
圖示:工具使用相關的提示詞。
行業評估
OpenAI 團隊通過一系列公開基準測試評估了 GPT-Rosalind。在 BixBench 基準測試中,該基準以真實世界生物信息學和數據分析為核心,GPT-Rosalind 在已發布評分模型中取得了領先表現。
![]()
圖示:GPT-Rosalind 在 BixBench 上表現出的領先性能。
在 LABBench2 這一衡量文獻檢索、數據庫訪問、序列操作和協議設計等多種研究任務表現的基準測試中,GPT-Rosalind 在 11 項任務中有 6 項優于 GPT-5.4。最顯著的改進來自 CloningQA,它要求為分子克隆協議設計 DNA 和酶試劑的端到端。
此外,團隊還與 Dyno Therapeutics(在 AI 設計基因療法領域具有先驅性) 合作,利用未發表、未受污染的序列,在 RNA 序列到功能預測和生成任務中評估該模型。該表現與 57 項人工智能-生物領域人類專家的歷史評分進行了比較。并在 Codex 應用中直接評估時,預測任務排名超過人類專家的第 95 百分位,序列生成任務中人類專家的排名約為第 84 百分位。
這些評估為科學家每天依賴的,用于產生證據、分析復雜數據并朝向可辯護的生物學結論邁進的工作流程,提供了有意義的表現信號。
連接科學家所用的工具
科學家可采用 OpenAI 團隊開發的,適用于 Codex 的新生命科學研究插件。該軟件包包含一套廣泛的模塊化技能,適用于大多數常見的研究工作流程,旨在幫助用戶跨越人類遺傳學、功能基因組學、蛋白質結構、生物化學、臨床證據及公共研究發現等領域工作。
https://github.com/openai/plugins/tree/main/plugins/life-science-research
這些技能作為協調層,幫助科學家更有效地處理寬泛、模糊且多步驟的問題。它們提供50多個公共多組學數據庫、文獻來源和生物學工具的訪問,并為蛋白質結構查找、序列搜索、文獻綜述和公開數據集發現等常見可重復工作流程提供靈活的起點。
入門操作與未來
研究組織可通過相關的資格認證和安全審核流程申請訪問權限。
https://openai.com/form/life-sciences-access/
在研究預覽期間,使用該模型不會消耗現有的信用點或代幣——但會受到濫用保護措施的影響。隨著項目擴展,團隊后續將分享更多價格和供應信息。
生命科學模型旨在幫助科學組織在需要技術能力和運營控制的環境中,更快地完成更高質量的工作。
這是 OpenAI 生命科學系列首個模型的發布,他們認為這是構建能夠加速科學發現的人工智能的長期承諾的開始,這些人工智能能夠加速從人類健康到更廣泛的生物研究等對社會極為重要的領域。團隊將繼續改進模型的生物學推理,擴大對工具密集和遠景研究流程的支持,并與領先科學機構緊密合作,評估其現實世界影響。
團隊同樣在探索人工智能引導的蛋白質和催化劑設計,包括人工智能系統在保留或改善關鍵功能特性的同時修改生物結構的能力。隨著時間推移,他們預計這些系統將成為越來越有能力的發現伙伴——幫助科學家更快地從問題走向證據,從證據到洞察,從洞察到患者新療法。
https://openai.com/index/introducing-gpt-rosalind/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.