<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      哈佛、MIT Broad研究所發布MEDEA:組學智能體缺的是自知之明

      0
      分享至



      作者:論文團隊

      編輯丨ScienceAI

      在靶點篩選、合成致死判斷與免疫治療響應預測等治療發現場景中,AI 智能體需要串聯多個組學數據源、調用多種機器學習模型并檢索文獻來完成多步分析。但現有智能體普遍面臨兩個問題:一是大模型在長鏈分析中會逐步丟失用戶指定的生物學上下文(如把「初始型 CD4+ αβ T 細胞」模糊成「CD4+ T 細胞」),導致下游分析在錯誤粒度上進行卻不觸發任何報警;二是面對多源證據沖突時缺乏調和機制 —— 工具輸出、文獻檢索與大模型參數化知識給出矛盾結論時,系統無法做出可追溯的取舍。

      為此,哈佛醫學院隋芃瑋 / 高尚華 / Marinka Zitnik 團隊提出 MEDEA,一個在分析流程每一步都嵌入驗證機制的組學 AI 智能體。MEDEA 在靶點發現、合成致死推理、免疫治療響應預測三個場景上完成了 5,679 次完整分析,比單獨使用大模型的準確率最高提升 45.9%,且消融實驗表明性能提升的主要來源不是骨干模型的能力差異,而是驗證模塊的有無。



      論文地址:https://medea.openscientist.ai

      開源地址:https://github.com/mims-harvard/Medea

      方法設計

      MEDEA 接受自然語言描述的研究目標,使用 20 個專業工具執行多步分析,核心設計原則是在流程每一步嵌入驗證,而非僅在最終輸出時判斷對錯。

      系統由四個協同模塊組成。研究規劃模塊將自然語言目標轉化為分步研究計劃后,進行上下文驗證(每個步驟中的細胞類型、疾病等生物學實體是否與所選工具兼容)和完整性驗證(計劃的技術可行性與邏輯一致性)。例如,當用戶要求分析肝星狀細胞的靶點,但所選單細胞基礎模型的預訓練數據不包含該細胞類型時,上下文驗證會檢測到不兼容,引導智能體從可用的近似細胞類型中選擇替代方案并記錄替代理由。



      分析執行模塊在代碼執行前后各加一層驗證:執行前檢查語法與接口兼容性,執行后審計數據來源與輸出和計劃的一致性。即使代碼運行成功,如果輸出偏離研究計劃預期,也會被標記并觸發修正。

      文獻推理模塊在檢索完成后,先對每篇論文在物種、疾病、細胞類型等維度做相關性篩選,過濾不相關文獻后再進行證據綜合,避免「檢索到什么就用什么」的問題。

      多輪討論模塊以三個模型組成的評審團,對工具分析、文獻推理、骨干模型三條證據通路的輸出做加權投票與多輪辯論。證據收斂時給出結論,分裂或不足時選擇校準棄權 —— 即不回答。

      工具空間中有 4 個機器學習模型(PINNACLE、TranscriptFormer、COMPASS、OpenScholar),它們是被智能體調用的工具而非骨干模型。智能體根據疾病上下文動態選擇調用哪個模型。受限工具實驗表明,PINNACLE 在類風濕關節炎等疾病上更優,TranscriptFormer 在肝母細胞瘤等場景上更優,反映了蛋白質互作網絡拓撲與基因表達動態兩類信號的互補性。

      MEDEA 在三個開放式治療發現任務上跑了 5,679 次完整組學分析,覆蓋精準靶點發現(2,400 次,涵蓋 5 種疾病,29 個細胞類型)、合成致死推理(2,385 次,7 個癌細胞系)、以及患者級別的免疫治療響應預測(894 次,298 名膀胱癌患者)。





      細胞類型特異性靶點發現

      2,400 次分析,覆蓋類風濕關節炎、1 型糖尿病、干燥綜合征、肝母細胞瘤、濾泡性淋巴瘤五種疾病及 29 種細胞類型。MEDEA 比單獨使用大模型的準確率最高提升 45.9%。

      該場景的核心挑戰在于細胞類型粒度。大模型在多步分析中會逐步模糊細胞類型 —— 將用戶指定的「初始型 CD4+ αβ T 細胞」簡化為「CD4+ T 細胞」。在類風濕關節炎中,初始型與效應記憶型 CD4+ αβ T 細胞的致病角色截然不同,混淆會導致靶點推薦指向錯誤的生物學邏輯。加入上下文驗證后,MEDEA 在髓樣樹突細胞上的準確率提升 28.9%,在初始型 CD4+ αβ T 細胞上提升 21.7%—— 這些恰恰是上下文粒度直接決定靶點推薦質量的細胞類型。



      消融實驗揭示了一個結構性矛盾。大模型單獨使用時幾乎從不放棄回答(棄權率僅 1.8%),但跨五種疾病的平均錯誤率高達 69.2%—— 在 1 型糖尿病上甚至達到 80%。文獻檢索配置方向相反:77.6% 的分析選擇放棄回答,因為細胞類型特異性的靶點文獻確實太過稀缺。大模型的參數化知識覆蓋面廣但可靠性低,文獻證據可靠性高但覆蓋面窄,任何單一通路都無法同時滿足兩者,只有多條通路互相校驗才能兼顧。 完整 MEDEA 達到最高準確率和最低失敗率。



      合成致死推理:糾錯、補漏、止損

      2,385 次分析,覆蓋 MCF7、MCF10A、MDAMB231、CAL27、CAL33、A549、A427 七個癌細胞系。MEDEA 比骨干大模型最高提升 21.7%(MCF7)。

      MEDEA 在該場景下展現出三種行為模式。在至少 323 個大模型答錯的案例中給出了正確判斷(糾錯);在 175 個大模型棄權的案例中給出了正確答案(補漏);在 141 個大模型犯錯的案例中選擇棄權而非跟著錯(止損)。在藥物發現場景中,止損可能比糾錯更有價值 —— 一個錯誤的合成致死預測可能觸發昂貴的實驗跟進,而一個校準的棄權只會讓研究者多花時間尋找其他證據。



      系統整合了 DepMap 基因共依賴分數與通路富集分析,對基因對聯合抑制是否會選擇性殺死癌細胞做出可追溯的判斷。

      免疫治療響應預測

      894 次患者級別分析,基于 IMvigor210 膀胱癌隊列的 298 名患者。MEDEA 比大模型最高提升 23.9%。在高腫瘤突變負荷且非炎癥型微環境這一最困難的亞組中,MEDEA 修正了底層機器學習模型 50.9% 的誤分類。



      論文中的一個患者案例清晰展示了多源證據沖突時的決策過程。一名腫瘤突變負荷為 19.0 的男性患者,GPT-4o 和 Claude 3.7 Sonnet 均基于高突變負荷預測「響應」。MEDEA 調用 COMPASS 分析腫瘤轉錄組后發現 T 細胞耗竭嚴重(評分 0.5067)、B 細胞浸潤極低(0.0260),微環境整體呈功能失調;而文獻檢索恰恰支持「高突變負荷→好響應」的關聯 —— 兩條證據直接矛盾。經多輪討論調和后,MEDEA 判定微環境功能障礙信號優先于突變負荷的統計關聯,預測「不響應」。患者實際結局為疾病進展。整個決策鏈路可追溯。



      驗證機制的貢獻大于骨干模型的選擇

      消融實驗中最核心的發現:MEDEA 的性能提升并非來自更強的骨干大模型。 無論使用 GPT-4o 還是 Claude 3.7 Sonnet 作為骨干,加入驗證模塊后性能顯著提升,去掉后顯著下降。這意味著當前組學智能體的性能瓶頸可能不在推理能力,而在過程可靠性。

      MEDEA 的輸出不是一個標簽或分數,而是一份包含完整推理鏈路的分析報告 —— 研究計劃、每步工具調用與輸出、文獻檢索與相關性評分、證據調和的決策過程。對于需要向團隊解釋「為什么推薦這個靶點」或「為什么判斷該患者不響應」的場景,這種可審計的輸出形態具有直接的實際價值。

      代碼、評測基準和全部工具配置均已開源,模塊化設計支持選擇性集成。論文同時指出局限性:評測基準依賴已有單細胞圖譜和特定患者隊列,部分評測依賴大模型評審,工具本身編碼了細胞類型粒度等假設,評審團式共識模塊存在關聯錯誤風險。

      在藥物發現中,一個自信的錯誤答案往往比一句誠實的「我不確定」代價更高。MEDEA 的校準棄權 —— 在證據不足時選擇不回答 —— 或許是這項工作中最具實際價值的設計。

      聲明:包含AI生成內容

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      上海日料餐廳傷人案 目擊者稱人生最恐怖經歷 受傷者按腹鮮血直流

      上海日料餐廳傷人案 目擊者稱人生最恐怖經歷 受傷者按腹鮮血直流

      東瀛萬事通
      2026-05-21 14:26:05
      爭議!國際足聯重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

      爭議!國際足聯重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

      念洲
      2026-05-21 08:02:07
      大模型狂飆的盡頭,這家國產 GPU 廠商要把算力放在客廳

      大模型狂飆的盡頭,這家國產 GPU 廠商要把算力放在客廳

      愛范兒
      2026-05-21 17:11:34
      國宴上桌,高層調研:一家民企密集被“看見”,什么信號?

      國宴上桌,高層調研:一家民企密集被“看見”,什么信號?

      智谷趨勢
      2026-05-20 17:04:05
      “同一批楊梅,合格飛歐洲,泡藥發全國”,這拷問讓人更扎心!

      “同一批楊梅,合格飛歐洲,泡藥發全國”,這拷問讓人更扎心!

      迷世書童
      2026-05-21 17:53:04
      日本公務員有多窮?你既然選擇穩定,就必須接受清貧

      日本公務員有多窮?你既然選擇穩定,就必須接受清貧

      生活時尚導刊
      2026-05-20 21:48:34
      烏戰熱點:呂特對俄發出毀滅性警告,俄名嘴狂言斬首澤連斯基

      烏戰熱點:呂特對俄發出毀滅性警告,俄名嘴狂言斬首澤連斯基

      史政先鋒
      2026-05-21 17:03:55
      606票:16票,歐盟報復開始,對中國進口鋼鐵征收50%關稅

      606票:16票,歐盟報復開始,對中國進口鋼鐵征收50%關稅

      流史歲月
      2026-05-21 14:25:07
      小米YU7標準版發布,售價23.35萬元起

      小米YU7標準版發布,售價23.35萬元起

      界面新聞
      2026-05-21 19:45:42
      日本宮城縣附近海域發生5.2級地震

      日本宮城縣附近海域發生5.2級地震

      財聯社
      2026-05-15 19:28:05
      生產線上87個攝像頭的全球壟斷:350億美元反壟斷大案,7名中國高管全球通緝

      生產線上87個攝像頭的全球壟斷:350億美元反壟斷大案,7名中國高管全球通緝

      風向觀察
      2026-05-21 17:02:11
      法國法院裁定法航和空客在2009年空難中“過失殺人”罪名成立

      法國法院裁定法航和空客在2009年空難中“過失殺人”罪名成立

      新華社
      2026-05-21 21:03:03
      女子華為手機漏液要求免費維修,被客服反問:你賬號粉絲量多少?

      女子華為手機漏液要求免費維修,被客服反問:你賬號粉絲量多少?

      互聯網大觀
      2026-05-21 10:42:06
      法網女單抽簽:鄭欽文首輪戰資格賽選手 32號種子王欣瑜戰塔格爾

      法網女單抽簽:鄭欽文首輪戰資格賽選手 32號種子王欣瑜戰塔格爾

      醉臥浮生
      2026-05-21 20:42:34
      人民大會堂女服務萬里挑一!她們是啥編制?選拔標準有多嚴?

      人民大會堂女服務萬里挑一!她們是啥編制?選拔標準有多嚴?

      復轉這些年
      2026-05-20 19:44:43
      越扒瓜越大!交大女學生吞獎金再添猛料,不止想進體制內這么簡單

      越扒瓜越大!交大女學生吞獎金再添猛料,不止想進體制內這么簡單

      觀史搜尋著
      2026-05-21 05:41:15
      河南村鎮銀行:儲戶存款無法兌付!時間已逾4年,儲戶欲哭無淚

      河南村鎮銀行:儲戶存款無法兌付!時間已逾4年,儲戶欲哭無淚

      胡侃社會百態
      2026-05-21 17:30:06
      61歲郭富城參觀方媛舅舅的飯店,和一幫親戚喝酒,獲外婆擁抱送別

      61歲郭富城參觀方媛舅舅的飯店,和一幫親戚喝酒,獲外婆擁抱送別

      一盅情懷
      2026-05-21 16:23:41
      菜市場泡“藥水”的7種蔬菜,業內人從不食用,普通人卻天天買

      菜市場泡“藥水”的7種蔬菜,業內人從不食用,普通人卻天天買

      復轉這些年
      2026-05-21 19:34:04
      上海交大對樊同學的“嚴重警告”,有多嚴重?

      上海交大對樊同學的“嚴重警告”,有多嚴重?

      呦呦鹿鳴
      2026-05-21 17:18:49
      2026-05-21 21:43:00
      ScienceAI incentive-icons
      ScienceAI
      關注人工智能與其他前沿技術
      1307文章數 227關注度
      往期回顧 全部

      科技要聞

      小米YU7 GT正式發布:售價38.99萬元

      頭條要聞

      中紀委連打三"虎":一人被指違規核發機動車號牌

      頭條要聞

      中紀委連打三"虎":一人被指違規核發機動車號牌

      體育要聞

      常住人口7000的小鎮,擁有了一支德甲球隊

      娛樂要聞

      反轉!金秀賢與金賽綸未成年時交往不實

      財經要聞

      潮水退去,裸泳的一定不止五糧液

      汽車要聞

      后驅+閃充+激光雷達 第三代元PLUS上市售11.99萬元起

      態度原創

      游戲
      數碼
      房產
      家居
      親子

      《房產達人2》櫻花DLC現已正式發售!

      數碼要聞

      小米米家中央空調強勁風風管機系列開售,國補價5524.2元起

      房產要聞

      順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學之約

      家居要聞

      風格碰撞 個性與藝術

      親子要聞

      家長如何快速判斷孩子脊柱是否有異常 | 科普一下

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 无码人妻丰满熟妇啪啪网不卡| 国产精品深夜福利免费观看| 延庆县| 亚洲码在线中文在线观看| 亚洲国精产品| 忘忧草在线社区www中国中文| 人妻系列无码专区无码中出| 成都市| 亚洲AV无码乱码国产精品久久| 无码人妻丰满熟妇区毛片18| 精品夜恋影院亚洲欧洲| 国产稚嫩高中生呻吟激情在线视频| 老司机在线精品| 国产精品无码av天天爽| 91无码人妻精品一区| 午夜丁香婷婷| 伊人在线亚洲| 一区二区三区四区亚洲综合| 亚洲国产天堂久久综合226114| www.久久99| 天天干白白操| 少妇下面被精子填满视频| 欧美男男GAYGAY巨大粗长肥| 亚洲AV无码AV在线影院| 免费超爽大片黄| 电影人妻少妇边接电话边娇喘| 亚洲3p| 污网站免费在线观看| a亚洲欧美中文日韩在线v日本| 日本丰满熟妇videossex一| 国内揄拍国内精品人妻久久| 国产中文字幕精品在线| 亚洲AV中文无码字幕色本草| AV成人| 麻豆AV无码久久精品蜜桃久久| 久久亚洲国产的中文| 无码人妻丰满熟妇区毛片| 亚洲精品一区二区五月天| 国产在线午夜不卡精品影院| sihu国产午夜精品一区二区三区| 国产浮力第一页|