百位臨床專家專業把關,國際頂刊內容注入,醫學AI要走進診室,首先要過的不是技術關,而是信任關。
撰文丨凌 駿
![]()
醫學AI賽道從不缺熱鬧。
大模型、智能問答、輔助診斷……過去 幾 年, 醫學AI工具層出不窮,可對 醫生群體 而言 ,一個問題始終懸而未決——AI給出的答案,能信嗎?
這不是技術潔癖,而是現實 的 顧慮。日常 生活中 , AI的“幻覺”現象 或許只是一次無傷大雅的誤差;但在醫學領域,一條虛構的文獻引用,一個編造的用藥劑量,都可能將臨床決策引向危險的方向。
面對這一痛點,一款新的 醫學AI 工具 給出了一套不同于行業主流的解法——不卷模型參數,轉而從 “ 內容源頭 ” 和 “ 輸出把關 ” 兩個維度同時下手。
5月13日,阿里健康旗下 的 醫學AI助手 “ 氫離子 ” 正式發布 , 由超 300位中國臨床專家 組建起“ 醫學AI專家委員會 ” ,并 宣布與英國BMJ集團(BMJ Group)達成期刊內容獨家合作 。
一邊是數百位中國臨床專家的專業判斷力把關 , 一邊是國際頂刊的前沿內容注入 。 當這兩股力量同時匯入一個AI模型,醫學AI或許才真正具備了走進診室的資格。
![]()
AI能答, 但醫生敢不敢信?
循證醫學引入中國 已 近三十年, 其 價值 早已不言而喻 。 但在高強度的臨床節奏下,如何高效獲取、篩選并應用最新的醫學證據,仍是一道現實難題。
北京某三甲醫院腫瘤內科住院醫師盧醫生對此深有體會。她告訴“醫學界”,腫瘤學的知識更新極快,幾乎每隔一陣就有新的臨床試驗結果公布,頂刊上的新發現,可能會直接影響第二天的治療策略。
“但現實是文獻更新的速度,遠快于人工檢索、學習并總結的效率。”盧醫生認為,在高強度的臨床節奏下,醫生很難實時追蹤每一條前沿進展,想把循證要求完全落到實處,并不容易。
這 也 并非個別科室的困擾。 溫州某三甲醫院急診科溫醫生同樣提到,急診科病種繁雜、病情瞬息萬變,遇到疑難病例時,醫生往往需要跨多個專業檢索平臺,才能找到可靠的臨床證據,“整個過程非常繁瑣費時”。
這種情況下, AI工具的出現 一度 被寄予厚望 , 可 當醫生們真正上手后, 又 遇到了新的問題。
盧醫生告訴“醫學界”,她曾嘗試用通用AI檢索文獻,即便明確要求提供準確的DOI號,點開鏈接卻發現是一篇毫不相關的文章。“這不但沒節省時間,反而增加了驗證成本。”溫醫生也有類似經歷,有些回答給出的引用,根本查不到出處。
虛構文獻, 編造 結論 …… 通用AI的 “ 幻覺 ” 問題,在其他領域或許只是不便, 但 在醫學場景中卻可能釀成真正的風險 , 也是醫生們難以信任AI最根本的原因。
正是基于這一 痛點 , 阿里健康在開發“ 氫離子 ” 之初,就 將核心定位 瞄準 在六個字上:低幻覺,高循證。 換句話說,“氫離子” 要解決的,不是 “ AI能不能回答醫學問題 ” ,而是 “ 醫生敢不敢信AI的回答 ” 。
為此, “ 氫離子 ” 構建了一套完整的循證鏈路 。
為了確保 所有回答均 能 標注權威出處,支持一鍵溯源 ,“ 氫離子 ” 錄入 了 千萬級醫學核心期刊文獻, 并 打通 了“ 中外文獻檢索 —— 翻譯 —— 解析 —— 可溯源回答 ” 的全流程 ,覆蓋從問題提出到證據驗證的完整工作流。
同時, 氫離子還首次將時效性與權威性融入引用邏輯——通過對全球指南與文獻的日更追蹤,每一個回答都能精準定位到原文中支撐觀點的具體語句,并同步校驗其時效性與可信度 , 精準指出 “ 引用的 哪句話 ? 為什么可信 ? 此刻是否仍然有效 ?”。
![]()
盧醫生告訴“醫學界”,在“氫離子”的輔助下,目前她已經形成了一套熟練的工作流:準備學術匯報時,先用通用AI生成大綱初稿,再用“氫離子”搜索權威文獻、翻譯精讀、提煉總結。“它給出的每一條引用,我都能查到真實出處,這是讓我最放心的。”
讓證據可得、可用、可信 , 在面對 循證醫學落地 的 “ 最后一公里 ” 時,這是“氫離子”所給出的回答。
醫學循證,靠什么保障?
“ 低幻覺 ” 三個字說起來簡單,但在醫學場景中,靠什么來保障?
當行業多數產品還在卷模型參數、卷問答的流暢度時,氫離子選擇了另一條路徑——從 “ 內容源頭的權威性 ” 和 “ 輸出質量的專家把關 ” 兩個維度,同時建立壁壘。
在內容源上, “ 氫離子 ” 沒有選擇依賴互聯網上質量參差不齊的公開信息,而是基于千萬級國際頂尖期刊文獻、國內外權威臨床指南與共識以及藥品說明書,構建了一套專用的循證數據庫。
據 阿里健康CTO王祥志 介紹,“ 氫離子 ” 有別于其他通用大模型的底層技術邏輯 , 是 四層循證AI架構 。
“ 第一層 是 證據理解與內容體系,所有指南和文獻在進入系統時,都會基于PICO框架和GRADE標準進行結構化理解 ; 第二層基于PICO的檢索與數據增強,保證輸出的每一句話都有據可查 ; 第三層 是 模型強化與微調 , 讓模型學會 ‘ 什么是準確、忠實循證、安全有用的答案 ’ ,并確保滿足循證醫學的嚴格標準。 ”
而 第四層, 則是由 醫學專家評審體系完成質量 的 閉環。
在此次 發布會上, “ 氫離子 ” 正式宣布成立 “ AI醫學專家委員會 ”, 由 黃曉軍教授、肖瑞平教授、于金明教授等10位國內各學科頂級專家 領銜 ,負責整體學術方向把關 。
同時, 50位指導委員會成員 負責 制定評測標準與方法論;數百位來自復旦100強醫院 的 評測醫生, 則 對AI回答進行驗證與反饋。
值得一提的是,這并非一次性的“專家亮相”。專家的定期評測結果,將持續地反饋到產品的迭代中,經確認后統一納入“氫離子”的實時知識庫更新,形成了“用——評——改”的循環。
肖瑞平教授在發布會上表示,AI對醫學的影響是方方面面的,但越往前走,越需要標準、需要底線、需要方向。 “ 什么樣的AI是安全的?什么樣的模型是可信的?這些問題不只是靠技術來解決,必須由臨床、由科學證據、由規范治理來回答。”
肖瑞平 教授 指出,專家委員會的三級架構設計——顧問委員會把握方向,指導委員會制定標準,評審委員會扎實做好臨床驗證——是一種務實、專業、可長久 運行的 模式。 “ 我們不是 走個形式 ,而是要面向臨床,建立一個經得起檢驗的、有循證基礎的AI評價體系。 ”
從內容源頭的權威性,到輸出質量的專家把關,這套 “ 頂刊授權+ 專家 審核 ” 的雙保障體系, 都指向了一個核心 目標:讓每一條AI輸出 , 都 能 經得起臨床驗證。
當國際頂刊投出“ 信任票 ”
發布會上另一個引發廣泛關注的信號,來自國際頂刊英國BMJ集團 。
“ 氫離子 ” 宣布, 成為BMJ集團在中國獨家合作的醫學AI平臺 , 包括 《英國醫學雜志》 在內, BMJ集團 旗下 70本醫學期刊 的所有 內容和多媒體資源 , 將獨家授權提供給“氫離子 ”。 同時,“ 氫離子 ” 目前還正在 與全球多家頂刊進行合作溝通。
![]()
國際頂刊篩選合作對象的標準素來嚴苛,其判斷“獨家內容授權”的依據,不僅是模型參數和用戶規模,更是對產品循證能力與專業內容把控水準的專業認可。
因此,對于一款將貫穿醫生日常工作的AI工具來說, 這張 “ 信任票 ” 的分量不言而喻。
依托此次合作, 中國醫生可以通過 “ 氫離子 ” 直連全球頂級醫學文獻,進行循證問答、全文閱讀、在線翻譯,解決臨床與科研過程中的醫學問題。
B MJ集團出版業務首席執行官Niels Peter Thomas博士 表示:“ BMJ集團致力于提供優質醫學知識、促進全球健康事業的發展。將期刊文章內容接入人工智能醫學平臺 ‘ 氫離子 ’ ,是突破傳統知識獲取方式的一次創新,期待能以此更好、更多地服務中國醫生。”
當AI 的所有 回答 , 都可溯源至頂刊原文或國內權威指南,當每一次輸出都經過專家委員會的驗證, “ 氫離子 ” 實際上建立 的,是 一套 “ 循證問答 標準 ” ——什么樣的信息源可以被引用,什么樣的輸出質量才算合格,什么樣的迭代機制才能持續可信。
這不只是一個產品的能力邊界,更可能深遠影響中國醫生的臨床決策習慣:從 “憑經驗判斷” 到 “ 有據可查 ” ,從 “ 我覺得 ” 到 “ 證據顯示 ” 。
肖瑞平教授 認為 ,面向全球醫學 AI 快速發展的格局,中國需要有自己的權威學術聲音,需要有立足臨床實踐、符合中國國情、經得起國際檢驗的醫學 AI 標準體系。
“ 我們有決心 ,也 有能力,匯聚全國頂尖學術力量,以嚴謹態度、科學方法、臨床實踐,打造屬于中國、服務中國,并能走向世界的醫學 AI 標準,為全球醫學 AI 治理貢獻中國智慧與中國方案。 ” 肖瑞平教授 說。
*“醫學界”力求所發表內容專業、可靠,但不對內容的準確性做出承諾;請相關各方在采用或以此作為決策依據時另行核查。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.