AI具備主任級醫(yī)師答題能力：是替代威脅還是能力放大？

2025-07-24 20:55:28　來源: 健聞咨詢

北京舉報

分享至

7月23日，夸克健康大模型通過國內(nèi)12門核心學(xué)科主任醫(yī)師筆試評測，成為首個完成這一挑戰(zhàn)的大模型。這距離它通過副主任醫(yī)師考試僅僅過去兩個月。AI能通過這樣的測試，至少在考試場景下已具備了接近主任醫(yī)師的答題水平。

主任醫(yī)師考試難度大、要求高，不僅考查考生對海量醫(yī)學(xué)知識的掌握程度，更注重對臨床綜合能力的考量，要求考生能夠像真正的醫(yī)生一樣分析復(fù)雜病例、權(quán)衡各種診療路徑。

在醫(yī)療AI普遍停留在“臨床執(zhí)業(yè)醫(yī)師”初級水平的當(dāng)下，這場“兩級跳”不僅是技術(shù)突破，更意味著AI從“醫(yī)學(xué)知識記憶”向“臨床思維推理”的關(guān)鍵跨越。雖然考試和真實臨床還有距離，但這一進展讓人對醫(yī)療AI多了幾分信心。

“做題”到“看病”,AI學(xué)會了醫(yī)生的“慢思考”

據(jù)夸克健康運營負(fù)責(zé)人趙存忠透露，早在2018年，夸克就開始了在醫(yī)療領(lǐng)域的探索，做內(nèi)容+工具平臺，除了面向普通用戶早期的健康問題，也服務(wù)醫(yī)學(xué)生關(guān)于專業(yè)學(xué)習(xí)的需求。如今有超200萬人的醫(yī)學(xué)生使用夸克搜索醫(yī)療考試題目。

隨著大模型技術(shù)能力的進步，夸克健康在持續(xù)進化。這次主任醫(yī)師考試為例，夸克健康大模型具備了“臨床綜合能力”，即不僅記得住知識，還能像醫(yī)生一樣分析病例、權(quán)衡診療路徑。對用戶來說，具備這一能力的夸克能幫他們輕松獲取深度思考后的專業(yè)醫(yī)療內(nèi)容，既有專業(yè)還有溫度，體驗拉滿。

北京大學(xué)醫(yī)學(xué)部皮膚與性病學(xué)系主任、北京大學(xué)人民醫(yī)院皮膚科副主任、主任醫(yī)師李厚敏評論稱，夸克健康大模型在皮膚科案例測試中表現(xiàn)全面，針對“28歲女性結(jié)節(jié)囊腫型痤瘡”問題，給出的方案涵蓋治療調(diào)整，瘢痕色素管理，皮膚屏障修復(fù)及心理疏導(dǎo)，符合臨床路徑、用藥規(guī)范，且關(guān)注了患者長期管理與心理狀態(tài)。

武漢大學(xué)精神衛(wèi)生中心主任王惠玲針對夸克健康大模型在精神科的應(yīng)用評價稱，其針對“中老年男性嚴(yán)重抑郁、治療效果差”的問題，模型建議邏輯清晰，包括提升患者治療積極性、優(yōu)化治療方案、指導(dǎo)家庭支持等，符合臨床思維，操作性強。而且模型還能糾正患者對抑郁藥物成癮性的誤區(qū)，明確常見與罕見副作用，并建議遵醫(yī)囑服藥及定期面診，解決了醫(yī)生反復(fù)告知的痛點。

據(jù)夸克健康算法負(fù)責(zé)人徐健介紹，這背后是夸克健康大模型的重要能力：首先，構(gòu)建醫(yī)療推理大模型，引入慢思考能力，驅(qū)動模型在面對復(fù)雜醫(yī)療問題時，能夠分階段、層層深入地推導(dǎo)出最終答案，提升了模型解題的可解釋性，也有效降低了直接給出錯誤結(jié)論的風(fēng)險；其次，基于高質(zhì)量思考數(shù)據(jù)做強化學(xué)習(xí)，激發(fā)模型的診療推理能力，提升模型的臨床可解釋性和推理一致性；最后，多輪“邊想邊搜”式的知識增強技術(shù)，自動檢索專業(yè)文獻(xiàn)、教材、指南、專家答疑、醫(yī)學(xué)知識圖譜等高權(quán)威資源，確保輸出答案時所依據(jù)的內(nèi)容具備及時性和權(quán)威性。

據(jù)悉，為了實現(xiàn)上述能力突破，夸克健康已搭建了專業(yè)醫(yī)生運營標(biāo)注體系，由團隊協(xié)同400多位頂級專家、1000多位專職醫(yī)生，構(gòu)建十幾萬條精標(biāo)的樣本數(shù)據(jù)，成為模型專業(yè)性的有力保障。

其中“慢思考”是一個重要進化。按照徐健的說法，AI不追求“快速出答案”，而是“像醫(yī)生一樣思考”，不能光看答案，還看重推理全過程，把每一步怎么想的都說清楚。

具體來說，慢思考能力融合了鏈?zhǔn)酵评砼c多階段臨床演繹路徑建模，驅(qū)動模型在面對復(fù)雜醫(yī)療問題時，能夠分階段、層層深入地推導(dǎo)出最終回答。核心是“雙數(shù)據(jù)產(chǎn)線+雙獎勵機制”體系：將醫(yī)療數(shù)據(jù)分為“可驗證”（如診斷結(jié)果）和“不可驗證”（如健康建議）兩類，分別搭建產(chǎn)線。對可驗證數(shù)據(jù)，用“結(jié)果獎勵模型”對標(biāo)標(biāo)準(zhǔn)答案；對不可驗證數(shù)據(jù)，用“過程獎勵模型”評估推理邏輯是否符合臨床規(guī)范。這既保證了診斷準(zhǔn)確性，也讓AI“思考過程”可追溯。

AI只是“第二大腦”而非“主治醫(yī)師”

目前整體來看，醫(yī)療大模型的價值在于：把重復(fù)性內(nèi)容交給AI，把模糊的資料用AI整合，把知識繁雜的部分用AI提示，最終醫(yī)生依然拍板。行業(yè)普遍認(rèn)為，AI只是“第二大腦”而非“主治醫(yī)師”。夸克健康則讓AI給普通人帶來了一份“有處可問”的踏實。

想想看，以前大家不舒服要么對著搜索引擎翻到眼花，要么在親戚群里被“過來人經(jīng)驗”繞暈。現(xiàn)在多了個能隨時喊醒的“健康顧問”，哪怕只是告訴你“這情況先不用急著連夜掛號”，都能省下不少折騰。這種改變在醫(yī)療資源緊張的地方更顯珍貴。

不過，趙存忠指出，目前大模型思考思維與真實醫(yī)生的能力還有差距，尤其是在處理復(fù)雜和延續(xù)性病癥中，當(dāng)病情發(fā)生細(xì)微變化的時候，洞察微變化的邏輯以及處理方法上。像李厚敏在評價本次測試時就指出，若能結(jié)合皮損圖像（如炎癥或結(jié)節(jié)為主），還可進一步細(xì)化治療方案，實現(xiàn)動態(tài)長期管理；針對患者對激素類藥物的焦慮，AI雖科學(xué)解釋了短期規(guī)范使用的安全性及替代方案，但未明確激素與維A酸類藥物的切換節(jié)點，仍有優(yōu)化空間。

趙存忠反復(fù)強調(diào)，目前大模型ToC應(yīng)用場景永遠(yuǎn)在院外，給用戶最直接、最實用、最合理的健康管理流程，也符合國家分級診療政策。

通俗來講，AI現(xiàn)在能做的，還是幫用戶給健康問題“打個草稿”，比如判斷胃痛該不該先掛消化科，提醒高血壓患者注意藥物和柚子的沖突，而不是代替醫(yī)生開處方、做診斷。真到了要抽血化驗、拍CT，或者躺上手術(shù)臺的時刻，醫(yī)生永遠(yuǎn)是最后的依靠。

而對醫(yī)生來說，AI則是“高效助手”。王惠玲以精神科為例指出，針對精神疾病須挖掘患者內(nèi)心體驗，AI可通過捕捉面部表情、瞳孔變化、語音語調(diào)等客觀指標(biāo)輔助醫(yī)生評估；而且患者常因病恥感隱瞞病情，AI可作為匿名健康指導(dǎo)工具，提供疾病知識、自我訓(xùn)練建議及就醫(yī)指引，減少信息差和就醫(yī)彎路。李厚敏則指出了AI與皮膚科的結(jié)合潛力。“皮膚科有4000多種疾病，且多為表觀化疾病，適合AI輔助診斷；全國僅1萬多名皮膚科醫(yī)生，AI可提升全科及基層醫(yī)生的診療能力，緩解資源短缺問題。”

如夸克健康所規(guī)劃的，重點做全科健康管家Agent——無論是健康飲食、健康就醫(yī)或看病相關(guān)問題，都可以經(jīng)Agent做初步判斷后，協(xié)同到上級醫(yī)院，進行服務(wù)延伸，以“服務(wù)C端用戶、成為醫(yī)生助手”的理念搭建整體產(chǎn)品能力。

醫(yī)療AI的“信任法則”

醫(yī)療是對“信任”要求最高的行業(yè)之一，它的每一項決策、每一個數(shù)據(jù)點、每一句話，背后都是一個人的生死、一家人的希望。所有醫(yī)療大模型都繞不開一個問題：如何讓醫(yī)生和患者相信？

夸克的實踐給出兩個答案：透明性和風(fēng)險可控。徐健指出，夸克健康大模型的競爭力從不是“在考試中拿了多少分”，而是讓醫(yī)生敢用、患者敢信。

這種信任來自哪里？不是媒體宣傳，不是論文數(shù)量，而是：輸出結(jié)果是否透明（有沒有依據(jù)）；推理路徑是否可追溯（怎么得到這個結(jié)論）；使用風(fēng)險是否可控（錯誤誰負(fù)責(zé)、有沒有兜底）。

徐健指出，夸克健康大模型“推理可追溯”，每個結(jié)論都標(biāo)注依據(jù)（如引用某版指南或文獻(xiàn)），思考路徑清晰可見。風(fēng)險控制則通過“作弊識別機制”，防止模型為“高分”說假話（如編造不存在的疾病），一旦發(fā)現(xiàn)就用人工標(biāo)注的負(fù)面案例修正；是如專家評測中展現(xiàn)的“風(fēng)險可控”，面對復(fù)雜癥狀時，會明確標(biāo)注“建議面診”，而非貿(mào)然下結(jié)論；是持續(xù)做對的事。

這種“不炫技，重踏實”的思路，正契合醫(yī)療行業(yè)的本質(zhì)。正如徐健所說：“讓AI持續(xù)做對的事，信任自然會來。”

“主任醫(yī)師級”AI背后是更平權(quán)的醫(yī)療未來

夸克健康大模型通過主任醫(yī)師考試的意義，遠(yuǎn)不止技術(shù)突破。

當(dāng)一個能分階段推理罕見病、動態(tài)分析復(fù)雜病例的“主任級AI”，以“慢思考”的方式將權(quán)威醫(yī)療知識拆解為可理解的健康建議，它正在悄悄改變醫(yī)療信息的流動邏輯：讓偏遠(yuǎn)地區(qū)的用戶也能接觸到主任級的初步診療思路，讓基層醫(yī)生有了隨時可查閱的“動態(tài)指南”，讓醫(yī)學(xué)生能直觀學(xué)習(xí)臨床思維的推演過程。

這種改變的核心，不在于AI是否能替代醫(yī)生，而在于它以“透明化推理+可控風(fēng)險”的模式，將專業(yè)醫(yī)療能力轉(zhuǎn)化為普惠的健康資源。醫(yī)療的進步從來不是追求速度，而是讓每一個決策都經(jīng)得起推敲。醫(yī)療的終極目標(biāo)是“人人可及”，而會“慢思考”的AI，正在成為這條路上的重要推手。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.