7月23日,夸克健康大模型通過國內(nèi)12門核心學(xué)科主任醫(yī)師筆試評測,成為首個完成這一挑戰(zhàn)的大模型。這距離它通過副主任醫(yī)師考試僅僅過去兩個月。AI能通過這樣的測試,至少在考試場景下已具備了接近主任醫(yī)師的答題水平。
主任醫(yī)師考試難度大、要求高,不僅考查考生對海量醫(yī)學(xué)知識的掌握程度,更注重對臨床綜合能力的考量,要求考生能夠像真正的醫(yī)生一樣分析復(fù)雜病例、權(quán)衡各種診療路徑。
在醫(yī)療AI普遍停留在“臨床執(zhí)業(yè)醫(yī)師”初級水平的當(dāng)下,這場“兩級跳”不僅是技術(shù)突破,更意味著AI從“醫(yī)學(xué)知識記憶”向“臨床思維推理”的關(guān)鍵跨越。雖然考試和真實臨床還有距離,但這一進展讓人對醫(yī)療AI多了幾分信心。
![]()
“做題”到“看病”,AI學(xué)會了醫(yī)生的“慢思考”
據(jù)夸克健康運營負(fù)責(zé)人趙存忠透露,早在2018年,夸克就開始了在醫(yī)療領(lǐng)域的探索,做內(nèi)容+工具平臺,除了面向普通用戶早期的健康問題,也服務(wù)醫(yī)學(xué)生關(guān)于專業(yè)學(xué)習(xí)的需求。如今有超200萬人的醫(yī)學(xué)生使用夸克搜索醫(yī)療考試題目。
隨著大模型技術(shù)能力的進步,夸克健康在持續(xù)進化。這次主任醫(yī)師考試為例,夸克健康大模型具備了“臨床綜合能力”,即不僅記得住知識,還能像醫(yī)生一樣分析病例、權(quán)衡診療路徑。對用戶來說,具備這一能力的夸克能幫他們輕松獲取深度思考后的專業(yè)醫(yī)療內(nèi)容,既有專業(yè)還有溫度,體驗拉滿。
北京大學(xué)醫(yī)學(xué)部皮膚與性病學(xué)系主任、北京大學(xué)人民醫(yī)院皮膚科副主任、主任醫(yī)師李厚敏評論稱,夸克健康大模型在皮膚科案例測試中表現(xiàn)全面,針對“28歲女性結(jié)節(jié)囊腫型痤瘡”問題,給出的方案涵蓋治療調(diào)整,瘢痕色素管理,皮膚屏障修復(fù)及心理疏導(dǎo),符合臨床路徑、用藥規(guī)范,且關(guān)注了患者長期管理與心理狀態(tài)。
武漢大學(xué)精神衛(wèi)生中心主任王惠玲針對夸克健康大模型在精神科的應(yīng)用評價稱,其針對“中老年男性嚴(yán)重抑郁、治療效果差”的問題,模型建議邏輯清晰,包括提升患者治療積極性、優(yōu)化治療方案、指導(dǎo)家庭支持等,符合臨床思維,操作性強。而且模型還能糾正患者對抑郁藥物成癮性的誤區(qū),明確常見與罕見副作用,并建議遵醫(yī)囑服藥及定期面診,解決了醫(yī)生反復(fù)告知的痛點。
據(jù)夸克健康算法負(fù)責(zé)人徐健介紹,這背后是夸克健康大模型的重要能力:首先,構(gòu)建醫(yī)療推理大模型,引入慢思考能力,驅(qū)動模型在面對復(fù)雜醫(yī)療問題時,能夠分階段、層層深入地推導(dǎo)出最終答案,提升了模型解題的可解釋性,也有效降低了直接給出錯誤結(jié)論的風(fēng)險;其次,基于高質(zhì)量思考數(shù)據(jù)做強化學(xué)習(xí),激發(fā)模型的診療推理能力,提升模型的臨床可解釋性和推理一致性;最后,多輪“邊想邊搜”式的知識增強技術(shù),自動檢索專業(yè)文獻(xiàn)、教材、指南、專家答疑、醫(yī)學(xué)知識圖譜等高權(quán)威資源,確保輸出答案時所依據(jù)的內(nèi)容具備及時性和權(quán)威性。
據(jù)悉,為了實現(xiàn)上述能力突破,夸克健康已搭建了專業(yè)醫(yī)生運營標(biāo)注體系,由團隊協(xié)同400多位頂級專家、1000多位專職醫(yī)生,構(gòu)建十幾萬條精標(biāo)的樣本數(shù)據(jù),成為模型專業(yè)性的有力保障。
其中“慢思考”是一個重要進化。按照徐健的說法,AI不追求“快速出答案”,而是“像醫(yī)生一樣思考”,不能光看答案,還看重推理全過程,把每一步怎么想的都說清楚。
![]()
具體來說,慢思考能力融合了鏈?zhǔn)酵评砼c多階段臨床演繹路徑建模,驅(qū)動模型在面對復(fù)雜醫(yī)療問題時,能夠分階段、層層深入地推導(dǎo)出最終回答。核心是“雙數(shù)據(jù)產(chǎn)線+雙獎勵機制”體系:將醫(yī)療數(shù)據(jù)分為“可驗證”(如診斷結(jié)果)和“不可驗證”(如健康建議)兩類,分別搭建產(chǎn)線。對可驗證數(shù)據(jù),用“結(jié)果獎勵模型”對標(biāo)標(biāo)準(zhǔn)答案;對不可驗證數(shù)據(jù),用“過程獎勵模型”評估推理邏輯是否符合臨床規(guī)范。這既保證了診斷準(zhǔn)確性,也讓AI“思考過程”可追溯。
AI只是“第二大腦”而非“主治醫(yī)師”
目前整體來看,醫(yī)療大模型的價值在于:把重復(fù)性內(nèi)容交給AI,把模糊的資料用AI整合,把知識繁雜的部分用AI提示,最終醫(yī)生依然拍板。行業(yè)普遍認(rèn)為,AI只是“第二大腦”而非“主治醫(yī)師”。夸克健康則讓AI給普通人帶來了一份“有處可問”的踏實。
想想看,以前大家不舒服要么對著搜索引擎翻到眼花,要么在親戚群里被“過來人經(jīng)驗”繞暈。現(xiàn)在多了個能隨時喊醒的“健康顧問”,哪怕只是告訴你“這情況先不用急著連夜掛號”,都能省下不少折騰。這種改變在醫(yī)療資源緊張的地方更顯珍貴。
不過,趙存忠指出,目前大模型思考思維與真實醫(yī)生的能力還有差距,尤其是在處理復(fù)雜和延續(xù)性病癥中,當(dāng)病情發(fā)生細(xì)微變化的時候,洞察微變化的邏輯以及處理方法上。像李厚敏在評價本次測試時就指出,若能結(jié)合皮損圖像(如炎癥或結(jié)節(jié)為主),還可進一步細(xì)化治療方案,實現(xiàn)動態(tài)長期管理;針對患者對激素類藥物的焦慮,AI雖科學(xué)解釋了短期規(guī)范使用的安全性及替代方案,但未明確激素與維A酸類藥物的切換節(jié)點,仍有優(yōu)化空間。
趙存忠反復(fù)強調(diào),目前大模型ToC應(yīng)用場景永遠(yuǎn)在院外,給用戶最直接、最實用、最合理的健康管理流程,也符合國家分級診療政策。
通俗來講,AI現(xiàn)在能做的,還是幫用戶給健康問題“打個草稿”,比如判斷胃痛該不該先掛消化科,提醒高血壓患者注意藥物和柚子的沖突,而不是代替醫(yī)生開處方、做診斷。真到了要抽血化驗、拍CT,或者躺上手術(shù)臺的時刻,醫(yī)生永遠(yuǎn)是最后的依靠。
而對醫(yī)生來說,AI則是“高效助手”。王惠玲以精神科為例指出,針對精神疾病須挖掘患者內(nèi)心體驗,AI可通過捕捉面部表情、瞳孔變化、語音語調(diào)等客觀指標(biāo)輔助醫(yī)生評估;而且患者常因病恥感隱瞞病情,AI可作為匿名健康指導(dǎo)工具,提供疾病知識、自我訓(xùn)練建議及就醫(yī)指引,減少信息差和就醫(yī)彎路。李厚敏則指出了AI與皮膚科的結(jié)合潛力。“皮膚科有4000多種疾病,且多為表觀化疾病,適合AI輔助診斷;全國僅1萬多名皮膚科醫(yī)生,AI可提升全科及基層醫(yī)生的診療能力,緩解資源短缺問題。”
如夸克健康所規(guī)劃的,重點做全科健康管家Agent——無論是健康飲食、健康就醫(yī)或看病相關(guān)問題,都可以經(jīng)Agent做初步判斷后,協(xié)同到上級醫(yī)院,進行服務(wù)延伸,以“服務(wù)C端用戶、成為醫(yī)生助手”的理念搭建整體產(chǎn)品能力。
醫(yī)療AI的“信任法則”
醫(yī)療是對“信任”要求最高的行業(yè)之一,它的每一項決策、每一個數(shù)據(jù)點、每一句話,背后都是一個人的生死、一家人的希望。所有醫(yī)療大模型都繞不開一個問題:如何讓醫(yī)生和患者相信?
夸克的實踐給出兩個答案:透明性和風(fēng)險可控。徐健指出,夸克健康大模型的競爭力從不是“在考試中拿了多少分”,而是讓醫(yī)生敢用、患者敢信。
這種信任來自哪里?不是媒體宣傳,不是論文數(shù)量,而是:輸出結(jié)果是否透明(有沒有依據(jù));推理路徑是否可追溯(怎么得到這個結(jié)論);使用風(fēng)險是否可控(錯誤誰負(fù)責(zé)、有沒有兜底)。
徐健指出,夸克健康大模型“推理可追溯”,每個結(jié)論都標(biāo)注依據(jù)(如引用某版指南或文獻(xiàn)),思考路徑清晰可見。風(fēng)險控制則通過“作弊識別機制”,防止模型為“高分”說假話(如編造不存在的疾病),一旦發(fā)現(xiàn)就用人工標(biāo)注的負(fù)面案例修正;是如專家評測中展現(xiàn)的“風(fēng)險可控”,面對復(fù)雜癥狀時,會明確標(biāo)注“建議面診”,而非貿(mào)然下結(jié)論;是持續(xù)做對的事。
這種“不炫技,重踏實”的思路,正契合醫(yī)療行業(yè)的本質(zhì)。正如徐健所說:“讓AI持續(xù)做對的事,信任自然會來。”
“主任醫(yī)師級”AI背后是更平權(quán)的醫(yī)療未來
夸克健康大模型通過主任醫(yī)師考試的意義,遠(yuǎn)不止技術(shù)突破。
當(dāng)一個能分階段推理罕見病、動態(tài)分析復(fù)雜病例的“主任級AI”,以“慢思考”的方式將權(quán)威醫(yī)療知識拆解為可理解的健康建議,它正在悄悄改變醫(yī)療信息的流動邏輯:讓偏遠(yuǎn)地區(qū)的用戶也能接觸到主任級的初步診療思路,讓基層醫(yī)生有了隨時可查閱的“動態(tài)指南”,讓醫(yī)學(xué)生能直觀學(xué)習(xí)臨床思維的推演過程。
這種改變的核心,不在于AI是否能替代醫(yī)生,而在于它以“透明化推理+可控風(fēng)險”的模式,將專業(yè)醫(yī)療能力轉(zhuǎn)化為普惠的健康資源。醫(yī)療的進步從來不是追求速度,而是讓每一個決策都經(jīng)得起推敲。醫(yī)療的終極目標(biāo)是“人人可及”,而會“慢思考”的AI,正在成為這條路上的重要推手。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.