4月30日,杭州德適生物科技股份有限公司(2526.HK,簡(jiǎn)稱 “德適”)在中國香港正式發(fā)布醫(yī)療AI評(píng)測(cè)平臺(tái)DoctorBench,并揭曉首期全球醫(yī)療大模型排行榜。杭州智診科技的WiseDiag-v2、谷歌的Gemini-3.1-Pro-Preview、OpenAI的GPT-5.4 位列前三甲。
![]()
該平臺(tái)首次以 “臨床實(shí)戰(zhàn)能力” 為核心標(biāo)尺,為全球醫(yī)療大模型構(gòu)建起一套貼近真實(shí)診療場(chǎng)景的多維評(píng)測(cè)體系。
專業(yè)人士指出,當(dāng)前,全球醫(yī)療大模型正加速從實(shí)驗(yàn)室走向臨床應(yīng)用,但行業(yè)始終缺乏一套能夠真正衡量模型“看病能力” 的評(píng)測(cè)標(biāo)準(zhǔn)。現(xiàn)有的評(píng)測(cè)大多聚焦于醫(yī)學(xué)知識(shí)問答,難以反映模型在復(fù)雜臨床情境中的綜合表現(xiàn)——這種評(píng)測(cè)與臨床實(shí)踐之間的鴻溝,正在成為制約醫(yī)療AI落地應(yīng)用的全球性挑戰(zhàn)。
此前,OpenAI發(fā)布HealthBench,標(biāo)志著領(lǐng)先企業(yè)開始重視這一挑戰(zhàn)。然而,醫(yī)療具有強(qiáng)烈的本土化特征——不同國家和地區(qū)的診療指南、語言習(xí)慣、患者群體存在顯著差異,任何單一評(píng)測(cè)體系都難以實(shí)現(xiàn)全球普適。
正是基于對(duì)這一全球性挑戰(zhàn)的深刻認(rèn)識(shí),德適發(fā)起并打造了DoctorBench 平臺(tái)。這一平臺(tái)的誕生,植根于一個(gè)跨學(xué)科團(tuán)隊(duì)近十年的深耕與協(xié)作。德適匯聚了基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)、人工智能、醫(yī)療產(chǎn)業(yè)等多領(lǐng)域的專家,將嚴(yán)謹(jǐn)?shù)呐R床醫(yī)學(xué)邏輯與前沿的深度學(xué)習(xí)算法深度融合,讓DoctorBench既能理解AI技術(shù)的邊界,又能洞察臨床實(shí)踐的復(fù)雜需求,并以此為標(biāo)準(zhǔn)構(gòu)建評(píng)測(cè)體系。
DoctorBench的核心理念是不再只考核大模型的 “知識(shí)儲(chǔ)備”,而是考核其 “像醫(yī)生一樣思考” 的臨床溝通與決策能力。平臺(tái)構(gòu)建了三大榜單體系 —— 醫(yī)學(xué)主榜單(LLM)、多模態(tài)榜單(VLM)與智能體榜單(Agent),分別評(píng)測(cè)模型的文本診療能力、多模態(tài)理解能力,以及模擬診療環(huán)境中的多輪決策與工具調(diào)用能力。
![]()
在評(píng)測(cè)機(jī)制上,DoctorBench首創(chuàng)“2大核心維度(安全性和準(zhǔn)確性)+3 項(xiàng)通用維度(交互質(zhì)量、信息優(yōu)先級(jí)、主動(dòng)詢問)+5 項(xiàng)專項(xiàng)模塊(證據(jù)與引用、可解釋推理、可執(zhí)行性、個(gè)體化適配、情感支持)” 的多維架構(gòu),并搭載 “場(chǎng)景自適應(yīng)權(quán)重”——根據(jù)不同臨床場(chǎng)景的風(fēng)險(xiǎn)等級(jí),動(dòng)態(tài)調(diào)整各維度權(quán)重,使評(píng)分邏輯更貼近真實(shí)診療決策。
尤為關(guān)鍵的是,平臺(tái)將 “醫(yī)學(xué)事實(shí)準(zhǔn)確” 與 “安全與風(fēng)險(xiǎn)控制” 設(shè)為具有 “一票否決權(quán)” 的核心紅線 —— 任何模型若在關(guān)乎患者安全的關(guān)鍵問題上出現(xiàn)嚴(yán)重偏差,無論其他維度表現(xiàn)如何突出,均無法獲得高分。這一設(shè)計(jì)源于團(tuán)隊(duì)對(duì)醫(yī)療本質(zhì)的深刻理解:在關(guān)乎生命的領(lǐng)域,安全性永遠(yuǎn)是第一要義,沒有妥協(xié)余地。
![]()
“醫(yī)療AI的發(fā)展是一場(chǎng)關(guān)乎人類共同健康福祉的長跑,既需要顛覆式的技術(shù)創(chuàng)新和跨學(xué)科、跨地域的深度協(xié)作,更需要對(duì)生命健康的絕對(duì)敬畏與堅(jiān)守。” 德適創(chuàng)始人宋寧博士表示,期待與全球更多科研機(jī)構(gòu)、臨床中心和行業(yè)伙伴攜手,讓真正有實(shí)力的技術(shù)被看見、被信賴,最終惠及每一位患者。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.