“從基層醫療來說,AI想下去是很容易的,但從那里產生AI還是挺難的。”近日,一脈陽光董事長陳朝陽對第一財經記者表示。
中國有超過三萬家鄉鎮衛生院,每年診療人次超過10億,在治病救人方面發揮重要作用。不過,在鄉鎮醫療機構,CT、超聲等設備所產生的數據比較粗糙。高質量數據是高質量大模型的前提條件,而鄉鎮醫療機構的影像數據暫時還不具備人工智能價值,這也是一種浪費。
![]()
AI能下,不能上
“從鄉鎮醫療機構采集有意義的影像,這一點比較難。”陳朝陽表示。
一脈陽光是一家醫療服務企業,業務聚焦于醫學影像數據,也就是CT、磁共振、超聲心電等。一脈陽光在全國20省份建有117個影像服務中心,合作機構超1100家。
一脈陽光不但與省市級別醫院合作,也會觸及鄉鎮醫療機構。
“中國大概有10萬家醫院,3萬個在農村叫鄉鎮衛生院,3萬個在社區,還有大概3萬在城市里面。我們認為要把未來醫療干好,要把這10萬個醫療機構變成數字化的醫院。”陳朝陽說。
國家衛生健康委員會發布的《2024年我國衛生健康事業發展統計公報》顯示,中國基層醫療衛生機構中,鄉鎮衛生院33334個。基層醫療機構,承擔著繁重的任務。2024年,鄉鎮衛生院診療人次13.8億,比上年增加0.7億人次。
影像數據是醫療數據的核心構成。考慮到中國病患人數眾多,各級醫療機構每年都會產生海量影像數據。從應用場景來看,中國人工智能企業,本應可以得到充足且優質的醫療數據。但真實的情況是,大量鄉鎮醫療機構的數據難以被人工智能企業所用。
“相對三甲醫院采集的影像數據,這些鄉鎮醫療機構采集到的數據差異很大。就像我們的CT,放在北京采到的數據跟搬到一個鄉鎮采集到的數據,那是兩件事兒。”陳朝陽表示,鄉鎮醫療機構的影像數據在訓練醫療大模型的時候,“很多就不能用”。
數據是人工智能的燃料。
中國是全球醫療AI企業的必爭之地。飛利浦等跨國企業,聯影等中國企業已經將AI視為塑造醫療未來的關鍵驅動力。飛利浦在不久前的中國國際醫療器械博覽會上,展出了50余款創新產品,近半數產品已與人工智能緊密相關。其中,新一代的能量CT掃描將帶來數據量的爆炸式增長。從谷歌到阿里,從飛利浦到智元機器人,不管它們開發的是大語言模型、面向真實世界的物理AI,還是CT硬件產品,每一家想要在人工智能時代有所作為的企業都將數據置于核心位置。
覓蜂科技董事長、CEO姚卯青此前接受第一財經采訪時說,現在的大模型都是數據驅動的,什么樣的數據就產生什么樣的模型。
“Garbage In、Garbage Out,如果你是垃圾數據進,就垃圾模型出。”姚卯青說。低質量數據還會造成深層次問題,如果有一個好的算法,訓練后卻沒有得到好的效果,大模型企業將難以分辨,到底是數據不好,還是模型出了問題,甚至可能因此而否定優秀的算法。
現在國內人工智能技術與基層醫療機構之間,是一種單向流動。人工智能技術可以在云端或者內嵌設備的方式,被基層醫療所采用。但是基層醫療難以向人工智能反向輸入足夠可用的數據。
這很大程度上源于醫療資源的不均質分配。
據陳朝陽分析,歐洲和美國的醫療體系均質化比較好,農村地區和城市的醫療水平差異化不是特別大。“所以它的數據轉化到應用端的成本會比我們低,因為采集端的標準化程度比較高。而對于我們來講,這是一個痛點。”
![]()
數據何以浪費了
三甲醫院和鄉鎮衛生院,影像數據質量完全不同,背后是人才體系的巨大差異。
中國的現代醫療體系,建設期并沒有多少年。但是中國人口眾多,地域廣大,因此醫護人員的相對比例還不夠高。
“我們這個體系經過幾十年發展,里面有幾個學科是很多高質量的醫學生不愿意選的,包括兒科和影像科。醫學生不愿意選這兩個科,主要原因還是跟收入有關。”陳朝陽表示,他們如果能在本科以上院校讀完影像專業,更傾向于走進城市醫院,而非落地基層醫療機構。
據陳朝陽觀察,當縣一級醫院臨床大夫已經達到博士生水平的時候,鄉鎮醫療機構的放射科大夫很多還是大專畢業生水平。
在醫院放射科,完成整套檢查流程需要兩位人員:設備操作員和影像醫生。
跟拿著傻瓜相機拍照不一樣,醫療設備操作員需要知道臨床醫生的大致診斷方向,也要明白如何使用設備的復雜功能來達成影像效果。
“例如MRI(磁共振成像)查看完之后,我懷疑患者的灰質有問題或者血管有問題,需要調一個TWI(磁共振成像中基于組織橫向弛豫時間差異生成圖像的技術)來檢查。如果他不會操作,信息量就不夠,臨床醫生就無法做好診斷。”陳朝陽說:“合格的影像醫生就更缺少了。一個胸部CT下來300張片子,一會看骨頭,一會看肺泡,沒有經過長時間訓練,他真是沒有辦法。”
在基層醫療機構數據質量不佳的情況下,一些醫療AI企業就要親自下場采集數據。
隨著5G等通信技術進展,這些機構可以遠距離控制異地設備,完成數據的標準化采集。這樣收集到的鄉鎮病患數據和一線城市的數據趨于一致。
“我們研發最花錢的就是人工智能,其中算力和數據的構建是大頭。”深至科技首席執行官朱瑞星不久前對記者表示。
朱瑞星認為,現在市面上已經有不少醫療大模型,而且發表在高質量醫學雜志上的公共數據已經被充分利用,AI醫療的獨特優勢將是獨有數據。
“獨有數據恰恰是能夠構建長期壁壘的東西,會讓你的模型精度不斷變高。沒有活的數據,其實就沒有壁壘。”朱瑞星說。
醫療數據的問題,并不只存在于基層醫療機構。
關于AI醫療的痛點,森億智能方面認為,核心難點是數據治理與集成的復雜性。醫院通常運行眾多獨立系統,其架構及數據標準各異,阻礙了跨系統互操作性。醫療術語缺乏標準化,且病歷等非結構化數據普遍存在,進一步增加了數據清洗與分析的復雜度。數據質量不佳(包括錯誤及字段缺失)削弱了人工智能模型的可靠性,并增加了開發成本。
“醫療機構極其分散,每個都是一個孤島。我們的治療行為分散到每個孤島里面去了。”陳朝陽說:“我是自己醫療數據的擁有者,連體檢數據都很難組織起來,因為有的時候在北京體檢,有的時候在上海體檢。”
數據質量,決定了人工智能的上限。中國人口眾多,醫療數據如果能被充分利用起來,那會令AI如虎添翼;如果因為采集不標準,醫療機構孤島化,這些數據不能被充分利用,則意味著巨大的浪費。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.