網易首頁 > 網易號 > 正文申請入駐

驚人浪費：鄉鎮CT拍出的數據，AI根本“看不懂”

2026-05-04 11:02:08　來源: 小蔣愛嘮嗑

四川舉報

分享至

“從基層醫療來說，AI想下去是很容易的，但從那里產生AI還是挺難的。”近日，一脈陽光董事長陳朝陽對第一財經記者表示。

中國有超過三萬家鄉鎮衛生院，每年診療人次超過10億，在治病救人方面發揮重要作用。不過，在鄉鎮醫療機構，CT、超聲等設備所產生的數據比較粗糙。高質量數據是高質量大模型的前提條件，而鄉鎮醫療機構的影像數據暫時還不具備人工智能價值，這也是一種浪費。

AI能下，不能上

“從鄉鎮醫療機構采集有意義的影像，這一點比較難。”陳朝陽表示。

一脈陽光是一家醫療服務企業，業務聚焦于醫學影像數據，也就是CT、磁共振、超聲心電等。一脈陽光在全國20省份建有117個影像服務中心，合作機構超1100家。

一脈陽光不但與省市級別醫院合作，也會觸及鄉鎮醫療機構。

“中國大概有10萬家醫院，3萬個在農村叫鄉鎮衛生院，3萬個在社區，還有大概3萬在城市里面。我們認為要把未來醫療干好，要把這10萬個醫療機構變成數字化的醫院。”陳朝陽說。

國家衛生健康委員會發布的《2024年我國衛生健康事業發展統計公報》顯示，中國基層醫療衛生機構中，鄉鎮衛生院33334個。基層醫療機構，承擔著繁重的任務。2024年，鄉鎮衛生院診療人次13.8億，比上年增加0.7億人次。

影像數據是醫療數據的核心構成。考慮到中國病患人數眾多，各級醫療機構每年都會產生海量影像數據。從應用場景來看，中國人工智能企業，本應可以得到充足且優質的醫療數據。但真實的情況是，大量鄉鎮醫療機構的數據難以被人工智能企業所用。

“相對三甲醫院采集的影像數據，這些鄉鎮醫療機構采集到的數據差異很大。就像我們的CT，放在北京采到的數據跟搬到一個鄉鎮采集到的數據，那是兩件事兒。”陳朝陽表示，鄉鎮醫療機構的影像數據在訓練醫療大模型的時候，“很多就不能用”。

數據是人工智能的燃料。

中國是全球醫療AI企業的必爭之地。飛利浦等跨國企業，聯影等中國企業已經將AI視為塑造醫療未來的關鍵驅動力。飛利浦在不久前的中國國際醫療器械博覽會上，展出了50余款創新產品，近半數產品已與人工智能緊密相關。其中，新一代的能量CT掃描將帶來數據量的爆炸式增長。從谷歌到阿里，從飛利浦到智元機器人，不管它們開發的是大語言模型、面向真實世界的物理AI,還是CT硬件產品，每一家想要在人工智能時代有所作為的企業都將數據置于核心位置。

覓蜂科技董事長、CEO姚卯青此前接受第一財經采訪時說，現在的大模型都是數據驅動的，什么樣的數據就產生什么樣的模型。

“Garbage In、Garbage Out，如果你是垃圾數據進，就垃圾模型出。”姚卯青說。低質量數據還會造成深層次問題，如果有一個好的算法，訓練后卻沒有得到好的效果，大模型企業將難以分辨，到底是數據不好，還是模型出了問題，甚至可能因此而否定優秀的算法。

現在國內人工智能技術與基層醫療機構之間，是一種單向流動。人工智能技術可以在云端或者內嵌設備的方式，被基層醫療所采用。但是基層醫療難以向人工智能反向輸入足夠可用的數據。

這很大程度上源于醫療資源的不均質分配。

據陳朝陽分析，歐洲和美國的醫療體系均質化比較好，農村地區和城市的醫療水平差異化不是特別大。“所以它的數據轉化到應用端的成本會比我們低，因為采集端的標準化程度比較高。而對于我們來講，這是一個痛點。”

數據何以浪費了

三甲醫院和鄉鎮衛生院，影像數據質量完全不同，背后是人才體系的巨大差異。

中國的現代醫療體系，建設期并沒有多少年。但是中國人口眾多，地域廣大，因此醫護人員的相對比例還不夠高。

“我們這個體系經過幾十年發展，里面有幾個學科是很多高質量的醫學生不愿意選的，包括兒科和影像科。醫學生不愿意選這兩個科，主要原因還是跟收入有關。”陳朝陽表示，他們如果能在本科以上院校讀完影像專業，更傾向于走進城市醫院，而非落地基層醫療機構。

據陳朝陽觀察，當縣一級醫院臨床大夫已經達到博士生水平的時候，鄉鎮醫療機構的放射科大夫很多還是大專畢業生水平。

在醫院放射科，完成整套檢查流程需要兩位人員：設備操作員和影像醫生。

跟拿著傻瓜相機拍照不一樣，醫療設備操作員需要知道臨床醫生的大致診斷方向，也要明白如何使用設備的復雜功能來達成影像效果。

“例如MRI(磁共振成像)查看完之后，我懷疑患者的灰質有問題或者血管有問題，需要調一個TWI(磁共振成像中基于組織橫向弛豫時間差異生成圖像的技術)來檢查。如果他不會操作，信息量就不夠，臨床醫生就無法做好診斷。”陳朝陽說：“合格的影像醫生就更缺少了。一個胸部CT下來300張片子，一會看骨頭，一會看肺泡，沒有經過長時間訓練，他真是沒有辦法。”

在基層醫療機構數據質量不佳的情況下，一些醫療AI企業就要親自下場采集數據。

隨著5G等通信技術進展，這些機構可以遠距離控制異地設備，完成數據的標準化采集。這樣收集到的鄉鎮病患數據和一線城市的數據趨于一致。

“我們研發最花錢的就是人工智能，其中算力和數據的構建是大頭。”深至科技首席執行官朱瑞星不久前對記者表示。

朱瑞星認為，現在市面上已經有不少醫療大模型，而且發表在高質量醫學雜志上的公共數據已經被充分利用，AI醫療的獨特優勢將是獨有數據。

“獨有數據恰恰是能夠構建長期壁壘的東西，會讓你的模型精度不斷變高。沒有活的數據，其實就沒有壁壘。”朱瑞星說。

醫療數據的問題，并不只存在于基層醫療機構。

關于AI醫療的痛點，森億智能方面認為，核心難點是數據治理與集成的復雜性。醫院通常運行眾多獨立系統，其架構及數據標準各異，阻礙了跨系統互操作性。醫療術語缺乏標準化，且病歷等非結構化數據普遍存在，進一步增加了數據清洗與分析的復雜度。數據質量不佳（包括錯誤及字段缺失）削弱了人工智能模型的可靠性，并增加了開發成本。

“醫療機構極其分散，每個都是一個孤島。我們的治療行為分散到每個孤島里面去了。”陳朝陽說：“我是自己醫療數據的擁有者，連體檢數據都很難組織起來，因為有的時候在北京體檢，有的時候在上海體檢。”

數據質量，決定了人工智能的上限。中國人口眾多，醫療數據如果能被充分利用起來，那會令AI如虎添翼；如果因為采集不標準，醫療機構孤島化，這些數據不能被充分利用，則意味著巨大的浪費。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.