健保大數據開放新進展,350萬名去識別化逝者資料開放企業申請
News from: iThome
健保署剛完成修法,正式開放非自然人也就是過世者去識別化的健保大數據,350萬人逝者健保大數據,不只政府與學研單位,現在也開放企業可以使用這批資料來研發醫療AI 。
衛福部健保署今日在一場研討會中,揭露健保資料庫開放的最新進程,健保署主任秘書葉逢明指出,繼去年開放了學研界申請健保資料庫之後,近期更上線了一套非自然人健保資料應用平臺,不只開放給政府機關與學研單位申請使用,申請資格更新增了「個人或法人」的選項,換句話說,企業現在也可以申請運用這批已故者的健保大數據來進行AI研究。
去年6月,健保署適度開放了全民健保資料庫,政府機關、學研單位申請通過後,能在受管制的環境中,取得所需類別的健保資料來進行研究。葉逢明表示,受限於個資法的約束,健保資料僅供學研單位使用,但個資法僅規範自然人的權益,非自然人(已故者)則不在此限。
因此,健保署單獨將已故者的資料抽取出來,每一筆就醫資料經過歸戶和去識別化,才匯入到一套廣達捐贈客製的人工智慧醫療雲運算整合平臺,作為資料運用平臺,並在10月初修正了「全民健康保險保險人資訊整合應用服務中心作業要點」,正式開放企業或個人,在這套平臺中進行醫療AI的相關研究。
葉逢明指出,這批非自然人的去識別化健保資料,從1997年累積至今,超過350萬人的所有歷史就醫資料,「跟健保資料庫開放的資料類別一模一樣。」健保署全民健保資料系統也串接了內政部戶政司的戶政資料,每個月會將新增的過逝者的健保資料,經過處理後更新到這個非自然人資料庫中。
不過,企業必須進入健保署內部來操作系統,所有資料如同過去作法,同樣無法攜出健保署,也必須符合當前訂定的使用規範。
新上線的健保資料平臺還提供本地端AI建模開發功能
過去,申請者要使用特定類別的健保資料,需由健保署排程,由負責專人撈取出資料後,再通知申請者到指定環境中做研究,整個申請流程可能需要1~3個月不等的時間,若申請者發現資料不符需求,得重跑整套流程,光是要取得資料就得花費許多時間成本。
新上線的資料平臺,不只優化資料庫搜尋速度,UI介面也更友善,若要搜尋肺癌病例,只要在搜尋欄位輸入國際疾病分類標準(ICD-9或ICD-10)中的肺癌疾病代碼,就能撈出所有罹患肺癌的患者資料,操作上更容易。健保署也轉而開放讓研究團隊在取得授權後,能自行操作系統,來搜尋所需類別的病患資料,不用再等待排程,讓資料取得更有效率,所需時間更能大幅縮短到半天以內。
這套平臺也提供了影像標註與模型訓練的功能。在影像標註方面,能提供標註者在線上共同標註,或是自行匯入標記好的影像來訓練模型;而在模型訓練方面,則已經內建了基本的AI模型框架,如SVM Classifier、Decision Tree Cassifier、Random Forest Cassifier等模型,讓不諳AI技術的申請者,也能直接套用基礎模型來進行訓練,或是直接以基礎模型的程式碼來修改,而AI開發者也能在平臺中寫程式,或是匯入自行開發的模型來使用。「希望提供給不同程度的開發者都能使用。」負責客製開發的廣達表示。
申請者也能在平臺中設定管理權限,根據團隊成員是主要研究者、研究助理、影像標註者、工程師等不同角色,限制不同成員能操作的系統功能,以此來管理標註資料與其他研究紀錄,同時也更有效保障醫療資料的隱私性。
也因這套平臺提供從資料搜尋、清整、標註到模型訓練的完整開發功能,平臺會留存申請者的開發紀錄,若不同研究團隊所需的資料集,過去已有研究者使用,就不需重複搜尋、可直接在平臺中取得,若有研究團隊願意公開研究成果,其他同主題的研究團隊也能利基在現有的模型基礎上,來進行調整或深化運用,更容易達到跨團隊之間的合作。
葉逢明表示,該平臺目前部署在健保署中,僅提供非自然人資料庫的使用服務,但未來也會擴及部署到現有的健保資料庫,來增進AI應用的開發效率。
健保資料庫提供異質資料,讓多個研究團隊的AI辨識率再提升
健保資料庫開放以來,也已經有多個研究單位與醫院使用這些資料,來加值原有的AI研究。
比如說,成大醫院就分享,今年初自行開發的武漢肺炎AI判讀模型,原本運用大量國外開放圖資來進行模型訓練,但國外影像資料的品質不一,且多數為重症病患的X光影像,相對於國內較多輕症患者的狀況來看,檢驗上還是會發生誤報情形,今年2~8月檢驗4,000名疑似病例的準確率,約為83%。
不過,在運用了健保資料庫的資料之後,在873筆去識別化後的臺灣本地資料中,其中包含562筆確診者與157筆正常者的X光影像,以此重新訓練AI模型,判讀準確率進步到92%。
也因為健保資料庫的資料來自全臺不同醫院,各醫院拍攝CT、MRI影像所採用的機器廠牌都不同,因此,產生了異質的影像資料。對於研究團隊來說,在運用了異質資料重新訓練模型後,能提升AI判讀的準確率,讓AI模型走出特定的影像辨識場景。比如北榮的腦轉移瘤AI模型DeepMets、臺大的心臟主動脈鈣化與脂肪全自動分析模型HeaortaNet、北醫的肺結節影像診斷輔助系統LungRads,都因而受惠。
雲端藥歷與醫療影像共享,大幅降低年度藥費與影像拍攝支出
不只是健保資料的應用有新成果,健保署署長李伯璋也揭露了健保醫療資訊雲端查詢系統上線以來的成效。
健保醫療資訊雲端查詢系統,前身為2013年建置的健保雲端藥歷系統,2016上線後,隔年起更陸續新增了CT、MRI、超音波等醫療影像資料的查詢功能,來提供給醫院與藥局使用。目前可查詢的項目,包括了藥歷、手術記錄、檢驗紀錄、CDC預防接種、出院病歷摘要,以及中醫、過敏藥物、特定藥物的用藥紀錄等。
李伯璋表示,建置了這套雲端查詢系統後,醫生或藥局在開藥前,就能透過患者的藥歷,來了解患者前一次領取的藥物是否已經用完、開立了哪些藥物,來避免重複用藥的情況發生,尤其在2018年新增了重複處方簽提示功能,以及2019年新增了藥品交互作用暨過敏藥物提示功能後,更能進一步為病患的用藥安全來把關。
健保署更統計,自2014年到2019年,因上線了雲端藥歷查詢,共減少了重複藥費76.88億元,2011年高達23.22億元的藥費支出,到去年已經降到僅有6.87億元,成效非常顯著,減少了不必要的資源浪費。
雲端查詢系統也同時減少了醫療影像的重複檢測。在建立醫療影像上傳、共享的制度以前,病患每轉院一次,就要重新拍攝一次醫療影像,不僅是種資源浪費,患者多次拍攝影像所累積的輻射值,或是特定場景所需的麻醉環節,都增加了潛在的健康風險。但現在,醫生要做醫療影像檢測前,若患者在28天內曾進行檢測,系統將主動提醒醫生來避免重複檢測,光是2018年與2019年,就省下了5.3億點(100 Million RVU)的檢驗費用。
而且,為了讓小型診所或藥局,也能快速查看醫療影像資料,「因為小醫院要看一張影像,有時候網路速度慢,就要等好幾秒鐘,」李伯璋表示,健保署從2018年開始,針對基層診所提供一般光纖網路補助,促使一般診所將原先ADSL轉換為光纖網路,2019年更提供全額補助,來加速各醫療單位的轉換。目前,基層西醫、中醫、牙醫與藥局的光纖採用率都已經達到8成,就連檢驗所、助產所、康復之家的光纖採用率,也都已經高達7成5。
不只是院方在看診、開藥參考的資訊雲端化,個人病歷的查閱上,健保署也推動了健康存摺。李伯璋指出,從2018年以行動認證來取代讀卡機申請的流程後,健康存摺的申請人數突破了100萬大關,今年更因口罩實名制的實施,不少民眾選擇透過健康存摺來預購口罩,更助長了健康存摺的申請,截至今年9月為止,已累積500萬人申請及7,000萬人次使用。
李伯璋更指出,由於民眾可以自行登入健康存摺來查看病歷,某種程度上也讓醫院的財務管理更透明,比如醫院在申報健保費用時,較不易有作假的狀況發生。
留言
張貼留言