醫(yī)療行業(yè)數(shù)據(jù)集成中的數(shù)據(jù)質(zhì)量問(wèn)題研究
林靖生① 郭茜②
①上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院計(jì)算機(jī)網(wǎng)絡(luò)中心,200433,上海市瑞金二路197 號(hào)
②Dimensional Insight, Inc. 美國(guó)泓維軟件有限公司,510145,廣州市荔灣區(qū)中山七路85-99號(hào)1603
之一
關(guān)鍵詞 數(shù)據(jù)集成 數(shù)據(jù)質(zhì)量 數(shù)據(jù)清洗 決策支持 數(shù)據(jù)挖掘
摘 要 分析了目前醫(yī)院在建立數(shù)據(jù)分析系統(tǒng)和數(shù)據(jù)挖掘系統(tǒng),數(shù)據(jù)集成環(huán)節(jié)中醫(yī)院當(dāng)
前的現(xiàn)狀和存在的問(wèn)題及應(yīng)對(duì)辦法。在醫(yī)院信息系統(tǒng)逐步建成后完善后,管理和利用好各
系統(tǒng)收集的數(shù)據(jù),為分析系統(tǒng)和決策系統(tǒng)服務(wù),使數(shù)據(jù)為醫(yī)院帶來(lái)更多的價(jià)值是醫(yī)院信息
化建設(shè)的又一個(gè)高地。各系統(tǒng)在數(shù)據(jù)集成過(guò)程中的數(shù)據(jù)質(zhì)量問(wèn)題直接影響到了日后分析和
決策的正確性,在系統(tǒng)建設(shè)過(guò)程中扮演了重要的角色。需要利用科學(xué)的方法和有效的工具,
建立一套定義、評(píng)價(jià)、效驗(yàn)、改善數(shù)據(jù)質(zhì)量的方法,為醫(yī)院數(shù)據(jù)集成提供有效的保障。
1 引言
數(shù)據(jù)集成已經(jīng)成為醫(yī)院數(shù)據(jù)挖掘和在線分析系統(tǒng)不可或缺的前提,因此,我們就不得
不正視與之密切相關(guān)的數(shù)據(jù)質(zhì)量問(wèn)題。決策系統(tǒng)和分析系統(tǒng)的正確結(jié)果都依賴原始數(shù)據(jù)的
質(zhì)量,沒有數(shù)據(jù)質(zhì)量的保證就不可能得到正確的分析結(jié)果和正確的決策判斷。中國(guó)醫(yī)院目
前在線分析系統(tǒng)和數(shù)據(jù)挖掘項(xiàng)目里,有相當(dāng)部分難以達(dá)到預(yù)期目標(biāo)甚至相去甚遠(yuǎn),造成這
種結(jié)局的一個(gè)重要原因就是中國(guó)醫(yī)院復(fù)雜的信息化背景造成的數(shù)據(jù)質(zhì)量問(wèn)題。在數(shù)據(jù)集成
項(xiàng)目中忽略數(shù)據(jù)數(shù)據(jù)質(zhì)量問(wèn)題,將為日后的信息化建設(shè)埋下隱患。如果發(fā)現(xiàn)各系統(tǒng)中的數(shù)
據(jù)質(zhì)量問(wèn)題、在數(shù)據(jù)集成中如何有效地檢測(cè)和效驗(yàn)數(shù)據(jù)質(zhì)量、如何在現(xiàn)有環(huán)境中利用有效
手段干預(yù)和改善數(shù)據(jù)質(zhì)量是我們必須面對(duì)的問(wèn)題。
2 醫(yī)療行業(yè)數(shù)據(jù)環(huán)境現(xiàn)狀
為了為醫(yī)院決策支持系統(tǒng)提供良好的數(shù)據(jù)分析和數(shù)據(jù)挖掘環(huán)境,在醫(yī)院數(shù)據(jù)集成項(xiàng)目
中會(huì)牽涉到醫(yī)院各方面的信息系統(tǒng)如HISRISPASCHR物流等,醫(yī)院的信息系統(tǒng)建設(shè)時(shí)
間闊度較長(zhǎng),各應(yīng)用和軟件提供商業(yè)比較分散、當(dāng)時(shí)也沒有可以參照的建設(shè)標(biāo)準(zhǔn)和數(shù)據(jù)標(biāo)
準(zhǔn)。有很多系統(tǒng)還是使用文件方式存儲(chǔ)數(shù)據(jù)。經(jīng)過(guò)多年的數(shù)據(jù)維護(hù)、搬遷,及當(dāng)時(shí)輸入時(shí)
487
缺乏效驗(yàn)。系統(tǒng)上線時(shí)功能模塊逐步上線導(dǎo)致的數(shù)據(jù)缺失、數(shù)據(jù)不完整、
2.1 醫(yī)院業(yè)務(wù)系統(tǒng)中一些存在問(wèn)題的數(shù)據(jù)的情形
2.1.1 常識(shí)形錯(cuò)誤 如:病人實(shí)際出生年月為1978 年,輸入時(shí)誤將9 輸入為8,導(dǎo)致病人
年齡130 歲。病人住院天數(shù)5 年確診天數(shù)1027 天, 輸入年月日輸入錯(cuò)誤,導(dǎo)致病人確診
天數(shù)大于住院天數(shù)。
2.1.2 不符合業(yè)務(wù)邏輯和規(guī)定 如:病人的病史記錄有氣管插管、氣管切開等搶救治療措
施,但在病人的費(fèi)用記錄里沒有相關(guān)的收費(fèi),病史記錄里有過(guò)告病危但沒有病危記錄,病
人實(shí)際沒有進(jìn)行一級(jí)護(hù)理或特級(jí)護(hù)理,但收費(fèi)按特護(hù)或一護(hù)收費(fèi)。
2.1.3 數(shù)據(jù)不完整 如:病人處方信息中,有處方的匯總記錄和總費(fèi)用記錄,但缺少明細(xì)
記錄。有手術(shù)但沒有數(shù)據(jù)報(bào)告或手術(shù)記錄。
2.1.4 數(shù)據(jù)缺乏實(shí)效性 如:手術(shù)完成后應(yīng)及時(shí)填寫數(shù)據(jù)切口等級(jí),如果到了出院才輸那
再圍術(shù)期抗菌用藥的分析就不能做到及時(shí)提示,在可控期間進(jìn)行控制。
2.1.5 數(shù)據(jù)統(tǒng)計(jì)口徑差異 如:病史科室、計(jì)算機(jī)中心、財(cái)務(wù)科室可能都擁有自己的信息
系統(tǒng)和對(duì)事物的描述方法。如門診人次、出院 |
|