對電子病歷應用數(shù)據(jù)挖掘的輔助醫(yī)療診斷研究
吳煒① 楊梅瑰② 唐飛岳③
①中國電信湖南省分公司政企客戶部,410011,長沙市五一大道359號
②中南大學湘雅三醫(yī)院醫(yī)務科,410013,長沙市桐梓坡路138號
③湖南交通職業(yè)技術學院信息管理系,410004,長沙市韶山南路635
1 引言
醫(yī)療質(zhì)量管理是醫(yī)院管理工作的核心和實質(zhì)所在,推進與落實醫(yī)療質(zhì)量管理是減少醫(yī)療安全隱患、遏制醫(yī)患糾紛發(fā)生的重要舉措。醫(yī)學科學的特性決定醫(yī)療風險必然存在,醫(yī)療服務不可能象其他商品生產(chǎn)行業(yè)實現(xiàn)零缺陷[1],但其中的人為因素是可控和可避免的。以2008年山東省3個地級市的醫(yī)療事故鑒定檔案的數(shù)據(jù)統(tǒng)計為例分析,其中72.66%的事故原因是可控或可避免[2]。醫(yī)方對病情未做全面考慮,過分依賴經(jīng)驗或輔助檢查結果,造成漏診、誤診或診斷不及時延誤治療;或?qū)δ承撛谖kU估計不足、醫(yī)療記錄不完整、不全面甚至出現(xiàn)錯誤,是影響醫(yī)療質(zhì)量的最直接的原因。如何避免診斷上的疏失及錯誤,是醫(yī)療管理必須考慮的重要問題。
在醫(yī)務人員的診斷過程中,通常以患者的口述或癥狀表現(xiàn),輔助以檢查結果做為診斷的依據(jù),但診斷的正確程度基本上依賴于醫(yī)務人員的臨床經(jīng)驗及專業(yè)素質(zhì)。對已知癥狀未能做出正確的診斷,而導致病情延誤治療或惡化是常見的醫(yī)療質(zhì)量缺陷。隨著信息技術的發(fā)展,記錄相關診斷信息的載體已逐漸從傳統(tǒng)紙本病歷轉(zhuǎn)變成電子病歷(Electronic Medical Record, EMR)。如何從電子病歷數(shù)據(jù)庫中找出診斷項目與診斷結果之間的關聯(lián)性,以最簡潔有效的幾個因素輔助醫(yī)務人員做出準確判斷,減少誤診及疏忽的可能性,已成為利用電子病歷來提高醫(yī)療質(zhì)量的重要研究課題。
2 理論分析
2.1 概述 “數(shù)據(jù)挖掘”是泛指從海量的數(shù)據(jù)中分析萃取,以探索得到非顯然的、未知的、潛在的、可能有用的信息未知為主要目的復雜活動,最初在1992 年由Frawley 等人首次提出[3]。1996年Fayyad等人對流程進一步細化為五個步驟[4]。同年,Brachman 與Anand在Fayyad的研究基礎上將流程細分為九個步驟[5]。通常
來說,在確定研究方向或要解決的問題后,數(shù)據(jù)挖掘的工作流程為:原始數(shù)據(jù)資料的搜集;將數(shù)據(jù)資料分組,轉(zhuǎn)換有意義的信息;在信息中甄選出有用的知識,從而實現(xiàn)“數(shù)據(jù)->信息->知識”的轉(zhuǎn)變。
目前數(shù)據(jù)挖掘的各種技術已被廣泛的應用在經(jīng)營輔助決策、消費行為分析等多個領域。針對特定疾病的診斷與預測也在國內(nèi)外得到一定的應用,例如以線性判別分析、主成分分析,結合類神經(jīng)網(wǎng)絡以鑒別青光眼;以及利用多群判別分析,結合血清檢驗與放射性治療的產(chǎn)生的線性函數(shù),透過ROC曲線分析預測C型肝炎病變?yōu)楦斡不母怕省T诖,本文提出以?shù)據(jù)挖掘技術為基礎,結合統(tǒng)計分析與規(guī)則推導理論,對電子病歷應用數(shù)據(jù)挖掘以實現(xiàn)醫(yī)療診斷輔助的研究。
2.2 數(shù)據(jù)預處理
2.2.1 數(shù)據(jù)修剪 由于數(shù)據(jù)挖掘通常面對的是數(shù)量龐大的數(shù)據(jù),為提高知識挖掘效率,通常會對數(shù)據(jù)進行預處理,有效地簡化或修剪數(shù)據(jù)但不失去原本數(shù)據(jù)中可能隱含的知識。數(shù)據(jù)修剪的理論依據(jù)主要是刪除與預計挖掘結果較不相關,或可能誤導挖掘結果的數(shù)據(jù),以減少整體的數(shù)據(jù)量與計算量,并增加挖掘結果的精確度。數(shù)據(jù)修剪也是數(shù)據(jù)挖掘技術中一個重要的研究方向,本文中不做深入探討。
針對布爾型(Boolean)的數(shù)據(jù)項,通?梢灾苯有藜。針對數(shù)值型(Numeric)的數(shù)據(jù)項,采用相關系數(shù)法[6]來做數(shù)據(jù)修剪,通過衡量兩數(shù)值變量的線性關系強度及正負偏離的參數(shù),來決定數(shù)據(jù)是否保留。
2.2.2 空白數(shù)據(jù)補齊 原始數(shù)據(jù)中通常會存在一部分被標示為“BLANK”、“NULL”的空白數(shù)據(jù)。為確保所分析數(shù)據(jù)的完整性,對此類數(shù)據(jù)必須予以補齊。處理空白數(shù)據(jù)的方法大致上有以下五種:直接忽略,該方法操作簡單 |
|