結(jié)構(gòu)化數(shù)據(jù)輸入的新研究
*A.M. van Ginneken, *M. de Wilde
**包含飛(摘譯)
*荷蘭,鹿特丹, Erasmus大學(xué),醫(yī)學(xué)信息學(xué)教研室
**上海中醫(yī)藥大學(xué),中醫(yī)學(xué)信息化-標(biāo)準(zhǔn)化研究室
摘要 本文描述了結(jié)構(gòu)化數(shù)據(jù)輸入(SDE)的哲學(xué)思考,知識(shí)模型和知識(shí)編輯器、概念庫(kù),和SDE的功能、模板、有效性檢查等有關(guān)技術(shù)及其界面,最后討論用戶(hù)個(gè)性化和介紹了當(dāng)前的發(fā)展現(xiàn)狀。
關(guān)鍵詞 電子病歷 醫(yī)學(xué)信息學(xué) 知識(shí)工程 標(biāo)準(zhǔn)化
(一) 結(jié)構(gòu)化輸入:一個(gè)悖論
傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)輸入(SDE)方法是紙張表格式的。人們?yōu)檫@種傳統(tǒng)方式開(kāi)發(fā)了電子版,并提供輸入檢查,檢查數(shù)字?jǐn)?shù)據(jù)的有效性和提高數(shù)據(jù)的完整性等先進(jìn)功能。但這種固定排版表格在較小的學(xué)科領(lǐng)域,數(shù)據(jù)需求比較固定和簡(jiǎn)單的部門(mén)是有效的。對(duì)較大的學(xué)科,及信息需求多變難以預(yù)測(cè)的部門(mén),固定格式就成為累贅。內(nèi)科和兒科是典型的那種學(xué)科。需要幾十個(gè)甚至幾百個(gè)表格,有的病人還需不同的一組次級(jí)表格。而且一般還缺乏通覽的功能,用戶(hù)只能看到在顯的表格。除了用戶(hù)方面的不便以外,維護(hù)和適應(yīng)用戶(hù)問(wèn)題也非常困難。由于格式刻板,固定不變,覆蓋面小,故一般用于數(shù)據(jù)類(lèi)型較少,按常規(guī)收集數(shù)據(jù)的部門(mén)或研究項(xiàng)目中。需附加的數(shù)據(jù)則仍用自由文本輸入。
一些程序采取較為動(dòng)態(tài)的方式并提供有限的控制詞匯庫(kù)(controlled vocabularies),以菜單或一組模板(template)的形式提供預(yù)定義的描述性選項(xiàng)(predefined descriptive options)。所謂動(dòng)態(tài)是指所提供的描述體征和癥狀的選項(xiàng)對(duì)應(yīng)于當(dāng)前正在處理的問(wèn)題。如 PEN&PAD, IMR-E, Ivory, Pure MD, Purkinje, 和A.M. van Ginneken等開(kāi)發(fā)的內(nèi)分泌學(xué)病歷系統(tǒng)的原型。這些系統(tǒng)所覆蓋的領(lǐng)域范圍和內(nèi)容的詳盡程度不同:一些系統(tǒng)用概念-屬性-值(concept–attribute–value)模型,而補(bǔ)充的細(xì)節(jié)(additional detail)以自由文本的方式輸入。IMR-E提供的模板的基礎(chǔ)是一些經(jīng)選擇的癥狀。Purkinje則用樹(shù)狀層次結(jié)構(gòu),可根據(jù)要求的詳盡程度逐級(jí)擴(kuò)展。固定格式和動(dòng)態(tài)程序的優(yōu)缺點(diǎn)可歸結(jié)如下,前者方便快速數(shù)據(jù)輸入,但過(guò)分受限于內(nèi)容范圍;后者可變性較大,信息量較大的數(shù)據(jù)所需瀏覽量(nevigation)太大,用戶(hù)的”選擇-決定”的工作量過(guò)大;
總之,悖論在于醫(yī)生希望在一個(gè)表中能輸入任何數(shù)據(jù)。所以問(wèn)題的實(shí)質(zhì)是有效性必以犧牲可變性為代價(jià),而可變性將會(huì)犧牲有效性,二者能否統(tǒng)一?
(二) 哲學(xué)思考
我們的哲學(xué)是電子病歷(CPR)應(yīng)有公共基本數(shù)據(jù)結(jié)構(gòu)但同時(shí)其覆蓋內(nèi)容可根據(jù)需要“量體裁衣”。公共結(jié)構(gòu)應(yīng)與專(zhuān)業(yè)無(wú)關(guān),即描述數(shù)據(jù)的屬性對(duì)所有專(zhuān)業(yè)是統(tǒng)一的。如實(shí)驗(yàn)室報(bào)告應(yīng)包括檢驗(yàn)類(lèi)型、結(jié)果值、單位、正常值范圍。例如對(duì)于血糖濃度測(cè)定的報(bào)告,無(wú)論是外科醫(yī)生還是內(nèi)科醫(yī)生申請(qǐng)均無(wú)差別。又例如,藥物處方均有藥名、劑量和每天用藥次數(shù)等項(xiàng)目。與臨床專(zhuān)業(yè)無(wú)關(guān)的數(shù)據(jù)用直接模型:屏幕上的字段與表中的屬性一一對(duì)應(yīng)的直接關(guān)系。這種直接模型比較簡(jiǎn)單但也較呆板:內(nèi)容的任何改變都要求數(shù)據(jù)庫(kù)和軟件作相應(yīng)的修改。因此,數(shù)據(jù)變化很少的專(zhuān)業(yè)可首選這種直接模型。
有些數(shù)據(jù)是專(zhuān)業(yè)依賴(lài)性的,也即不同的專(zhuān)科應(yīng)用不同的數(shù)據(jù)項(xiàng),如心臟科的病歷與矯形外科的病歷大相徑庭。當(dāng)前癥狀記錄,物理檢查,放射科報(bào)告,內(nèi)分泌科報(bào)告,病理報(bào)告等也是如此。但為了內(nèi)容的可適性(flexibility),基本結(jié)構(gòu)應(yīng)是非內(nèi)容依賴(lài)性的。我們選擇樹(shù)狀結(jié)構(gòu),不僅能表達(dá)病人數(shù)據(jù),而且能表達(dá)任何描述性信息。每個(gè)結(jié)點(diǎn)表示一個(gè)概念,其子樹(shù)則表示其描述。然而,樹(shù)狀數(shù)據(jù)模型并不反映‘父子系列’的抽象內(nèi)容。每個(gè)結(jié)點(diǎn)所指的概念必需“告以”解釋這種內(nèi)容。因?yàn)楦郊恿诉@一解釋步驟,所以稱(chēng)其為間接模型。間接模型的可適性的關(guān)鍵是內(nèi)容的可擴(kuò)展性和不斷發(fā)展性且無(wú)須改變數(shù)據(jù)庫(kù)和軟件。
圖 1. 間接模型.知識(shí)庫(kù)和病人數(shù)據(jù)庫(kù)的內(nèi)容更新無(wú)須更新程序
ORCA(Open Record for CAre)是兼有專(zhuān)業(yè)獨(dú)立性和非獨(dú)立性數(shù)據(jù)并以直接和非直接數(shù)據(jù)模型實(shí)現(xiàn)的通用CPR的原型。該程序的采集結(jié)構(gòu)化數(shù)據(jù)的非直接部分的用戶(hù)界面是動(dòng)態(tài)的,但直覺(jué)性和高效性欠缺。高效性和可適應(yīng)性的結(jié)合是一個(gè)嚴(yán)峻的挑戰(zhàn),因此我們把研究重點(diǎn)放在專(zhuān)業(yè)依賴(lài)性數(shù)據(jù)的SDE上。這一SDE是全新的設(shè)計(jì)模塊,在數(shù)據(jù)錄入時(shí)利用知識(shí)庫(kù)指導(dǎo)。以下介紹此SDE的知識(shí)模型,知識(shí)編輯器及用戶(hù)界面。
|
|