存儲架構(gòu)
8.1
存儲需求分析
基于健康檔案的區(qū)域衛(wèi)生信息平臺建設(shè)中最關(guān)鍵的是數(shù)據(jù)。如何滿足區(qū)域衛(wèi)生信息平臺的存儲需求,是我們必須考慮的問題。以下我們對區(qū)域衛(wèi)生信息平臺中所涉及的存儲需求進(jìn)行分析。
8.1.1
存儲的數(shù)據(jù)類型
在存儲架構(gòu)的設(shè)計中,我們需要同時考慮健康檔案的數(shù)據(jù)存儲和區(qū)域衛(wèi)生信息平臺的數(shù)據(jù)存儲。
健康檔案的存儲主要分成五種類型:健康檔案數(shù)據(jù)存儲(EHR Data Storage)、業(yè)務(wù)文檔數(shù)據(jù)存儲(Business Document Storage)、ODS數(shù)據(jù)存儲(Operational Data Store)、業(yè)務(wù)平臺數(shù)據(jù)存儲(Business Data Storage)、數(shù)據(jù)倉庫存儲(Data Warehouse)。
區(qū)域衛(wèi)生信息平臺運行所涉及的支撐數(shù)據(jù)包括:標(biāo)準(zhǔn)數(shù)據(jù)、注冊數(shù)據(jù)、來自各POS的數(shù)據(jù)等。
1)、健康檔案數(shù)據(jù)
健康檔案數(shù)據(jù)(EHR Data Store)是區(qū)域衛(wèi)生信息平臺的基礎(chǔ)。健康檔案數(shù)據(jù)不限定以關(guān)系型數(shù)據(jù)庫或文檔的存儲方式進(jìn)行存儲,在存儲架構(gòu)設(shè)計中應(yīng)重點考慮健康檔案數(shù)據(jù)中不同數(shù)據(jù)存儲方式下的存儲、歸檔、檢索的效率,以及所涉及的數(shù)據(jù)備份恢復(fù)。
根據(jù)健康檔案信息的分類,健康檔案存儲服務(wù)分為七個存儲庫:個人基本信息存儲庫、主要疾病和健康問題摘要存儲庫、兒童保健存儲庫、婦女保健存儲庫、疾病控制存儲庫、疾病管理存儲庫以及醫(yī)療服務(wù)存儲庫。
2)、業(yè)務(wù)文檔數(shù)據(jù)庫
業(yè)務(wù)文檔數(shù)據(jù)庫指的是醫(yī)療活動產(chǎn)生的與EHR相關(guān)的文檔,這些文檔通過區(qū)域信息交換層(HIAL)傳送到區(qū)域衛(wèi)生信息平臺。它需要平臺的專門服務(wù)解析和
670
映射(Parser/Map/Rebuilder),才能轉(zhuǎn)換成EHR文檔。平臺必須有一個永久存儲業(yè)務(wù)文檔庫的數(shù)據(jù)庫。
業(yè)務(wù)文檔以XML方式進(jìn)行組織,與電子簽名相結(jié)合,在文檔庫中進(jìn)行注冊。
3)、ODS數(shù)據(jù)庫
從業(yè)務(wù)支持的角度來看,我們需要建立ODS數(shù)據(jù)庫,來實現(xiàn)對業(yè)務(wù)的更好支持。為了完成某些特定業(yè)務(wù)上的流程要求,可能產(chǎn)生很多中間數(shù)據(jù),而這些中間數(shù)據(jù)都有賴ODS數(shù)據(jù)庫實現(xiàn)其存儲方式。
4)、業(yè)務(wù)平臺數(shù)據(jù)庫
除健康檔案數(shù)據(jù)(EHR Data Store)之外,區(qū)域衛(wèi)生信息平臺需要存儲一些相關(guān)的業(yè)務(wù)數(shù)據(jù),并實現(xiàn)對這些數(shù)據(jù)的插入、更新、查詢和統(tǒng)計功能。業(yè)務(wù)數(shù)據(jù)主要包括以文檔形式存儲的結(jié)果數(shù)據(jù),以及操作型數(shù)據(jù)。
文檔數(shù)據(jù):以文檔形式存在于平臺中的臨床和預(yù)防保健業(yè)務(wù)數(shù)據(jù),例如檢驗報告、處方、傳染病報告卡等。這些數(shù)據(jù)是結(jié)果數(shù)據(jù)。
操作型數(shù)據(jù):從多個醫(yī)療機(jī)構(gòu)內(nèi)部信息系統(tǒng)中采集上來,并加以匯總處理后的數(shù)據(jù),主要服務(wù)于統(tǒng)一的實時查詢和實時的統(tǒng)計。
5)、數(shù)據(jù)倉庫
主要是業(yè)務(wù)管理和輔助決策所需的支撐數(shù)據(jù)。這些數(shù)據(jù)是通過數(shù)據(jù)倉庫工具進(jìn)行抽取、轉(zhuǎn)化和整理后存儲在數(shù)據(jù)倉庫中的。數(shù)據(jù)倉庫數(shù)據(jù)以主題方式組織,是經(jīng)過二次加工的歷史數(shù)據(jù)。
6)、標(biāo)準(zhǔn)數(shù)據(jù)
標(biāo)準(zhǔn)數(shù)據(jù)是區(qū)域衛(wèi)生信息平臺運行的數(shù)據(jù)基礎(chǔ)。標(biāo)準(zhǔn)數(shù)據(jù)包括區(qū)域衛(wèi)生業(yè)務(wù)數(shù)據(jù)的所有數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,通過這個庫和數(shù)據(jù)校驗機(jī)制對數(shù)據(jù)中心的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化保障,主要的數(shù)據(jù)標(biāo)準(zhǔn)包括整個定義電子健康檔案的數(shù)據(jù)集和數(shù)據(jù)元(具體可參考衛(wèi)生部發(fā)布的中國健康檔案數(shù)據(jù)標(biāo)準(zhǔn)),還有各種代碼標(biāo)準(zhǔn)。由于數(shù)據(jù)標(biāo)準(zhǔn)存在著時效性,因此針對有時效性的數(shù)據(jù)進(jìn)行版本控制,不同的版本有各自的生命周期,不同生命周期中的業(yè)務(wù)數(shù)據(jù)對應(yīng)不同版本的數(shù)據(jù)。
在系統(tǒng)實現(xiàn)中,標(biāo)準(zhǔn)數(shù)據(jù)以XML template的形式或關(guān)系型數(shù)據(jù)的形式進(jìn)行存儲。
7)、注冊數(shù)據(jù)
注冊數(shù)據(jù)是滿足注冊服務(wù)所需的數(shù)據(jù)及存儲。包括個人、醫(yī)療衛(wèi)生人員、醫(yī)療
671
衛(wèi)生機(jī)構(gòu)、醫(yī)療衛(wèi)生術(shù)語的注冊管理數(shù)據(jù)。
8)、區(qū)域信息交換層(HIAL)臨時存儲的交換數(shù)據(jù)
區(qū)域信息交換層(HIAL)將來自于POS的數(shù)據(jù)/文檔接入到平臺中進(jìn)行處理。區(qū)域信息交換層(HIAL)將EHR數(shù)據(jù)/文檔發(fā)送到POS或其他數(shù)據(jù)消費方。這些數(shù)據(jù)/文檔在處理前將臨時存放在數(shù)據(jù)交換(HIAL)應(yīng)用服務(wù)器或其他服務(wù)器。這部分?jǐn)?shù)據(jù)的存儲要求有較高的I/O速度。
8.1.2
數(shù)據(jù)存儲的模式需求
對于基于健康檔案的區(qū)域衛(wèi)生信息平臺來說,數(shù)據(jù)存儲模式是信息架構(gòu)要考慮的一項重要內(nèi)容。對于區(qū)域衛(wèi)生信息的使用者而言,沒有必要關(guān)心數(shù)據(jù)的存儲模式。這比如大家從互聯(lián)網(wǎng)上查找新聞時,大家并不關(guān)心存儲這條新聞的服務(wù)器放在那個國家,也即不必關(guān)心數(shù)據(jù)存儲模式。但是區(qū)域衛(wèi)生信息平臺的設(shè)計者,需要從經(jīng)濟(jì)可行性、技術(shù)可行性和管理可行性方面去考慮選擇不同的數(shù)據(jù)存儲模式。
區(qū)域衛(wèi)生信息平臺涉及到與居民健康相關(guān)的所有業(yè)務(wù),因此其業(yè)務(wù)數(shù)據(jù)具有類型多、容量大的特點。數(shù)據(jù)存儲模式種類有以下三種:集中式、分布式和聯(lián)邦式。集中式:建設(shè)一個統(tǒng)一的數(shù)據(jù)中心,把一個區(qū)域內(nèi)需要共享的數(shù)據(jù)集中全部存儲在數(shù)據(jù)中心。分布式:一個區(qū)域內(nèi)沒有統(tǒng)一的數(shù)據(jù)存儲中心,數(shù)據(jù)可以分散在不同的機(jī)構(gòu)和地點。例如,某個患者需要訪問上個月做的X光檢查資料,區(qū)域衛(wèi)生信息平臺會將該患者的訪問需求轉(zhuǎn)移到他上個月去的醫(yī)院的系統(tǒng),將存儲在該醫(yī)院的數(shù)據(jù)提供給患者使用。所謂聯(lián)邦式是集中與分布相結(jié)合的數(shù)據(jù)存儲模式,對于用戶經(jīng)常訪問的數(shù)據(jù)集中在數(shù)據(jù)中心,其余分散在不同地點或機(jī)構(gòu)。
根據(jù)業(yè)務(wù)數(shù)據(jù)的特點,對數(shù)據(jù)存儲的要求也不盡相同。我們對這三種數(shù)據(jù)存儲的優(yōu)劣勢以及數(shù)據(jù)分布的分析如下:
表8-1 數(shù)據(jù)存儲的優(yōu)劣勢以及數(shù)據(jù)分布
數(shù)據(jù)存儲模式
優(yōu)點
缺點
數(shù)據(jù)分布
集中式存儲方式
效率高且方法簡單
但擴(kuò)展性和靈活適應(yīng)性受到一定局限
在本系統(tǒng)建設(shè)中,對于居民基本信息(包括姓名、性別、出生年月、身份證號、社會保險號等),由于其使用頻率高,數(shù)據(jù)容量相對較小,可采用數(shù)據(jù)中心集中式存儲的
672
方式;對于公共衛(wèi)生信息,如疾病預(yù)防數(shù)據(jù)、婦幼保健數(shù)據(jù)、精神衛(wèi)生數(shù)據(jù),則采用中心集中存儲的模式,這樣可以保證該類數(shù)據(jù)的安全性。
分布式存儲方式
一般說來效率較低,技術(shù)實現(xiàn)復(fù)雜
擴(kuò)展性和靈活性有很大優(yōu)勢
在本系統(tǒng)建設(shè)中,對于醫(yī)學(xué)影像信息,其數(shù)據(jù)量大,可采用分布式的存儲模式,這類信息通過注冊到區(qū)域衛(wèi)生信息平臺,當(dāng)醫(yī)療機(jī)構(gòu)需要調(diào)閱時,可通過平臺查詢獲取數(shù)據(jù)所存儲的地址(一般為某醫(yī)療機(jī)構(gòu)),再從目的地獲取所需要的信息。這樣既減輕了平臺的負(fù)載,也提高了數(shù)據(jù)的調(diào)閱效率,但缺點是對醫(yī)療機(jī)構(gòu)之間的網(wǎng)絡(luò)要求較高,區(qū)域范圍內(nèi)各醫(yī)療機(jī)構(gòu)之間必須是雙向網(wǎng)絡(luò),而且需要保證一定的帶寬。
混合存儲方式(聯(lián)邦式)
結(jié)合以上兩種模式的優(yōu)點
對于其他業(yè)務(wù)數(shù)據(jù)(如實驗室檢驗數(shù)據(jù)、就診記錄數(shù)據(jù)),則可以根據(jù)實際的業(yè)務(wù)需求,采用分布式存儲+集中式存儲的混合模式。
總的來說,區(qū)域衛(wèi)生信息平臺存儲架構(gòu)設(shè)計中應(yīng)考慮支持這三種架構(gòu)來實現(xiàn)數(shù)據(jù)存儲。
8.1.3
數(shù)據(jù)存儲的安全需求
在存儲設(shè)計中,應(yīng)考慮數(shù)據(jù)存儲的安全需求。由于數(shù)據(jù)不限定以關(guān)系型數(shù)據(jù)庫或文檔形式進(jìn)行存儲,需要建立安全控制機(jī)制,對存儲的數(shù)據(jù)對象訪問進(jìn)行授權(quán)。對于存儲在數(shù)據(jù)庫中的數(shù)據(jù),除了授權(quán)機(jī)制之外,應(yīng)考慮視圖級安全和記錄級安
673
全控 |
|