基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及模式識(shí)別、相似性測(cè)度及電子病歷領(lǐng)域,更具體地說,設(shè)及一種基于結(jié) 構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法及裝置。
【背景技術(shù)】
[0002] 電子病歷是醫(yī)療信息化的必然產(chǎn)物,具備傳統(tǒng)紙質(zhì)病歷所不具備的優(yōu)點(diǎn),比如便 于保存、傳閱,并便于進(jìn)一步開發(fā)病歷的潛在價(jià)值。近年來,有關(guān)電子病歷的應(yīng)用研究逐漸 增多,但大多數(shù)僅限于記錄患者的癥狀和治療過程,而對(duì)其包含的大量信息再應(yīng)用設(shè)及較 少。電子病歷既是患者的診療過程的記錄,也是醫(yī)生經(jīng)驗(yàn)的載體,其包含了醫(yī)生的經(jīng)驗(yàn)W及 患者個(gè)體化差異的大量信息。所W對(duì)于電子病歷的信息挖掘,會(huì)極大地發(fā)揮醫(yī)療大數(shù)據(jù)信 息資源的臨床價(jià)值。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的是提供一種基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法及裝置,該 方法及裝置能夠找出對(duì)患者診療方案更具參考意義的參考病歷,W解決現(xiàn)有病歷大數(shù)據(jù)未 能有效利用的問題。
[0004] 本發(fā)明的具體技術(shù)方案如下:
[0005] 一種基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法,該檢索方法包括:
[0006]W新病歷的已檢查項(xiàng)目為準(zhǔn)則、病歷數(shù)據(jù)庫中新病歷W前的歷史病歷為待選方案 建立目標(biāo)層-準(zhǔn)則層-方案層=層結(jié)構(gòu)的層次模型;
[0007] 計(jì)算準(zhǔn)則層相對(duì)于目標(biāo)層的權(quán)重;
[000引計(jì)算新病歷與歷史病歷的單項(xiàng)相似度,所述單項(xiàng)相似度是對(duì)單個(gè)檢查項(xiàng)目而言兩 個(gè)病歷的相似程度;
[0009] 將相對(duì)同一歷史病歷的各個(gè)單項(xiàng)相似度與權(quán)重對(duì)應(yīng)相乘獲取新病歷與歷史病歷 的綜合相似度;
[0010] 利用診治醫(yī)師和醫(yī)院的等級(jí)指數(shù)計(jì)算歷史病歷的參考價(jià)值指數(shù);
[0011] 利用綜合相似度與參考價(jià)值指數(shù)確定新病歷與歷史病歷的綜合匹配度;W及
[0012] 選取綜合匹配度高的歷史病歷作為該新病歷的參考病歷;
[0013] 所述病歷數(shù)據(jù)庫是對(duì)醫(yī)療機(jī)構(gòu)的電子病歷進(jìn)行結(jié)構(gòu)化后建立的疾病診療數(shù)據(jù)庫。
[0014] 在上述的基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法中,優(yōu)選地,在計(jì)算準(zhǔn)則層 相對(duì)于目標(biāo)層的權(quán)重的步驟中,包括:用各個(gè)已檢查項(xiàng)目與疾病的關(guān)聯(lián)度指數(shù)構(gòu)造準(zhǔn)則層 相對(duì)于目標(biāo)層的判斷矩陣;W及將判斷矩陣的各行向量進(jìn)行幾何平均,然后進(jìn)行歸一化處 理得到目標(biāo)層的權(quán)重。
[0015] 在上述的基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法中,優(yōu)選地,在計(jì)算新病歷 與歷史病歷的單項(xiàng)相似度的步驟中,采用距離系數(shù)來判定兩個(gè)病歷之間的匹配度。
[0016] 在上述的基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法中,優(yōu)選地,所述距離系數(shù) 為相對(duì)海明距離Du,單項(xiàng)相似度Su計(jì)算如下:
[0017]
[001引其中,i和j表示進(jìn)行比較的兩個(gè)病歷,Xk表示已檢查項(xiàng)目k的指標(biāo),Xl_表示所有 病歷中Xk指標(biāo)的最大值,表示所有病歷中Xk指標(biāo)的最小值,m為指標(biāo)個(gè)數(shù),0《Dm。
[0019] 在上述的基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法中,優(yōu)選地,所述病歷數(shù)據(jù) 庫W時(shí)間為主索引,每個(gè)時(shí)間點(diǎn)上包含各項(xiàng)相關(guān)檢查的子索引,子索引分層設(shè)置。
[0020] 一種基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索裝置,該檢索裝置包括:
[0021] 層次模型構(gòu)造模塊,用于W新病歷的已檢查項(xiàng)目為準(zhǔn)則、病歷數(shù)據(jù)庫中新病歷W 前的歷史病歷為待選方案建立目標(biāo)層-準(zhǔn)則層-方案層=層結(jié)構(gòu)的層次模型;
[0022] 權(quán)重計(jì)算模塊,用于計(jì)算準(zhǔn)則層相對(duì)于目標(biāo)層的權(quán)重;
[0023] 單項(xiàng)相似度計(jì)算模塊,用于計(jì)算新病歷與歷史病歷的單項(xiàng)相似度,所述單項(xiàng)相似 度是對(duì)單個(gè)檢查項(xiàng)目而言兩個(gè)病歷的相似程度;
[0024] 綜合相似度計(jì)算模塊,用于將相對(duì)同一歷史病歷的各個(gè)單項(xiàng)相似度與權(quán)重對(duì)應(yīng)相 乘獲取新病歷與歷史病歷的綜合相似度;
[0025] 參考價(jià)值指數(shù)計(jì)算模塊,用于利用診治醫(yī)師和醫(yī)院的等級(jí)指數(shù)計(jì)算歷史病歷的參 考價(jià)值指數(shù);
[0026] 綜合匹配度計(jì)算模塊,用于利用綜合相似度與參考價(jià)值指數(shù)確定新病歷與歷史病 歷的綜合匹配度;W及
[0027] 輸出檢索結(jié)果模塊,用于選取綜合匹配度高的歷史病歷作為該新病歷的參考病 歷;
[002引所述病歷數(shù)據(jù)庫是對(duì)醫(yī)療機(jī)構(gòu)的電子病歷進(jìn)行結(jié)構(gòu)化后建立的疾病診療數(shù)據(jù)庫。
[0029] 在上述的基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索裝置中,優(yōu)選地,所述權(quán)重計(jì)算 模塊包括;判斷矩陣構(gòu)造子模塊,用于用各個(gè)已檢查項(xiàng)目與疾病的關(guān)聯(lián)度指數(shù)構(gòu)造準(zhǔn)則層 相對(duì)于目標(biāo)層的判斷矩陣;W及矩陣處理子模塊,用于將判斷矩陣的各行向量進(jìn)行幾何平 均,然后進(jìn)行歸一化處理得到目標(biāo)層的權(quán)重。
[0030] 在上述的基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索裝置中,優(yōu)選地,在所述單項(xiàng)相 似度計(jì)算模塊中,采用距離系數(shù)來判定兩個(gè)病歷之間的匹配度。
[0031] 在上述的基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索裝置中,優(yōu)選地,在所述單項(xiàng)相 似度計(jì)算模塊中,所述距離系數(shù)為相對(duì)海明距離Dy,單項(xiàng)相似度Su計(jì)算如下:
[0032]
[0033] 其中,i和j表示進(jìn)行比較的兩個(gè)病歷,Xk表示已檢查項(xiàng)目k的指標(biāo),Xl_表示所有 病歷中Xk指標(biāo)的最大值,表示所有病歷中Xk指標(biāo)的最小值,m為指標(biāo)個(gè)數(shù),0《Dm。
[0034] 在上述的基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索裝置中,優(yōu)選地,所述病歷數(shù)據(jù) 庫W時(shí)間為主索引,每個(gè)時(shí)間點(diǎn)上包含各項(xiàng)相關(guān)檢查的子索引,子索引分層設(shè)置。
[0035] 本發(fā)明通過將醫(yī)療機(jī)構(gòu)的病歷結(jié)構(gòu)化,構(gòu)建病歷數(shù)據(jù)庫,進(jìn)而依托病人已經(jīng)進(jìn)行 的檢查結(jié)果檢索獲得與病人最為相似的病歷,從而能夠?yàn)獒t(yī)生進(jìn)行個(gè)性化的診治提供有價(jià) 值的參考。
【附圖說明】
[0036] 圖1為本發(fā)明基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法一些實(shí)施例的流程圖;
[0037]圖2為其層次模型的示意圖;
[0038]圖3為其病歷數(shù)據(jù)庫部分分類索引的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0039]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)一步說明。該些更詳細(xì)的描述旨在幫助理解本 發(fā)明,而不應(yīng)被用于限制本發(fā)明。根據(jù)本發(fā)明公開的內(nèi)容,本領(lǐng)域技術(shù)人員明白,可W不需 要一些或者所有該些特定細(xì)節(jié)即可實(shí)施本發(fā)明。而在其它情況下,為了避免將發(fā)明創(chuàng)造淡 化,未詳細(xì)描述眾所周知的操作過程。
[0040]層次分析法是一種利用定性和定量分析尋求最優(yōu)解決方案的方法,在管理領(lǐng)域應(yīng) 用較多。本發(fā)明在層次分析法基礎(chǔ)上進(jìn)行改進(jìn),嘗試運(yùn)用于臨床領(lǐng)域,為電子病歷的潛在價(jià) 值的開發(fā)利用提供技術(shù)支持。
[0041] 如圖1所示,一些實(shí)施例基于結(jié)構(gòu)化病歷數(shù)據(jù)庫的參考病歷檢索方法包括W下步 驟:
[0042]步驟S100,W新病歷的已檢查項(xiàng)目為準(zhǔn)則、病歷數(shù)據(jù)庫中新病歷W前的歷史病歷 為待選方案建立目標(biāo)層-準(zhǔn)則層-方案層=層結(jié)構(gòu)的層次模型。
[0043]在一些實(shí)施例中,W冠屯、病為例進(jìn)行說明,建立的層次模型如圖2所示,已進(jìn)行的 檢查項(xiàng)目包括常規(guī)屯、電、運(yùn)動(dòng)屯、電、核醫(yī)學(xué)、超聲、CT、冠狀動(dòng)脈造影,它們構(gòu)成了準(zhǔn)則層。依 據(jù)傳統(tǒng)的層次分析法并結(jié)合在本技術(shù)中的應(yīng)用建立。計(jì)算準(zhǔn)則層相對(duì)于目標(biāo)層的權(quán)重時(shí)利 用層次分析法中的構(gòu)造判斷矩陣的方法,但在計(jì)算方案層相對(duì)準(zhǔn)則層的權(quán)重時(shí),由于方案 層中的方案指的是病歷數(shù)據(jù)庫中的各個(gè)病例,而病例數(shù)據(jù)量較大,無法由人工判斷各病例 相對(duì)于各準(zhǔn)則的權(quán)重,即不能利用構(gòu)造判斷矩陣的方法,所W此處的確定各病例的權(quán)重歸 為依據(jù)各準(zhǔn)則(常規(guī)屯、電相似、運(yùn)動(dòng)屯、電相似、核醫(yī)學(xué)相似、超聲相似、CT相似、冠狀動(dòng)脈造 影相似)計(jì)算病歷數(shù)據(jù)庫中各病例與新入病例的相似度,同時(shí)結(jié)合每個(gè)病歷的重要性。
[0044]步驟S200,計(jì)算準(zhǔn)則層相對(duì)于目標(biāo)層的權(quán)重。
[0045]首先,構(gòu)造準(zhǔn)則層相對(duì)于目標(biāo)層的判斷矩陣,具體地,用各個(gè)已檢查項(xiàng)目與疾病的 關(guān)聯(lián)度指數(shù)構(gòu)造準(zhǔn)則層相對(duì)于目標(biāo)層的判斷矩陣。各項(xiàng)檢查相對(duì)于冠屯、病確診的重要性 (即各個(gè)已檢查項(xiàng)目與疾病的關(guān)聯(lián)度指數(shù))由經(jīng)驗(yàn)醫(yī)生給出,舉例如下:
[0046]
[0047] 表中,El為常規(guī)屯、電,E2為運(yùn)動(dòng)屯、電,E3為核醫(yī)學(xué),E4為超聲,E5為CT,E6為冠 狀動(dòng)脈造影,e為關(guān)聯(lián)度指數(shù)。貝Ij,判斷矩陣為:
[0048]
[0049] 通常ey與ej,呈倒數(shù)關(guān)系。
[0050] 接下來,利用判斷矩陣確定各準(zhǔn)則相對(duì)于目標(biāo)的權(quán)重系數(shù),具體的,將判斷矩陣的 各行向量進(jìn)行幾何平均,然后進(jìn)行歸一化處理得到目標(biāo)層的權(quán)重。舉例來說,將上述判斷矩 陣A各行向量進(jìn)行幾何平均,由
[0054] 對(duì)W向量歸一化,由
[005引為了獲得更好效果,進(jìn)一步地,還包括;計(jì)算判斷矩陣的最大特征根,利用最大特 征根計(jì)算一致性指標(biāo),檢驗(yàn)判斷矩陣的一致性,獲得具有良好一致性的權(quán)重。具體的,根據(jù)
[0059]
[0060] 計(jì)算判斷矩陣的最大特征根Am。,;由
[0061]
[0062] 計(jì)算一致性指標(biāo)CI,與平均隨機(jī)一致性指標(biāo)RI計(jì)算得到判斷矩陣的一致性比率 CR=CI/RI,若CR小于0. 1,說明判斷矩陣具有滿意的一致性,不需要調(diào)整,權(quán)重系數(shù)W可 用。
[0063] 步驟S300,計(jì)算新病歷與歷史病歷的單項(xiàng)相似度,所述單項(xiàng)相似度是對(duì)單個(gè)檢查 項(xiàng)目而言兩個(gè)病歷的相似程度。
[0064] 每個(gè)病歷都是由一系列診斷指標(biāo)數(shù)據(jù)序列所組成,計(jì)算兩個(gè)數(shù)據(jù)序列的相似度較 常用的方法包括相關(guān)系數(shù)、相似系數(shù)、距離系數(shù)和相似離度。相關(guān)系數(shù)和相似系數(shù)一般用來 判斷數(shù)據(jù)序列的形相似,距離系數(shù)多用于判斷值相似,相似離度是一種比較新的方法,結(jié)合 了形相似和值相似,但實(shí)際運(yùn)用中效果并不十分理想。在此應(yīng)用中,由于病歷中每個(gè)指標(biāo)即 每個(gè)數(shù)據(jù)點(diǎn)代表的意義不盡相同,用值相似來判斷兩個(gè)病歷之間的匹配度更為合適,所W 一些實(shí)施例中采用距離系數(shù)來判定兩個(gè)病歷之間的匹配度。
[00化]距離系數(shù)主要包括絕對(duì)距離(即海明距離)和歐式距離,相比而言,絕對(duì)距離更能 反映兩序列之間的值相似程度,所W-些實(shí)施例中采用絕對(duì)距離:
[0066]
[0067] 其中m為每項(xiàng)檢查項(xiàng)目下可量化的診斷指標(biāo)數(shù)量。由于在比較病歷的相似程度 上,每個(gè)用于比較的指標(biāo)意義不同,量綱不同,為了去除量綱的影響,一些實(shí)施例中還對(duì)絕 對(duì)距離進(jìn)行了改進(jìn),使用相對(duì)海明距離:
[0068]
[0069] 具體的,單項(xiàng)相似度Sy計(jì)算如下;