本發(fā)明涉及醫(yī)療數(shù)據(jù)處理,尤其涉及一種抗菌藥物臨床使用病程記錄生成方法和系統(tǒng)。
背景技術(shù):
1、隨著醫(yī)院信息系統(tǒng)與人工智能技術(shù)的迅速發(fā)展,信息技術(shù)與醫(yī)療健康領(lǐng)域的深度融合引領(lǐng)著數(shù)字醫(yī)療、智慧醫(yī)療等新興醫(yī)療業(yè)態(tài)不斷涌現(xiàn)、蓬勃興起,使其日益成為臨床醫(yī)療工作和醫(yī)院管理工作的發(fā)展方向。目前,雖然包括病程記錄在內(nèi)的醫(yī)療文書電子化已經(jīng)基本實(shí)現(xiàn),但是這些病程記錄仍然需要醫(yī)生人為輸入到系統(tǒng)上,從而加劇了臨床醫(yī)生的工作負(fù)擔(dān)。另外人為輸入的抗菌藥物使用病程記錄中還經(jīng)常存在信息遺漏、關(guān)鍵內(nèi)容缺失、記錄不規(guī)范及內(nèi)容過于簡(jiǎn)化等問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明針對(duì)現(xiàn)有技術(shù)中的不足,公開了一種抗菌藥物臨床使用病程記錄生成方法,包括如下步驟:
2、s1,獲取患者全景歷史醫(yī)療數(shù)據(jù),所述患者全景歷史醫(yī)療數(shù)據(jù)包括患者基本信息、抗菌藥物臨床使用相關(guān)數(shù)據(jù)和對(duì)應(yīng)的病程記錄,所述抗菌藥物臨床使用相關(guān)數(shù)據(jù)包括但不限于醫(yī)生抗菌藥物處方權(quán)限、抗菌藥物醫(yī)囑明細(xì)、用法用量、病原學(xué)檢驗(yàn)結(jié)果與其他實(shí)驗(yàn)室檢測(cè)結(jié)果、抗菌治療效果;
3、s2,對(duì)所述患者全景歷史醫(yī)療數(shù)據(jù)進(jìn)行預(yù)處理,將文本分割成單詞/詞語并添加詞性標(biāo)注后形成病程記錄訓(xùn)練數(shù)據(jù)集;
4、s3,使用bi-lstm-crf模型建立抗菌藥物使用病程記錄生成規(guī)則,根據(jù)所述抗菌藥物使用病程記錄生成規(guī)則構(gòu)建病程記錄生成模型,利用病程記錄訓(xùn)練數(shù)據(jù)集中的各訓(xùn)練樣本對(duì)未經(jīng)訓(xùn)練的病程記錄生成模型選用隨機(jī)梯度下降訓(xùn)練算法進(jìn)行訓(xùn)練,所述訓(xùn)練樣本包括預(yù)處理后的抗菌藥物臨床使用相關(guān)數(shù)據(jù)和對(duì)應(yīng)的病程記錄;
5、s4,將采集到的醫(yī)生填寫的抗菌藥物醫(yī)囑信息輸入完成訓(xùn)練的病程記錄生成模型,生成抗菌藥物使用病程記錄文本并添加至電子病歷文書中。
6、優(yōu)選的,所述病程記錄生成模型包括列嵌入層、編碼器層和多層感知機(jī)層,其中:所述列嵌入層,被配置為分別提取抗菌藥物臨床使用相關(guān)數(shù)據(jù)中的各離散特征和連續(xù)特征,對(duì)無標(biāo)簽數(shù)據(jù)進(jìn)行特征隨機(jī)掩碼替換,將各離散特征和連續(xù)特征映射成同樣長(zhǎng)度的d維向量,并轉(zhuǎn)換為4個(gè)第一d維嵌入向量;所述編碼器層,由6個(gè)多層串行疊加的transformer編碼器層組成,被配置為將所述的4個(gè)第一d維嵌入向量作為輸入量,輸入到該編碼器層進(jìn)行特征相關(guān)性處理后輸出與對(duì)應(yīng)的4個(gè)第一d維向量具有相同維度的4個(gè)第二d維向量;所述多層感知機(jī)層,用于將4個(gè)第二d維嵌入向量并排拼接成4d長(zhǎng)度的一維向量來作為輸出量,其用于預(yù)測(cè)特征的輸出層包括兩個(gè)歸一化指數(shù)函數(shù)softmax層用于預(yù)測(cè)病程記錄中的所需各填充數(shù)據(jù);兩個(gè)歸一化指數(shù)函數(shù)softmax層分別用于輸出第一特征和第二特征;包含第一特征輸出節(jié)點(diǎn)數(shù)為6個(gè),其中5個(gè)第一特征輸出節(jié)點(diǎn)用于分別輸出具有5級(jí)分類的抗菌藥物種類、1個(gè)第一特征輸出節(jié)點(diǎn)用于輸出缺失類別;包含第二特征輸出節(jié)點(diǎn)數(shù)為4個(gè),其中3個(gè)第二特征輸出節(jié)點(diǎn)用于分別輸出3個(gè)不同的劑量范圍、1個(gè)第二特征輸出節(jié)點(diǎn)用于輸出缺失類別;包含4個(gè)概率輸出節(jié)點(diǎn),用于預(yù)測(cè)各掩碼向量,所述掩碼向量能夠被配置為表示是否使用設(shè)定的抗菌藥物或是否存在設(shè)定過敏情況;包含1個(gè)概率輸出節(jié)點(diǎn)用于預(yù)測(cè)偽標(biāo)簽,所述偽標(biāo)簽?zāi)軌虮慌渲脼閷?duì)感染病原體的初步判斷或?qū)χ委熜Ч念A(yù)測(cè)結(jié)果。
7、優(yōu)選的,所述抗菌藥物臨床使用相關(guān)數(shù)據(jù)中的離散特征包括藥物種類和用藥途徑,所述藥物種類包括但不限于青霉素類、頭孢菌素類、大環(huán)內(nèi)酯類、喹諾酮類和氨基糖苷類,所述用藥途徑包括但不限于口服、靜脈注射和外用;所述抗菌藥物臨床使用相關(guān)數(shù)據(jù)中的連續(xù)特征包括用藥劑量和用藥時(shí)長(zhǎng)。
8、優(yōu)選的,所述列嵌入層具體被配置為:
9、將藥物種類特征用表示,具有分別對(duì)應(yīng)青霉素類、頭孢菌素類、大環(huán)內(nèi)酯類、喹諾酮類、氨基糖苷類的5個(gè)取值;用藥途徑特征用表示,具有分別對(duì)應(yīng)口服、靜脈注射、外用的3個(gè)取值;用藥劑量特征用表示;用藥時(shí)長(zhǎng)特征用表示;隨機(jī)生成的mask向量為,其中,生成1的概率為p;
10、進(jìn)行特征隨機(jī)掩碼替換后的結(jié)果為:
11、,
12、,
13、其中和是隨機(jī)采樣得到的其它值;將各離散特征和連續(xù)特征映射成同樣長(zhǎng)度的4個(gè)d維向量:
14、;
15、;
16、;
17、。
18、優(yōu)選的,所述編碼器層具體還被配置為:假設(shè)第個(gè)transformer編碼器層的輸入為:
19、,經(jīng)過自注意力機(jī)制self-attention對(duì)輸入數(shù)據(jù)進(jìn)行處理和經(jīng)前饋神經(jīng)網(wǎng)絡(luò)處理后得到輸出:
20、,ffn是預(yù)先配置好的前饋神經(jīng)網(wǎng)絡(luò),其中
21、,
22、,,,、、是可學(xué)習(xí)的參數(shù)矩陣,是鍵向量的維度;經(jīng)過6層特征相關(guān)性處理后,得到最終輸出。
23、本發(fā)明還公開了一種抗菌藥物臨床使用病程記錄生成系統(tǒng),包括數(shù)據(jù)獲取模塊、數(shù)據(jù)處理模塊、模型訓(xùn)練模塊和記錄生成模塊,其中數(shù)據(jù)獲取模塊,用于獲取患者全景歷史醫(yī)療數(shù)據(jù),所述患者全景歷史醫(yī)療數(shù)據(jù)包括患者基本信息、抗菌藥物臨床使用相關(guān)數(shù)據(jù)和對(duì)應(yīng)的病程記錄,所述抗菌藥物臨床使用相關(guān)數(shù)據(jù)包括但不限于醫(yī)生抗菌藥物處方權(quán)限、抗菌藥物醫(yī)囑明細(xì)、用法用量、病原學(xué)檢驗(yàn)結(jié)果與其他實(shí)驗(yàn)室檢測(cè)結(jié)果、抗菌治療效果;數(shù)據(jù)處理模塊,用于對(duì)所述患者全景歷史醫(yī)療數(shù)據(jù)進(jìn)行預(yù)處理,將文本分割成單詞/詞語并添加詞性標(biāo)注后形成病程記錄訓(xùn)練數(shù)據(jù)集;模型訓(xùn)練模塊,用于使用bi-lstm-crf模型建立抗菌藥物使用病程記錄生成規(guī)則,根據(jù)所述抗菌藥物使用病程記錄生成規(guī)則構(gòu)建病程記錄生成模型,利用病程記錄訓(xùn)練數(shù)據(jù)集中的各訓(xùn)練樣本對(duì)未經(jīng)訓(xùn)練的病程記錄生成模型選用隨機(jī)梯度下降訓(xùn)練算法進(jìn)行訓(xùn)練,所述訓(xùn)練樣本包括預(yù)處理后的抗菌藥物臨床使用相關(guān)數(shù)據(jù)和對(duì)應(yīng)的病程記錄;記錄生成模塊,用于將采集到的醫(yī)生填寫的抗菌藥物醫(yī)囑信息輸入完成訓(xùn)練的病程記錄生成模型,生成抗菌藥物使用病程記錄文本并添加至電子病歷文書中。
24、優(yōu)選的,所述病程記錄生成模型包括列嵌入層、編碼器層和多層感知機(jī)層,其中:所述列嵌入層,被配置為分別提取抗菌藥物臨床使用相關(guān)數(shù)據(jù)中的各離散特征和連續(xù)特征,對(duì)無標(biāo)簽數(shù)據(jù)進(jìn)行特征隨機(jī)掩碼替換,將各離散特征和連續(xù)特征映射成同樣長(zhǎng)度的d維向量,并轉(zhuǎn)換為4個(gè)第一d維嵌入向量;所述編碼器層,由6個(gè)多層串行疊加的transformer編碼器層組成,被配置為將所述的4個(gè)第一d維嵌入向量作為輸入量,輸入到該編碼器層進(jìn)行特征相關(guān)性處理后輸出與對(duì)應(yīng)的4個(gè)第一d維向量具有相同維度的4個(gè)第二d維向量;所述多層感知機(jī)層,用于將4個(gè)第二d維嵌入向量并排拼接成4d長(zhǎng)度的一維向量來作為輸出量,其用于預(yù)測(cè)特征的輸出層包括兩個(gè)歸一化指數(shù)函數(shù)softmax層用于預(yù)測(cè)抗菌藥物使用病程記錄中的所需各填充數(shù)據(jù);兩個(gè)歸一化指數(shù)函數(shù)softmax層分別用于輸出第一特征和第二特征;包含第一特征輸出節(jié)點(diǎn)數(shù)為6個(gè),其中5個(gè)第一特征輸出節(jié)點(diǎn)用于分別輸出具有5級(jí)分類的抗菌藥物種類、1個(gè)第一特征輸出節(jié)點(diǎn)用于輸出缺失類別;包含第二特征輸出節(jié)點(diǎn)數(shù)為4個(gè),其中3個(gè)第二特征輸出節(jié)點(diǎn)用于分別輸出3個(gè)不同的劑量范圍、1個(gè)第二特征輸出節(jié)點(diǎn)用于輸出缺失類別;包含4個(gè)概率輸出節(jié)點(diǎn),用于預(yù)測(cè)各掩碼向量,所述掩碼向量能夠被配置為表示是否使用設(shè)定的抗菌藥物或是否存在設(shè)定過敏情況;包含1個(gè)概率輸出節(jié)點(diǎn)用于預(yù)測(cè)偽標(biāo)簽,所述偽標(biāo)簽?zāi)軌虮慌渲脼閷?duì)感染病原體的初步判斷或?qū)χ委熜Ч念A(yù)測(cè)結(jié)果。
25、優(yōu)選的,所述抗菌藥物臨床使用相關(guān)數(shù)據(jù)中的離散特征包括藥物種類和用藥途徑,所述藥物種類包括但不限于青霉素類、頭孢菌素類、大環(huán)內(nèi)酯類、喹諾酮類和氨基糖苷類,所述用藥途徑包括但不限于口服、靜脈注射和外用;所述抗菌藥物臨床使用相關(guān)數(shù)據(jù)中的連續(xù)特征包括用藥劑量和用藥時(shí)長(zhǎng)。
26、本發(fā)明還公開了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述任一所述抗菌藥物臨床使用病程記錄生成方法的步驟。
27、本發(fā)明還公開了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,所述計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一所述抗菌藥物臨床使用病程記錄生成方法的步驟。
28、本發(fā)明公開的抗菌藥物臨床使用病程記錄生成方法和系統(tǒng),通過采集患者全景歷史醫(yī)療數(shù)據(jù),通過預(yù)處理和標(biāo)注形成病程記錄訓(xùn)練數(shù)據(jù)集,使用bi-lstm-crf模型建立抗菌藥物使用病程記錄生成規(guī)則,根據(jù)抗菌藥物使用病程記錄生成規(guī)則構(gòu)建病程記錄生成模型,并使用病程記錄訓(xùn)練數(shù)據(jù)集進(jìn)行模型訓(xùn)練。醫(yī)生輸入抗菌藥物醫(yī)囑信息后,模型就能根據(jù)實(shí)時(shí)抓取的患者相關(guān)醫(yī)療數(shù)據(jù)自動(dòng)生成抗菌藥物使用病程記錄文本并添加至電子病歷文書中,保證抗菌藥物使用醫(yī)療文書質(zhì)量,并為抗菌藥物醫(yī)保支付審核提供可實(shí)時(shí)抓取的審核資料和可靠的依據(jù)。
29、本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。