一種計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及移動(dòng)互聯(lián)網(wǎng)中的數(shù)據(jù)處理領(lǐng)域,具體涉及計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理系統(tǒng)及方法。
【背景技術(shù)】
[0002]計(jì)算機(jī)輔助診斷(computer aided diagnosis,CAD) [1]或計(jì)算機(jī)輔助檢測(cè)(computer aideddetect1n,CAD)是指通過(guò)影像學(xué)、醫(yī)學(xué)圖像處理技術(shù)以及其他可能的生理、生化手段,結(jié)合計(jì)算機(jī)的分析計(jì)算,輔助發(fā)現(xiàn)病灶,提高診斷的準(zhǔn)確率[2]。現(xiàn)在常說(shuō)的CAD技術(shù)主要是指基于醫(yī)學(xué)影像學(xué)的計(jì)算機(jī)輔助技術(shù)。與所述計(jì)算機(jī)輔助檢測(cè)(CAD)相區(qū)別,后者重點(diǎn)是檢測(cè),計(jì)算機(jī)只需要對(duì)異常征象進(jìn)行標(biāo)注,在此基礎(chǔ)上進(jìn)行常見(jiàn)的影像處理,并無(wú)需進(jìn)行進(jìn)一步診斷。即,計(jì)算機(jī)輔助診斷是計(jì)算機(jī)輔助檢測(cè)的延伸和最終目的,相應(yīng)地,計(jì)算機(jī)輔助檢測(cè)是計(jì)算機(jī)輔助診斷的基礎(chǔ)和必經(jīng)階段。CAD技術(shù)又被稱為醫(yī)生的“第三只眼”,CAD系統(tǒng)的廣泛應(yīng)用有助于提高醫(yī)生診斷的敏感性和特異性。
【發(fā)明內(nèi)容】
[0003]為了使基于位置的推薦更加準(zhǔn)確,需要將互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行前期處理,本發(fā)明的目的就在于提供這樣的一種計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理系統(tǒng)及方法。
[0004]一種計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理系統(tǒng),包括移動(dòng)信息處理中心,用于對(duì)互聯(lián)網(wǎng)數(shù)據(jù)分析和挖掘,并輸出結(jié)果到后續(xù)的推薦系統(tǒng);所述移動(dòng)信息處理中心包括依次相連的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)處理服務(wù)器,數(shù)據(jù)倉(cāng)庫(kù)用于對(duì)互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行存儲(chǔ)和預(yù)處理,包括依次連接的數(shù)據(jù)清理模塊、數(shù)據(jù)變換模塊和數(shù)據(jù)集成模塊;數(shù)據(jù)處理服務(wù)器采用Hadoop平臺(tái),包括順序連接的HDFS模塊和MapReduce模塊。
[0005]數(shù)據(jù)處理服務(wù)器還包括HBase模塊,存儲(chǔ)需要隨時(shí)讀寫(xiě)的數(shù)據(jù),其輸出端與MapReduce模塊連接。
[0006]互聯(lián)網(wǎng)數(shù)據(jù)為位置信息、疾病信息集合和病例文件。
[0007]計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理方法,包括以下步驟:
[0008]步驟1、數(shù)據(jù)清理模塊對(duì)收集到的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行清理,去除冗余數(shù)據(jù)、填補(bǔ)缺值數(shù)據(jù),清除異常數(shù)據(jù);
[0009]步驟2、數(shù)據(jù)變換模塊按線性或非線性劃分?jǐn)?shù)據(jù)的屬性,將數(shù)據(jù)轉(zhuǎn)換成可供數(shù)據(jù)挖掘的形式;例如將音頻和視頻轉(zhuǎn)換成系統(tǒng)指定的格式,將數(shù)值數(shù)據(jù)統(tǒng)一為離散化或連續(xù)型數(shù)據(jù)進(jìn)行處理;
[0010]步驟3、數(shù)據(jù)集成模塊將經(jīng)過(guò)數(shù)據(jù)變換后的數(shù)據(jù)集成在數(shù)據(jù)倉(cāng)庫(kù)中;
[0011]步驟4、預(yù)處理后的大量的互聯(lián)網(wǎng)數(shù)據(jù)分布式存儲(chǔ)在HDFS模塊中,小部分需要隨時(shí)讀寫(xiě)的數(shù)據(jù)存儲(chǔ)在HBase模塊中;
[0012]步驟5、MapReduce模塊對(duì)HDFS模塊和HBase模塊中的數(shù)據(jù)進(jìn)行挖掘,并將挖掘出的結(jié)果輸出給推薦系統(tǒng)。
[0013]本發(fā)明達(dá)到的有益效果:通過(guò)對(duì)雜亂無(wú)章的互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行預(yù)處理和分析挖掘,使其符合被推薦系統(tǒng)接收的需求,從而使推薦結(jié)果更加準(zhǔn)確可靠。
【附圖說(shuō)明】
[0014]圖1為本發(fā)明一種計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理系統(tǒng)結(jié)構(gòu)原理圖。
【具體實(shí)施方式】
[0015]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0016]如圖1所示,一種計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理系統(tǒng)處理包括用戶的位置信息、疾病信息集合和病例文件在內(nèi)的互聯(lián)網(wǎng)數(shù)據(jù),它包括移動(dòng)信息處理中心,由數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)處理服務(wù)器組成,其中數(shù)據(jù)倉(cāng)庫(kù)用于對(duì)互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行存儲(chǔ)和預(yù)處理,數(shù)據(jù)預(yù)處理功能由數(shù)據(jù)清理模塊、數(shù)據(jù)變換模塊、數(shù)據(jù)集成模塊構(gòu)成,對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的互聯(lián)網(wǎng)數(shù)據(jù)依次進(jìn)行上述處理,然后送入數(shù)據(jù)處理服務(wù)器。在這里,經(jīng)過(guò)預(yù)處理的大量數(shù)據(jù)被存入HDFS模塊,小部分需要隨時(shí)讀寫(xiě)的數(shù)據(jù)存入Hbase模塊,它是一個(gè)搭建在HDFS模塊上的面向列的數(shù)據(jù)庫(kù),運(yùn)行在HDFS之上。MapReduce模塊分布式并發(fā)處理HDFS模塊中的大量數(shù)據(jù),進(jìn)行數(shù)據(jù)挖掘;通過(guò)基于MapReduce的數(shù)據(jù)挖掘算法對(duì)大量毫無(wú)規(guī)律的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,并將結(jié)果輸出給推薦系統(tǒng),推薦系統(tǒng)根據(jù)這些數(shù)據(jù)對(duì)用戶行為模式進(jìn)行分析,比較用戶的行為模式和待推薦的物品之間的相似程度,從而決定要為該用戶推薦哪種物品。
[0017]本發(fā)明方案所公開(kāi)的技術(shù)手段不僅限于上述實(shí)施方式所公開(kāi)的技術(shù)手段,還包括由以上技術(shù)特征任意組合所組成的技術(shù)方案。
【主權(quán)項(xiàng)】
1.一種計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理系統(tǒng),其特征在于:包括移動(dòng)信息處理中心,用于對(duì)互聯(lián)網(wǎng)數(shù)據(jù)分析和挖掘,并輸出結(jié)果到后續(xù)的推薦系統(tǒng);所述移動(dòng)信息處理中心包括依次相連的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)處理服務(wù)器,數(shù)據(jù)倉(cāng)庫(kù)用于對(duì)互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行存儲(chǔ)和預(yù)處理,包括依次連接的數(shù)據(jù)清理模塊、數(shù)據(jù)變換模塊和數(shù)據(jù)集成模塊;數(shù)據(jù)處理服務(wù)器采用Hadoop平臺(tái),包括順序連接的HDFS模塊和MapReduce模塊,所述互聯(lián)網(wǎng)數(shù)據(jù)為位置信息、疾病信息集合和病例文件。2.根據(jù)權(quán)利要求1或2所述的互聯(lián)網(wǎng)數(shù)據(jù)處理系統(tǒng),其特征在于:所述數(shù)據(jù)處理服務(wù)器還包括HBase模塊,存儲(chǔ)需要隨時(shí)讀寫(xiě)的數(shù)據(jù),其輸出端與MapReduce模塊連接。3.一種利用權(quán)利要求3所述的一種計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理系統(tǒng)進(jìn)行數(shù)據(jù)處理的方法,其特征在于,包括以下步驟: 步驟1、數(shù)據(jù)清理模塊對(duì)收集到的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行清理,去除冗余數(shù)據(jù)、填補(bǔ)缺值數(shù)據(jù),清除異常數(shù)據(jù); 步驟2、數(shù)據(jù)變換模塊按線性或非線性劃分?jǐn)?shù)據(jù)的屬性,將數(shù)據(jù)轉(zhuǎn)換成可供數(shù)據(jù)挖掘的形式; 步驟3、數(shù)據(jù)集成模塊將經(jīng)過(guò)數(shù)據(jù)變換后的數(shù)據(jù)集成在數(shù)據(jù)倉(cāng)庫(kù)中; 步驟4、預(yù)處理后的大量的互聯(lián)網(wǎng)數(shù)據(jù)分布式存儲(chǔ)在HDFS模塊中,小部分需要隨時(shí)讀寫(xiě)的數(shù)據(jù)存儲(chǔ)在HBase模塊中; 步驟5、MapReduce模塊對(duì)HDFS模塊和HBase模塊中的數(shù)據(jù)進(jìn)行挖掘,并將挖掘出的結(jié)果輸出給推薦系統(tǒng)。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種計(jì)算機(jī)輔助醫(yī)療數(shù)據(jù)處理系統(tǒng)及方法,該系統(tǒng)包括移動(dòng)信息處理中心,用于對(duì)互聯(lián)網(wǎng)數(shù)據(jù)分析和挖掘,并輸出結(jié)果到后續(xù)的推薦系統(tǒng);移動(dòng)信息處理中心包括依次相連的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)處理服務(wù)器,數(shù)據(jù)倉(cāng)庫(kù)用于對(duì)互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行存儲(chǔ)和預(yù)處理,包括依次連接的數(shù)據(jù)清理模塊、數(shù)據(jù)變換模塊和數(shù)據(jù)集成模塊;數(shù)據(jù)處理服務(wù)器采用Hadoop平臺(tái),包括順序連接的HDFS模塊和MapReduce模塊。通過(guò)對(duì)雜亂無(wú)章的互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行預(yù)處理和分析挖掘,使其符合被推薦系統(tǒng)接收的需求,從而使推薦結(jié)果更加準(zhǔn)確可靠。
【IPC分類(lèi)】G06F19/00
【公開(kāi)號(hào)】CN105243277
【申請(qǐng)?zhí)枴緾N201510662352
【發(fā)明人】平凡, 萬(wàn)林
【申請(qǐng)人】平凡
【公開(kāi)日】2016年1月13日
【申請(qǐng)日】2015年10月10日