本發(fā)明涉及醫(yī)學(xué)數(shù)據(jù)處理領(lǐng)域,特別涉及一種基于評分模型對乳腺癌進行風(fēng)險評分的方法及裝置。
背景技術(shù):
乳腺癌是危害人類健康甚至危及生命的常見惡性腫瘤,其發(fā)病率呈逐年上升且年輕化趨勢,乳腺癌已成為上升幅度最快的惡性腫瘤之一,嚴重威脅著患者的身心健康。
相關(guān)技術(shù)中,乳腺癌診斷一般過程為:用戶到醫(yī)院,經(jīng)過醫(yī)生和精密儀器的診斷,例如,醫(yī)生根據(jù)乳房攝影術(shù)的檢測結(jié)果和觸診檢測結(jié)果確定用戶是否患有乳腺癌,然而,由于早期乳腺癌大多是無痛性腫物,身體可以無任何不適,即不影響生活,也不影響工作,大部分女性容易忽視,不會到醫(yī)院進行檢查,并且去醫(yī)院檢測所消耗的時間和成本較高,從而導(dǎo)致乳腺癌早期診斷率不足30%。因此,如何精準的評估乳腺癌風(fēng)險,對于用戶十分重要。
技術(shù)實現(xiàn)要素:
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的一個目的在于提出一種基于評分模型對乳腺癌進行風(fēng)險評分的方法,該方法提供了一種通過評分模型準確評估用戶的乳腺癌的風(fēng)險評分的方法,方便了用戶獲取乳腺癌的風(fēng)險評分以及方便用戶根據(jù)風(fēng)險評分了解自身患病的風(fēng)險,相對于傳統(tǒng)方法,減少了用戶獲取乳腺癌的風(fēng)險評分的時間和成本,提高了用戶的用戶體驗度。
本發(fā)明的第二個目的在于提出一種基于評分模型對乳腺癌進行風(fēng)險評分的裝置。
本發(fā)明的第三個目的在于提出一種基于評分模型對乳腺癌進行風(fēng)險評分的裝置。
本發(fā)明的第四個目的在于提出一種非易失性計算機存儲介質(zhì)。
本發(fā)明的第五個目的在于提出一種計算機程序產(chǎn)品。
為達上述目的,本發(fā)明第一方面實施例提出了一種基于評分模型對乳腺癌進行風(fēng)險評分的方法,包括:獲取用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù);根據(jù)所述基因檢測結(jié)果、外部致病特征數(shù)據(jù)和預(yù)先訓(xùn)練的評分模型,確定所述用戶的乳腺癌的風(fēng)險評分;根據(jù)所述風(fēng)險評分獲取對應(yīng)的建議信息,并將所述風(fēng)險評分以及對應(yīng)的建議信息提供給所述用戶。
本發(fā)明實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法,通過將所獲取的用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù)輸入至預(yù)先訓(xùn)練的評分模型中,通過評分模型確定出用戶的乳腺癌的風(fēng)險評分,并根據(jù)風(fēng)險評分獲取對應(yīng)的建議信息,并將用戶患乳腺癌的風(fēng)險評分以及對應(yīng)的建議信息提供給用戶,由此,提供了一種通過評分模型準確評估用戶的乳腺癌的風(fēng)險評分的方法,方便了用戶獲取乳腺癌的風(fēng)險評分,以及方便用戶根據(jù)風(fēng)險評分了解自身患病的風(fēng)險,相對于傳統(tǒng)方法,減少了用戶獲取乳腺癌的風(fēng)險評分的時間和成本,提高了用戶的用戶體驗度。
為達上述目的,本發(fā)明第二方面實施例提出了一種使基于評分模型對乳腺癌進行風(fēng)險評分的裝置,包括:獲取模塊,用于獲取用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù);確定模塊,用于根據(jù)所述基因檢測結(jié)果、外部致病特征數(shù)據(jù)和預(yù)先訓(xùn)練的評分模型,確定所述用戶的乳腺癌的風(fēng)險評分;處理模塊,用于根據(jù)所述風(fēng)險評分獲取對應(yīng)的建議信息,并將所述風(fēng)險評分以及對應(yīng)的建議信息提供給所述用戶。
本發(fā)明實施例的基于評分模型對乳腺癌進行風(fēng)險評分的裝置,通過將所獲取的用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù)輸入至預(yù)先訓(xùn)練的評分模型中,通過評分模型確定出用戶的乳腺癌的風(fēng)險評分,并根據(jù)風(fēng)險評分獲取對應(yīng)的建議信息,并將用戶患乳腺癌的風(fēng)險評分以及對應(yīng)的建議信息提供給用戶,由此,方便了用戶獲取乳腺癌的風(fēng)險評分,以及方便用戶根據(jù)風(fēng)險評分了解自身患病的風(fēng)險,相對于傳統(tǒng)方法,減少了用戶獲取乳腺癌的風(fēng)險評分的時間和成本,提高了用戶的用戶體驗度。
本發(fā)明第三方面實施例提出了一種基于評分模型對乳腺癌進行風(fēng)險評分的裝置,其特征在于,包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,所述處理器被配置為:獲取用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù);根據(jù)所述基因檢測結(jié)果、外部致病特征數(shù)據(jù)和預(yù)先訓(xùn)練的評分模型,確定所述用戶的乳腺癌的風(fēng)險評分;根據(jù)所述風(fēng)險評分獲取對應(yīng)的建議信息,并將所述風(fēng)險評分以及對應(yīng)的建議信息提供給所述用戶。
本發(fā)明第四方面實施例提供了一種非易失性計算機存儲介質(zhì),所述計算機存儲介質(zhì)存儲有一個或者多個程序,當所述一個或者多個程序被一個設(shè)備執(zhí)行時,使得所述設(shè)備執(zhí)行以本發(fā)明第一方面實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法。
本發(fā)明第五方面實施例提供了一種計算機程序產(chǎn)品,當所述計算機程序產(chǎn)品中的指令處理器執(zhí)行時,執(zhí)行一種基于評分模型對乳腺癌進行風(fēng)險評分的方法,所述方法包括:獲取用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù);根據(jù)所述基因檢測結(jié)果、外部致病特征數(shù)據(jù)和預(yù)先訓(xùn)練的評分模型,確定所述用戶的乳腺癌的風(fēng)險評分;根據(jù)所述風(fēng)險評分獲取對應(yīng)的建議信息,并將所述風(fēng)險評分以及對應(yīng)的建議信息提供給所述用戶。
本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
附圖說明
本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施例的描述中將變得明顯和容易理解,其中:
圖1為根據(jù)本發(fā)明一個實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法的流程圖;
圖2為訓(xùn)練評分模型的細化流程圖;
圖3為根據(jù)本發(fā)明另一個實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法的流程圖;
圖4為根據(jù)本發(fā)明一個實施例的基于評分模型對乳腺癌進行風(fēng)險評分的裝置的結(jié)構(gòu)示意圖;
圖5為根據(jù)本發(fā)明另一個實施例的基于評分模型對乳腺癌進行風(fēng)險評分的裝置的結(jié)構(gòu)示意圖;
圖6為根據(jù)本發(fā)明又一個實施例的基于評分模型對乳腺癌進行風(fēng)險評分的裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面詳細描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
在本發(fā)明的描述中,需要理解的是,術(shù)語“多個”指兩個或兩個以上;術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性。
下面參考附圖描述根據(jù)本發(fā)明實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法及裝置。
圖1為根據(jù)本發(fā)明一個實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法的流程圖。
如圖1所示,根據(jù)本發(fā)明實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法,包括以下步驟。
s11,獲取用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù)。
作為一種示例性的實施方式,接收用戶通過終端上傳的基因檢測結(jié)果和外部致病特征數(shù)據(jù)。
其中,終端可以為計算機、平板電腦、智能手機等具有各種操作系統(tǒng)的硬件設(shè)備。
舉例而言,在智能手機的過程中,用戶可通過智能手機將自身的基因檢測結(jié)果和外部致病特征數(shù)據(jù)上傳至服務(wù)器。
其中,基因檢測結(jié)果中包含與乳腺癌的發(fā)生有密切關(guān)系的基因數(shù)據(jù)。
例如,基因檢測結(jié)果中可以包括brca1以及brca2,其中,腫瘤抑制基因brca1和brca2與乳腺癌發(fā)病的關(guān)系較為密切。
其中,外部致病特征數(shù)據(jù)是指除基因因素之外的與引起乳腺癌有關(guān)的其他外部因素。
其中,外部致病特征數(shù)據(jù)可以包括但不限于生活方式數(shù)據(jù)、家族病史數(shù)據(jù)、藥物史數(shù)據(jù)和身體特征數(shù)據(jù)。
其中,生活方式數(shù)據(jù)可以包括但不限于是否偏好高脂肪食品、是否喜愛飲酒,平均運動量等數(shù)據(jù)。
家族病時數(shù)據(jù)可以包括三代直系女性親屬乳腺癌的患病情況,即確定三代直系女性親屬中是否患有乳腺癌。
藥物史數(shù)據(jù)可以包括一些外援性雌激素的藥物(例如避孕藥)的使用情況。
身體特征數(shù)據(jù)可以包括但不限于個人的身體質(zhì)量指數(shù)bmi(bodymassindex),初潮時間,停經(jīng)時間,生育時間,胸部是否接受過放射治療等數(shù)據(jù)。
作為一種示例性的實施方式,可為用戶提供一種包括生活方式、家族病史、藥物史和身體特征等必填選項的問卷調(diào)查,并根據(jù)用戶在問卷調(diào)查中填寫的數(shù)據(jù)獲取生活方式數(shù)據(jù)、家族病史數(shù)據(jù)、藥物史數(shù)據(jù)和身體特征數(shù)據(jù)等外部致病特征數(shù)據(jù)。
舉例而言,在用戶通過終端打開評估乳腺風(fēng)險的產(chǎn)品時,評估乳腺風(fēng)險的產(chǎn)品可提示用戶上傳自身的基因檢測結(jié)果,并提供包含生活方式、家族病史、藥物史和身體特征等必填選項的用戶界面,并接收用戶針對相應(yīng)選項所填寫的相關(guān)數(shù)據(jù),并將用戶所填寫的相關(guān)數(shù)據(jù)上傳至服務(wù)器,以使服務(wù)器獲取用戶的生活方式數(shù)據(jù)、家族病史數(shù)據(jù)、藥物史數(shù)據(jù)和身體特征數(shù)據(jù)等外部致病特征數(shù)據(jù)。
作為另一種示例性的實施方式,接收用戶通過終端上傳的基因檢測結(jié)果,以及從預(yù)先保存用戶的外部致病特征數(shù)據(jù)的數(shù)據(jù)庫中獲取對應(yīng)用戶的外部致病特征數(shù)據(jù)。
其中,需要說明的是,上述數(shù)據(jù)庫中所保存的用戶的外部致病特征數(shù)據(jù)可通過多種方式獲得,例如,在用戶注冊時,可填寫上述外部致病特征數(shù)據(jù),或者,服務(wù)器從其他醫(yī)護系統(tǒng)中獲取用戶的外部致病特征數(shù)據(jù)。
s12,根據(jù)基因檢測結(jié)果、外部致病特征數(shù)據(jù)和預(yù)先訓(xùn)練的評分模型,確定用戶的乳腺癌的風(fēng)險評分。
在本發(fā)明的一個實施例中,在獲取用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù)后,可將基因檢測結(jié)果和外部致病特征數(shù)據(jù)輸入至預(yù)先訓(xùn)練的評分模型,評分模型通過分析基因檢測結(jié)果和外部致病特征數(shù)據(jù)確定出用戶的乳腺癌的風(fēng)險評分。
在本發(fā)明的一個實施例中,訓(xùn)練評分模型的具體過程,如圖2所示,可以包括:
s21,獲取樣本用戶的樣本基因檢測結(jié)果和樣本外部致病特征數(shù)據(jù)。
作為一種示例性的實施方式,在通過問卷調(diào)查的方式獲取樣本用戶的樣本外部致病特征數(shù)據(jù)時,在獲取樣本用戶的問卷調(diào)查結(jié)果后,可判斷問卷調(diào)查結(jié)果中的樣本外部致病特征數(shù)據(jù)是否完整,在確定出問卷調(diào)查結(jié)果中的樣本外部致病特征數(shù)據(jù)不完整時,可將對應(yīng)的問卷調(diào)查結(jié)果刪除,以減少不完整的樣本外部致病特征數(shù)據(jù)對后續(xù)訓(xùn)練評分模型的影響。
作為另一種示例性的實施方式,在通過問卷調(diào)查的方式獲取樣本用戶的樣本外部致病特征數(shù)據(jù)時,在獲取樣本用戶的問卷調(diào)查結(jié)果后,可判斷問卷調(diào)查結(jié)果中的樣本外部致病特征數(shù)據(jù)是否完整,在確定出問卷調(diào)查結(jié)果中的樣本外部致病特征數(shù)據(jù)不完整時,可進一步判斷樣本外部致病特征數(shù)據(jù)中不完整的比例是否超過預(yù)設(shè)閾值,如果超過預(yù)設(shè)閾值,將對應(yīng)的問卷調(diào)查結(jié)果刪除,以減少不完整的樣本外部致病特征數(shù)據(jù)對后續(xù)訓(xùn)練評分模型的影響。
如果判斷樣本外部致病特征數(shù)據(jù)中不完整的比例未超過預(yù)設(shè)閾值,則根據(jù)其他樣本外部致病特征數(shù)據(jù)完整的問卷調(diào)整結(jié)果對該問卷調(diào)整結(jié)果中不完整的部分進行處理,以使該問卷調(diào)整結(jié)果中的樣本外部致病特征數(shù)據(jù)完整。
其中,預(yù)設(shè)閾值是預(yù)先設(shè)置的。
舉例而言,假設(shè)當前問卷調(diào)整結(jié)果中沒有包含年齡信息,并且確定當前問卷調(diào)整結(jié)果樣本外部致病特征數(shù)據(jù)不完整的比例未超過預(yù)設(shè)閾值,此時,如果根據(jù)其他樣本外部致病特征數(shù)據(jù)完整的問卷調(diào)整結(jié)果確定年齡的平均值為30歲,則將30歲作為當前問卷調(diào)整結(jié)果中的年齡信息。
s22,獲取與樣本基因檢測結(jié)果和樣本外部致病特征數(shù)據(jù)對應(yīng)的評分標注數(shù)據(jù)。
s23,對樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)和評分標注數(shù)據(jù)進行訓(xùn)練,以得到評分模型。
作為一種示例性的實施方式,服務(wù)器可利用機器學(xué)習(xí)方法對大量樣本用戶的樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)和評分標注數(shù)據(jù)進行訓(xùn)練,以確定出樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)與評分標注數(shù)據(jù)之間的對應(yīng)關(guān)系,并根據(jù)所獲得的對應(yīng)關(guān)系建立評分模型。
也就是說,該實施例通過機器學(xué)習(xí)方法對關(guān)于乳腺癌相關(guān)的大量醫(yī)學(xué)數(shù)據(jù)進行分析,通過機器學(xué)習(xí)和數(shù)據(jù)挖掘的方法,找到了乳腺癌的潛在規(guī)律,訓(xùn)練出了高精度高性能的評估風(fēng)險的模型。
其中,評分標注數(shù)據(jù)是根據(jù)樣本用戶的樣本基因檢測結(jié)果和樣本外部致病特征數(shù)據(jù)預(yù)先標注的乳腺癌的風(fēng)險評分。
其中,需要理解的是,風(fēng)險評分的高低與以下面因素有關(guān):樣本用戶的樣本基因檢測結(jié)果確定與乳腺癌相關(guān)的一些關(guān)鍵的蛋白質(zhì)是否發(fā)生突變,以及確定樣本基因檢測結(jié)果中與乳腺癌相關(guān)的基因是否發(fā)生突變,以及在發(fā)生突變時,確定基因突變的類型,以及突變的來源。
其中,突變的來源可來自于父系或母系。
其中,突變的來源可通過樣本用戶的父系或母系的基因檢測結(jié)果確定。
在本發(fā)明的一個實施例中,為了準確建立評分模型,可基于隨機森林算法,對樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)和評分標注數(shù)據(jù)進行訓(xùn)練,以得到評分模型。
具體而言,在獲取樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)和評分標注數(shù)據(jù)后,可先通過隨機森林算法對樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)和評分標注數(shù)據(jù)進行訓(xùn)練,以獲取訓(xùn)練出的評分模型。
在獲取樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)和評分標注數(shù)據(jù)后,可先通過隨機森林算法對樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)和評分標注數(shù)據(jù)進行訓(xùn)練,以獲取訓(xùn)練出的評分模型。
在訓(xùn)練出評分模型后,可獲取測試數(shù)據(jù)集合,其中,測試數(shù)據(jù)集合中包括測試基因檢測結(jié)果、測試外部致病特征數(shù)據(jù)和對應(yīng)的評分標注數(shù)據(jù)。然后,將測試基因檢測結(jié)果、測試外部致病特征數(shù)據(jù)輸入至評分模型中,以獲取評分模型中輸出的風(fēng)險評分結(jié)果,之后,通過評分模型中輸出的風(fēng)險評分結(jié)果和測試數(shù)據(jù)集合中對應(yīng)的評分標注數(shù)據(jù)確定評分模型的準確度是否超過預(yù)先設(shè)置的準確度閾值,如果未超過預(yù)先設(shè)置的準確度閾值,則對評分模型的模型參數(shù)進行調(diào)優(yōu)處理,以通過調(diào)整模型參數(shù)來提高評分模型的準確度。
其中,需要說明的是,測試數(shù)據(jù)集合是預(yù)先獲取的,例如,可將預(yù)先收集的數(shù)據(jù)按比例隨機分成訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集,以通過該方式獲取測試數(shù)據(jù)集合。
其中,需要理解的是,在使用評分模型的過程中,為了不斷提高評分模型的準確性,可間隔預(yù)設(shè)時間后基于更新后的訓(xùn)練數(shù)據(jù)集合對評分模型進行更新。
s13,根據(jù)風(fēng)險評分獲取對應(yīng)的建議信息,并將風(fēng)險評分以及對應(yīng)的建議信息提供給用戶。
其中,需要理解的是,風(fēng)險評分越小表明用戶患乳腺癌的風(fēng)險越低。
本發(fā)明實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法,通過將所獲取的用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù)輸入至預(yù)先訓(xùn)練的評分模型中,通過評分模型確定出用戶的乳腺癌的風(fēng)險評分,并根據(jù)風(fēng)險評分獲取對應(yīng)的建議信息,并將用戶患乳腺癌的風(fēng)險評分以及對應(yīng)的建議信息提供給用戶,由此,提供了一種通過評分模型準確評估用戶的乳腺癌的風(fēng)險評分的方法,方便了用戶獲取乳腺癌的風(fēng)險評分,以及方便用戶根據(jù)風(fēng)險評分了解自身患病的風(fēng)險,相對于傳統(tǒng)方法,減少了用戶獲取乳腺癌的風(fēng)險評分的時間和成本,提高了用戶的用戶體驗度。
圖3為根據(jù)本發(fā)明另一個實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法的流程圖。
如圖3所示,根據(jù)本發(fā)明實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法,包括以下步驟。
s31,獲取用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù)。
s32,根據(jù)基因檢測結(jié)果、外部致病特征數(shù)據(jù)和預(yù)先訓(xùn)練的評分模型,確定用戶的乳腺癌的風(fēng)險評分。
其中,需要說明的是,對步驟s11-s12的解釋說明也適用于步驟s31-s32,此處不贅述。
s33,判斷風(fēng)險評分是否超過預(yù)設(shè)閾值,若是,則執(zhí)行步驟s34,否則執(zhí)行步驟s35。
其中,預(yù)設(shè)閾值是預(yù)先設(shè)置的風(fēng)險評分的閾值。
s34,向用戶提供風(fēng)險評分和進一步檢查的建議信息。
也就是說,在判斷出用戶的乳腺癌的風(fēng)險評分超過預(yù)設(shè)閾值時,可確定用戶極有可能患有乳腺癌,為了及時發(fā)現(xiàn)并治療,此時,可建議用戶對醫(yī)院進行一步檢查。
s35,向用戶提供風(fēng)險評分和預(yù)防乳腺癌的建議信息。
其中,預(yù)防乳腺癌的建議信息可以包括但不限于飲食建議、運動建議、乳腺護理建議等。
本發(fā)明實施例的基于評分模型對乳腺癌進行風(fēng)險評分的方法,通過將所獲取的用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù)輸入至預(yù)先訓(xùn)練的評分模型中,通過評分模型確定出用戶的乳腺癌的風(fēng)險評分,并根據(jù)風(fēng)險評分給用戶合理的建議信息,方便了用戶根據(jù)建議信息進一步檢查或者了解與預(yù)防乳腺癌有關(guān)的信息,減少了用戶獲取乳腺癌的風(fēng)險評分的時間和成本,提高了用戶的用戶體驗度。
為了實現(xiàn)上述實施例,本發(fā)明還提出了一種基于評分模型對乳腺癌進行風(fēng)險評分的裝置。
圖4為根據(jù)本發(fā)明一個實施例的基于評分模型對乳腺癌進行風(fēng)險評分的裝置的結(jié)構(gòu)示意圖。
如圖4所示,該基于評分模型對乳腺癌進行風(fēng)險評分的裝置包括獲取模塊110、確定模塊120和處理模塊130,其中:
獲取模塊110用于獲取用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù)。
其中,外部致病特征數(shù)據(jù)可以包括但不限于生活方式數(shù)據(jù)、家族病史數(shù)據(jù)、藥物史數(shù)據(jù)和身體特征數(shù)據(jù)。
其中,生活方式數(shù)據(jù)可以包括但不限于是否偏好高脂肪食品、是否喜愛飲酒,平均運動量等數(shù)據(jù)。
家族病時數(shù)據(jù)可以包括三代直系女性親屬乳腺癌的患病情況,即確定三代直系女性親屬中是否患有乳腺癌。
藥物史數(shù)據(jù)可以包括一些外援性雌激素的藥物(例如避孕藥)的使用情況。
身體特征數(shù)據(jù)可以包括但不限于個人的身體質(zhì)量指數(shù)bmi(bodymassindex),初潮時間,停經(jīng)時間,生育時間,胸部是否接受過放射治療等數(shù)據(jù)。
確定模塊120用于根據(jù)基因檢測結(jié)果、外部致病特征數(shù)據(jù)和預(yù)先訓(xùn)練的評分模型,確定用戶的乳腺癌的風(fēng)險評分。
處理模塊130用于根據(jù)風(fēng)險評分獲取對應(yīng)的建議信息,并將風(fēng)險評分以及對應(yīng)的建議信息提供給用戶。
在本發(fā)明的一個實施例中,為了通過評分模型準確評估用戶的乳腺癌的風(fēng)險評分,在圖4所示的實施例的基礎(chǔ)上,如圖5所示,該裝置還可以包括訓(xùn)練模塊140,其中,訓(xùn)練模塊140用于獲取樣本用戶的樣本基因檢測結(jié)果和樣本外部致病特征數(shù)據(jù),并獲取與樣本基因檢測結(jié)果和樣本外部致病特征數(shù)據(jù)對應(yīng)的評分標注數(shù)據(jù),以及對樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)和評分標注數(shù)據(jù)對進行訓(xùn)練,以得到評分模型。
在本發(fā)明的一個實施例中,為了訓(xùn)練得到準確的評分模型,訓(xùn)練模塊140具體用于:基于隨機森林算法,對樣本基因檢測結(jié)果、樣本外部致病特征數(shù)據(jù)和評分標注數(shù)據(jù)進行訓(xùn)練,以得到評分模型。
其中,需要理解的是,在通過訓(xùn)練模塊140訓(xùn)練出評分模型后,該裝置還可以包括測試模塊(圖中未示出),測試模塊用于獲取測試數(shù)據(jù)集合,其中,測試數(shù)據(jù)集合中包括測試基因檢測結(jié)果、測試外部致病特征數(shù)據(jù)和對應(yīng)的評分標注數(shù)據(jù)。然后,將測試基因檢測結(jié)果、測試外部致病特征數(shù)據(jù)輸入至評分模型中,以獲取評分模型中輸出的風(fēng)險評分結(jié)果,之后,通過評分模型中輸出的風(fēng)險評分結(jié)果和測試數(shù)據(jù)集合中對應(yīng)的評分標注數(shù)據(jù)確定評分模型的準確度是否超過預(yù)先設(shè)置的準確度閾值,如果未超過預(yù)先設(shè)置的準確度閾值,則對評分模型的模型參數(shù)進行調(diào)優(yōu)處理,以通過調(diào)整模型參數(shù)來提高評分模型的準確度。
其中,需要理解的是,在使用評分模型的過程中,為了不斷提高評分模型的準確性,可間隔預(yù)設(shè)時間后基于更新后的訓(xùn)練數(shù)據(jù)集合對評分模型進行更新。
在本發(fā)明的一個實施例中,為了給用戶合理的建議,在圖5所示的實施例的基礎(chǔ)上,如圖6所示,該處理模塊130可以包括,其中:
判斷單元131用于判斷風(fēng)險評分是否超過預(yù)設(shè)閾值。
第一提供單元132用于:在判斷風(fēng)險評分超過預(yù)設(shè)閾值時,向用戶提供風(fēng)險評分和進一步檢查的建議信息。
第二提供單元133用于在判斷風(fēng)險評分未超過預(yù)設(shè)閾值時,向用戶提供風(fēng)險評分和預(yù)防乳腺癌的建議信息。
其中,需要說明的是,前述對基于評分模型對乳腺癌進行風(fēng)險評分的方法實施例的解釋說明也適用于該實施例的基于評分模型對乳腺癌進行風(fēng)險評分的裝置,此處不再贅述。
本發(fā)明實施例的基于評分模型對乳腺癌進行風(fēng)險評分的裝置,通過將所獲取的用戶的基因檢測結(jié)果和外部致病特征數(shù)據(jù)輸入至預(yù)先訓(xùn)練的評分模型中,通過評分模型確定出用戶的乳腺癌的風(fēng)險評分,并根據(jù)風(fēng)險評分獲取對應(yīng)的建議信息,并將用戶患乳腺癌的風(fēng)險評分以及對應(yīng)的建議信息提供給用戶,由此,方便了用戶獲取乳腺癌的風(fēng)險評分,以及方便用戶根據(jù)風(fēng)險評分了解自身患病的風(fēng)險,相對于傳統(tǒng)方法,減少了用戶獲取乳腺癌的風(fēng)險評分的時間和成本,提高了用戶的用戶體驗度。
在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不必須針對的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任一個或多個實施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實施例或示例以及不同實施例或示例的特征進行結(jié)合和組合。
此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個該特征。在本發(fā)明的描述中,“多個”的含義是兩個或兩個以上,除非另有明確具體的限定。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實施方式的范圍包括另外的實現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認為是用于實現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實現(xiàn)在任何計算機可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計算機的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說明書而言,"計算機可讀介質(zhì)"可以是任何可以包含、存儲、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計算機可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個或多個布線的電連接部(電子裝置),便攜式計算機盤盒(磁裝置),隨機存取存儲器(ram),只讀存儲器(rom),可擦除可編輯只讀存儲器(eprom或閃速存儲器),光纖裝置,以及便攜式光盤只讀存儲器(cdrom)。另外,計算機可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因為可以例如通過對紙或其他介質(zhì)進行光學(xué)掃描,接著進行編輯、解譯或必要時以其他合適方式進行處理來以電子方式獲得所述程序,然后將其存儲在計算機存儲器中。
應(yīng)當理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實現(xiàn)。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項或他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(pga),現(xiàn)場可編程門陣列(fpga)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實現(xiàn)上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實施例的步驟之一或其組合。
此外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件功能模塊的形式實現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中。
上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。盡管上面已經(jīng)示出和描述了本發(fā)明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實施例進行變化、修改、替換和變型。