專利名稱:計算機輔助疾病診斷方法
技術領域:
本發(fā)明涉及疾病的診斷、普查和預測方法。更具體地,本發(fā)明涉及一種診斷、普查和預測人或動物的疾病的方法,并可確定疾病的嚴重程度和起因。
本發(fā)明還涉及一種利用一個或者多個神經(jīng)網(wǎng)絡得到診斷指標進行診斷、普查和預測疾病的計算機輔助方法。在本發(fā)明的最佳實施方式中,該方法用于診斷和預測例如骨質疏松癥和癌癥-包括但不限于卵巢、乳房、睪丸、結腸及前列腺的腫瘤。在另一個最佳實施方式中,本發(fā)明包括一個系統(tǒng),它可以接收從數(shù)據(jù)發(fā)送站發(fā)送的患者數(shù)據(jù)、通過受過訓練的神經(jīng)網(wǎng)絡處理這些數(shù)據(jù)以產(chǎn)生診斷值或預測值并把這些值發(fā)送到遠程數(shù)據(jù)接收裝置。
在本文中,術語“疾病”定義為身體的任何部分、器官或系統(tǒng)(或者它們的任何組合)的正常結構或功能的失常。一種具體的疾病是由包括著化學和物理改變的特征性癥狀和征兆表示的。一種疾病經(jīng)常關聯(lián)著其它種種因素,包括但不限于人口統(tǒng)計的、環(huán)境的、職業(yè)的、遺傳的和病史的因素。通過種種方法可以對某些特征性的征兆、癥狀和有關因素進行定量來得到重要的診斷信息。出于這種應用目的,一種疾病的可定量的征兆、癥狀和/或生物液體的被測物的特性被定義為是該疾病的“生物標記”。當前的診斷和預測方法依賴于對這些生物標記單獨地和相互關聯(lián)地進行鑒別和評估。通常,一種特定疾病的診斷涉及到臨床醫(yī)師,如內(nèi)科醫(yī)生、獸醫(yī)或者其它保健人員,對測量上述因素所獲得的數(shù)據(jù)連帶考慮到許多傳統(tǒng)上不太量化的如職業(yè)史因素等進行的主觀分析。遺憾的是,這種對一種疾病診斷或預測的主觀處理一般不能包括所有可能的相關因素,因此不能對各種因素的作用提供準確的權衡來得到正確的診斷和預測。
通常,病理過程涉及逐漸的變化,僅當發(fā)生明顯的變化時這些變化才變成是表觀的。在許多情況下,病理變化涉及多個生物標記的細微改變。只由單個生物標記表明存在或者不存在一種病是罕見的。那些相關的并且和正常參照范圍有關的生物標記的模式才是患有疾病的指示。包括但不限于人口統(tǒng)計的、環(huán)境的、職業(yè)的、遺傳的和病史因素的其它因素可以對疾病的診斷和預測起重要的作用,尤其同生物標記的模式一起考慮時。遺憾的是,在考慮這些因素與一種疾病的病因或是否存在的聯(lián)系的主觀診斷過程多少是不精確的,并且許多可能是重要的因素卻沒有得到足夠的重視甚至是一點也未考慮到。
當各個生物標記未示出可預示的變化并且所收集觀測的生物標記之間的模式和相互關系不清晰時,內(nèi)科醫(yī)生診斷的準確性明顯下降。并且,隨著和某種特定疾病診斷相關的生物標記數(shù)量以及人口統(tǒng)計變量數(shù)量的增加,這些變量之中的有關診斷模式的數(shù)量相應增加。這種增加的復雜性降低了臨床醫(yī)生辨別模式以及準確診斷或預測疾病的能力。
每年許多人患前列腺癌,并且其中的不少人死于該病。要可靠地和準確地得到前列腺癌的早期診斷是非常困難的。但是,前列腺癌的早期診斷對于最大可能的成功地醫(yī)治這種疾病是最重要的?,F(xiàn)有的普查技術包括直腸指診(DRE)、尿道前列腺活檢以及血液中的前列腺特異抗原(PSA)的檢測。依賴血清PSA水平,特別是低PSA水平時,作為前列腺癌的唯一診斷手段常常得到不可接受程度的非準確診斷。這些普查技術失診許多早期前列腺癌病例,造成這種癌在前列腺內(nèi)并且還在前列腺囊之外的增長。最重要的是在早期,未出現(xiàn)轉移之前診斷出這種疾病。
此外,診斷方法應該能夠區(qū)分良性前列腺增生(BPH)和前列腺癌并且能夠區(qū)分癌癥和非癌癥。還需要一種可以在早期診斷或預測前列腺癌的確實的,可靠的,靈敏的,準確的技術,并且能夠區(qū)分用T1b、T2、T3和TNXM1表征的前列腺癌的不同期。
骨質疏松癥和骨質稀少癥是另一個帶有多種生物標記的疾病的例子,下述生物標記集合地顯示了存在骨質疏松癥的特性變化鈣、磷酸鹽、雌二醇(濾泡的,中周期的,黃體的,或經(jīng)絕后的)、孕酮(濾泡的,中周期的,黃體的,中黃體的,口服避孕藥的,或超過60歲的),堿性磷酸酶、肝-ALP百分比,以及總的腸-ALP。在測量這些生物標記后,作診斷的臨床醫(yī)師會接著把測量結果和正?;鶞史秶M行比較。當一些生物標記在正?;鶞史秶鈺r,另外的生物標記可能顯然在正常基準范圍之內(nèi)。在某些情況下,所有的生物標記值可能都在正常基準范圍之內(nèi)。在給出這樣的數(shù)據(jù)下,臨床醫(yī)師可能懷疑患者已遭受某些骨損傷,但是不能對是否存在骨質疏松癥得出明確的和有意義的診斷。
和一些疾病相關的生物標記的特征性改變已由許多資料提供;但是,在診斷疾病和確定預測中各個具體生物標記的定量說明尚未很好建立。通過更詳盡地考察對一種特定疾病的常規(guī)診斷方法可最好地說明從對一組實驗室數(shù)據(jù)的分析提出診斷的固有困難。下面是對骨質疏松疾病的討論。
本文中所使用的術語“骨質稀少癥”意味著任何低于正常的骨質減少。本文中所使用的術語“骨質疏松癥”意味著廣義骨質稀少癥中的一種特殊形式,其特征是骨密度的降低、低骨質以及骨組織的微結構損壞。
骨質稀少癥包括一組具有不同病因的疾病,它們具有每單位體積的骨質減小到足夠機械支承所必需的量級之下的特點。骨質疏松癥是骨骼的無機部分逐漸損耗的結果并且可由任何數(shù)量的因素造成。原發(fā)性骨質疏松癥是和年令有關的失調,女性中尤為普遍,其特征是在缺乏其它可辨明起因下的骨質減小。但是,男女都可發(fā)生骨質疏松癥。女性中該病一般是在絕經(jīng)后在50多歲或60多歲時判明的。男性中經(jīng)常在60歲左右和70歲左右判明骨質疏松癥。
幾個人口統(tǒng)計參數(shù)和增加發(fā)生骨質疏松癥的危險有關。下面是一部分個體的清單,他們的人口統(tǒng)計及行為使它們具有發(fā)生骨質疏松癥的危險。
經(jīng)絕后的女性吸煙者重嗜酒者各種毒品如類固醇的使用者女性跑步者和芭蕾舞演員消耗太少熱量的男馬拉松運動員食欲過盛者和厭食者飲食極差者對奶制品過敏者癌癥患者纖瘦女性65歲以上的所有男性和女性除了是女性之外,三個最明顯的危險因素是飲食極差、缺乏運動以及是經(jīng)絕后的。和骨質疏松癥相關的其它危險因素包括人種因素,例如高加索人或東方人后代,白皙膚色以及骨質疏松家族史。
骨質疏松癥的發(fā)作可能是于創(chuàng)傷之后隱襲的或突發(fā)的,和骨質疏松癥相關的最普通主訴是背痛。最后,疼痛可擴展到骨盆、胸和肩。在脊柱中,椎骨可壓縮,并且背可呈弓形??赡艹霈F(xiàn)例如駝背(脊柱后凸)或脊柱側凸的情況。若脊柱變形,還會影響其它的身體部位。例如,肋骨可按壓骨盆,或者胃可推入骨盆。除了脊柱問題之外,骨質疏松癥還可由輕微的創(chuàng)傷甚至有時沒有創(chuàng)傷下都會導致髖部、腕部和肋骨的骨折。參見Mazess等的“骨質疏松癥下的橈骨、脊柱和鄰近股骨的骨密度”,J.of Bone and Mineral Research,Vol.3,pgs.13-18,(1988);Riggs B.L.等的“退化性骨質疏松癥”,New Engl.J.Med.Vol.314,pgs,1676-1686(1986)。和骨質疏松癥相關的變化是逐漸的,從而常常在早期檢測不出骨質疏松癥。
鈣和磷酸鹽是骨胳的無機部分的主要成分。血液的化學分析可顯示鈣、磷酸鹽以及堿性磷酸酶處于正常范圍。但是,堿性磷酸酶的同功酶可能明顯地增加。骨質疏松患者中發(fā)現(xiàn)骨吸收的增加,這是破骨細胞作用的結果,通常涉及無機物以及有機基質的溶解并最終導致尿羥脯氨酸排泄的增加。在這些患者中幾乎全由卵巢分泌的血清雌二醇明顯地減少。
骨質的早期減少可通過本領域中熟練的技術人員所知的四種廣泛應用的對骨不具侵害性的方法進行判斷,這些方法包括單光子吸收法、雙光子吸收法(DPA)、雙能量X射線吸收法(DXA)以及定量計算機斷層X射線攝影法(CAT掃描)。其中的幾種用于測量骨中的無機物含量,而一些方法相對選擇用于骨骼或者相對于骨皮質的小梁。這些方法還提供不同等級的曝光光度。
磁共振成象(MRI)技術和陽電子發(fā)射層析X射線攝影法通過提供有關骨密度及活力的信息也可提供在診斷包括著骨質稀少癥和骨質疏松癥的多種疾病中有用的信息。
射線照相吸收法(RA)是一種手骨無機物的非損傷X射線測量方法。用標準X光機拍攝的照片送到中心實驗室以供計算機控制的分析。
現(xiàn)有的標準診斷技術對于骨質疏松癥的早期檢查不是有效的。骨質疏松癥中的所見變化是漸進的,并且常常在該病的早期是未被檢測的。骨質疏松癥通常在早期是不能檢查出因為必須減少約30%至40%骨質后對于采用標準的X射線診斷技術才是明顯的。通過檢查早期的骨損失以預防骨質疏松癥要遠遠強于在晚期確定這種疾病,隨后則力圖防止它的發(fā)展。一旦出現(xiàn)嚴重的損壞并在骨折的小梁的兩端間產(chǎn)生裂隙,則現(xiàn)有的療法不能恢復受損的骨。因此,治療方面的努力應該以預防以及早期確定漸進的疾病為目標,從而可以在出現(xiàn)實質性的不能挽救的結構損傷之前開始治療。請參見,Cummings等的“鄰近絕經(jīng)的女性是否應集體檢診骨質疏松癥?”Ann.Int.Med.,Vol.104,pgs.817-823,(1986);Courpron P的“骨質疏松癥下的骨組織機理”,Orthop.Clin.North Am.,Vol.12,pgs.513-545,(1981);Frost H.M.的“骨模型的機械行列式”,Metabol.Bone.Dis.Rel.Res.,Vol.4,pgs 217-229(1982)。需要的是一種早期檢查和預報骨質疏松癥的方法,并考慮到和該病相關的多個生物標記以及人口統(tǒng)計變量的因素。
現(xiàn)有診斷骨質疏松癥的方法的一個問題是其過程給不出骨質疏松癥的根本起因的有關信息,使得難以為患者制定適當治療方案。例如,經(jīng)絕后的骨質疏松癥的一個普遍原因是雌酮缺乏,但X射線技術測量不出?,F(xiàn)有骨質稀少癥的診斷方法的另一個固有問題是現(xiàn)有的所有方法需要昂貴和復雜的進行骨密度測量的醫(yī)療測試設備。另外,患者必須照射X射線。這使得由于昂貴以及對于中等診斷不能得到必要的測試設備對高危險性的人群進行一般性的普查是不現(xiàn)實的。
鑒于從一組預兆的生物標記的實驗室數(shù)據(jù)以及從與生物標記數(shù)據(jù)任選組合的人口統(tǒng)計中得出診斷所遇到的困難,需要一種能對復雜模式識別的自動診斷系統(tǒng)。在利用計算模型得到診斷中的模式識別上已經(jīng)有多種嘗試。最普遍的從多變量實驗室數(shù)據(jù)進行診斷的計算模型中的一種方法是辨別函數(shù)分析。但是,僅依賴傳統(tǒng)模式識別技術(幾何學上的、語法上的、樣板的、統(tǒng)計的)的診斷系統(tǒng)對于評定多種疾病狀態(tài)的特征生物標記模式不是有效的,部分是由于問題的固有非線性特性以及缺乏被觀察數(shù)據(jù)中的已知數(shù)學結構。不存在準確描述如何分析一組生物標記以得出診斷的清晰規(guī)則。
近年來,人工神經(jīng)網(wǎng)絡已流行為一種對多變量實驗室數(shù)據(jù)進行識別和分析的精細的診斷模式。神經(jīng)網(wǎng)絡可區(qū)別那些對于人和常規(guī)的計算方法過于精細或過于復雜的模式或傾向。人不能馬上輕易地融會貫通多于二個或三個變量時,神經(jīng)網(wǎng)絡可以理解幾百個變量中的相互關系。已開發(fā)出神經(jīng)網(wǎng)絡在臨床診斷和/或預測上的應用價值的例子包括·精神病學(參見Mulsant,B.H.的“作為一種臨床診斷方法的神經(jīng)網(wǎng)絡”,MD Computing,Vol.7,pp.25-36(1990))。
·孤獨癥(參見Cohen.I.等的“診斷孤獨癥一種基于神經(jīng)網(wǎng)絡的工具”,PCAI,pp.22-25(May/June 1994));·兒科放射學(參見Boone,J.M.等的“放射診斷中的神經(jīng)網(wǎng)絡。I.引言和說明”,Invest.Radiol.,Vol.25,pp.1012-1016(1990)以及Gross,G.W.等的“放射診斷中的神經(jīng)網(wǎng)絡。II.新生期的胸放射學的解釋”,Invest.Radiol.Vol.25,pp.1017-1023(1990));·乳腺癌(參見Astion,M.L.等的“在癌癥診斷中把神經(jīng)網(wǎng)絡應用于對實驗室數(shù)據(jù)的解釋”,Clin.Chem.,Vol.38,No.1,pp.34-38(1992);Yuzheng,W.等的“乳房X線照相術中的人工神經(jīng)網(wǎng)絡乳腺癌診斷中的決策應用”,Radiology,Vol.82,pp.81-87(1993);Kappen,H.J.等的“對治療結果預測的神經(jīng)網(wǎng)絡分析”,Annals ofOncology,Vol.4,Supp.4,pp.S31-S34(1993);以及Ravdin,P.M.等的“用于預測各個乳腺癌患者的后果的網(wǎng)絡網(wǎng)絡分析的實際應用”,BreastCancer Research and Treatment,《乳腺癌的研究與治療》,Vol.22,pp.285-293(1992));
·卵巢癌(參見Wilding,p.等的“反向傳播神經(jīng)網(wǎng)絡在乳腺和卵巢癌診斷上的應用”,Cancer Letters,Vol.77,pp.145-153(1994));·甲狀腺疾病(參見Sharpe,P.K.等的“體外實驗室檢測甲狀腺功能的診斷中的人工神經(jīng)網(wǎng)絡”,Clin,Chem.,Vol.39,No.11,pps.2248-2253(1993));·前列腺癌(參見Show,P.S.等的“前列腺癌的診斷和愈后中的人工神經(jīng)網(wǎng)絡先導研究”,J.Urology,Vol.1521923-1926(1994));·宮頸癌(參見Rutenberg的美國4,965,725號專利);以及·心臟病學(參見Leong等的美國5,280,792號專利以及Furlong,J.W.的“系列心臟酶數(shù)據(jù)的神經(jīng)網(wǎng)絡;人工機器智能的一種臨床應用”,Clin.Chem.,Vol.96,No.1,pp.134-141(July 1991)。
神經(jīng)網(wǎng)絡能識別模式,尤其適合作出診斷。不同于現(xiàn)有的從一組邏輯規(guī)則得出診斷的各種方法,神經(jīng)網(wǎng)絡不需要在一組規(guī)則中對過程知識的顯式編碼。神經(jīng)網(wǎng)絡從例子中了解。當輸入到神經(jīng)網(wǎng)絡中的數(shù)據(jù)是預處理過的時,神經(jīng)網(wǎng)絡更有效地了解清楚。
計算機輔助臨床模式分類技術有兩種基本方法。第一種方法應用已知的知識以及某給定疾病過程的事實(生理的、解剖的、分子生物的,等等)來嘗試建立觀察到的或測量到的數(shù)據(jù)和幾種可能的分類類別中的一種類別之間聯(lián)系。這些已有的知識和事實常常用規(guī)則(如臨床專家系統(tǒng))、某種形式的數(shù)值函數(shù)(如參數(shù)統(tǒng)計推理中的統(tǒng)計分布)表示,甚至只能用由方程系統(tǒng)描述的復雜模型(如藥代動力學模型)表示。
第二種方法利用數(shù)值化程序去適應性地構建和修改數(shù)值化分類系統(tǒng),它是基于用多組提煉的輸入值與已知的分類結果配對得到的訓練數(shù)據(jù)的。在該方法中,不用也不能用顯式形式表示人類專家知識。替代它的是,這種知識是隱含地由帶有確認分類的訓練數(shù)據(jù)提供的。經(jīng)監(jiān)督學習(從例子中學習)提取的這種知識以及分類系統(tǒng)的適應構建完全托付給學習規(guī)則系統(tǒng)。具有第二種方法的分類系統(tǒng)包括各種形式的例如多層前饋感知器的神經(jīng)網(wǎng)絡分類器。
兩種方法都具有缺點。第一種方法使用主題范圍中的顯式知識把觀察到的未知數(shù)據(jù)和已知類別聯(lián)系起來。但是,在許多實際情況下,這種知識是不完整的或者只是一部分的,不能用明確的和準確的并可以直接編碼到分類系統(tǒng)中的條目表示。另一方面,純數(shù)值模式分類方法把構建分類系統(tǒng)的負擔完全加到適應性學習過程上。所得到的系統(tǒng)的性能受到訓練數(shù)據(jù)中所含信息的數(shù)量和內(nèi)容的限制并且受到提取這些信息的學習規(guī)則系統(tǒng)的效率的限制,而與在該主題范圍內(nèi)可能存在極多已知知識的事實無關。在一些例如未對患者數(shù)據(jù)進行預選擇或定標的預處理的情況下,對神經(jīng)網(wǎng)絡的訓練若不是不可能的則可能是極為困難的,因為輸入變量的數(shù)量可能太多而且這些變量對于特定疾病的關系可能太弱而達不到所需的預測精度。
因此,需要一種和能容納大量如生物標記及人口統(tǒng)計等因素的設備和系統(tǒng)結合的診斷以及預測疾病的方法。該系統(tǒng)應該能夠處理大量的患者以及大量的諸如生物標記因素和人口統(tǒng)計因素的患者變量。該疾病的診斷和預測方法應該選擇帶有高預測值的因素、預處理這些因素并且把數(shù)據(jù)輸入到基于計算機的神經(jīng)網(wǎng)絡或者多元神經(jīng)網(wǎng)絡中以訓練神經(jīng)網(wǎng)絡預測或診斷疾病。這些神經(jīng)網(wǎng)絡應該產(chǎn)生由一個或多個表示一種疾病的存在(診斷)或者將未出現(xiàn)(預測)的輸出變量構成的診斷指標。該系統(tǒng)應該具有把患者數(shù)據(jù)輸入到訓練過的神經(jīng)網(wǎng)絡中并且產(chǎn)生表示該患者是否已患有或將患有該疾病的輸出值的能力。
此外,因為臨床醫(yī)師很少有由他們支配的這種基于計算機的神經(jīng)網(wǎng)絡能力,從而還需要一種可把患者數(shù)據(jù)發(fā)送到上面所述的基于計算機的神經(jīng)網(wǎng)絡的系統(tǒng),該系統(tǒng)將接收數(shù)據(jù),把數(shù)據(jù)輸入到訓練過的神經(jīng)網(wǎng)絡,產(chǎn)生表示診斷或預測的輸出值并且把有關診斷或預測的信息發(fā)送到另一個地方,例如原始數(shù)據(jù)發(fā)送站或者也許直接發(fā)送到臨床醫(yī)師的辦公室。這種系統(tǒng)應該提供對復雜和高度訓練過的預測及診斷神經(jīng)網(wǎng)絡的訪問,這可增加臨床醫(yī)床診斷及預測能力的準確性。該系統(tǒng)應該能夠接收大量的患者數(shù)據(jù)并且能夠通過神經(jīng)網(wǎng)絡迅速地處理數(shù)據(jù)以得到對疾病的診斷和預測。
這種系統(tǒng)可應用于神經(jīng)網(wǎng)絡對此已專門得到訓練的任何疾病或情況的診斷和預測。
本發(fā)明是用于診斷、普查或預測疾病的一種設備和一種方法。更具體地,本發(fā)明和一種采用訓練過的神經(jīng)網(wǎng)絡的方法有關,并且和一種用于診斷、普查或預測例如人或動物的疾病以及用于確定疾病的嚴重性和起因的方法有關。該目的是通過執(zhí)行下列步驟實現(xiàn)的收集關于患者的數(shù)據(jù),供選的數(shù)據(jù)類型包括生物的、體格的、人口統(tǒng)計的、人種的、環(huán)境的以及醫(yī)療史的數(shù)據(jù);選擇那些和診斷一種疾病有關的數(shù)據(jù);對數(shù)據(jù)數(shù)字化;掃描這些數(shù)字化后的值;進行檢驗以分析這些數(shù)據(jù)的辨別力;對獨立的數(shù)據(jù)值分組;預處理這些數(shù)據(jù)以得到預處理值;把選擇出的數(shù)據(jù)輸入到基于計算機的神經(jīng)網(wǎng)絡以訓練神經(jīng)網(wǎng)絡;分析各個數(shù)據(jù)輸入對神經(jīng)網(wǎng)絡的作用;根據(jù)性能、準確性和成本選擇最優(yōu)訓練的神經(jīng)網(wǎng)絡,訓練該神經(jīng)網(wǎng)絡產(chǎn)生診斷指標;并且把其他患者的數(shù)據(jù)輸入到該訓練過的神經(jīng)網(wǎng)絡中以產(chǎn)生表示該患者是否已患有或容易患上該疾病的輸出值。
本發(fā)明還包括一種用于快速診斷、普查或預測大量患者中的疾病的設備和方法,其中從遠程位置處向中央設施發(fā)送患者數(shù)據(jù)。在中央設施處,接收數(shù)據(jù)并把數(shù)據(jù)引入到計算機系統(tǒng),計算機系統(tǒng)執(zhí)行下列操作;分析患者數(shù)據(jù)以評定數(shù)據(jù)格式的正確性;標定數(shù)據(jù)以提供類似范圍內(nèi)的不同類型的值;把標定后的患者數(shù)據(jù)引入到訓練過的神經(jīng)網(wǎng)絡中以計算輸出值;把該輸出值和訓練過的神經(jīng)網(wǎng)絡產(chǎn)生的診斷指標進行比較;根據(jù)該比較形成診斷或預測;把診斷或預測傳輸?shù)揭粋€遠程位置,該位置任選地是發(fā)送原始患者數(shù)據(jù)組的位置或者是保健室。
本發(fā)明的該實施方式允許快速地測定由包括著生物標記數(shù)據(jù)和人口統(tǒng)計數(shù)據(jù)的患者數(shù)據(jù)所構成的大量數(shù)據(jù)組,對某特定的疾病或者幾種疾病形成診斷或預測,并且迅速地把結果傳輸給負責該病人的保健人員或機構。該系統(tǒng)不僅提供可提高患者健康改進的診斷能力,并且還減小因浪費時間、治療延誤以及誤診所帶來的花銷。該系統(tǒng)為大量的患者樣本進行普查提供診斷及預測疾病的能力,并且使得保健人員能夠訪問專門訓練過的復雜的基于計算機的神經(jīng)網(wǎng)絡它可以高精確性和準確性地診斷疾病。
在一種實施方式中,本發(fā)明可用于甚至在非常早期階段快速地和準確地診斷和預測前列腺癌。在該實施方式中,可以快速地和經(jīng)濟地普查大量的包括著生物標記以及任選的人口統(tǒng)計數(shù)據(jù)的患者數(shù)據(jù)組,以便以高精確性及準確性診斷及預測前列腺癌。此外,本發(fā)明簡便地確定前列腺癌病期,并且簡易地對前列腺增生和前列腺癌區(qū)分。
在另一種實施方式中,本發(fā)明可用于甚至在非常早期階段快速地和準確地診斷和愈后骨質疏松癥和骨質稀少癥。在該實施方式中,可以快速地和經(jīng)濟地普查大量的包括著生物標記以及任選的人口統(tǒng)計數(shù)據(jù)的患者數(shù)據(jù)組,以便以高精確性及準確性診斷和預測骨質疏松癥和骨質稀少癥。此外,本發(fā)明簡便地確定骨質疏松癥和骨質稀少癥的程度并且提供有關起因變量的信息。
本發(fā)明的一個目的是診斷和預測患者的某種疾病,對于這種疾病在患者群體中存在著足夠的例如生物標記及人口統(tǒng)計數(shù)據(jù)的數(shù)據(jù)以便具體地訓練神經(jīng)網(wǎng)絡來產(chǎn)生帶有高預測實用度的診斷指標,并且在新的患者數(shù)據(jù)組中準確地和可靠地診斷該疾病。利用該系統(tǒng)可以普查大量的多變量患者數(shù)據(jù)集,用于確定一種疾病的存在或者預測一種疾病。
因此,本發(fā)明的一個目的是提供一種用于診斷、普查或預測疾病并且確定其嚴重性的方法。
本發(fā)明的再一個目的是提供一種由包含著基于計算機的訓練過的神經(jīng)網(wǎng)絡系統(tǒng)的方法和設備構成的系統(tǒng),該系統(tǒng)通過下述步驟診斷、普查或預測疾病并且確定疾病的嚴重性經(jīng)數(shù)據(jù)接收裝置接收來自其它地方的患者數(shù)據(jù);把該數(shù)據(jù)發(fā)送到包含著基于計算機的訓練過的神經(jīng)網(wǎng)絡的一個或者幾個計算機,通過訓練過的神經(jīng)網(wǎng)絡或者通過任選的幾個訓練過的神經(jīng)網(wǎng)絡處理該患者數(shù)據(jù),以產(chǎn)生一個作為診斷值的輸出值;把這些診斷值發(fā)送到另一個位置處,任意地發(fā)送到另一個計算機以傳輸?shù)饺我獾赜捎嬎銠C或其它數(shù)據(jù)接收裝置構成的遠程位置。該系統(tǒng)可含有一個或幾個計算機以及一個或幾個訓練過的神經(jīng)網(wǎng)絡。
本發(fā)明的另一個目的是提供一種用于診斷、普查或愈后疾病以及確定疾病的嚴重性的設備。
本發(fā)明的一個特點是提供一種普查、預測和診斷前列腺癌的方法。
本發(fā)明的另一個特點是提供一種普查、預測和診斷骨質疏松癥和骨質稀少癥的方法。
本發(fā)明的另一個特點是提供一種普查、預測和診斷乳腺癌的方法。
本發(fā)明的再一個特點是提供一種普查、預測和診斷卵巢癌的方法。
本發(fā)明的又一個特點是提供一種普查、預測和診斷結腸癌的方法。
本發(fā)明的另一個特點是提供一種普查、預測和診斷睪丸癌的方法。
本發(fā)明的一個優(yōu)點是提供一種診斷疾病的方法,該方法對該疾病的可能起因提供更好的了解。
本發(fā)明的另一個優(yōu)點是提供一種診斷癌癥的方法,該方法對該癌癥的可能起因提供更好的了解。
本發(fā)明的另一個優(yōu)點是提供一種癌癥的診斷檢驗,該檢驗可用于迅速地和經(jīng)濟地普查來自大量患者的數(shù)據(jù)組。
本發(fā)明再一個優(yōu)點是提供一種對骨質疏松癥的檢驗,該檢驗還給出作為骨質稀少狀態(tài)的根本病因的信息。
本發(fā)明的另一個優(yōu)點是把提供一種骨質疏松癥的診斷檢驗,該檢驗可用于普查大量的個體。
本發(fā)明的另一個優(yōu)點是提供一種用于診斷骨質疏松癥和確定骨質稀少的根本病因并且不必使患者接受照射的方法。
在閱讀下面的對公開實施方式的詳細說明以及附屬權利要求書之后,本發(fā)明的這些和其它的目的、特點和優(yōu)點將會清晰。
圖1表示具有多個輸出的前饋神經(jīng)網(wǎng)絡。
圖2表示具有單個輸出的前饋神經(jīng)網(wǎng)絡。
圖3是一個方程,表示一條典型神經(jīng)的輸入和輸出之間的數(shù)學關系。
圖4示意表示本發(fā)明的第二最佳實施方式。
圖5表示用于構造前列腺癌神經(jīng)網(wǎng)絡診斷系統(tǒng)的訓練數(shù)據(jù)。
圖6表示為構造用于前列腺癌檢測的神經(jīng)網(wǎng)絡Prost AsureTM系統(tǒng)所使用的訓練數(shù)據(jù)。
圖7表示為構造用于前列腺癌檢測的神經(jīng)網(wǎng)絡Prost AsureTM系統(tǒng)所使用的檢驗數(shù)據(jù)。
圖8表示用于構造QuiOsTM骨質疏松癥神經(jīng)網(wǎng)絡診斷系統(tǒng)的訓練數(shù)據(jù)。
圖9表示用于測試QuiOsTM骨質疏松癥神經(jīng)網(wǎng)絡診斷系統(tǒng)的檢驗數(shù)據(jù)。
圖10顯示在診斷骨質稀少癥中QuiQsTM系統(tǒng)的靈敏度和特異性。
圖11是726個檢驗樣本的散布圖,表示QuiOsTM值和以T-評分形式在L2-L4上和Ward三角上的骨無機物密度(BMD)測量的關系。
圖12示意表示同時發(fā)生的多訪問推理技術。
圖13示意地表示一種用于構造和訓練診斷及預測疾病的基于計算機的神經(jīng)網(wǎng)絡型的分類器的方法。
圖14表示基于神經(jīng)網(wǎng)絡的診斷系統(tǒng)的結構。
圖15示意地概述用于接收患者數(shù)據(jù)、利用訓練過的神經(jīng)網(wǎng)絡分析患者數(shù)據(jù)并且發(fā)送結果的ProstAsureTM基于計算機的神經(jīng)網(wǎng)絡系統(tǒng)的體系結構。
圖16是用于分析患者數(shù)據(jù)輸入并且對ProstAsureTM診斷值的系統(tǒng)體系結構。
圖17提供用于不同年令組的正常、BPH以及前列腺癌的ProstAsureTM基準范圍。
圖18提供ProstAsureTM檢驗數(shù)據(jù)組中的樣本的診斷準則。
圖19表示診斷正常、BPH和癌癥患者中的重要ProstAsureTM統(tǒng)計結果。
圖20顯示193個檢驗癌癥病例中的ProstAsureTM結果。
圖21是416個檢驗樣本中的ProstAsureTM值對PSA值的散布圖。通過非線性地組合多個生物標記,ProstAsureTM比利用單個生物標記(PSA)更有效地區(qū)分正常、BPH和癌癥患者。
圖22表示比較ProstAsureTM和僅用PSA的診斷能力的接收器一運算特性(ROC)曲線。曲線下的區(qū)域是檢驗有效性的一種測量。Rel.ProstAsure指的是對按年令分類的基準范圍的回歸。在把癌癥和正常及BPH區(qū)分開來的統(tǒng)計意義上ProstAsureTM明顯優(yōu)于PSA。
圖23顯示用訓練數(shù)據(jù)和檢驗數(shù)據(jù)計算出的ProstAsureTM靈敏度和特異性。
圖24表示在檢測及判別前列腺癌和辨別正常及BPH患者下的ProstAsureTM的靈敏度和特異性。
圖25是ProstAsureTM算法的數(shù)學描述。
圖26是QuiOsTM算法的數(shù)學描述。
下述專利申請整體地作為本文的參考資料1995年7月25日遞交的美國臨時申請序列號60/001,425;1995年6月7日遞交的美國申請序列號08/472,632;1995年2月2日遞交的PCT申請PCT/US95/01379;1994年10月13日遞交的美國申請序列號08/323,446;1994年9月30日遞交的美國申請序列號08/315,851;1992年12月14日遞交的美國申請序列號07/990,772;1992年12月14日遞交的PCT申請PCT/US92/10879;1992年10月21日遞交的美國申請序列號07/964,86;1991年12月12日遞交的美國申請序列號07/806,980。
在本文中,術語“疾病”定義為身體的任何部分、器官或系統(tǒng)(或者它們的任何組合)對正常結構或功能的偏離。一種具體的疾病是由包括著生物、化學和物理變化的特征癥狀以及征兆表示的,并且經(jīng)常和多種其它因素(包括但不限于人口統(tǒng)計、環(huán)境、職業(yè)史、遺傳和醫(yī)療史因素)有關。某些特征征兆、癥狀以及有關的因素可以通過各種方法定量以產(chǎn)生重要的診斷信息。
術語“患者”指的是任何人或動物。
出于本申請的目的,一種特定疾病的生物液體和組織中的可定量的征兆、癥狀和/或被測物被定義為是該疾病的“生物標記”。當前的診斷和預測方法依賴于對這些生物標記單獨地和相互有關地鑒別和測定。術語“生物標記”包括所有類型的來自患者的生物數(shù)據(jù)。
患者數(shù)據(jù)可能包括各種類型的和該疾病具有某種關系的數(shù)據(jù)。信息可能是生物的。這樣的數(shù)據(jù)可以從對任何生物參數(shù)的測量中得出。這些物質包括,但不限于,內(nèi)分泌物質如激素,外分泌物質如各種酶以及神經(jīng)傳遞質、電解質、蛋白質、碳水化合物、生物因子、細胞因子、單核因子,脂肪酸、甘油三酸酯和膽固醇。
其它類型的生物數(shù)據(jù)可以來自對源于患者的器官、組織或細胞的組織分析,包括在光學顯微鏡和電子顯微鏡水平上利用下述但不限于下述任意數(shù)量的技術進行的組織分析結構分析、組織化學、免疫細胞化學、原位雜交和放射自顯影等技術。
生物數(shù)據(jù)可以從來自患者的并進行培養(yǎng)的細胞的進行分析得出??梢詸z驗這些細胞的各種組織和生化特性。例如,從患者體內(nèi)取出的并予以培養(yǎng)的細胞可用于檢驗以確定和某種疾病的存在相關的特異標記的存在??蓹z驗細胞的新陳代謝活性或者其在培養(yǎng)基中產(chǎn)生和釋放的生成物。
有關患者的生物數(shù)據(jù)包括和轉錄(transcription)和翻譯(translation)(例如各種形式的核糖核酸、脫氧核糖核酸以及其它轉錄因子)有關的核分子以及胞質分子的遺傳及分子生物分析的結果,并且包括對由這種核糖核酸分子的翻譯造成的最終結果分子的遺傳學及分子生物學分析的結果。
生物數(shù)據(jù)的范疇內(nèi)還包括各種用于分析患者的結構及解剖方法,例如射線照片、乳房X線照片、熒光圖象攝影和斷層X射線照片,包括但不限于X射線、磁共振成象、CT、放射介入顯影、正電子發(fā)射層折X射線照相法、內(nèi)窺鏡、聲譜圖、超聲心動圖以及對它們的改進方法。
生物數(shù)據(jù)還包括涉及到年令、重量、生長率、牙健康狀態(tài)、心血管狀態(tài)、生殖狀態(tài)(青春期前的、青春期的、青春期后的、絕經(jīng)前的、絕經(jīng)的、經(jīng)絕后的、能生育的、不能生育的)、體脂肪百分比以及體脂肪分布。生物數(shù)據(jù)還包括體驗的結果,包括但不限于人工觸診、直腸指診、前列腺觸診、睪丸觸診、體重、體脂肪量以及分布、聽診、反射檢測、血壓測量、心音和有關心血管音、陰道和其它婦科檢查(包括宮頸、子宮和卵巢的觸診、輸卵管評定、乳腺檢查以及乳腺的射線照片和紅外檢查)。
可以以患者的醫(yī)療史的形式得到其它生物數(shù)據(jù)。這樣的數(shù)據(jù)包括但不限于下述數(shù)據(jù)包括祖父母和父母在內(nèi)的祖先、兄弟姐妹以及后代的病史,他們的健康問題、遺傳史、心理狀況、精神疾病、去世年令及死因;已得疾病及狀態(tài);已做外科手術;已做血管成形術,接種;習慣如鍛練時間表、飲酒量、抽煙量和吸毒量;心臟信息,包括但不限于血壓、脈搏、心電圖、心音圖、冠狀動脈圖、踏車試驗(treadmill)壓力測試、鉈壓力測試以及其它的心血管成像技術。上面提及的所有類型的生物數(shù)據(jù)看做是用于本申請的目的的“生物標記”。
術語“生物液”包括但不限于血液、血清、腦脊液、腹膜液、唾液、淚液、生殖液、眼內(nèi)液、消化液、呼吸液、胸膜液、心包液、淋巴液、尿液、細胞內(nèi)和細胞外液以及神經(jīng)液。
術語“人口統(tǒng)計數(shù)據(jù)”包括有關患者的種族、種類、性別、人種、環(huán)境、對環(huán)境毒素和環(huán)境輻射的暴露、壓力等級、行為方式、以前的職業(yè)和當前的職業(yè)。人口統(tǒng)計數(shù)據(jù)也可提供診斷和預測疾病中有用的信息。
本發(fā)明提供一種診斷、普查或預測患者某種疾病的方法,該方法包括步驟測量已知和該疾病相關的預測生物標記組的濃度;把這些生物標記濃度轉變成數(shù)字化值;預處理這些數(shù)字化值以得到預處理值;并且把這些預處理值發(fā)送到基于計算機的神經(jīng)網(wǎng)絡以訓練該神經(jīng)網(wǎng)絡診斷和預測該疾病,從而來自該神經(jīng)網(wǎng)絡的診斷指標表示患者何時患有該疾病或者何時可能會出現(xiàn)該疾病。
本發(fā)明還包括一種用于診斷、普查或預測患者中某種疾病的設備,該設備包括把已知的和該疾病相關的來自患者的預定生物標記組的濃度進行數(shù)字化的裝置;預處理這些數(shù)字化值的裝置;以及和數(shù)字化以及標定裝置連接的基于計算機的訓練過的神經(jīng)網(wǎng)絡,用于生成網(wǎng)絡輸出值;用于把神經(jīng)網(wǎng)絡的輸出值和診斷指標進行比較的裝置;以產(chǎn)生表示該患者何時患得該病或者何時可能會出現(xiàn)該疾病。
根據(jù)本發(fā)明的第一實施方式,利用訓練過的神經(jīng)網(wǎng)絡通過分析一組某病預定的生物標記或人口統(tǒng)計數(shù)據(jù)來確定對應于該病存在及嚴重性的診斷指標。根據(jù)本發(fā)明,為某一患者確定和某種特定疾病的發(fā)生有關的某些生物標記的濃度或人口統(tǒng)計數(shù)據(jù)。把這些數(shù)據(jù)轉換成數(shù)字化值。接著預處理(定標、取舍、線性/非線性組合、等等)這些數(shù)字化值,然后把預處理值任意地連同一個或幾個從原始值計算出的二次值發(fā)送到訓練過的神經(jīng)網(wǎng)絡以產(chǎn)生診斷指標。數(shù)據(jù)的預處理在該階段發(fā)生并且用來減小神經(jīng)網(wǎng)絡的負擔以及用來增加神經(jīng)網(wǎng)絡診斷和預測疾病的準確性的靈敏性。通過引入已知疾病狀態(tài)的患者群體以及這些患者的生物標記值或人口統(tǒng)計數(shù)據(jù)訓練神經(jīng)網(wǎng)絡并且“教會”神經(jīng)網(wǎng)絡識別這種疾病狀態(tài)下的生物標記組的模式。在訓練神經(jīng)網(wǎng)絡之后,向訓練過的神經(jīng)網(wǎng)絡引入帶有未知疾病狀態(tài)的患者的生物標記值。接著該神經(jīng)網(wǎng)絡處理信息以產(chǎn)生輸出值,該輸出值是診斷值,表示患者是否患有該病或者是否可能出現(xiàn)該病。
盡管不希望被這種陳述所約束,發(fā)明人們建議人工神經(jīng)網(wǎng)絡,尤其是多層的前饋網(wǎng)絡,可經(jīng)過其加權連接以對應于對分類疾病的重要的數(shù)據(jù)模式。另外,神經(jīng)網(wǎng)絡可以辨別和各種失調關聯(lián)的唯一的數(shù)據(jù)模式,以幫助分類那些看來是不和惡性的或良性的模式中的一種模式吻合的邊緣病例。多重神經(jīng)網(wǎng)絡本發(fā)明還包括一種診斷、普查或預測患者某種疾病的方法,包括步驟測量患者的和該疾病相關的一組預定生物標記的濃度,數(shù)字化這些濃度,預處理數(shù)字化值以得到預處理值,對這些被測值的數(shù)字化值定標,把預處理后的值引入到第一神經(jīng)網(wǎng)絡,以及把第一神經(jīng)網(wǎng)絡的輸出值和把可以包括著第一預定生物標記組中的一個或多個生物標記的第二預定生物標記組發(fā)送到第二訓練過的神經(jīng)網(wǎng)絡,從而把第二神經(jīng)網(wǎng)絡的輸出值和診斷指標進行比較以產(chǎn)生表示患者何時患有該病或者何時可能出現(xiàn)該病的診斷值。
本發(fā)明的第二實施方式涉及由神經(jīng)網(wǎng)絡對生物標記進行二級分析。這避免由訓練網(wǎng)絡時的主預測變量造成的偏差。在第一次分析中神經(jīng)網(wǎng)絡排除主生物標記或主預測變量,而在第二次分析中神經(jīng)網(wǎng)絡包括該變量。例如,若認為年令是診斷骨質疏松癥中的主預測變量,在第一神經(jīng)網(wǎng)絡的訓練中不包括該變量,其訓練數(shù)據(jù)組限于別的選出的生物標記。在利用第一組生物標記得到一個診斷指標后,利用該診斷指標以及包含年令的完整輸入變量組訓練第二神經(jīng)網(wǎng)絡以產(chǎn)生另一個診斷指標。該最終的診斷指標是人工神經(jīng)網(wǎng)絡生成的指標和利用其它非數(shù)字患者信息的啟發(fā)式分析結果的綜合。
在另一個實施方式中,本發(fā)明提供一種由診斷、普查或預測患者中前列腺癌的設備和方法構成的系統(tǒng)包括著ProstAsureTM系統(tǒng)。在該實施方式中,對生物標記分析得到的數(shù)據(jù)以及任選的人口統(tǒng)計信息進行預處理,并輸入到一個訓練過的神經(jīng)網(wǎng)絡中。本發(fā)明中把前列腺特異抗原(PSA)、前列腺酸性磷酸酶(PAP)以及三種形式的肌酸激酶(BB、MB和MM)用作生物標記。應理解別的生物標記和人口統(tǒng)計數(shù)據(jù)也可能用于本發(fā)明。例如,觸診到前列腺的直腸指診結果可任意地和其它生物標記或人口統(tǒng)計數(shù)據(jù)結合。該訓練過的神經(jīng)網(wǎng)絡提供表示患者是否患有前列腺癌的輸出值。該訓練過的神經(jīng)網(wǎng)絡能夠在前列腺癌發(fā)展的早期提供非常準確的診斷和預測,從而顯示出高靈敏度和特異性。前列腺癌的分期,甚至該病的非常早期階段得以確定。另外,本發(fā)明把良性前列腺增生和前列腺癌區(qū)分開來,并且區(qū)分前列腺癌和非癌狀態(tài)。
本發(fā)明的另一特殊實施方式包括一種由利用基于計算機的訓練過的神經(jīng)網(wǎng)絡診斷和確定患者的骨質稀少癥和骨質疏松癥的嚴重性和根本病因的方法和設備構成的系統(tǒng)。在建議的實施方式中,該方法確定下述生物標記的血清含量鈣、磷酸鹽、總堿性磷酸酶、一種堿性磷酸酶同功酶、雌二醇和孕酮。該堿性磷酸酶同功酶最好是T細胞衍生的堿性磷酸酶或者是血液、肝或腸的堿性磷酸酶同功酶。任選地,可在訓練過的神經(jīng)網(wǎng)絡中包括患者的年令或人口統(tǒng)計數(shù)據(jù)。由該方法計算的骨密度系數(shù)很高程度地和用標準方法測量的骨密度關聯(lián),標準方法包括如射線照相吸收法、定量CT、雙光子吸收法和骨密度的直接測量。這樣測得的骨密度系數(shù)然后和骨質稀少嚴重度等級比較。
本發(fā)明的另一實施方式的目的在于一種利用神經(jīng)網(wǎng)絡普查、預測和診斷疾病以得到結論性的診斷的計算機輔助方法。本發(fā)明適用于具有收集裝置、能夠檢測生物液中被測物量的樣本檢測裝置以及在視頻顯示裝置上打印或顯示測試結果的裝置的現(xiàn)有診斷設備。
發(fā)明人們發(fā)現(xiàn)生物標記共同地隨著疾病過程改變,并且共同地組成一個新的疾病可預測性強于單個生物標記的診斷生物標記。當在基于計算機的訓練過的神經(jīng)網(wǎng)絡中按組地處理和分析生物標記產(chǎn)生單個診斷指標時,診斷的靈敏度和特異性增加,這樣和分析單個的生物標記相比內(nèi)科醫(yī)生可能更早和更準確地檢測疾病的存在,或者更準確地估計預測。
按照本發(fā)明的一種實施方式,首先從患者收集一種或幾種生物液。利用標準的實驗室技術測量生物液中和某特定疾病相關的生物標記,以確定它們的濃度,或者在某些情況下確定這些生物標記的是否存在。應理解這種處理可在常規(guī)診斷設備中自動地進行。出于示例的目的,在本節(jié)的其它處為骨質稀少癥以及為前列腺癌獲得生物標記值的方法提供說明。
本發(fā)明的方法所依靠的診斷某種疾病的生物標記必須預示所擬診的疾病并且必須與由神經(jīng)網(wǎng)絡進行分析在統(tǒng)計上是顯著的。選擇在診斷疾病上能提供統(tǒng)計上顯著差別的生物標記涉及幾個步驟。首先,必須得出和診斷引起注意的疾病顯示著某些關系的生物標記的清單。通常,只需要包括反映疾病過程的不同方面或其它診斷信息的生物標記。第二,選出的生物標記必須在靈敏度、特異性以及陽性陰性預測力的方面上具有合理的診斷值。還要考慮到和評定生物標記的實驗方案的設計和實施。第三,如果候選生物標記的數(shù)量太大,則可能需要引入正式的辨別分析。但是,許多標準的統(tǒng)計分析方法可能不能滿足高非線性的分類問題的要求。典型地,對生物標記值和人口統(tǒng)計數(shù)據(jù)值進行定標以提供不同生物標記或人口統(tǒng)計變量之間的相對類似的取值范圍。以這種方式,測量不同變量中固有的不同數(shù)值范圍的差異減小。預處理由生物標記和其它人口統(tǒng)計數(shù)據(jù)構成的輸入變量是訓練神經(jīng)網(wǎng)絡中的一個重要步驟。如果候選變量的數(shù)量不太大,可以把它們都包括在對神經(jīng)網(wǎng)絡訓練的初始嘗試中。如果神經(jīng)網(wǎng)絡的輸入生物標記中的一個或幾個對分類決策處理是不相關的??梢栽谟柧氝^的神經(jīng)網(wǎng)絡的網(wǎng)絡連接加權中反映出來。然后可以從某特定疾病的生物標記組中去掉這些值。評定一種神經(jīng)網(wǎng)絡選出的生物標記用于分析的統(tǒng)計重要性以及選擇用于訓練神經(jīng)網(wǎng)絡的生物標記的其它方法在本領域是周知的。
下面通過幾種包括前列腺癌、骨質疏松癥、卵巢癌、結腸癌、乳腺癌和睪丸癌的例子確定符合上面敘述的準則的生物標記,即它們是可預示某特定疾病的并且由神經(jīng)網(wǎng)絡分析在統(tǒng)計上是顯著的。請理解下面所說明的用于特定疾病的這些生物標記是本發(fā)明的示例,并不認作是對本發(fā)明的范圍施加任何限制。
<p>下面提供上面所使用的縮寫的檢索表
*LASA-P是DIANON系統(tǒng)公司的注冊商標**CA 15-3是Centocor公司的注冊商標根據(jù)本發(fā)明的方法可以診斷多種疾病。為適應用本方法診斷,疾病的生物標記和人口統(tǒng)計數(shù)據(jù)必須可量化。生物標記和人口統(tǒng)計數(shù)據(jù)還必須可預示疾病并且必須彼此是統(tǒng)計上顯著的。本發(fā)明的方法同樣適用于診斷任何可辨別其生物標記以及人口統(tǒng)計數(shù)據(jù)的疾病,包括但不限于傳染病和遺傳畸形。
在確定某種疾病的生物標記之后,由基于計算機、訓練過的神經(jīng)網(wǎng)絡對生物標記值數(shù)字化、預處理和分析以產(chǎn)生單個診斷值。用于模式分類問題的最常見神經(jīng)網(wǎng)絡的體系結構是前饋網(wǎng)絡,它典型地包括一個輸入層、一個或多個隱藏層和一個輸出層。圖1和圖2表示二種不同前饋網(wǎng)絡中的神經(jīng)元的排列。
構成神經(jīng)網(wǎng)絡的各層的元素稱為神經(jīng)元或節(jié)點。輸入信號從輸入層向前饋送到隱藏層并且接著饋送到輸出層。各層中神經(jīng)元的數(shù)量是在訓練網(wǎng)絡之前確定的。典型地,對每個輸入變量存在一個輸入神經(jīng)元或節(jié)點,并且每個輸出變量一個輸出節(jié)點。神經(jīng)網(wǎng)絡的各輸入值是各預測器變量。這些預測器變量可以是定量的或定性的。神經(jīng)網(wǎng)絡不做數(shù)據(jù)分布假設并且可以同時使用定時的和定性的輸入。在本發(fā)明中,生物標記值以及選擇產(chǎn)生的二級值在預處理中重定標在0.0和1.0之間或者-1.0和1.0之間,以構成輸入變量。
神經(jīng)網(wǎng)絡的輸出表示輸出類別。例如,惡性可用惡性輸出神經(jīng)元的最大輸出以及良性神經(jīng)元的靜默表示,而良性過程可用良性神經(jīng)元的最大輸出和惡性神經(jīng)元的靜默表示。簡單的算術函數(shù)與兩個神經(jīng)元組合以產(chǎn)生單個診斷指標。還可采用單個輸出神經(jīng)元。大于0.5的輸出表示惡性而小于0.5的輸出表示良性狀態(tài),以這種方式直接得到的診斷指標。還可采用相反的表示形式。
隱藏層的數(shù)量以及隱藏層的節(jié)點數(shù)量是對神經(jīng)網(wǎng)絡的性能具有明顯影響的可設置參數(shù)。實際上,隱藏神經(jīng)元的最佳數(shù)量是根據(jù)試驗確定的。確定隱藏神經(jīng)元的最佳數(shù)量的裝置是本領域中熟練的技術人員周知的并且取決于要解決問題的復雜性。
在本發(fā)明中,神經(jīng)網(wǎng)絡的一種實施方式是采用反向傳播訓練算法的多層前饋感知器。隱藏層的數(shù)量以及每個隱藏層中神經(jīng)元的數(shù)量按與診斷問題的復雜程度具有足夠的匹配來確定。在訓練組中的樣本代表著實際應用中所有會遇到的不具有明顯矛盾的可能情況以及一般比生成和交叉證實測試中的樣本數(shù)量和層次在統(tǒng)計上是足夠的假設下,下面概述的準則用于確定所選的網(wǎng)絡結構是否是恰當?shù)摹?br>
即使在多次調整訓練算法的參數(shù)之后,若神經(jīng)網(wǎng)絡連續(xù)地不能正確地分類訓練組中的大部分樣本,則應增加網(wǎng)絡的復雜性。
另一方面,如果神經(jīng)網(wǎng)絡對于正確地分類訓練組達到高比率但不能準確地對測試組中的大量樣本進行分類,網(wǎng)絡結構可能對于求解的問題太復雜,即它對適應訓練數(shù)據(jù)組具有足夠的固有靈活性但是對于測試數(shù)據(jù)組不具有足夠的預測力。若為這種情況,應逐步減少隱藏層中的神經(jīng)元數(shù)量,或者,如果存在多個隱藏層,應逐步減少隱藏層。
還有可能用含稍稍過多隱藏神經(jīng)元的神經(jīng)網(wǎng)絡完成通則。這可以這樣實現(xiàn)在訓練中周期性地用交叉證實檢測數(shù)據(jù)測試部分訓練過的神經(jīng)網(wǎng)絡,并且在交叉證實錯誤達到最少時停止接著開始增加測試。
通常并不總是必須具有大的訓練樣本組。若訓練組中的樣本已經(jīng)在足夠的統(tǒng)計顯著性上代表所有可能的情況,增加新的樣本一般不會增加訓練樣本中的信息量。代之可能會減小樣本中的有用信息對噪聲的比率。在另一種極端下,太小的訓練組一般不能覆蓋群體中的所有可能的變異。所產(chǎn)生的神經(jīng)網(wǎng)絡常常簡單地記住訓練組中的所有情況但幾乎不做歸納。
輸入層和輸出層不直接連接。每個輸入神經(jīng)元和后面的隱藏層中的各個神經(jīng)元連接,取決于隱藏層的數(shù)量隱藏層中的神經(jīng)元和后面的相鄰隱藏層或者輸出層中的各個神經(jīng)元連接。對每個具體神經(jīng)元的多條連接中的每條連接加權。在隱藏層和輸出層中,每個節(jié)點把乘以各自的連接加權值并加上偏置項的輸入激活值相加。然后加權后的總和通過一個典型地為S形函數(shù)的非線性輸出函數(shù),后者賦于神經(jīng)網(wǎng)絡表示復雜非線性關系的能力。若一個神經(jīng)元的加權輸入和大于門限值,該神經(jīng)元熔掉。如圖3中所示,一旦一個神經(jīng)元在門限之上,其輸出的幅度是凈輸入的S形函數(shù)。神經(jīng)網(wǎng)絡中活動的最終結果是凈輸出,它是各輸入的復雜非線性函數(shù)。
總之以及根據(jù)本發(fā)明,首先確定和定標某具體疾病的生物標記或人口統(tǒng)計變量的值。生物標記從輸入層前饋到隱藏層(或幾層)并且再前饋到神經(jīng)網(wǎng)絡的輸出層。輸入層中神經(jīng)元的數(shù)量是在訓練網(wǎng)絡前確定的并且對應于預測特定疾病的生物標記的數(shù)量。預選擇生物標記并且預處理生物標記值。對每個診斷變量或生物標記有一個輸入神經(jīng)元,并且每個所需的輸出有一個輸出神經(jīng)元。除標明的生物標記外,診斷變量可以包括人口統(tǒng)計信息。輸出層中神經(jīng)元的數(shù)量取決于所需的輸出類型。隱藏層中神經(jīng)元的數(shù)量是在訓練期間經(jīng)試驗確定的。
用于診斷特定疾病的神經(jīng)網(wǎng)絡必須得到訓練以去診斷該疾病。根據(jù)本發(fā)明在一種實施方式中,通過反向傳播訓練神經(jīng)網(wǎng)絡。反向傳播指的是通過確定各值之間的最佳連接加權準確地建立一種輸入和輸出樣本的訓練神經(jīng)網(wǎng)絡的技術,它在本領域中是周知的。其它可用來按照本發(fā)明的目的訓練神經(jīng)網(wǎng)絡的技術可以包括任何非線性全局優(yōu)化技術,例如遺傳搜索算法;但是,前饋、反向傳播神經(jīng)網(wǎng)絡是最流行的。
在訓練神經(jīng)網(wǎng)絡的起始階段,網(wǎng)絡中的連接加權是隨機化的。接著向網(wǎng)絡一次一個數(shù)據(jù)地提交訓練數(shù)據(jù)。根據(jù)本發(fā)明,訓練數(shù)據(jù)由一組患者的生物標記值或人口統(tǒng)計值以及對每個患者的診斷組成。生物標記值以及,供選地,人口統(tǒng)計值被數(shù)字化和預處理,并且預處理后的值是訓練網(wǎng)絡的輸入變量。對每個患者,網(wǎng)絡利用該患者的預處理值估定診斷,并接著和實際的診斷進行比較。若網(wǎng)絡的診斷是正確的,則不改變網(wǎng)絡中的連接強度和門限,并且向網(wǎng)絡提交下一個患者。若估定的診斷是不正確的,調整隱藏層以及輸出層中的連接加權和門限以減小分類錯誤的量值。在完成調整之后,提交下一個患者。繼續(xù)訓練直至訓練組中的所有患者都正確的分類或者滿足某預置的停止準則(例如迭代的最大次數(shù))。
在訓練神經(jīng)網(wǎng)絡時,訓練者可設定和分類錯誤定義有關的判定界限,即錯誤診斷。相關的參數(shù)是規(guī)定估定的輸出必須離實際的輸出多近才是正確的錯誤容限。例如,若采用兩個輸出神經(jīng)元并把訓練容限設定為5%,則當惡性輸出神經(jīng)元在最大值的95%處激發(fā)并且良性神經(jīng)元在最大值的5%內(nèi)激發(fā)則認為惡性估定是正確的。相類似,良性診斷的正確估定意味著良性輸出神經(jīng)元在最大值的95%處激發(fā)并且惡性神經(jīng)元在最大值的5%內(nèi)激發(fā)。這種確定分類錯誤的方法是本領域中熟練的技術人員周知的。
在本發(fā)明的最佳實施方式中,若采用單輸出神經(jīng)元,良性正常診斷設定在0.1的輸出而惡性或異常診斷設定在0.9的輸出。還可采取相反的表達方式。錯誤容限是一個可調整的參數(shù),在使神經(jīng)網(wǎng)絡成功地做出準確診斷上它是重要的。
在神經(jīng)網(wǎng)絡針對所需的疾病訓練之后,具有未知話病狀態(tài)和可能無病的患者的生物標記值以及任選的人口統(tǒng)計值被數(shù)字化、預處理和引入到訓練過的神經(jīng)網(wǎng)絡中。接著神經(jīng)網(wǎng)絡處理這些信息以生成一個對應于患有或不患有該特定疾病的診斷的值。根據(jù)本發(fā)明,這是通過采用單個輸出神經(jīng)元或者多個輸出神經(jīng)元實現(xiàn)的。若采用多于一個的輸出神經(jīng)元,組合各神經(jīng)元的輸出以產(chǎn)生單個診斷指標。
如圖4中所示,在本發(fā)明的第二實施方式中,由訓練過的神經(jīng)網(wǎng)絡分析生物標記得到的診斷值進一步由一組和患者的其它信息相配合的啟發(fā)式規(guī)則進行分析。患者的其它信息包括例如家族醫(yī)療史和人口統(tǒng)計信息。接著處理該信息以產(chǎn)生單個第二診斷值。
在另一種實施方式中,本發(fā)明的同時、多訪問推理系統(tǒng)可利用已有的知識以及只能從訓練數(shù)據(jù)中數(shù)值地提取的隱信息。已有知識的使用可采取設立診斷患者的具體的生物標記的正常基準范圍。如圖20中所描述該系統(tǒng)具有四個主功能塊1.輸入數(shù)據(jù)預處理在該塊中,各個對象的觀測數(shù)據(jù)值通過變換及組合序列。該過程的目的是把未加工的輸入數(shù)據(jù)轉換成一種在最明確的方式下保留有用信息同時去掉大部分無關的“噪聲”數(shù)據(jù)的形式。此外,可利用原始輸入生成二級輸入變量。通常事實上為非線性的這些變換還有助于減小自適應學習和分類功能塊上的壓力。
2.機械(實際)建模和仿真在該功能塊中,利用關于特定疾病過程的可得到的知識以及信息建立某些正常過程的機械(實際)模型,這些正常過程(心理學上的,解剖學上的,藥物學上的,病理學上的,分子生物學上的,遺傳學上的,等)與患者測量數(shù)據(jù)的來源有關。這些患者數(shù)據(jù)包括例如下面的但不局限于下面的類型和變量電診斷方法腦電圖心電圖肌電圖斷層X射線照片神經(jīng)傳導試驗成象診斷方法X射線NMRCT掃描PET掃描熒光X線照相術乳房X線照相術聲譜儀紅外線心回波圖確定各種生物液中生物標記的臨床檢驗室診斷方法血液尿唾液胃腸液生殖液腦脊髓液PCR基因標記放射免疫測定,ELISA色譜法受體測定組織學診斷法組織分析細胞學組織分型免疫細胞化學病理組織分析電子顯微鏡原位雜交藥代動力學診斷法治療藥物監(jiān)視受體特征和測定其它因素體格檢查醫(yī)療史精神和心理史行為模式行為測試人口統(tǒng)計數(shù)據(jù)吸毒、飲酒、吸煙和飲食方式環(huán)境影響(職業(yè)、對化學品、射線、毒素等的暴露)普通病理學這些模型基于研究中的各個患者的輸入數(shù)據(jù),或者基于各個患者所屬的一類患者的信息。這些模型的仿真輸出形成了與觀測到的患者數(shù)據(jù)進行比較的基礎以及在下一功能塊中檢測差異和異常的基礎。
3.差異和異常的檢測該同時多訪問推理技術系統(tǒng)的關鍵概念中的一個概念是利用已有知識(即CADRS和上面的診斷方法)以及正常和疾病過程中的事實來避免使數(shù)值化調整的模式分類子系統(tǒng)因患者狀況不同帶來的觀測數(shù)據(jù)的正常變化而過載。在該塊中,機械模型的輸出結果和觀測到的患者數(shù)據(jù)比較。接著把差異(不必是簡單的值上的數(shù)值差)作為輸入數(shù)據(jù)饋給自適應模式分類子系統(tǒng)以產(chǎn)生所需的臨床指示。
4.自適應模式分類子系統(tǒng)由于臨床問題的復雜特性,該功能塊中的分類函數(shù)/算法通常實質上是非線性的,作為特殊情況也包括線性和分段線性系統(tǒng)。分類函數(shù)的建立以及它們的參數(shù)的確定是根據(jù)分類問題的已知性質的,并且最重要的是根據(jù)可使用訓練數(shù)據(jù)中的隱含信息的。這種自適應分類系統(tǒng)的例子包括各種形式的分類信息的人工神經(jīng)網(wǎng)絡。
本發(fā)明還通過下述的示例進一步得到說明,這些示例不是按對本發(fā)明的范圍施加限制的方式構建的。相反,在閱讀本申請的說明之后,那些本領域內(nèi)熟練的技術人員會清楚地理解到,在不違背本發(fā)明的精神和/或附屬權利要求書的范圍下,手段可以是各種其它實施方式、改進方式和同等方式。
在下述一些利用神經(jīng)網(wǎng)絡分析數(shù)據(jù)的示例里,利用NeuralShell2(1.5版本)(Ward System Group公司)神經(jīng)網(wǎng)絡開發(fā)程序在奔騰60兆赫計算機(Magitronic公司)上訓練該神經(jīng)網(wǎng)絡。在其它示例中采用不同的計算機硬件。
示例1下例說明訓練一個神經(jīng)網(wǎng)絡以預測前列腺癌。
總共52個樣本劃分成二組,一個訓練組和一個普通測試組。訓練組包括40個樣本(28個穩(wěn)定的和12個進展的),普遍測試組包括12個樣本(9個穩(wěn)定的和3個發(fā)展中的)。
根據(jù)分類任務的復雜程度選擇初始的網(wǎng)絡體系結構。采用多層前饋網(wǎng)絡。初始體系結構的選擇涉及選擇隱藏層的數(shù)量以及每個隱藏層中神經(jīng)元的數(shù)量。進行幾次反復嘗試以確定一種在訓練樣本組和普通測試樣本組上都顯示良好結果的足夠設置。該網(wǎng)絡具有一個帶有九個神經(jīng)元的隱藏層并具有二個輸出神經(jīng)元。
最初,隨機地設定各神經(jīng)元中的連接加權。該神經(jīng)網(wǎng)絡具有五個輸入神經(jīng)元,對應于前列腺癌的五個重要輸入變量TPS、PSA、PAP、CEA和睪酮。圖5中示出訓練數(shù)據(jù)。在訓練期間,每個患者的五個輸入變量首先在0.0和1.0的連續(xù)范圍內(nèi)線性定標。接著把得到的五個數(shù)作為輸入向量提交給該人工神經(jīng)網(wǎng)絡的輸入神經(jīng)元。
對每個輸入向量,該網(wǎng)絡根據(jù)網(wǎng)絡神經(jīng)元之間的連接加權產(chǎn)生一個輸出。該輸出可以是一個單值或者一個數(shù)值向量,其取決于所使用的輸出神經(jīng)元的數(shù)量。該網(wǎng)絡具有二個輸出神經(jīng)元。通過下述數(shù)學式處理二個神經(jīng)元的輸出以產(chǎn)生單個診斷指標
網(wǎng)絡中的每個神經(jīng)元通過非線性S形函數(shù)(通常是一個邏輯函數(shù))傳送該神經(jīng)元的所有輸入的總和參與輸出計算并且把結果發(fā)送給后面相鄶層中的每個神經(jīng)元。把產(chǎn)生的輸出或每個輸出神經(jīng)元和所需的“目標”輸出進行比較。0.1的值對應于穩(wěn)定的診斷而0.9的輸出對應進展中的診斷。該差異用于計算指導訓練算法(即反向傳播算法)的誤差項,調整網(wǎng)絡連接加權以力圖減小訓練樣本組上的網(wǎng)絡輸出和目標值之間的差時。
在訓練后,該神經(jīng)網(wǎng)絡正確地分類100%的樣本。
當提供普通的檢驗結果時,該訓練過的神經(jīng)網(wǎng)絡正確地分類100%的穩(wěn)定樣本和66%的正在發(fā)展的疾病的樣本。
示例2在附屬的圖25中提供Prost AsureTM算法的數(shù)學描述。在圖6和7中分別提供用于Prost AsureTM的訓練數(shù)據(jù)和檢驗數(shù)據(jù)。訓練數(shù)據(jù)組顯示患者的年令、PSA、PAP、CK-BB、CK-MB、CK-MM、總CK、直腸指診和種族的數(shù)據(jù)。
在對檢驗數(shù)據(jù)和訓練數(shù)據(jù)的癌癥檢查上,Prost AsureTM顯示出下述靈敏度和特異性(用百分比表示)檢查的靈敏度 檢測 訓練前列腺癌(PC) 80.3% 84.4%2期PC85.3 85.1T2、T3期和TNXMI期(PC) 87.9 87.9把前列腺增生檢查為BPH66.1 68.9辨別的特異性 百分比非癌癥為非癌癥 92.8% 91.8假定的正常為正常 67.6 68.2
*BPH=良性前列腺增生當用Pearson x2分布檢驗(x2分布值=128.8)并且自由度為4和P值<0.00001時,Prost AsureTM系統(tǒng)的這些結果是統(tǒng)計非常顯著的。這些結果展示出在診斷前列腺癌、區(qū)分該病的階段以及辨別良性前列腺增生及正常等等上Prost AsureTM系統(tǒng)的靈敏度和特異性。
示例3本例說明構建和訓練用于診斷骨質疏松癥的神經(jīng)網(wǎng)絡。訓練和檢驗數(shù)據(jù)分別在圖8和9中示出。QuiOsTM算法的數(shù)學描述附錄在圖26中。本例展示構建和訓練用于診斷骨質疏松癥的神經(jīng)網(wǎng)絡。
圖8提供用于訓練診斷骨質疏松癥的神經(jīng)網(wǎng)絡的數(shù)據(jù)。所選的生物標記包括年令、鈣、磷酸鹽、雌二醇(ETWO)、孕酮、總堿性磷酸酶、總腸堿性磷酸酶以及肝堿性磷酸酶的百分比。圖8還包括該神經(jīng)網(wǎng)絡得到的診斷指標。
圖9提供用于檢驗按圖8中的數(shù)據(jù)訓練的網(wǎng)絡的數(shù)據(jù)以及得到的神經(jīng)網(wǎng)絡診斷指標。
在實施本發(fā)明的一個方面中,通過一種或幾種標準方法測量一組人或動物中具有不同嚴重性的疾病的嚴重性。然后賦予該測量一個和嚴重性標度對應的數(shù)字值。標度的范圍從無病的人或動物至帶有嚴重疾病的人或動物。該標度最好是一個數(shù)值標度。例如,可以指定一個值對應于正?;蜉p微的疾病,另一值對應中等的疾病,而第三個值代表嚴重的疾病。
接著確定一組具有疾病的不同嚴重性的人或動物中的血液成分預定集的濃度。根據(jù)本發(fā)明,最好測量由一種或幾種常規(guī)方法測出其疾病嚴重性的相同一組人或動物的血液成分。骨質稀少癥本發(fā)明的一種實施方式的例子是一種診斷患者骨質稀少癥的方法。該方法最好利用六種血液成分。這些成分是鈣、磷酸鹽、總堿性磷酸酶、一種堿性磷酸酶同功酶、雌二醇和孕酮。實施本發(fā)明的堿性磷酸酶同功酶最好包括淋巴細胞衍生的堿性磷酸酶同功酶和骨、肝或腸堿性磷酸酶同功酶。本發(fā)明包括利用上述六種血液成分通過把這些供檢驗的值輸入到在圖26中附錄的QuiOsTM算法計算骨密度商數(shù)。在QuiOsTM算法中還包括年令、體重和身高。
除了診斷患者的骨質稀少狀態(tài)外,利用本發(fā)明可以確定骨質稀少癥的根本病因的指示。例如,通過按本文所說明的方法實施本發(fā)明,可以確定患者的骨質稀少癥是由于經(jīng)絕后雌激素的缺乏引起的還是由于其它的狀況如癌癥引起的。這可使護理醫(yī)生能更好地制定對骨質稀少癥的治療。
在本發(fā)明中采用五種臨床檢驗室普遍進行的血清檢驗。對T-淋巴細胞衍生的堿性磷酸酶的檢驗只是試驗的;但是,對血液、肝和腸的堿性磷酸酶同功酶的檢驗都是知道的。只要檢驗給出所測量的成分的準確血液濃度,這六種血清成分所使用的檢驗類型對本發(fā)明則不是關鍵性的。圖10和11中所示的結果顯示骨質稀少癥診斷中的極好靈敏度和特異性。
示例4該例解釋構建和訓練用于計算機輔助診斷和預測疾病的分類器的方法。該分類器基于計算機的神經(jīng)網(wǎng)絡。下面的字母子節(jié)標題代表圖13中的字母標記。
a.輸入的初始選擇按提取對診斷該疾病以及確定該疾病的發(fā)展階段的有用信息的方式選擇和該疾病過程有關的生物標記和其它測量(解剖的、生理的、病理的等等)。該選擇很大地依賴于醫(yī)療經(jīng)驗、生物醫(yī)學基礎科學的現(xiàn)有知識以及臨床研究的進展。
b.對辨別力的檢測利用訓練組中檢驗數(shù)據(jù)分別在線性和非線性組合下對選出的輸入進行辨別力的統(tǒng)計分析。所使用的軟件類型包括商用統(tǒng)計軟件包(例如Math Works公司的MatLabTM,Statsoft公司用于Windows 4.5的Statistira)以及由Horus公司的人員開發(fā)的用輸入變量的非線性組合和變換進行聚類分析的程度。采用科學數(shù)據(jù)顯示技術引導非線性組合及變換的構建。從選擇的輸入組中去掉那些在訓練數(shù)據(jù)中不顯示對分離不同診斷類的患者數(shù)據(jù)特征有辨別力的輸入。
c.對各種輸入的分類幾個初始確定的輸入可能在疾病過程的相同方面是緊密相關的或者是簡單的不同測量,并且可能提供類似的但略有差異的值。把它們組合到輸入子集中。在開發(fā)基于神經(jīng)網(wǎng)絡的分類器(它們用神經(jīng)網(wǎng)絡補充提供分類系統(tǒng))的過程中,一次只使用每個子集中的一個輸入(首先是具有較高辨別力的一個)以構成分類器的實際輸入表。在分組過程中利用生物標記專家知識。例如,可以把兩個略有不同的對相同生物現(xiàn)象進行測量的檢驗,如CA125和CA125II歸納到一起。各輸入間的交互影響、相關及相同的統(tǒng)計分析有助于確定這些分組(例如x2分布、配對t-檢驗等等)。
d.預處理預處理步驟包括輸入值的準備,“預處理值”被用為基于神經(jīng)網(wǎng)絡的分類器的實際輸入。該步驟包括對原始輸入生物標記或人口統(tǒng)計值(它們可以是數(shù)字化值和/或利用原始輸入值的線性或非線性組合建立的二級輸入)的線性或非線性變換(例如改比例)。本步驟中使用的軟件和過程類似于上面所說明的步驟b“對辨別力的檢測”中的軟件和過程。在步驟b中,目標是確定某特定的生物標記或者別的測量是否提供任何有用的信息。在本步驟中,利用統(tǒng)計、數(shù)學和計算工具幫助“預消化”信息。例如,按非線性公式組合的二個輸入提供更明顯的分類信息。增加一個利用該式的計算值的輸入使訓練更為容易。利用生物醫(yī)學以及臨床科學領域中的專家知識(例如某種類型的變換或組合在生物上是否是“似乎合理的”)并且利用模式分類中的經(jīng)驗。例如,通過觀察輸入變量空間中的樣本,可以估定樣本分布中的復雜性并利用該信息調整神經(jīng)網(wǎng)絡的結構。由于非線性運算以及在組合中常常使用大量輸入值,對新建立的二次輸入的有效性的直接數(shù)值評估可能是非常困難的。廣泛使用科學數(shù)據(jù)顯示技術以在構造和評估二級輸入中提供指導。例如,彩色編碼以及坐標系統(tǒng)變換允許觀測高于三維空間的數(shù)據(jù)。這有助于理解輸入變量空間中樣本的分布和預處理步驟的結構。
預處理步驟是非常重要的。該領域中的以前的工作者設想神經(jīng)網(wǎng)絡的非線性特性可全面地利用以原始輸入值為形式的訓練數(shù)據(jù)中的信息(參見Astion,M.L.和Wilding,P.的“癌癥診斷中神經(jīng)網(wǎng)絡對實驗室數(shù)據(jù)的解釋的應用”,Clinical Chemistry 3834-38(1992),該文中未提及預處理)。但是,該“解開”多線索的和相關的信息以方便對神經(jīng)網(wǎng)絡的訓練的步驟在成功地開發(fā)基于神經(jīng)網(wǎng)絡的診斷系統(tǒng)中起著極為重要的作用。
e.選擇具有最大辨別力的輸入該步驟涉及從可能變換過的原始輸入值中和從新建立的二次輸入中選擇輸入變量以形成基于神經(jīng)網(wǎng)絡的分類器的實際輸入表。該表中初始選擇的輸入數(shù)量基于步驟b和d中的辨別力評定結果以及可利用的有關該問題復雜性的知識。
f.檢測/評估和分析各種輸入的作用在該步驟中,利用檢驗數(shù)據(jù)組的數(shù)據(jù)評估基于訓練過的神經(jīng)網(wǎng)絡的分類器的性能,該檢驗數(shù)據(jù)組沒有在構建和訓練該基于神經(jīng)網(wǎng)絡的分類器中涉及到,該分類器是一種利用神經(jīng)網(wǎng)絡作為其分類決策部件的分類系統(tǒng)。由于基于神經(jīng)網(wǎng)絡的計算中的非線性特性,通常不可能直接分析各種輸入數(shù)據(jù)對產(chǎn)生神經(jīng)網(wǎng)絡分類器的最終結果的作用。采取下述步驟1)觀察每個輸入發(fā)出的網(wǎng)絡連接強度;2)對隨單個輸入量改變的神經(jīng)網(wǎng)絡輸出中相關變化進行比較的靈敏性分析;以及3)更完全的分析方法,例如利用Monte Carle取樣法在多個輸入同時改變方面建立一個靈敏表面。
g.選擇訓練得最好的神經(jīng)網(wǎng)絡分類器增加/刪除輸入值以及構造/評估神經(jīng)網(wǎng)絡分類器的重復處理產(chǎn)生多種構形的基于神經(jīng)網(wǎng)絡的診斷系統(tǒng)。對“最好”的選擇基于兩個基本考慮1)在絕對意義上以及和現(xiàn)有方法的比較上該系統(tǒng)的有效性;以及2)輸入數(shù)據(jù)的數(shù)量以及相關的成本。
示例5構建和訓練用于計算機輔助診斷設備的基于神經(jīng)網(wǎng)絡的分類器的過程下面逐條說明圖14中所示的構造和訓練過程中采用的步驟
1.若診斷組的總數(shù)量為2,轉到下一步驟。否則,根據(jù)有關該疾病過程的已知因素;把分離的組組織到二進制分類判定樹中。對每對需要二進制分類的組(是/否、陽性/陰性等等)重復步驟2-6。
2.在第一層上導出神經(jīng)網(wǎng)絡(ANN1,1至ANN1,M)a.選擇用于訓練和檢驗的適當數(shù)據(jù)組。
b.若記錄的神經(jīng)網(wǎng)絡的總數(shù)超過預定數(shù)量,轉到步驟3。
c.構建新的神經(jīng)網(wǎng)絡并且從總輸入表中選擇子集(通過設定神經(jīng)網(wǎng)絡選擇器完成)。
d.利用不同的初始條件和訓練參數(shù)訓練相同結構的多個神經(jīng)網(wǎng)絡。對于每個訓練過的神經(jīng)網(wǎng)絡,若結果明顯地超過包括具有不同網(wǎng)絡結構的網(wǎng)絡在內(nèi)的以前訓練過的神經(jīng)網(wǎng)絡(根據(jù)各組中正確或錯誤分類的患者),去掉低品質性能的神經(jīng)網(wǎng)絡。重復進行直至在新訓練的神經(jīng)網(wǎng)絡中不能觀察到明顯的性能改進或者直至用盡初始條件和參數(shù)的全部合理變化。
e.若用盡所有的合理網(wǎng)絡結構以及它們的變型,轉至下一步驟,否則轉至步驟3。
3.比較所有記錄的神經(jīng)網(wǎng)絡的性能并且去掉差的或重疊的神經(jīng)網(wǎng)絡。若二個神經(jīng)網(wǎng)絡提供類似的結果,去掉帶有更復雜網(wǎng)絡結構的一個。
4.記錄所有保留的神經(jīng)網(wǎng)絡。
5.在第二層上導出神經(jīng)網(wǎng)絡(神經(jīng)網(wǎng)絡ANN2,1至神經(jīng)網(wǎng)絡2,N)。用第一層中保留的神經(jīng)網(wǎng)絡的輸出變量擴大原始輸入表,并且重復步驟2-4。
6.利用線性或非線性方法把一個或幾個記錄的神經(jīng)網(wǎng)絡的輸出組合為單個分類指標。利用網(wǎng)絡訓練中未涉及到的檢驗數(shù)據(jù)評估其分離二個診斷組的性能。為這對診斷組選擇最佳的二進制分類函數(shù)。
7.根據(jù)二進制分類判定樹,組合得到的二進制分類函數(shù)以形成一個“超函數(shù)”,該“超函數(shù)”產(chǎn)生一個帶有Horus任意單位和帶有各個不同診斷組的基準范圍的單值診斷指標。
示例6用于診斷前列腺癌的對患者數(shù)據(jù)進行神經(jīng)網(wǎng)絡分析的基于計算機的Prost AsureTM系統(tǒng)這是一個基于計算機的系統(tǒng),它具備接收患者數(shù)據(jù)、利用訓練過的神經(jīng)網(wǎng)絡分析數(shù)據(jù)、產(chǎn)生表示前列腺癌的存在或不存在的輸出值、把該值發(fā)送到另一個計算機以及把該值發(fā)送到另一個位置的能力。在圖15中概略表示該系統(tǒng)。圖15中的各個方塊被編號并在下述說明中被引用。該系統(tǒng)具備接收和分析大量的患者數(shù)據(jù)、迅速地產(chǎn)生診斷前列腺癌的輸出值以及把結果任意地發(fā)送到遠程位置的高能力。該系統(tǒng)允許迅速地分析大量的患者數(shù)據(jù)組并且向臨床檢驗室和保健部門提供診斷值。應理解圖15代表本發(fā)明的一種最佳實施方式,并且應理解在實施本發(fā)明以診斷包括前列腺癌在內(nèi)的任何疾病時可采用其它的系統(tǒng)配置,例如涉及單計算機或多計算機的不同硬件配置。
數(shù)據(jù)文件包含為計算前列腺癌的診斷指標所需的患者檢驗數(shù)據(jù)。數(shù)據(jù)文件是標準的ASCII文件。每個患者記錄為文件中的一行。文件的各行用回車;換行(CR/LF)對定界。記錄中的字段用ASCII字符“,”定界,每條記錄包含下述七個字段1)標識(ID)-字母數(shù)字;2)年令-數(shù)字;3)前列腺特有抗原(PSA)-數(shù)字;4)PAP-數(shù)字;5)CKBB-數(shù)字;6)CKMB-數(shù)字;7)CKMM-數(shù)字。每個字母數(shù)字字段包含一條由字母“a”到“z”、“A”到“Z”、數(shù)字“0”到“9”以及字符“-”、“-”、“.”、“$”組成的字符串。數(shù)字字段包含一條十進制數(shù)字的串。它可包含單個十進制小數(shù)點“.”。在數(shù)字中不允許出現(xiàn)空格字符“ ”和逗號字符“,”。
每個患者記錄占據(jù)輸入數(shù)據(jù)文件中的一行。一條記錄中的數(shù)據(jù)字段用逗號分隔。在回送給Lab Corp的結果文件中,重復各輸入值,后面跟有二個也用逗號分隔的附加數(shù)據(jù)字段計算出的ProstAsureTM(紐約州Rochester市的HORUS醫(yī)療公司)值和整數(shù)的誤差代碼。
在真正計算Prost AsureTM值之前,根據(jù)下述按圖16中列出的次序的錯誤檢查準則對患者記錄進行錯誤檢查。一旦出現(xiàn)代碼130之外的錯誤,錯誤檢查停止。不對該患者計算Prost AsureTM值。輸出文件記錄中的Prost AsureTM字段填入“xxxx”并且把第一非130錯誤代碼附屬為最后的字段。當檢驗了所有的準則并且沒有查出錯誤或只查出代碼130時,計算Prost AsureTM值并在結果文件記錄中報告。相應地把錯誤代碼0或130附屬成最后的字段。
按如下定義錯誤代碼錯誤代碼110-該記錄包括少于7個用逗號隔開的字段。后面跟著一個逗號的空字段仍當作一個字段并且不會觸發(fā)本檢查。錯誤代碼100-第一字段(ID字段)是空的。錯誤代碼120-其余的數(shù)字字段中的一個不是有效的數(shù)字格式(包括一個空字段)或者一個數(shù)字字段具有負值。錯誤代碼130-檢驗室檢驗值中的一個值超過普通的患者參考范圍的上限的五倍;或者三個或更多的檢驗室檢驗結果具有零值;或者年齡=0或>150。
Prost AsureTM系統(tǒng)由二臺計算機工作站和有關的通信設備及連接設備組成(圖15)。下一段是對該系統(tǒng)的概述。
Prost AsureTM站I(14)基本上是一個通信控制站。它經(jīng)調制解調器(2)和電話線下載來自遠程計算機系統(tǒng)(Lap Corp)(1)的檢驗數(shù)據(jù),并且把Prost AsureTM結果上載到遠程系統(tǒng)。通過一條直接的假調制解調器的電纜(7)在各自的相應串行端口上,站I(14)和站II(15)連接。站I(14)把成功下載的數(shù)據(jù)文件發(fā)送給站II(15)并且從站II接收用于上載的ProstAsureTM結果文件。站I控制下載間隔的定時。它通過取決于錯誤狀況的重試和/或報警操作(13)處理錯誤狀況。在上載(4)和(3)之前站I比較外出結果文件和進入數(shù)據(jù)文件(5)的數(shù)據(jù)部分以確保結果文件的完整性。
Prost AsureTM站II(15)是用于Prost AsureTM算法計算(11)的主計算站并且放置訓練過的神經(jīng)網(wǎng)絡(11)。站II(15)接收來自站I(14)的數(shù)據(jù)文件并且把結果文件發(fā)送(8和9)給站I(14)。站II(15)讀出和驗證從站I接收的數(shù)據(jù)。若檢查出(12和10)無效數(shù)據(jù),用“x”字符標記Prost AsureTM的結果字段,并且還用具體的錯誤代碼反映該狀態(tài)。若檢測出數(shù)據(jù)值是異常的但是有效的,將提供Prost AsureTM結果;但是,將用錯誤代碼指示這種狀況。站II調用動態(tài)連接庫(DLL)以進行神經(jīng)網(wǎng)絡結構的計算,該庫來自一種領先的神經(jīng)網(wǎng)絡軟件-商用軟件包NSHELL2的2.0版本(馬里蘭州Frederick鎮(zhèn)的Ward SystemGroup公司)。站II包括錯誤處理程序(10)以處理各種錯誤狀況。它在嚴重錯誤狀況下向操作員(13)報警(9和10)。站II還負責原始數(shù)值文件和結果文件的存檔。
Prost Asure系統(tǒng)利用哥倫比亞大學的Kermit軟件在二個工作站站I和II之間以及在站I和遠程計算機系統(tǒng)之間進行通信。Kermit是可靠的和充分測試過的通信協(xié)議。Prost AsureTM系統(tǒng)軟件在微軟的Windows環(huán)境下運行,該環(huán)境提供相容和用戶友好的接口。為簡化操作Prost AsureTM軟件設計成是按全屏幕方式執(zhí)行的。系統(tǒng)說明系統(tǒng)要求圖15中提供系統(tǒng)的圖示概述。站I(14)站I的要求包括如下奔騰計算機75兆赫或更高,一個不少于8Mb的RAM,一個不少于1.0Gb的硬盤機,一個速度為9600比特/秒或更高的內(nèi)部調制解調器,一個SVGA監(jiān)視器以及用于Work group的Microsoft Windows(WFW)3.11。站II(15)站II的要求包括如下奔騰75兆赫或更高,一個不少于8Mb的RAM,一個不小于1.0Gb的硬盤機,一個850MB的內(nèi)部磁帶機,一個超VGA監(jiān)視器以及用于Work group的MicrosoftWindows(WFW)3.11。
該系統(tǒng)需要一個Microsoft Windows的打印器驅動程序支持的激光打印機。還需要用于經(jīng)串行端口在站I和站II之間進行連接的假調制解調器7和RS-232電纜。
實際安裝的系統(tǒng)一種實際安裝系統(tǒng)的例子如下站I的構成NEC Ready Pentinm SystemsTM(奔騰100MHz CPU,16Mb RAM,1.0GB硬盤機)NEC Multisync XV17TM監(jiān)視器;預裝入用于Workgroup的MS Windows 3.11。站II的構成NEC Ready Pentiam SystemsTM(奔騰100MHz CPU,16Mb RAM,1.0Gb硬盤機)內(nèi)部的850Mb磁帶機NEC Multisync XV17TM監(jiān)視器,預裝入用于Workgroup的MS Windows。打印機HP Laser Jet III參考資料Operations Procedure;Ready Pentium Systems User’s Guide;NEC Ready Pentinm Systems Hardware Ref./Operations Guide;NEC Multisync XV17TMUser’s Guide。
系統(tǒng)功能在下述對程序的說明中,術語“緊急報警程序”定義為報告計算機軟件或硬件系統(tǒng)中或者數(shù)據(jù)文件傳送機制中需要人類操作員和/或運行管理者13的立即注意或介入的異常情況的自動程序。在“緊急報警程序中”,1)受到影響的計算機產(chǎn)生在設施外能聽到的響亮警報聲;2)受到影響的計算機屏幕閃爍并且顯示出錯信息和對應的錯誤代碼;以及3)計算機系統(tǒng)自動地撥打當班人員的尋呼機號碼。
站I(14)從主機(1)(HP3000 UNIX工作站)下載患者檢驗數(shù)據(jù)并且對主機(1)上載計算結果,主機(1)位于北卡羅來納州的Research Triangle Park的美國LaboratoryCorporation(Lab Corp)的設備中。站I充當外部數(shù)據(jù)源(LabCorp主機)和Prost AsureTM處理工作站(站II)15之間的緩沖器和防火墻。下面是對站I提供的功能的詳細說明。這些功能也是在系統(tǒng)有效性測試期間檢查的功能。
I-1啟動經(jīng)過調制解調器對主機的遠程連接。調用自動注冊程序以利用MS DOS Kermit軟件和下載程序得到供處理的新的患者數(shù)據(jù)。它利用Kermit ASCII文件傳送協(xié)議。
I-2每60分鐘自動地發(fā)生連接及文件下載。在連接失敗的情況下,在10秒的間隔中自動反復再連接。在連續(xù)10次努力失敗后,系統(tǒng)I發(fā)出錯誤代碼#200并且啟動“緊急報警程序”。
I-3一旦完成數(shù)據(jù)文件的下載,系統(tǒng)I啟動和站II的連接并且把新接收的數(shù)據(jù)文件發(fā)送給站II。若站I反復十次失敗發(fā)送數(shù)據(jù),站I發(fā)出錯誤代碼#230并且啟動“緊急報警程序”。
站II處理接收的數(shù)據(jù),為每個患者計算Prost AsureTM指標并且把結果和原始輸入值一起發(fā)送給站I。
I-4在成功地接收完成后的結果數(shù)據(jù)文件之后,站I把結果數(shù)據(jù)文件中每個患者的輸入值和原始接收的數(shù)據(jù)文件中的輸入值進行比較以確保完全匹配。若出現(xiàn)錯誤,調用“緊急報警程序并且顯示錯誤代碼#300或#310(不匹配的記錄數(shù)量)或#320(至少一個記錄不和輸入值匹配)。當發(fā)生300系列錯誤時,不向LabCorp主機發(fā)送結果并且立即通知運行管理者。
I-5連接Lab Corp并向Lab Corp主機發(fā)回數(shù)據(jù)(類似于I-1,除執(zhí)行文件拒載代替文件下載之外)。
I-6類似于I-2,若連接努力失敗,站I在10秒間隔中重復連接嘗試。在連續(xù)10次嘗試失敗后,站I顯示錯誤代碼#290并且啟動”緊急報警程序“。
站II從站I接收數(shù)據(jù)并且向站I發(fā)送數(shù)據(jù)。站II利用ProstAsureTM算法處理數(shù)據(jù)。站II提供下述功能。在系統(tǒng)有效性測試期間這些功能被測試。
II-1一旦建立由站I啟動的連接,站II接收已發(fā)送的患者文件。
II-2站II利用Prost AsureTM算法順序地處理數(shù)據(jù)文件中的患者記錄(見圖25)。
II-3一旦完成步驟II-2,站II啟動和站I的連接,并且利用MS DOS Kermit ASCII文件傳送程式向站I發(fā)送結果數(shù)據(jù)文件。若嘗試10次不能發(fā)送文件,站II發(fā)出錯誤代碼#260并且啟動“緊急報警程序”。結果數(shù)據(jù)文件中的記錄(行)由計算中使用的輸入數(shù)據(jù)值和附加的二個字段組成,附加的二個字段是對患者計算的Prost AsureTM值以及一個指示計算正?;虍惓5娜龜?shù)字代碼。在異常情況下,該代碼是一個錯誤代碼,它含有關于所出現(xiàn)的異常情況的類型的信息。
II-4在完成向站I發(fā)送結果數(shù)據(jù)文件后,數(shù)據(jù)文件和由該數(shù)據(jù)文件加上二個附加字段欄1)計算值和2)錯誤代碼組成的結果文件歸檔到站II的二個指字目錄“c\pacompu\padata\”和“c\pacompu\paresult”中,該目錄帶有反映編碼日期和時間標記的文件名,形式為mmddhhnn.yy其中mm月份、dd日期、hh小時、nn分鐘以及yy年。
示例7本發(fā)明包括利用計算機輔助神經(jīng)網(wǎng)絡診斷卵巢癌。這一新形式使用上面的卵巢癌II標題下列出包括CA125、M-CSF、OVXI、LASA、CAA7-24和CA19-9的生物標記。在用186個對象的獨立數(shù)據(jù)組檢驗后,檢測達到89%的靈敏性和89%的特異性。
當然,應該理解,上面的說明僅和本發(fā)明的最佳實施方式有關,并且在不違背附屬權利要求書中所敘述的本發(fā)明的范圍和精神下可對本文進行大量的修改和變更。
權利要求
1.一種診斷或預測患者的疾病的方法,包括把和該疾病相關的患者的生物標記的濃度轉換成數(shù)字化值;預處理數(shù)字化值以得到預處理的值;把預處理的值輸入到含有訓練過的神經(jīng)網(wǎng)絡的計算機中;把預處理值引入到訓練過的神經(jīng)網(wǎng)絡中,其中該訓練過的神經(jīng)網(wǎng)絡是專門為診斷或預測該疾病訓練的并且產(chǎn)生一個輸出值,該輸出值對應于患有或不患有該疾病或者該疾病的嚴重性;以及把來自該訓練過的神經(jīng)網(wǎng)絡的輸出值發(fā)送到和顯示裝置連接的輸出值接收器。
2.權利要求1的方法,還包括把患者的生物統(tǒng)計數(shù)據(jù)轉換成數(shù)字化值;預處理數(shù)字化值以產(chǎn)生預處理值;把預處理值輸入到計算機;以及把預處理值引入到訓練過的神經(jīng)網(wǎng)絡中。
3.權利要求1的方法,還包括把該訓練過的神經(jīng)網(wǎng)絡的輸出值以及來自患者生物標記的第二組預處理值或者任選的來自患者人口統(tǒng)計數(shù)據(jù)的第二組預處理值引入到計算機中的第二訓練過的神經(jīng)網(wǎng)絡里,其中該第二訓練過的神經(jīng)網(wǎng)絡訓練成診斷或預測該疾病并且產(chǎn)生第二輸出值,該第二輸出值對應于患有或不患有該疾病或者對應于該疾病的嚴重性;以及把第二輸出值從第二訓練過的神經(jīng)網(wǎng)絡發(fā)送到和顯示裝置連接的輸出值接收器。
4.權利要求1的方法,包括把患者生物標記數(shù)據(jù)以及任選的患者人口統(tǒng)計數(shù)據(jù)插入到患者記錄中;把患者記錄中的數(shù)據(jù)引入到計算機中,在其中對數(shù)據(jù)進行數(shù)據(jù)格式錯誤分析;把不帶有格式錯誤的患者數(shù)據(jù)轉換成數(shù)字化值;預處理數(shù)字化值以產(chǎn)生預處理值;把預處理值引入到訓練過的神經(jīng)網(wǎng)絡中,其中該訓練過的神經(jīng)網(wǎng)絡是專門為診斷或預測該疾病訓練的,其產(chǎn)生一個表示患有或不患有該疾病或者該疾病的嚴重性的輸出值;以及把該輸出值和患者數(shù)據(jù)插入到該患者記錄中。
5.權利要求1的方法,其中該疾病是從由骨質疏松癥、骨質增生癥、乳腺癌、卵巢癌、結腸癌、前列腺癌和睪丸癌組成的組中選擇的。
6.一種用于訓練基于計算機的神經(jīng)網(wǎng)絡來用于診斷和預測患者疾病的方法,包括隨機選擇基于計算機的神經(jīng)網(wǎng)絡中的連接加權;從一組患有一種疾病的患者得到和該疾病相關的患者生物標記的濃度;把生物標記的濃度轉換成數(shù)字化值;預處理數(shù)字化值以產(chǎn)生預處理值;通過經(jīng)該神經(jīng)網(wǎng)絡的輸入端逐次地引入作為輸入變量的每個患者的預處理值訓練神經(jīng)網(wǎng)絡;從該神經(jīng)網(wǎng)絡得到一個輸出值,其中該輸出值表示神經(jīng)網(wǎng)絡的診斷并且對應于患有或不患有該疾病或者對應于該疾病的嚴重性;把神經(jīng)網(wǎng)絡的輸出值和實際診斷進行比較;若神經(jīng)網(wǎng)絡的診斷不對應于實際診斷,調整連接加權;經(jīng)過該神經(jīng)網(wǎng)絡的輸入端引入作為輸入變量的該組患者中的患者的預處理值;得到該神經(jīng)網(wǎng)絡的第二輸出值;把該神經(jīng)網(wǎng)絡的第二輸出值和實際診斷進行比較,若神經(jīng)網(wǎng)絡的診斷不對應于實際診斷,調整連接加權;重復上述向該神經(jīng)網(wǎng)絡引入該組患者中其它患者的預處理值、得到新的輸出值、把新的輸出值和實際診斷進行比較以及選擇性地調整連接加權等步驟;以及任選地建立關于分類錯誤的判定極限。
7.一種設備,包括一個包含著訓練過的神經(jīng)網(wǎng)絡的計算機,其中該訓練過的神經(jīng)網(wǎng)絡訓練成診斷或預測某種疾病。
8.權利要求7的設備,還包括用于把和該疾病相關的患者生物標記濃度轉換成數(shù)字化值的設備;用于預處理數(shù)字化值以生成預處理值的裝置;用于把預處理值輸入到該訓練過的神經(jīng)網(wǎng)絡的裝置,從而該訓練過的神經(jīng)網(wǎng)絡產(chǎn)生一個輸出值,該輸出值和是否患有該疾病或者和該疾病的嚴重性相對應;以及用于傳送該輸出值的裝置。
9.權利要求7的設備,還包括用于把患者人口統(tǒng)計數(shù)據(jù)轉換成數(shù)字化值的裝置;用于預處理該數(shù)字化值以生成預處理值的裝置;用于把預處理值輸入到該訓練過的神經(jīng)網(wǎng)絡的裝置,從而該訓練過的神經(jīng)網(wǎng)絡產(chǎn)生一個輸出值,該輸出值和是否患有該疾病或者和該疾病的嚴重性相對應;以及用于傳送該輸出值的裝置。
10.權利要求8的設備,還包括多于一個的訓練過的神經(jīng)網(wǎng)絡,其中這些訓練過的神經(jīng)網(wǎng)絡訓練成專門診斷或預測某種疾病并且各產(chǎn)生一個輸出值,輸出值和是否患有該疾病或者和該疾病的嚴重性相對應。
11.權利要求7的設備,其中疾病是從由骨質疏松癥、骨質增生癥、乳腺癌、卵巢癌、結腸癌、前列腺癌和睪丸癌組成的組中選擇的。
全文摘要
本發(fā)明的同時、多訪問推理技術系統(tǒng)利用現(xiàn)有的知識以及可從訓練數(shù)據(jù)中數(shù)值化地提取的隱信息提供一種用于診斷疾病和治療患者的方法及設備。該技術還包括一個用于從其它位置接收患者數(shù)據(jù)、在訓練過的神經(jīng)網(wǎng)絡中分析數(shù)據(jù)、產(chǎn)生診斷值以及任意地把診斷值發(fā)送到其它地方的系統(tǒng)。
文檔編號G06F19/00GK1194045SQ96196534
公開日1998年9月23日 申請日期1996年7月25日 優(yōu)先權日1995年7月25日
發(fā)明者斯蒂芬D·巴恩希爾, 張振 申請人:好樂思治療公司