1.一種癌細(xì)胞線粒體生物標(biāo)志物,其特征在于:當(dāng)所述癌細(xì)胞為結(jié)直腸癌時(shí),其線粒體生物標(biāo)志物包括:oxct1、clpb、slc25a12、mrpl51、sfxn1、gatm和trmt10c基因。
2.一種基于機(jī)器算法篩選如權(quán)利要求1所述癌細(xì)胞線粒體生物標(biāo)志物的方法,其特征在于,包括以下步驟:
3.根據(jù)權(quán)利要求2所述基于機(jī)器算法篩選癌細(xì)胞線粒體生物標(biāo)志物的方法,其特征在于:步驟(1)中,從geo數(shù)據(jù)庫(kù)中下載所述待篩選癌細(xì)胞所有癌組織和癌旁組織的表達(dá)數(shù)據(jù)集;通過(guò)perl和r語(yǔ)言limma包,用normalizebetweenarrays方法,對(duì)所述表達(dá)數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理;從mitocarta3.0數(shù)據(jù)庫(kù)中下載所述線粒體相關(guān)基因;通過(guò)r語(yǔ)言limma包獲得所述線粒體相關(guān)基因在所述表達(dá)數(shù)據(jù)中的表達(dá)量。
4.根據(jù)權(quán)利要求2或3所述基于機(jī)器算法篩選癌細(xì)胞線粒體生物標(biāo)志物的方法,其特征在于:步驟(2)中,通過(guò)r語(yǔ)言limma包和pheatmap包進(jìn)行差異分析;通過(guò)r語(yǔ)言corrplot包進(jìn)行相關(guān)性分析。
5.根據(jù)權(quán)利要求2或3所述基于機(jī)器算法篩選癌細(xì)胞線粒體生物標(biāo)志物的方法,其特征在于:步驟(3)中,用基因本體論通過(guò)r語(yǔ)言enrichplot包進(jìn)行功能富集分析;用京都基因和基因組百科全書通過(guò)r語(yǔ)言ggplot2包和clusterprofiler包進(jìn)行功能富集分析。
6.根據(jù)權(quán)利要求2或3所述基于機(jī)器算法篩選癌細(xì)胞線粒體生物標(biāo)志物的方法,其特征在于:步驟(4)中,所述機(jī)器算法包括lasso回歸和/或svm-rfe回歸;所述lasso回歸的具體篩選方法為:通過(guò)r語(yǔ)言glmnet包構(gòu)建模型,繪制cvfit圖形和lasso回歸圖形,再進(jìn)一步在cvfit圖形上繪制交叉驗(yàn)證圖形,找到縱坐標(biāo)最小值,即交叉驗(yàn)證誤差最小值,通過(guò)r語(yǔ)言glmnet包確定lasso回歸篩選的特征基因;所述svm-rfe回歸的具體篩選方法為:通過(guò)r語(yǔ)言e1071包,設(shè)置十折的交叉驗(yàn)證,對(duì)特征基因的重要性進(jìn)行排序,構(gòu)建模型繪制準(zhǔn)確性圖形,找到準(zhǔn)確性最高點(diǎn),繪制交叉驗(yàn)證誤差圖形,找到誤差最低點(diǎn),根據(jù)兩者結(jié)果通過(guò)r語(yǔ)言e1071包確定svm-rfe回歸篩選的特征基因;通過(guò)r語(yǔ)言venndiagram包確定不同機(jī)器算法篩選所得特征基因的核心交集靶點(diǎn)。
7.根據(jù)權(quán)利要求2或3所述基于機(jī)器算法篩選癌細(xì)胞線粒體生物標(biāo)志物的方法,其特征在于:對(duì)步驟(4)所得癌細(xì)胞線粒體生物標(biāo)志物進(jìn)行準(zhǔn)確性驗(yàn)證;所述準(zhǔn)確性驗(yàn)證的方法一為:將步驟(4)所得癌細(xì)胞線粒體生物標(biāo)志物在癌疾病組織和癌旁組織中進(jìn)行差異表達(dá)分析;方法二為:在hpa數(shù)據(jù)庫(kù)獲得步驟(4)所得癌細(xì)胞線粒體生物標(biāo)志物在人正常組織和人癌變組織中的免疫組化數(shù)據(jù)表達(dá);方法三為:在人正常細(xì)胞和人癌變細(xì)胞水平進(jìn)行mrna表達(dá)水平的差異表達(dá)分析。
8.根據(jù)權(quán)利要求7所述基于機(jī)器算法篩選癌細(xì)胞線粒體生物標(biāo)志物的方法,其特征在于:所述在癌疾病組織和癌旁組織中進(jìn)行差異表達(dá)分析是指:從tcga數(shù)據(jù)庫(kù)中下載所述癌疾病組織和癌旁組織所有測(cè)序數(shù)據(jù),通過(guò)r語(yǔ)言limma包、r語(yǔ)言ggplot2包和r語(yǔ)言ggpubr包獲得步驟(4)所得癌細(xì)胞線粒體生物標(biāo)志物在癌疾病組織和癌旁組織中的差異表達(dá)情況;所述免疫組化數(shù)據(jù)表達(dá)即蛋白表達(dá)水平差異情況;所述mrna表達(dá)水平的差異表達(dá)分析是指:在人正常細(xì)胞和人癌變細(xì)胞水平,分別通過(guò)qrt-pcr水平,驗(yàn)證步驟(4)所得癌細(xì)胞線粒體生物標(biāo)志物在體外水平mrna的差異表達(dá)情況。