午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

一種基于副本交換的變步長蛋白質(zhì)構(gòu)象空間搜索方法

文檔序號:9217469閱讀:645來源:國知局
一種基于副本交換的變步長蛋白質(zhì)構(gòu)象空間搜索方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物信息學(xué)、計(jì)算機(jī)應(yīng)用領(lǐng)域,尤其涉及的是一種基于副本交換的變 步長蛋白質(zhì)構(gòu)象空間搜索方法。
【背景技術(shù)】
[0002] 蛋白質(zhì)分子在生物細(xì)胞化學(xué)反應(yīng)過程中起著至關(guān)重要的作用。它們的結(jié)構(gòu)模型和 生物活性狀態(tài)對我們理解和治愈多種疾病有重要的意義。蛋白質(zhì)只有折疊成特定的三維結(jié) 構(gòu)才能產(chǎn)生其特有的生物學(xué)功能。因此,要了解蛋白質(zhì)的功能,就必須獲得其三維空間結(jié) 構(gòu)。
[0003] 蛋白質(zhì)三級結(jié)構(gòu)預(yù)測是生物信息學(xué)的一個(gè)重要任務(wù)。目前,蛋白質(zhì)結(jié)構(gòu)預(yù)測方法 大致可以分為兩類,基于模板的方法和不基于模板的方法。其中,不基于模板的從頭預(yù)測 (Ab-inito)方法應(yīng)用最為廣泛。它適用于同源性小于25%的大多數(shù)蛋白質(zhì),僅從序列產(chǎn) 生全新結(jié)構(gòu),對蛋白質(zhì)分子設(shè)計(jì)及蛋白質(zhì)折疊的研宄等具有重要意義。當(dāng)前有以下幾種比 較成功的從頭預(yù)測方法:張陽與Jeffrey Skolnick合作的TASSER(Threading/Assembly/ Refinement)方法、David Baker及團(tuán)隊(duì)設(shè)計(jì)的Rosetta方法、Shehu等設(shè)計(jì)的FeLTr方法 等。但是到目前還沒有一種十分完善的方法來預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),即使獲得了很好的 預(yù)測結(jié)果,但也只是針對某些蛋白質(zhì)而言的,目前主要的技術(shù)瓶頸在于兩個(gè)方面,第一方面 在于采樣方法,現(xiàn)有技術(shù)對構(gòu)象空間采樣能力不強(qiáng),另一方面在于構(gòu)象更新方法,現(xiàn)有技術(shù) 對構(gòu)象的更新精度仍然不足。
[0004] 因此,現(xiàn)有的構(gòu)象空間搜索方法存在不足,需要改進(jìn)。

【發(fā)明內(nèi)容】

[0005] 為了克服現(xiàn)有蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的構(gòu)象更新精度較低、搜索能力較差的不足, 本發(fā)明提出在低能量引導(dǎo)的樹搜索框架下,利用基于副本交換的變步長蛋白質(zhì)構(gòu)象空間搜 索方法,增強(qiáng)了構(gòu)象跳出局部極小點(diǎn)的能力,同時(shí)保持了個(gè)體的多樣性,進(jìn)而增強(qiáng)對構(gòu)象空 間中近天然態(tài)構(gòu)象搜索的能力。
[0006] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
[0007] -種基于副本交換的變步長蛋白質(zhì)構(gòu)象空間搜索方法,所述搜索方法包括以下步 驟:
[0008] 1)給定輸入的氨基酸序列;
[0009] 2)按照能量對構(gòu)象空間分層,劃分成一維網(wǎng)格,能量值以SE為間隔,從最低能量 到最高能量分層,表示為GEG ;
[0010] 3)按照溫度對構(gòu)象空間分層,劃分成一維網(wǎng)格,由起始溫度逐步非等間隔的到最 低溫度,表不為[T max,Tmin];
[0011] 4)在每一個(gè)能量層中再按照超速形狀識別方法(USR)刻度對能量層進(jìn)行細(xì)分得 到"構(gòu)象室",記為cell ;
[0012] 5)對給定的氨基酸序列進(jìn)行一次完全的片段組裝得到一個(gè)初始構(gòu)象;
[0013] 6)調(diào)用Rosetta Score3能量函數(shù),計(jì)算得到的初始構(gòu)象的能量值,并根據(jù)能量值 將此構(gòu)象放入相應(yīng)的能量層中;
[0014] 7)由超速形狀識別(USR)判別將該構(gòu)象置入指定cell;
[0015] 8)按照〇>(/) = £:^(/)對能量層分配權(quán)重,其中1表示能量層,表示該層平均 能量的平方,《 (1)表示權(quán)重值;
[0016] 9)按照
設(shè)置片段組裝(FA)步長,其中N為序列長度,M 為常數(shù);
[0017] 10)按照
1設(shè)置Monte Carlo擾動(MC)步長,其中N為序 列長度,Q為常數(shù),由以上公式反向分配步長值;
[0018] 11)初始溫度值根據(jù)區(qū)間分半搜索方法來確定,從而非等間隔的建立溫度列表
[T-,Tmin];
[0019] 12)設(shè)置迭代次數(shù);
[0020] 13)構(gòu)象空間搜索過程:
[0021]13. 1)按照能量權(quán)重值_;) = ,依概率
隨機(jī)的反向選能量層 1 ;
[0022] 13. 2)按照概率1/[ (1+nsel) confs]選定"構(gòu)象室"cell,其中,nsel表示當(dāng)前cell 被選擇的頻次,confs表示當(dāng)前cell中構(gòu)象的數(shù)目;
[0023] 13. 3)選定cell后,隨機(jī)選擇一個(gè)構(gòu)象,用于下一步的擴(kuò)展;
[0024] 13.4)按照步驟9)設(shè)定的FA步長,對選定構(gòu)象進(jìn)行片段組裝,生成新的構(gòu)象;
[0025] 13. 5)按照步驟10)設(shè)定的MC步長,對構(gòu)象進(jìn)行Monte Carlo擾動,使用設(shè)定的相 應(yīng)溫度參數(shù),按照玻爾茲曼概率'AE接受新生成的構(gòu)象,其中AE為當(dāng)前構(gòu)象與上一步產(chǎn) 生的構(gòu)象之間的能量差,0為溫度因子,0 =_l/kBT,kB為玻爾茲曼常數(shù),T為溫度參數(shù);
[0026] 13. 6)如果當(dāng)前新生成的構(gòu)象被接受,則將其存入構(gòu)象系綜;
[0027] 13. 7)按照en AE判斷是否需要進(jìn)行副本交換,其中A 0為新生成的構(gòu)象與前 一構(gòu)象的溫度參數(shù)差值,0 =-l/kBT,若發(fā)生副本交換,則交換兩個(gè)構(gòu)象在構(gòu)象空間中的位 置,若不發(fā)生副本交換,則直接進(jìn)行下一次迭代;
[0028] 14)迭代的運(yùn)行步驟13),直至達(dá)到設(shè)置的迭代次數(shù)。
[0029] 本發(fā)明的有益效果為:在低能量引導(dǎo)的樹搜索框架下,采用變步長和副本交換的 策略搜索蛋白質(zhì)構(gòu)象空間,依據(jù)所分能量層的權(quán)重在不同能量層賦予不同的片段組裝(FA) 步長和Monte Carlo擾動(MC)步長,在構(gòu)象空間能量較高的區(qū)域,使用大的FA步長和較小 的MC步長,迫使算法更快的向低能量區(qū)域搜索,隨著構(gòu)象搜索逐步向低能量區(qū)域靠近,改 變FA、MC步長,在能量較低的區(qū)域使用較小的FA步長和較大的MC步長,避免對天然態(tài)構(gòu)象 的采樣不足導(dǎo)致算法有效性降低。同時(shí)在構(gòu)象空間對溫度分層,在不同的溫度層采用相應(yīng) 的Metropolis準(zhǔn)則來判斷是否接收當(dāng)前構(gòu)象,以增強(qiáng)構(gòu)象跳出局部極小點(diǎn)的能力,g[J本交 換的引入能夠進(jìn)一步增強(qiáng)構(gòu)象空間中采樣的多樣性,從而增強(qiáng)了對構(gòu)象空間中近天然態(tài)構(gòu) 象采樣的能力。
【附圖說明】
[0030] 圖1是蛋白質(zhì)1VII構(gòu)象系綜中構(gòu)象更新示意圖。
【具體實(shí)施方式】
[0031] 下面結(jié)合附圖對本發(fā)明作進(jìn)一步描述。
[0032] 參照圖1,一種基于副本交換的變步長蛋白質(zhì)構(gòu)象空間搜索方法,包括以下步驟:
[0033] 1)給定輸入的氨基酸序列;
[0034] 2)按照能量對構(gòu)象空間分層,劃分成一維網(wǎng)格,能量值以SE為間隔,從最低能量 到最高能量分層,表示為Geg ;
[0035] 3)按照溫度對構(gòu)象空間分層,劃分成一維網(wǎng)格,由起始溫度逐步非等間隔的到最 低溫度,表不為[T max,Tmin];
[0036] 4)在每一個(gè)能量層中再按照超速形狀識別方法(USR)刻度對能量層進(jìn)行細(xì)分得 到"構(gòu)象室",記為cell ;
[0037] 5)對給定的氨基酸序列進(jìn)行一次完全的片段組裝得到一個(gè)初始構(gòu)象;
[0038] 6)調(diào)用Rosetta Score3能量函數(shù),計(jì)算得到的初始構(gòu)象的能量值,并根據(jù)能量值 將此構(gòu)象放入相應(yīng)的能量層中;
[0039] 7)由超速形狀識別(USR)判別將該構(gòu)象置入指定cell ;
[0040] 8)按照《(/) = £^(/)對能量層分配權(quán)重,其中1表示能量層,£^.g(/)表示該層平均 能量的平方,《 (1)表示權(quán)重值;
[0041] 9)按照
設(shè)置片段組裝(FA)步長,其中N為序列長度,M 為常數(shù);
[0042] 10)按照
設(shè)置Monte Carlo擾動(MC)步長,其中N為序 列長度,Q為常數(shù),由以上公式反向分配步長值;
[0043] 11)初始溫度值根據(jù)區(qū)間分半搜索方法來確定,從而非等間隔的建立溫度列表
[T-,Tmin];
[0044] 12)設(shè)置迭代次數(shù);
[0045] 13)構(gòu)象空間搜索過程:
[0046] 13. 1)按照能量權(quán)重值《(/) = £;%(/),依概率
隨機(jī)的反向選能量 層1 ;
[0047] 13. 2)按照概率1/[ (1+nsel) confs]選定"構(gòu)象室"cell,其中,nsel表示當(dāng)前cell 被選擇的頻次,confs表示當(dāng)
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1