午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

基于圖注意力網(wǎng)絡(luò)和多尺度特征融合的藥物-靶點(diǎn)相互作用的預(yù)測(cè)方法

文檔序號(hào):39721017發(fā)布日期:2024-10-22 13:12閱讀:7來(lái)源:國(guó)知局
基于圖注意力網(wǎng)絡(luò)和多尺度特征融合的藥物-靶點(diǎn)相互作用的預(yù)測(cè)方法

本公開(kāi)實(shí)施例涉及藥物發(fā)現(xiàn),尤其涉及一種基于圖注意力網(wǎng)絡(luò)和多尺度特征融合的藥物-靶點(diǎn)相互作用的預(yù)測(cè)方法。


背景技術(shù):

1、藥物發(fā)現(xiàn)是指通過(guò)系統(tǒng)性的科學(xué)研究和實(shí)驗(yàn),發(fā)現(xiàn)新的藥物或者開(kāi)發(fā)現(xiàn)有藥物的過(guò)程,其歷史可以追溯到數(shù)百萬(wàn)年前僅使用草藥的時(shí)期。傳統(tǒng)的新藥研發(fā)是一項(xiàng)復(fù)雜的系統(tǒng)工程,需要通過(guò)大規(guī)模的篩選來(lái)發(fā)現(xiàn)先導(dǎo)化合物,然后經(jīng)過(guò)藥物專(zhuān)家反復(fù)的體外實(shí)驗(yàn)、動(dòng)物試驗(yàn)和人體內(nèi)試驗(yàn)來(lái)進(jìn)行測(cè)試優(yōu)化。20世紀(jì)80年代,隨著計(jì)算機(jī)的快速發(fā)展,相關(guān)的技術(shù)開(kāi)始擴(kuò)展到藥物發(fā)現(xiàn)領(lǐng)域。計(jì)算機(jī)輔助藥物設(shè)計(jì)是一個(gè)涉及多學(xué)科的綜合研究領(lǐng)域,旨在通過(guò)計(jì)算機(jī)方法去尋找、開(kāi)發(fā)和分析藥物及相關(guān)生物活性化合物的潛在聯(lián)系。它涵蓋了虛擬篩選、先導(dǎo)化合物優(yōu)化、藥物副反應(yīng)預(yù)測(cè)等一系列任務(wù)及相關(guān)計(jì)算方法,加快了化學(xué)開(kāi)發(fā)的早期階段,指導(dǎo)和加速了藥物研發(fā)過(guò)程,有效緩解了傳統(tǒng)的實(shí)驗(yàn)室方法的時(shí)間和成本的局限性,提供了更迅速、更經(jīng)濟(jì)的藥物開(kāi)發(fā)途徑,進(jìn)一步滿(mǎn)足了日益變化的疾病治療需求。

2、藥物靶點(diǎn)關(guān)系(drug-target?interaction,dti)預(yù)測(cè)任務(wù)是計(jì)算機(jī)輔助藥物設(shè)計(jì)領(lǐng)域中的熱門(mén)話(huà)題之一,該任務(wù)旨在預(yù)測(cè)藥物分子和靶點(diǎn)之間的相互作用,以揭示潛在的藥物靶點(diǎn),加速新藥物的發(fā)現(xiàn)和開(kāi)發(fā)過(guò)程。因?yàn)榇蠖鄶?shù)藥物需要通過(guò)與體內(nèi)特定的靶分子如酶、核受體、g-蛋白偶聯(lián)受體(g-protein-coupled?receptor,gpcrs)和離子通道等相互作用來(lái)達(dá)到治療效果,所以藥物研發(fā)中的多個(gè)領(lǐng)域,例如先導(dǎo)物的生成和優(yōu)化、藥物重定位、多重藥理學(xué)等都涉及到dti的識(shí)別和預(yù)測(cè)。而傳統(tǒng)的實(shí)驗(yàn)室方法具有以下缺點(diǎn):(1)傳統(tǒng)的藥理學(xué)方法鑒定dti成本高、耗時(shí)長(zhǎng);(2)蛋白質(zhì)和藥物分子的空間結(jié)構(gòu)復(fù)雜且相互作用的機(jī)制涉及多個(gè)層面。鑒于以上缺點(diǎn),研究人員可以使用大規(guī)模的生物信息學(xué)數(shù)據(jù)以及計(jì)算機(jī)方法來(lái)對(duì)潛在的dti進(jìn)行預(yù)測(cè),通過(guò)縮小搜索空間來(lái)對(duì)后續(xù)的濕實(shí)驗(yàn)進(jìn)行補(bǔ)充和輔助,從而加快藥物研發(fā)流程。

3、針對(duì)上述缺點(diǎn),提出了多種基于機(jī)器學(xué)習(xí)的方法,但是現(xiàn)有的基于計(jì)算機(jī)的dti預(yù)測(cè)方法依然存在一些缺陷,例如:(1)大量的預(yù)測(cè)模型著眼于藥物和靶蛋白本身的結(jié)構(gòu)或序列信息,或者專(zhuān)注于某幾種關(guān)鍵醫(yī)學(xué)實(shí)體之間的局部交互關(guān)系,而很少關(guān)注藥物和靶蛋白在醫(yī)學(xué)知識(shí)圖譜中的全局表現(xiàn),這一定程度上限制了模型的預(yù)測(cè)能力;(2)大量的現(xiàn)有工作只從單一尺度特征出發(fā),只關(guān)注某一個(gè)層面的藥物和靶蛋白表現(xiàn),而忽略了多尺度信息之間潛在的協(xié)同作用,這不利于獲得高質(zhì)量且富有表現(xiàn)力的藥物和靶點(diǎn)特征。


技術(shù)實(shí)現(xiàn)思路

1、為了避免現(xiàn)有技術(shù)的不足之處,本技術(shù)提供一種基于圖注意力網(wǎng)絡(luò)和多尺度特征融合的藥物-靶點(diǎn)相互作用的預(yù)測(cè)方法,用以解決現(xiàn)有技術(shù)中存在缺乏對(duì)藥物和靶點(diǎn)全局表現(xiàn)的考量,缺乏對(duì)多尺度信息之間潛在協(xié)同作用的考量的缺點(diǎn)的問(wèn)題。

2、根據(jù)本公開(kāi)實(shí)施例,提供一種基于圖注意力網(wǎng)絡(luò)和多尺度特征融合的藥物-靶點(diǎn)相互作用的預(yù)測(cè)方法,該方法包括:

3、獲取藥物序列數(shù)據(jù)、蛋白質(zhì)序列信息和藥物-靶蛋白的關(guān)聯(lián)數(shù)據(jù);其中,所述藥物-靶蛋白的關(guān)聯(lián)數(shù)據(jù)包括dti關(guān)聯(lián)數(shù)據(jù)和知識(shí)圖譜數(shù)據(jù);

4、利用rdkit集成方法提取所述藥物序列數(shù)據(jù)中的藥物屬性信息和所述蛋白質(zhì)序列信息中的靶蛋白屬性信息;

5、基于所述dti關(guān)聯(lián)數(shù)據(jù)和所述知識(shí)圖譜數(shù)據(jù),獲取藥物的全局位置特征、靶蛋白的全局位置特征、藥物的綜合位置信息和靶蛋白的綜合位置信息;

6、對(duì)所述藥物屬性信息、所述靶蛋白屬性信息、所述藥物的綜合位置信息和所述靶蛋白的綜合位置信息進(jìn)行多尺度特征融合,以得到藥物對(duì)的表示;

7、基于三層的全連接網(wǎng)絡(luò)構(gòu)建預(yù)測(cè)器,根據(jù)所述預(yù)測(cè)器構(gòu)建網(wǎng)絡(luò)模型;

8、利用所述藥物對(duì)的表示對(duì)所述網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,且得到藥物-靶點(diǎn)對(duì)的關(guān)聯(lián)概率。

9、進(jìn)一步的,獲取藥物序列數(shù)據(jù)、蛋白質(zhì)序列信息和藥物-靶蛋白的關(guān)聯(lián)數(shù)據(jù)的步驟中,包括:

10、從drugbank數(shù)據(jù)庫(kù)中獲取所述藥物序列數(shù)據(jù),從uniprot數(shù)據(jù)庫(kù)中獲取所述蛋白質(zhì)序列信息,從primekg數(shù)據(jù)庫(kù)中獲取所述藥物-靶蛋白的關(guān)聯(lián)數(shù)據(jù);其中,所述藥物-靶蛋白的關(guān)聯(lián)數(shù)據(jù)包括所述dti關(guān)聯(lián)數(shù)據(jù)和所述知識(shí)圖譜數(shù)據(jù);

11、將所述dti關(guān)聯(lián)數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。

12、進(jìn)一步的,利用rdkit集成方法提取所述藥物序列數(shù)據(jù)中的藥物屬性信息和所述蛋白質(zhì)序列信息中的靶蛋白屬性信息的步驟中,包括:

13、利用所述rdkit集成方法將所述藥物序列數(shù)據(jù)轉(zhuǎn)化為藥物對(duì)應(yīng)的分子圖;

14、在所述分子圖利用屬性掩蓋方法得到每個(gè)原子的嵌入;

15、對(duì)所述原子的嵌入進(jìn)行平均池化,以得到分子圖的表示,并將所述分子圖的表示作為藥物屬性信息;

16、將所述蛋白質(zhì)序列信息中的每個(gè)蛋白質(zhì)序列轉(zhuǎn)換為偽位置特異性評(píng)分矩陣特征,以編碼具有不同序列長(zhǎng)度的蛋白質(zhì)的演化和序列信息;

17、根據(jù)所述偽位置特異性評(píng)分矩陣特征得到靶蛋白表示,并將所述靶蛋白表示作為靶蛋白屬性信息。

18、進(jìn)一步的,基于所述dti關(guān)聯(lián)數(shù)據(jù)和所述知識(shí)圖譜數(shù)據(jù),獲取藥物的全局位置特征、靶蛋白的全局位置特征、藥物的綜合位置信息和靶蛋白的綜合位置信息的步驟中,包括:

19、利用知識(shí)圖譜嵌入技術(shù)對(duì)所述知識(shí)圖譜數(shù)據(jù)進(jìn)行學(xué)習(xí),以得到所有實(shí)體嵌入,且將所有所述實(shí)體嵌入中藥物的實(shí)體嵌入作為所述藥物的全局位置特征,將所有所述實(shí)體嵌入中靶蛋白的實(shí)體嵌入作為所述靶蛋白的全局位置特征;

20、對(duì)所述dti關(guān)聯(lián)數(shù)據(jù)中的訓(xùn)練集進(jìn)行處理,一比一生成正例和負(fù)例;

21、以所述訓(xùn)練集的正例為邊,所述藥物的全局位置特征為藥物節(jié)點(diǎn)的初始特征,所述靶蛋白的全局位置特征為靶蛋白的初始特征,構(gòu)建藥物和靶蛋白的二部圖;

22、利用圖注意力網(wǎng)絡(luò)對(duì)所述二部圖進(jìn)行迭代學(xué)習(xí),使所述二部圖中的每條邊自適應(yīng)地學(xué)習(xí)權(quán)重,并通過(guò)消息傳遞來(lái)更新圖中節(jié)點(diǎn)的特征,以得到更新后的藥物特征和更新后的靶蛋白特征;

23、將所述更新后的藥物特征作為藥物的綜合位置信息,將所述更新后的靶蛋白特征作為靶蛋白的綜合位置信息。

24、進(jìn)一步的,對(duì)所述藥物屬性信息、所述靶蛋白屬性信息、所述藥物的綜合位置信息和所述靶蛋白的綜合位置信息進(jìn)行多尺度特征融合,以得到藥物對(duì)的表示的步驟中,包括:

25、對(duì)所述藥物屬性信息、所述靶蛋白屬性信息、所述藥物的綜合位置信息和所述靶蛋白的綜合位置信息進(jìn)行向量相連操作,以得到藥物對(duì)的表示。

26、進(jìn)一步的,基于三層的全連接網(wǎng)絡(luò)構(gòu)建預(yù)測(cè)器,根據(jù)所述預(yù)測(cè)器構(gòu)建網(wǎng)絡(luò)模型的步驟中,包括:

27、基于三層的全連接網(wǎng)絡(luò)構(gòu)建預(yù)測(cè)器,并設(shè)置輸出維度為1,以保證所述網(wǎng)絡(luò)模型的輸出為一個(gè)0到1之間的數(shù)字;

28、基于所述預(yù)測(cè)器,構(gòu)建網(wǎng)絡(luò)模型。

29、進(jìn)一步的,利用所述藥物對(duì)的表示對(duì)所述網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,且得到藥物-靶點(diǎn)對(duì)的關(guān)聯(lián)概率的步驟中,包括:

30、利用所述藥物對(duì)的表示對(duì)所述網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,以得到訓(xùn)練好的所述網(wǎng)絡(luò)模型,且輸出訓(xùn)練集的藥物-靶點(diǎn)對(duì)的關(guān)聯(lián)概率;

31、利用所述驗(yàn)證集對(duì)訓(xùn)練好的所述網(wǎng)絡(luò)模型進(jìn)行驗(yàn)證;

32、利用所述測(cè)試集對(duì)驗(yàn)證后的所述網(wǎng)絡(luò)模型進(jìn)行測(cè)試,以得到所述測(cè)試集的預(yù)測(cè)結(jié)果。

33、進(jìn)一步的,所述網(wǎng)絡(luò)模型的優(yōu)化的目標(biāo)函數(shù)為元交叉熵?fù)p失函數(shù)。

34、本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:

35、本公開(kāi)的實(shí)施例中,通過(guò)上述基于圖注意力網(wǎng)絡(luò)和多尺度特征融合的藥物-靶點(diǎn)相互作用的預(yù)測(cè)方法,將大型醫(yī)學(xué)知識(shí)圖譜引入dti預(yù)測(cè)任務(wù)中,利用知識(shí)圖譜中豐富的生物學(xué)信息來(lái)挖掘藥物和靶點(diǎn)之間潛在的關(guān)系。考慮了藥物和靶點(diǎn)的自身序列信息,以及和其他醫(yī)學(xué)實(shí)體之間的位置信息,對(duì)自身特性和外在聯(lián)系進(jìn)行了綜合考慮。在得到位置信息時(shí),同時(shí)關(guān)注了藥物和靶點(diǎn)之間的局部位置信息,以及藥物和靶點(diǎn)在知識(shí)圖譜中的全局位置信息,并使用圖注意力網(wǎng)絡(luò)來(lái)對(duì)不同尺度的位置信息進(jìn)行融合,得到的綜合位置信息有助于獲得高質(zhì)量的藥物和靶蛋白特征。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1