基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法、裝置和設(shè)備與流程

文檔序號(hào)：39728013發(fā)布日期：2024-10-22 13:30閱讀：1來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法、裝置和設(shè)備與流程

本申請(qǐng)涉及人工智能，具體涉及一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法、裝置和設(shè)備。

背景技術(shù)：

1、不斷增加的在線活動(dòng)讓互聯(lián)網(wǎng)用戶(hù)面臨潛在的網(wǎng)絡(luò)威脅和安全問(wèn)題，這些威脅和攻擊中最主要的攻擊形式是以域名為依托而展開(kāi)的，如點(diǎn)擊欺詐、網(wǎng)頁(yè)篡改、sql注入攻擊、網(wǎng)站后門(mén)、緩存投毒等。域名作為互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施，與各種網(wǎng)絡(luò)活動(dòng)有著內(nèi)在的聯(lián)系。由于域名的靈活性和可訪問(wèn)性，進(jìn)而惡意域名也就成為網(wǎng)絡(luò)攻擊者所使用的主要手段。因此，如何有效地識(shí)別惡意域名和惡意網(wǎng)站一直是網(wǎng)絡(luò)安全研究的重要課題。

2、目前，通?；谏疃葘W(xué)習(xí)識(shí)別惡意網(wǎng)站。一方面，深度學(xué)習(xí)是以數(shù)據(jù)為驅(qū)動(dòng)的，要訓(xùn)練出高性能的模型，往往需要大批量、高質(zhì)量的數(shù)據(jù)，而惡意域名在每個(gè)單一機(jī)構(gòu)的樣本量很少，各個(gè)運(yùn)營(yíng)商又有各自的隱私政策，無(wú)法共用數(shù)據(jù)進(jìn)行模型訓(xùn)練，導(dǎo)致訓(xùn)練的模型對(duì)惡意域名識(shí)別的準(zhǔn)確率不高；另一方面，現(xiàn)有的深度學(xué)習(xí)模型都是基于文本序列信息進(jìn)行訓(xùn)練的，單一的數(shù)據(jù)模態(tài)降低了模型識(shí)別的準(zhǔn)確率。

3、因此，如何提高惡意域名識(shí)別模型的準(zhǔn)確率成為亟待解決的問(wèn)題。

技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明提供一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法、裝置和設(shè)備，用以解決現(xiàn)有技術(shù)中惡意域名識(shí)別模型的準(zhǔn)確率較低的技術(shù)問(wèn)題。

2、本發(fā)明提供一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，包括：

3、執(zhí)行循環(huán)過(guò)程直至滿(mǎn)足預(yù)設(shè)迭代條件；所述循環(huán)過(guò)程包括：

4、使用域名訓(xùn)練數(shù)據(jù)訓(xùn)練惡意域名識(shí)別模型后，對(duì)所述惡意域名識(shí)別模型的參數(shù)進(jìn)行加密，得到加密模型參數(shù)，所述域名訓(xùn)練數(shù)據(jù)由包含域名對(duì)應(yīng)網(wǎng)頁(yè)文字內(nèi)容的第一訓(xùn)練數(shù)據(jù)和包含域名對(duì)應(yīng)網(wǎng)頁(yè)圖像內(nèi)容的第二訓(xùn)練數(shù)據(jù)組成；

5、將所述加密模型參數(shù)發(fā)送至服務(wù)端；

6、獲得所述服務(wù)端反饋的聚合模型參數(shù)后，對(duì)所述聚合模型參數(shù)進(jìn)行解密，得到解密模型參數(shù)；

7、基于所述解密模型參數(shù)對(duì)所述惡意域名識(shí)別模型進(jìn)行更新。

8、根據(jù)本發(fā)明提供的一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，所述第二訓(xùn)練數(shù)據(jù)是使用預(yù)置圖像語(yǔ)言模型對(duì)源網(wǎng)頁(yè)圖像進(jìn)行識(shí)別得到的，所述預(yù)置圖像語(yǔ)言模型是基于如下步驟訓(xùn)練的：

9、獲取預(yù)訓(xùn)練模型中除輸出層以外的模型參數(shù)，所述預(yù)訓(xùn)練模型是預(yù)先訓(xùn)練的適用于各場(chǎng)景的視覺(jué)語(yǔ)言生成模型；

10、將所述模型參數(shù)代入待訓(xùn)練圖像語(yǔ)言模型后，使用圖像語(yǔ)言訓(xùn)練數(shù)據(jù)對(duì)所述待訓(xùn)練圖像語(yǔ)言模型進(jìn)行訓(xùn)練，得到預(yù)置圖像語(yǔ)言模型，所述圖像語(yǔ)言訓(xùn)練數(shù)據(jù)包括多個(gè)圖像-文本對(duì)數(shù)據(jù)，所述預(yù)置圖像語(yǔ)言模型是惡意域名場(chǎng)景下的視覺(jué)語(yǔ)言生成模型。

11、根據(jù)本發(fā)明提供的一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，所述預(yù)訓(xùn)練模型是一個(gè)多任務(wù)模型，所述預(yù)訓(xùn)練模型包括：

12、單模態(tài)編碼器，用于分別對(duì)輸入圖像及對(duì)應(yīng)的文本進(jìn)行編碼；

13、基于圖像的文本編碼器，用于基于交叉注意力層模擬圖文信息交互，預(yù)測(cè)圖像-文本對(duì)是正匹配或負(fù)匹配；

14、基于圖像的文本解碼器，用于生成輸入圖像的文本描述。

15、根據(jù)本發(fā)明提供的一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，所述惡意域名識(shí)別模型基于如下步驟進(jìn)行惡意域名識(shí)別：

16、使用嵌入層對(duì)輸入數(shù)據(jù)進(jìn)行編碼，得到詞向量序列；

17、使用轉(zhuǎn)換器編碼器將所述詞向量序列轉(zhuǎn)化為基于上下文表示的中間向量；

18、將所述中間向量輸入至輸出層，得到輸出層輸出的惡意域名識(shí)別結(jié)果。

19、根據(jù)本發(fā)明提供的一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，基于如下公式對(duì)所述惡意域名識(shí)別模型的參數(shù)進(jìn)行加密：

20、m＝wi；

21、s＝rnmodn2，n＝pq；

22、

23、其中，wi表示第i個(gè)參數(shù)，pk表示公鑰，表示使用公鑰pk對(duì)第i個(gè)參數(shù)wi進(jìn)行加密后得到的密文，p和q是兩個(gè)質(zhì)數(shù)。

24、根據(jù)本發(fā)明提供的一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，所述聚合模型參數(shù)是基于如下公式計(jì)算得到的：

25、

26、其中，dj表示第j個(gè)客戶(hù)端的域名訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量，k表示所述惡意域名識(shí)別模型的參數(shù)個(gè)數(shù)，wavg表示第i個(gè)參數(shù)對(duì)應(yīng)的聚合參數(shù)。

27、根據(jù)本發(fā)明提供的一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，基于如下公式對(duì)所述聚合模型參數(shù)進(jìn)行解密：

28、

29、λ＝lcm(p-1,q-1)；

30、b＝λ-1modn；

31、c＝wavg；

32、wi＝b·l(cλmodn2)modn。

33、本發(fā)明還提供一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練裝置，包括：

34、循環(huán)迭代模塊，用于：執(zhí)行循環(huán)過(guò)程直至滿(mǎn)足預(yù)設(shè)迭代條件；所述循環(huán)過(guò)程包括：

35、使用域名訓(xùn)練數(shù)據(jù)訓(xùn)練惡意域名識(shí)別模型后，對(duì)所述惡意域名識(shí)別模型的參數(shù)進(jìn)行加密，得到加密模型參數(shù)，所述域名訓(xùn)練數(shù)據(jù)由包含域名對(duì)應(yīng)網(wǎng)頁(yè)文字內(nèi)容的第一訓(xùn)練數(shù)據(jù)和包含域名對(duì)應(yīng)網(wǎng)頁(yè)圖像內(nèi)容的第二訓(xùn)練數(shù)據(jù)組成；

36、將所述加密模型參數(shù)發(fā)送至服務(wù)端；

37、獲得所述服務(wù)端反饋的聚合模型參數(shù)后，對(duì)所述聚合模型參數(shù)進(jìn)行解密，得到解密模型參數(shù)；

38、基于所述解密模型參數(shù)對(duì)所述惡意域名識(shí)別模型進(jìn)行更新。

39、本發(fā)明還提供一種電子設(shè)備，包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序，所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如上述任一種所述基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法。

40、本發(fā)明還提供一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一種所述基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法。

41、本申請(qǐng)實(shí)施例提供的基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法、裝置和設(shè)備，執(zhí)行循環(huán)過(guò)程直至滿(mǎn)足預(yù)設(shè)迭代條件；所述循環(huán)過(guò)程包括：使用域名訓(xùn)練數(shù)據(jù)訓(xùn)練惡意域名識(shí)別模型后，對(duì)所述惡意域名識(shí)別模型的參數(shù)進(jìn)行加密，得到加密模型參數(shù)，所述域名訓(xùn)練數(shù)據(jù)由包含域名對(duì)應(yīng)網(wǎng)頁(yè)文字內(nèi)容的第一訓(xùn)練數(shù)據(jù)和包含域名對(duì)應(yīng)網(wǎng)頁(yè)圖像內(nèi)容的第二訓(xùn)練數(shù)據(jù)組成；將所述加密模型參數(shù)發(fā)送至服務(wù)端；獲得所述服務(wù)端反饋的聚合模型參數(shù)后，對(duì)所述聚合模型參數(shù)進(jìn)行解密，得到解密模型參數(shù)；基于所述解密模型參數(shù)對(duì)所述惡意域名識(shí)別模型進(jìn)行更新。惡意網(wǎng)址上都有大量的圖像，且這些圖像大多與這個(gè)網(wǎng)址的類(lèi)別相關(guān)，而圖像能提供直觀的信息特征，因此基于圖像訓(xùn)練的惡意域名識(shí)別模型可以利用網(wǎng)址上的圖像預(yù)測(cè)網(wǎng)址是否為惡意網(wǎng)址，從而提高惡意域名識(shí)別的準(zhǔn)確性；將模型參數(shù)同態(tài)加密上傳服務(wù)器進(jìn)行計(jì)算，解決了多個(gè)企業(yè)組織客戶(hù)端大規(guī)模數(shù)據(jù)分散、不易集中且具有高度隱私的問(wèn)題。

技術(shù)特征：

1.一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，應(yīng)用于客戶(hù)端，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，其特征在于，所述第二訓(xùn)練數(shù)據(jù)是使用預(yù)置圖像語(yǔ)言模型對(duì)源網(wǎng)頁(yè)圖像進(jìn)行識(shí)別得到的，所述預(yù)置圖像語(yǔ)言模型是基于如下步驟訓(xùn)練的：

3.根據(jù)權(quán)利要求2所述的基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，其特征在于，所述預(yù)訓(xùn)練模型是一個(gè)多任務(wù)模型，所述預(yù)訓(xùn)練模型包括：

4.根據(jù)權(quán)利要求1所述的基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，其特征在于，所述惡意域名識(shí)別模型基于如下步驟進(jìn)行惡意域名識(shí)別：

5.根據(jù)權(quán)利要求1所述的基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，其特征在于，基于如下公式對(duì)所述惡意域名識(shí)別模型的參數(shù)進(jìn)行加密：

6.根據(jù)權(quán)利要求5所述的基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，其特征在于，所述聚合模型參數(shù)是基于如下公式計(jì)算得到的：

7.根據(jù)權(quán)利要求6所述的基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法，其特征在于，基于如下公式對(duì)所述聚合模型參數(shù)進(jìn)行解密：

8.一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練裝置，其特征在于，包括：

9.一種電子設(shè)備，包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序，其特征在于，所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法。

10.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其上存儲(chǔ)有計(jì)算機(jī)程序，其特征在于，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法。

技術(shù)總結(jié)
本申請(qǐng)涉及人工智能領(lǐng)域，提供一種基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法、裝置和設(shè)備。所述方法包括：使用域名訓(xùn)練數(shù)據(jù)訓(xùn)練惡意域名識(shí)別模型后對(duì)模型的參數(shù)進(jìn)行加密，得到加密模型參數(shù)，域名訓(xùn)練數(shù)據(jù)由包含域名對(duì)應(yīng)網(wǎng)頁(yè)文字內(nèi)容的第一訓(xùn)練數(shù)據(jù)和包含域名對(duì)應(yīng)網(wǎng)頁(yè)圖像內(nèi)容的第二訓(xùn)練數(shù)據(jù)組成；將加密模型參數(shù)發(fā)送至服務(wù)端；獲得服務(wù)端反饋的聚合模型參數(shù)后解密，得到解密模型參數(shù)；基于解密模型參數(shù)對(duì)惡意域名識(shí)別模型進(jìn)行更新。本申請(qǐng)?zhí)峁┑膼阂庥蛎R(shí)別模型訓(xùn)練方法利用網(wǎng)址上的圖像預(yù)測(cè)網(wǎng)址是否為惡意網(wǎng)址，提高惡意域名識(shí)別的準(zhǔn)確性；將模型參數(shù)同態(tài)加密上傳服務(wù)器進(jìn)行計(jì)算，解決了多個(gè)企業(yè)組織客戶(hù)端大規(guī)模數(shù)據(jù)分散且具有高度隱私的問(wèn)題。

技術(shù)研發(fā)人員：胡澤遠(yuǎn),蔣健,李海傳,羅瓊,吳軒,袁子昂
受保護(hù)的技術(shù)使用者：中國(guó)移動(dòng)通信集團(tuán)浙江有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/10/21

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：胡澤遠(yuǎn),蔣健,李海傳,羅瓊,吳軒,袁子昂
技術(shù)所有人：中國(guó)移動(dòng)通信集團(tuán)浙江有限公司
我是此專(zhuān)利的發(fā)明人

上一篇：車(chē)輛的轉(zhuǎn)向裝置的制作方法
上一篇：風(fēng)險(xiǎn)預(yù)測(cè)方法和裝置與流程

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法、裝置和設(shè)備與流程

基于聯(lián)邦學(xué)習(xí)的惡意域名識(shí)別模型訓(xùn)練方法、裝置和設(shè)備與流程