本領(lǐng)域涉及信息安全,尤其涉及一種流量確定的方法、裝置、設(shè)備、計(jì)算機(jī)存儲(chǔ)介質(zhì)及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、云計(jì)算作為一種成熟的技術(shù)被廣泛應(yīng)用于生活的各個(gè)領(lǐng)域。憑借云服務(wù)器的強(qiáng)大的資源存儲(chǔ)能力和計(jì)算能力,用戶和企業(yè)在工作中得到了極大的便利。但是,目前存在大量的黑客惡意攻擊云計(jì)算平臺(tái)的行為,對(duì)保證云計(jì)算平臺(tái)用戶的數(shù)據(jù)安全提出了挑戰(zhàn)。
2、相關(guān)技術(shù)中,通常采用入侵檢測(cè)算法檢測(cè)訪問流量是否具有攻擊性質(zhì),但是入侵檢測(cè)算法仍然會(huì)把部分訪問流量分類錯(cuò)誤,因此檢測(cè)出攻擊流量的準(zhǔn)確性比較低。
技術(shù)實(shí)現(xiàn)思路
1、本公開實(shí)施例提供一種流量確定的方法、裝備、設(shè)備、計(jì)算機(jī)存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品,能夠提高檢測(cè)出攻擊流量的準(zhǔn)確性。
2、第一方面,本公開實(shí)施例提供一種流量確定的方法,方法包括:
3、獲取待檢測(cè)網(wǎng)絡(luò)流量數(shù)據(jù),待檢測(cè)網(wǎng)絡(luò)流量數(shù)據(jù)包括多個(gè)特征數(shù)據(jù);
4、計(jì)算多個(gè)特征數(shù)據(jù)之間的第一互信息值,第一互信息值表征多個(gè)特征數(shù)據(jù)中任意兩個(gè)特征數(shù)據(jù)的關(guān)聯(lián)程度;
5、基于多個(gè)特征數(shù)據(jù)之間的第一互信息值,從多個(gè)特征數(shù)據(jù)中獲取第一互信息值大于或等于第一閾值的特征數(shù)據(jù)作為第一目標(biāo)特征集合;
6、將第一目標(biāo)特征集合輸入目標(biāo)模型中的第一模型,利用第一模型對(duì)第一目標(biāo)特征集合分類,確定初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果;
7、將初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對(duì)初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果二次分類得到當(dāng)前預(yù)測(cè)目標(biāo)結(jié)果。
8、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,基于多個(gè)特征數(shù)據(jù)之間的第一互信息值,從多個(gè)特征數(shù)據(jù)中獲取第一互信息值大于或等于第一閾值的特征數(shù)據(jù)作為第一目標(biāo)特征集合,包括:
9、獲取第一互信息值大于或等于第一閾值的第一特征數(shù)據(jù)的第一數(shù)量;
10、在第一數(shù)量等于第二閾值的情況下,獲取第一特征數(shù)據(jù)作為第一目標(biāo)特征集合。
11、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,在獲取第一互信息值大于或等于第一閾值的第一特征數(shù)據(jù)的第一數(shù)量后,方法還包括:
12、在第一數(shù)量大于第二閾值的情況下,確定第一特征數(shù)據(jù)的第一互信息值大于或等于目標(biāo)第一閾值的第二特征數(shù)據(jù);其中目標(biāo)第一閾值大于第一閾值;
13、在第二特征數(shù)據(jù)的數(shù)量等于第二閾值的情況下,確定第二特征數(shù)據(jù)為第二目標(biāo)特征集合。
14、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,在將第一目標(biāo)特征集合輸入目標(biāo)模型中的第一模型,利用第一模型對(duì)第一目標(biāo)特征集合分類,確定初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果之前,方法還包括:
15、獲取歷史目標(biāo)流量數(shù)據(jù)和歷史非目標(biāo)流量數(shù)據(jù),歷史目標(biāo)流量數(shù)據(jù)的數(shù)量小于歷史非目標(biāo)流量數(shù)據(jù)的數(shù)量,歷史目標(biāo)流量數(shù)據(jù)包括多個(gè)特征類型不同的歷史目標(biāo)子流量數(shù)據(jù),特征類型基于特征數(shù)據(jù)確定;
16、將多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的特征數(shù)據(jù)輸入生成式對(duì)抗網(wǎng)絡(luò)模型,得到多個(gè)對(duì)應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合;
17、基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合訓(xùn)練目標(biāo)模型。
18、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,將多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的特征數(shù)據(jù)輸入生成式對(duì)抗網(wǎng)絡(luò)模型,得到多個(gè)對(duì)應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合,包括:
19、構(gòu)建生成器網(wǎng)絡(luò)模型和判別器網(wǎng)絡(luò)模型,生成器網(wǎng)絡(luò)模型和判別器網(wǎng)絡(luò)模型組合得到生成式對(duì)抗網(wǎng)絡(luò)模型;
20、根據(jù)判別器網(wǎng)絡(luò)模型,對(duì)生成器網(wǎng)絡(luò)模型生成的樣本數(shù)據(jù)與歷史目標(biāo)子流量數(shù)據(jù)進(jìn)行區(qū)分,得到訓(xùn)練好的生成式對(duì)抗網(wǎng)絡(luò)模型;
21、利用多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的特征數(shù)據(jù),調(diào)整訓(xùn)練好的生成式對(duì)抗網(wǎng)絡(luò)模型的超參數(shù),得到目標(biāo)生成式對(duì)抗網(wǎng)絡(luò)模型;
22、基于目標(biāo)生成式對(duì)抗網(wǎng)絡(luò)模型,生成多個(gè)特征類型不同的目標(biāo)子流量數(shù)據(jù);
23、將多個(gè)特征類型不同的目標(biāo)子流量數(shù)據(jù)與對(duì)應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)合并,得到多個(gè)對(duì)應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合。
24、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,在基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合訓(xùn)練目標(biāo)模型之前,方法還包括:
25、利用jaccard系數(shù),獲取不同歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合的特征數(shù)據(jù)之間的相似度;
26、在相似度大于第三閾值的情況下,獲取相似度對(duì)應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合的樣本數(shù)量;
27、在相似度對(duì)應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合的樣本數(shù)量均小于第四閾值的情況下,合并相似度對(duì)應(yīng)的歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合的樣本數(shù)量,得到組合歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合;
28、基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合訓(xùn)練目標(biāo)模型,包括:
29、基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合、多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合和組合歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合,訓(xùn)練目標(biāo)模型。
30、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,基于歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合訓(xùn)練目標(biāo)模型,包括:
31、將歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合輸入目標(biāo)模型中的第一模型,利用第一模型對(duì)樣本集合分類,確定預(yù)測(cè)目標(biāo)結(jié)果和預(yù)測(cè)非目標(biāo)結(jié)果;
32、將預(yù)測(cè)目標(biāo)結(jié)果和預(yù)測(cè)非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對(duì)預(yù)測(cè)目標(biāo)結(jié)果和預(yù)測(cè)非目標(biāo)結(jié)果二次分類得到第一預(yù)測(cè)目標(biāo)結(jié)果。
33、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,第一模型包括支持向量機(jī)模型,在將歷史非目標(biāo)流量數(shù)據(jù)組成的樣本集合和多個(gè)歷史目標(biāo)子流量數(shù)據(jù)的過采樣樣本集合輸入目標(biāo)模型中的第一模型,利用第一模型對(duì)樣本集合分類,確定預(yù)測(cè)目標(biāo)結(jié)果和預(yù)測(cè)非目標(biāo)結(jié)果之前,方法還包括:
34、對(duì)粒子群算法的參數(shù)初始化并獲取多個(gè)粒子的適應(yīng)度,其中粒子表征一組支持向量機(jī)模型的懲罰參數(shù)和內(nèi)核參數(shù),粒子群算法的參數(shù)包括慣性權(quán)值;
35、將多個(gè)粒子的適應(yīng)度求和,得到第一適應(yīng)度;
36、將第一適應(yīng)度除以多個(gè)粒子對(duì)應(yīng)的數(shù)量,得到種群平均適應(yīng)度;
37、從多個(gè)粒子中任意選取兩個(gè)粒子;
38、將兩個(gè)粒子中的適應(yīng)度值最低的歷史最小適應(yīng)度作為目標(biāo)適應(yīng)度,粒子的歷史最小適應(yīng)度基于多次迭代得到的多個(gè)適應(yīng)度確定;
39、將多個(gè)粒子的適應(yīng)度分別與種群平均適應(yīng)度相除,得到第二適應(yīng)度;
40、將第二適應(yīng)度與第五閾值比較,得到比較結(jié)果;
41、在比較結(jié)果表征第二適應(yīng)度大于或等于第五閾值的情況下,任意選取兩個(gè)粒子適應(yīng)度中的較小適應(yīng)度對(duì)應(yīng)的位置作為粒子更新后位置;
42、獲取粒子位置更新后的目標(biāo)適應(yīng)度;
43、在目標(biāo)適應(yīng)度小于適應(yīng)度閾值的情況下,獲取目標(biāo)適應(yīng)度對(duì)應(yīng)的懲罰參數(shù)和內(nèi)核參數(shù)作為最佳懲罰參數(shù)和最佳內(nèi)核參數(shù);
44、基于最佳懲罰參數(shù)和最佳內(nèi)核參數(shù)得到參數(shù)調(diào)整后的支持向量機(jī)模型。
45、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,對(duì)粒子群算法的參數(shù)初始化并獲取多個(gè)粒子的適應(yīng)度,包括:
46、利用迭代次數(shù)和隨機(jī)數(shù)之間的對(duì)應(yīng)關(guān)系更新慣性權(quán)值,得到更新后的慣性權(quán)值。
47、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,對(duì)粒子群算法的參數(shù)初始化并獲取多個(gè)粒子的適應(yīng)度,包括:
48、根據(jù)粒子對(duì)應(yīng)的支持向量機(jī)模型分類錯(cuò)誤的次數(shù)與總分類次數(shù)的比值評(píng)估粒子的適應(yīng)度。
49、在一個(gè)可以實(shí)現(xiàn)的實(shí)施方式中,第二模型包括孤立森林模型,將預(yù)測(cè)目標(biāo)結(jié)果和預(yù)測(cè)非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對(duì)預(yù)測(cè)目標(biāo)結(jié)果和預(yù)測(cè)非目標(biāo)結(jié)果二次分類得到第一預(yù)測(cè)目標(biāo)結(jié)果,包括:
50、將預(yù)測(cè)目標(biāo)結(jié)果和預(yù)測(cè)非目標(biāo)結(jié)果輸入目標(biāo)模型中的孤立森林模型,利用孤立森林模型分別獲取預(yù)測(cè)目標(biāo)結(jié)果和預(yù)測(cè)非目標(biāo)結(jié)果中的離群點(diǎn),離群點(diǎn)對(duì)應(yīng)一種預(yù)測(cè)結(jié)果;
51、獲取預(yù)測(cè)目標(biāo)結(jié)果中除離群點(diǎn)之外的所有點(diǎn),得到第二預(yù)測(cè)目標(biāo)結(jié)果;
52、利用孤立森林模型對(duì)預(yù)測(cè)目標(biāo)結(jié)果和預(yù)測(cè)非目標(biāo)結(jié)果的離群點(diǎn)進(jìn)行二次分類,得到預(yù)測(cè)結(jié)果為預(yù)測(cè)目標(biāo)結(jié)果的第一離群點(diǎn);
53、將第一離群點(diǎn)和第二預(yù)測(cè)目標(biāo)結(jié)果合并,得到第一預(yù)測(cè)目標(biāo)結(jié)果。
54、第二方面,本公開實(shí)施例提供了一種流量確定的裝置,裝置包括:
55、獲取模塊,用于獲取待檢測(cè)網(wǎng)絡(luò)流量數(shù)據(jù),待檢測(cè)網(wǎng)絡(luò)流量數(shù)據(jù)包括多個(gè)特征數(shù)據(jù);
56、計(jì)算模塊,用于計(jì)算多個(gè)特征數(shù)據(jù)之間的第一互信息值,第一互信息值表征多個(gè)特征數(shù)據(jù)中任意兩個(gè)特征數(shù)據(jù)的關(guān)聯(lián)程度;
57、獲取模塊,還用于基于多個(gè)特征數(shù)據(jù)之間的第一互信息值,從多個(gè)特征數(shù)據(jù)中獲取第一互信息值大于或等于第一閾值的特征數(shù)據(jù)作為第一目標(biāo)特征集合;
58、確定模塊,用于將第一目標(biāo)特征集合輸入目標(biāo)模型中的第一模型,利用第一模型對(duì)第一目標(biāo)特征集合分類,確定初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果;
59、獲取模塊,還用于將初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對(duì)初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果二次分類得到當(dāng)前預(yù)測(cè)目標(biāo)結(jié)果。
60、第三方面,本公開實(shí)施例提供了一種流量確定的設(shè)備,設(shè)備包括處理器,以及存儲(chǔ)有計(jì)算機(jī)程序指令的存儲(chǔ)器;處理器讀取并執(zhí)行計(jì)算機(jī)程序指令,以實(shí)現(xiàn)如第一方面的任意一項(xiàng)的流量確定的方法。
61、第四方面,本公開實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序指令,計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面的任意一項(xiàng)的流量確定的方法。
62、第五方面,本公開實(shí)施例提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面的任意一項(xiàng)的流量確定的方法。
63、本公開實(shí)施例提供一種流量確定的方法、裝置、設(shè)備、計(jì)算機(jī)存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品,獲取待檢測(cè)網(wǎng)絡(luò)流量數(shù)據(jù),待檢測(cè)網(wǎng)絡(luò)流量數(shù)據(jù)包括多個(gè)特征數(shù)據(jù)。計(jì)算多個(gè)特征數(shù)據(jù)之間的第一互信息值,第一互信息值表征多個(gè)特征數(shù)據(jù)中任意兩個(gè)特征數(shù)據(jù)的關(guān)聯(lián)程度?;诙鄠€(gè)特征數(shù)據(jù)之間的第一互信息值,從多個(gè)特征數(shù)據(jù)中獲取第一互信息值大于或等于第一閾值的特征數(shù)據(jù)作為第一目標(biāo)特征集合。利用第一閾值篩選第一互信息值較大的特征數(shù)據(jù),能夠提高分類結(jié)果的準(zhǔn)確性。將第一目標(biāo)特征集合輸入目標(biāo)模型中的第一模型,利用第一模型對(duì)第一目標(biāo)特征集合分類,確定初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果。將初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果輸入目標(biāo)模型中的第二模型,利用第二模型對(duì)初始預(yù)測(cè)目標(biāo)結(jié)果和初始預(yù)測(cè)非目標(biāo)結(jié)果二次分類得到當(dāng)前預(yù)測(cè)目標(biāo)結(jié)果。通過利用第二模型對(duì)第一模型的分類結(jié)果二次分類,能夠減少錯(cuò)誤分類的概率,提高檢測(cè)出攻擊流量的準(zhǔn)確性。