午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

預(yù)測(cè)模型的訓(xùn)練方法、信息傳播路徑的預(yù)測(cè)方法與流程

文檔序號(hào):39724557發(fā)布日期:2024-10-22 13:21閱讀:2來(lái)源:國(guó)知局
預(yù)測(cè)模型的訓(xùn)練方法、信息傳播路徑的預(yù)測(cè)方法與流程

本技術(shù)涉及信息處理領(lǐng)域,具體而言,涉及一種預(yù)測(cè)模型的訓(xùn)練方法、信息傳播路徑的預(yù)測(cè)方法。


背景技術(shù):

1、隨著互聯(lián)網(wǎng)的廣泛使用,諸如網(wǎng)絡(luò)暴力信息、網(wǎng)絡(luò)謠言等有害信息的傳播常常會(huì)引發(fā)諸多問(wèn)題。為了減少引發(fā)的問(wèn)題,可以預(yù)先對(duì)有害信息的傳播路徑進(jìn)行預(yù)測(cè)。

2、在相關(guān)技術(shù)中,存在通過(guò)構(gòu)建有突破口信息的知識(shí)圖譜進(jìn)行預(yù)測(cè)的方案,但其構(gòu)建過(guò)程沒有考慮傳播信息的內(nèi)容本身及其上下文信息,從而不能較為全面地構(gòu)建知識(shí)圖譜,導(dǎo)致預(yù)測(cè)的準(zhǔn)確性較低。另外,還存在通過(guò)同構(gòu)圖進(jìn)行預(yù)測(cè)的方案,但同構(gòu)圖只考慮了一種節(jié)點(diǎn)類型,從而也會(huì)導(dǎo)致預(yù)測(cè)的準(zhǔn)確性較低。


技術(shù)實(shí)現(xiàn)思路

1、本技術(shù)實(shí)施例的目的在于提供一種預(yù)測(cè)模型的訓(xùn)練方法、信息傳播路徑的預(yù)測(cè)方法,用以提高預(yù)測(cè)的信息傳播路徑的準(zhǔn)確性。

2、第一方面,本技術(shù)實(shí)施例提供了一種預(yù)測(cè)模型的訓(xùn)練方法,該方法包括:根據(jù)樣本信息構(gòu)建樣本異構(gòu)圖;所述樣本信息至少包括賬號(hào)實(shí)體信息、內(nèi)容載體實(shí)體信息以及關(guān)鍵詞實(shí)體信息,所述樣本異構(gòu)圖的節(jié)點(diǎn)表征賬號(hào)實(shí)體、內(nèi)容載體實(shí)體或者關(guān)鍵詞實(shí)體,所述樣本異構(gòu)圖的邊表征實(shí)體之間的連接關(guān)系;從所述樣本異構(gòu)圖中提取傳播所述樣本信息的多個(gè)元路徑,并確定各個(gè)元路徑中各個(gè)節(jié)點(diǎn)的目標(biāo)特征;將所述樣本異構(gòu)圖以及各個(gè)節(jié)點(diǎn)的目標(biāo)特征輸入初始預(yù)測(cè)模型中,將所述樣本異構(gòu)圖的真實(shí)標(biāo)簽作為所述初始預(yù)測(cè)模型的期望輸出訓(xùn)練所述初始預(yù)測(cè)模型,得到預(yù)測(cè)模型;所述真實(shí)標(biāo)簽表征所述樣本異構(gòu)圖中各個(gè)節(jié)點(diǎn)之間存在連接關(guān)系的概率。這樣,可以通過(guò)樣本信息,建立用于表征賬號(hào)實(shí)體、內(nèi)容載體實(shí)體以及關(guān)鍵詞實(shí)體之間的關(guān)聯(lián)關(guān)系的樣本異構(gòu)圖,從而可以根據(jù)該樣本異構(gòu)圖以及節(jié)點(diǎn)特征訓(xùn)練得到預(yù)測(cè)模型。這樣,既考慮了傳播信息的內(nèi)容本身及其上下文信息,又考慮了多種節(jié)點(diǎn)的類型情況,從而能夠提高預(yù)測(cè)模型的準(zhǔn)確性。

3、可選地,所述確定各個(gè)元路徑中各個(gè)節(jié)點(diǎn)的目標(biāo)特征,包括:確定各個(gè)元路徑中各個(gè)節(jié)點(diǎn)的類型權(quán)重;所述類型權(quán)重表征節(jié)點(diǎn)受其鄰居節(jié)點(diǎn)所屬類型的影響程度;針對(duì)一個(gè)元路徑中的一個(gè)節(jié)點(diǎn),根據(jù)該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的類型權(quán)重以及鄰居節(jié)點(diǎn)的特征,確定該節(jié)點(diǎn)的聚合特征;針對(duì)所述多個(gè)元路徑中的一個(gè)元路徑,根據(jù)該元路徑中各個(gè)節(jié)點(diǎn)的聚合特征以及元路徑總數(shù),確定該元路徑的傳播權(quán)重;所述傳播權(quán)重表征所述樣本信息在按照該元路徑傳播的過(guò)程中受不同類型的節(jié)點(diǎn)的影響程度;針對(duì)所述樣本異構(gòu)圖中的任一節(jié)點(diǎn),根據(jù)該節(jié)點(diǎn)所在的元路徑的傳播權(quán)重以及元路徑中各個(gè)節(jié)點(diǎn)的聚合特征,確定該節(jié)點(diǎn)的目標(biāo)特征。這樣,每個(gè)節(jié)點(diǎn)聚合了其所在元路徑中相連接的所有節(jié)點(diǎn)的特征以及元路徑的傳播權(quán)重,這樣有效利用了樣本異構(gòu)圖的結(jié)構(gòu)信息以及節(jié)點(diǎn)間的多種類型關(guān)系,從而有助于提高預(yù)測(cè)模型的準(zhǔn)確性。

4、可選地,在所述針對(duì)一個(gè)元路徑中的一個(gè)節(jié)點(diǎn),根據(jù)該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的類型權(quán)重以及鄰居節(jié)點(diǎn)的特征,確定該節(jié)點(diǎn)的聚合特征之前,所述確定各個(gè)元路徑中各個(gè)節(jié)點(diǎn)的目標(biāo)特征,還包括:構(gòu)建各個(gè)實(shí)體分別對(duì)應(yīng)的嵌入特征;其中,各個(gè)嵌入特征的維度大于所述賬號(hào)實(shí)體的總數(shù),且大于所述關(guān)鍵詞實(shí)體的總數(shù);所述針對(duì)一個(gè)元路徑中的一個(gè)節(jié)點(diǎn),根據(jù)該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的類型權(quán)重以及鄰居節(jié)點(diǎn)的特征,確定該節(jié)點(diǎn)的聚合特征,包括:針對(duì)一個(gè)元路徑中的一個(gè)節(jié)點(diǎn),根據(jù)該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的類型權(quán)重以及鄰居節(jié)點(diǎn)的嵌入特征,確定該節(jié)點(diǎn)的聚合特征。這樣,通過(guò)構(gòu)建各個(gè)實(shí)體分別對(duì)應(yīng)的嵌入特征,可以豐富節(jié)點(diǎn)特征,在一定程度上能夠有助于提高預(yù)測(cè)模型的準(zhǔn)確性。

5、可選地,所述初始預(yù)測(cè)模型包括解碼器,以及所述方法還包括:在包括正樣本邊的所述樣本異構(gòu)圖中引入負(fù)樣本邊,得到訓(xùn)練異構(gòu)圖;所述正樣本邊表征節(jié)點(diǎn)之間真實(shí)存在連接關(guān)系,所述負(fù)樣本邊表征節(jié)點(diǎn)之間真實(shí)不存在連接關(guān)系;這樣,所述將所述樣本異構(gòu)圖以及各個(gè)節(jié)點(diǎn)的目標(biāo)特征輸入初始預(yù)測(cè)模型中,將所述樣本異構(gòu)圖的真實(shí)標(biāo)簽作為所述初始預(yù)測(cè)模型的期望輸出訓(xùn)練所述初始預(yù)測(cè)模型,得到預(yù)測(cè)模型,包括:將所述訓(xùn)練異構(gòu)圖以及各個(gè)節(jié)點(diǎn)的目標(biāo)特征輸入解碼器中,通過(guò)所述解碼器得到所述訓(xùn)練異構(gòu)圖中各條邊存在的概率;針對(duì)于所述訓(xùn)練異構(gòu)圖中的任意一條邊,若該條邊存在的概率大于概率閾值,則確定存在該條邊;若該條邊存在的概率小于概率閾值,則確定不存在該條邊;統(tǒng)計(jì)存在的邊的第一數(shù)量以及不存在的邊的第二數(shù)量;根據(jù)所述第一數(shù)量、所述第二數(shù)量以及所述訓(xùn)練異構(gòu)圖中各條邊的真實(shí)標(biāo)簽,確定訓(xùn)練誤差;若所述訓(xùn)練誤差小于誤差閾值,將當(dāng)前的解碼器確定為所述預(yù)測(cè)模型。這樣,可以通過(guò)構(gòu)建訓(xùn)練異構(gòu)圖,豐富訓(xùn)練數(shù)據(jù),將訓(xùn)練過(guò)程轉(zhuǎn)換為二分類問(wèn)題,使預(yù)測(cè)模型學(xué)習(xí)到如何識(shí)別正樣本邊以及如何識(shí)別出負(fù)樣本邊的能力,在一定程度上提高了預(yù)測(cè)模型的泛化能力以及準(zhǔn)確性。

6、可選地,在所述根據(jù)樣本信息構(gòu)建樣本異構(gòu)圖之前,所述方法還包括:根據(jù)謠言類型,構(gòu)建關(guān)鍵詞列表;這樣,所述根據(jù)樣本信息構(gòu)建樣本異構(gòu)圖,包括:若所述樣本信息中存在與所述關(guān)鍵詞列表中的任一關(guān)鍵詞匹配的關(guān)鍵詞實(shí)體信息,則根據(jù)該關(guān)鍵詞實(shí)體信息、所述樣本信息中的賬號(hào)實(shí)體信息以及內(nèi)容載體實(shí)體信息構(gòu)建所述樣本異構(gòu)圖。這樣,可以將關(guān)鍵詞進(jìn)行分類,以便于處理不同類型的謠言,提高了預(yù)測(cè)模型的泛化能力。

7、可選地,所述根據(jù)樣本信息構(gòu)建樣本異構(gòu)圖,包括:若所述賬號(hào)實(shí)體信息與所述內(nèi)容載體實(shí)體信息之間存在發(fā)布關(guān)系,則連接表征所述賬號(hào)實(shí)體的節(jié)點(diǎn)與表征所述內(nèi)容載體實(shí)體的節(jié)點(diǎn);若所述內(nèi)容載體實(shí)體信息與所述關(guān)鍵詞實(shí)體信息之間存在包含關(guān)系,則連接表征所述內(nèi)容載體實(shí)體的節(jié)點(diǎn)與表征所述關(guān)鍵詞實(shí)體的節(jié)點(diǎn);若任意兩個(gè)賬號(hào)實(shí)體信息之間存在關(guān)注關(guān)系,則連接表征所述任意兩個(gè)賬號(hào)實(shí)體信息所對(duì)應(yīng)的賬號(hào)實(shí)體的節(jié)點(diǎn)。這樣,通過(guò)不同實(shí)體之間的關(guān)系,能夠構(gòu)建出較為全面的樣本異構(gòu)圖,在一定程度上提高了預(yù)測(cè)模型的準(zhǔn)確性。

8、第二方面,本技術(shù)實(shí)施例提供了一種信息傳播路徑的預(yù)測(cè)方法,該方法包括:根據(jù)待處理信息構(gòu)建異構(gòu)圖;所述待處理信息至少包括賬號(hào)實(shí)體信息、內(nèi)容載體實(shí)體信息以及關(guān)鍵詞實(shí)體信息,所述異構(gòu)圖的節(jié)點(diǎn)表征賬號(hào)實(shí)體、內(nèi)容載體實(shí)體或者關(guān)鍵詞實(shí)體,所述異構(gòu)圖的邊表征實(shí)體之間存在的連接關(guān)系;從所述異構(gòu)圖中提取傳播所述待處理信息的多個(gè)元路徑,并確定各個(gè)元路徑中各個(gè)節(jié)點(diǎn)的目標(biāo)特征;將所述異構(gòu)圖以及各個(gè)節(jié)點(diǎn)的目標(biāo)特征輸入預(yù)測(cè)模型,通過(guò)所述預(yù)測(cè)模型得到節(jié)點(diǎn)之間存在邊的概率;所述預(yù)測(cè)模型通過(guò)如第一方面所述的訓(xùn)練方法得到;通過(guò)節(jié)點(diǎn)之間存在邊的概率,預(yù)測(cè)所述待處理信息的傳播路徑。這樣,可以通過(guò)預(yù)測(cè)模型預(yù)測(cè)出不同類型的實(shí)體之間是否存在連接關(guān)系,由于預(yù)測(cè)模型的預(yù)測(cè)準(zhǔn)確性較高,從而可以得到較為準(zhǔn)確的預(yù)測(cè)結(jié)果。相較于現(xiàn)有技術(shù)中存在的諸如使用同構(gòu)圖或者構(gòu)建有突破口信息的知識(shí)圖譜進(jìn)行預(yù)測(cè)的方案,本實(shí)現(xiàn)方式的預(yù)測(cè)方法既考慮了待處理信息的內(nèi)容本身及其上下文信息,又考慮了多種節(jié)點(diǎn)的類型情況,從而能夠預(yù)測(cè)出較為準(zhǔn)確的傳播路徑。進(jìn)一步的,由于預(yù)測(cè)出了較為準(zhǔn)確的傳播路徑,因此可以確定出傳播路徑的起始實(shí)體,從而達(dá)到了溯源目的。

9、第三方面,本技術(shù)實(shí)施例提供了一種預(yù)測(cè)模型的訓(xùn)練裝置,該裝置包括:樣本異構(gòu)圖構(gòu)建模塊,用于根據(jù)樣本信息構(gòu)建樣本異構(gòu)圖;所述樣本信息至少包括賬號(hào)實(shí)體信息、內(nèi)容載體實(shí)體信息以及關(guān)鍵詞實(shí)體信息,所述樣本異構(gòu)圖的節(jié)點(diǎn)表征賬號(hào)實(shí)體、內(nèi)容載體實(shí)體或者關(guān)鍵詞實(shí)體,所述樣本異構(gòu)圖的邊表征實(shí)體之間的連接關(guān)系;第一確定模塊,用于從所述樣本異構(gòu)圖中提取傳播所述樣本信息的多個(gè)元路徑,并確定各個(gè)元路徑中各個(gè)節(jié)點(diǎn)的目標(biāo)特征;訓(xùn)練模塊,用于將所述樣本異構(gòu)圖以及各個(gè)節(jié)點(diǎn)的目標(biāo)特征輸入初始預(yù)測(cè)模型中,將所述樣本異構(gòu)圖的真實(shí)標(biāo)簽作為所述初始預(yù)測(cè)模型的期望輸出訓(xùn)練所述初始預(yù)測(cè)模型,得到預(yù)測(cè)模型;所述真實(shí)標(biāo)簽表征所述樣本異構(gòu)圖中各個(gè)節(jié)點(diǎn)之間存在連接關(guān)系的概率。這樣,能夠提高預(yù)測(cè)模型的準(zhǔn)確性。

10、第四方面,本技術(shù)實(shí)施例提供了一種信息傳播路徑的預(yù)測(cè)裝置,該裝置包括:異構(gòu)圖構(gòu)建模塊,用于根據(jù)待處理信息構(gòu)建異構(gòu)圖;所述待處理信息至少包括賬號(hào)實(shí)體信息、內(nèi)容載體實(shí)體信息以及關(guān)鍵詞實(shí)體信息,所述異構(gòu)圖的節(jié)點(diǎn)表征賬號(hào)實(shí)體、內(nèi)容載體實(shí)體或者關(guān)鍵詞實(shí)體,所述異構(gòu)圖的邊表征實(shí)體之間存在的連接關(guān)系;第二確定模塊,用于從所述異構(gòu)圖中提取傳播所述待處理信息的多個(gè)元路徑,并確定各個(gè)元路徑中各個(gè)節(jié)點(diǎn)的目標(biāo)特征;輸入模塊,用于將所述異構(gòu)圖以及各個(gè)節(jié)點(diǎn)的目標(biāo)特征輸入預(yù)測(cè)模型,通過(guò)所述預(yù)測(cè)模型得到節(jié)點(diǎn)之間存在邊的概率;所述預(yù)測(cè)模型通過(guò)如第一方面所述的訓(xùn)練方法得到;預(yù)測(cè)模塊,用于通過(guò)節(jié)點(diǎn)之間存在邊的概率,預(yù)測(cè)所述待處理信息的傳播路徑。這樣,可以得到較為準(zhǔn)確的預(yù)測(cè)結(jié)果,從而能夠預(yù)測(cè)出較為準(zhǔn)確的傳播路徑,并且能夠達(dá)到溯源目的。

11、第五方面,本技術(shù)實(shí)施例提供一種電子設(shè)備,包括處理器以及存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)可讀取指令,當(dāng)所述計(jì)算機(jī)可讀取指令由所述處理器執(zhí)行時(shí),運(yùn)行如上述第一方面或者第二方面提供的所述方法中的步驟。

12、第六方面,本技術(shù)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)運(yùn)行如上述第一方面或者第二方面提供的所述方法中的步驟。

13、第七方面,本技術(shù)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,其包括計(jì)算機(jī)程序或指令,該計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)運(yùn)行如第一方面或者第二方面所述的方法。

14、本技術(shù)的其他特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書闡述,并且,部分地從說(shuō)明書中變得顯而易見,或者通過(guò)實(shí)施本技術(shù)實(shí)施例了解。本技術(shù)的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫的說(shuō)明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1