本發(fā)明涉及計算機(jī)處理,尤其涉及一種信息匹配方法、裝置、電子設(shè)備以及存儲介質(zhì)。
背景技術(shù):
1、目前,在信息編輯的過程中,為了提高編輯效率可以在編輯過程中顯示與編輯信息相關(guān)聯(lián)的信息。
2、但是,相關(guān)聯(lián)信息的確定多是采用模糊匹配算法或者單純通過編輯距離來確定的,存在受常用詞或錯別字干擾導(dǎo)致存在匹配效果不佳的問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供了一種信息匹配方法、裝置、電子設(shè)備以及存儲介質(zhì),以達(dá)到信息匹配的準(zhǔn)確性以及高效性的效果。
2、根據(jù)本發(fā)明的一方面,提供了一種信息匹配方法,該方法包括:
3、通過對接收到的待匹配信息分詞處理,得到與所述待匹配信息相一致的至少一個待處理詞匯,其中,所述待匹配信息中至少包括文本和/或音頻;
4、依據(jù)預(yù)先確定的詞頻統(tǒng)計表分別確定所述至少一個待處理詞匯的出現(xiàn)頻次,其中,所述詞頻統(tǒng)計表是依據(jù)預(yù)先獲取的多個標(biāo)準(zhǔn)信息確定的;
5、依據(jù)所述至少一個待處理詞匯的出現(xiàn)頻次和預(yù)設(shè)詞頻范圍,從所述至少一個待處理詞匯中確定出至少一個關(guān)鍵詞;
6、從數(shù)據(jù)庫中調(diào)取與每個關(guān)鍵詞相對應(yīng)至少一個候選信息,并確定所述候選信息與所述待匹配信息之間的匹配度,以基于所述匹配度確定與所述待匹配信息相匹配的至少一個目標(biāo)信息;
7、其中,所述目標(biāo)信息為所述多個標(biāo)準(zhǔn)信息中的信息。
8、進(jìn)一步的,采用下述方式確定所述詞頻統(tǒng)計表:
9、獲取多個標(biāo)準(zhǔn)信息,并對所述標(biāo)準(zhǔn)信息分詞處理,得到多個待統(tǒng)計詞匯;
10、對每個待統(tǒng)計詞匯的出現(xiàn)頻次統(tǒng)計處理,得到所述待統(tǒng)計詞匯的出現(xiàn)頻次;
11、依據(jù)各待統(tǒng)計詞匯以及相應(yīng)的出現(xiàn)頻次,確定所述詞頻統(tǒng)計表。
12、進(jìn)一步的,所述依據(jù)所述至少一個待處理詞匯的出現(xiàn)頻次和預(yù)設(shè)詞頻范圍,從所述至少一個待處理詞匯中確定出至少一個關(guān)鍵詞,包括:
13、依據(jù)所述至少一個待處理詞匯的出現(xiàn)頻次從低往高的順序選擇第一數(shù)量的待調(diào)整詞匯,并確定所述待調(diào)整詞匯所對應(yīng)的總頻次;
14、在所述總頻次在預(yù)設(shè)詞頻范圍之內(nèi)時,將所述待調(diào)整詞匯作為關(guān)鍵詞。
15、進(jìn)一步的,所述方法還包括:
16、若所述總頻次未在所述預(yù)設(shè)詞頻范圍之內(nèi)時,調(diào)整所述第一數(shù)量,以基于更新后的所述第一數(shù)量確定待調(diào)整詞匯,并確定所述待調(diào)整詞匯的總頻次;
17、若所述總頻次依然未在所述預(yù)設(shè)詞頻范圍之內(nèi),則重復(fù)執(zhí)行調(diào)整所述第一數(shù)量,以及確定待調(diào)整詞匯的步驟,直至所述總頻次在所述預(yù)設(shè)詞頻范圍之內(nèi)。
18、進(jìn)一步的,所述從數(shù)據(jù)庫中調(diào)取與每個關(guān)鍵詞相對應(yīng)至少一個候選信息,包括:
19、對于每個關(guān)鍵詞,從數(shù)據(jù)庫中調(diào)取與所述關(guān)鍵詞相關(guān)聯(lián)的多個待使用候選信息;
20、將所有關(guān)鍵詞的待使用候選信息去重處理,得到所有關(guān)鍵詞所對應(yīng)的至少一個候選信息。
21、進(jìn)一步的,所述確定所述候選信息與所述待匹配信息之間的匹配度,以基于所述匹配度確定與所述待匹配信息相匹配的至少一個目標(biāo)信息,包括:
22、基于相似度算法模型或者編輯距離確定模型分別確定所述待匹配信息與所述候選信息之間的匹配度;或,
23、基于預(yù)先訓(xùn)練的匹配度確定模型對所述待匹配信息和候選信息匹配處理,得到所述待匹配信息和所述候選信息之間的匹配度;
24、從所述匹配度中篩選出預(yù)設(shè)數(shù)量的目標(biāo)候選信息,并將所述目標(biāo)候選信息作為所述目標(biāo)信息。
25、進(jìn)一步的,所述標(biāo)準(zhǔn)信息對應(yīng)于企業(yè)/學(xué)校名稱,所述待匹配信息對應(yīng)于用戶編輯的信息。
26、根據(jù)本發(fā)明的另一方面,提供了一種信息匹配裝置,該裝置包括:
27、待處理詞匯確定模塊,用于通過對接收到的待匹配信息分詞處理,得到與所述待匹配信息相一致的至少一個待處理詞匯,其中,所述待匹配信息中至少包括文本和/或音頻;
28、頻次確定模塊,用于依據(jù)預(yù)先確定的詞頻統(tǒng)計表分別確定所述至少一個待處理詞匯的出現(xiàn)頻次,其中,所述詞頻統(tǒng)計表是依據(jù)預(yù)先獲取的多個標(biāo)準(zhǔn)信息確定的;
29、關(guān)鍵詞確定模塊,用于依據(jù)所述至少一個待處理詞匯的出現(xiàn)頻次和預(yù)設(shè)詞頻范圍,從所述至少一個待處理詞匯中確定出至少一個關(guān)鍵詞;
30、目標(biāo)信息確定模塊,用于從數(shù)據(jù)庫中調(diào)取與每個關(guān)鍵詞相對應(yīng)至少一個候選信息,并確定所述候選信息與所述待匹配信息之間的匹配度,以基于所述匹配度確定與所述待匹配信息相匹配的至少一個目標(biāo)信息;
31、其中,所述目標(biāo)信息為所述多個標(biāo)準(zhǔn)信息中的信息。
32、根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:
33、至少一個處理器;以及
34、與所述至少一個處理器通信連接的存儲器;其中,
35、所述存儲器存儲有可被所述至少一個處理器執(zhí)行的計算機(jī)程序,所述計算機(jī)程序被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行本發(fā)明實施例任一所述的信息匹配方法。
36、根據(jù)本發(fā)明的另一方面,提供了一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)指令,所述計算機(jī)指令用于使處理器執(zhí)行時實現(xiàn)本發(fā)明實施例任一所述的信息匹配方法。
37、根據(jù)本發(fā)明的另一方面,提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,所述計算機(jī)程序在被處理器執(zhí)行時用于執(zhí)行如本發(fā)明實施例任一所述的信息匹配方法。
38、本發(fā)明實施例所提供的技術(shù)方案,通過對接收到的待匹配信息分析處理,可以得到與待匹配信息相對應(yīng)的至少一個待處理詞匯。對于每個待處理詞匯,可以依據(jù)預(yù)先確定的詞頻統(tǒng)計表,確定相應(yīng)待處理詞匯所對應(yīng)的出現(xiàn)頻次,進(jìn)而依據(jù)出現(xiàn)頻次和預(yù)設(shè)詞頻范圍,從至少一個待處理詞匯中確定出關(guān)鍵詞。調(diào)取與關(guān)鍵詞相對應(yīng)的候選信息,并根據(jù)候選信息與待匹配信息之間的匹配度,可以確定出與待匹配信息相對應(yīng)的目標(biāo)信息,解決了現(xiàn)有技術(shù)中采用數(shù)據(jù)庫模糊匹配或者單純采用編輯距離來確定目標(biāo)信息時,存在效果不佳的問題,實現(xiàn)了提高確定目標(biāo)信息準(zhǔn)確率的效果。
39、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識本發(fā)明的實施例的關(guān)鍵或重要特征,也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過以下的說明書而變得容易理解。
1.一種信息匹配方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,采用下述方式確定所述詞頻統(tǒng)計表:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述至少一個待處理詞匯的出現(xiàn)頻次和預(yù)設(shè)詞頻范圍,從所述至少一個待處理詞匯中確定出至少一個關(guān)鍵詞,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從數(shù)據(jù)庫中調(diào)取與每個關(guān)鍵詞相對應(yīng)至少一個候選信息,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述候選信息與所述待匹配信息之間的匹配度,以基于所述匹配度確定與所述待匹配信息相匹配的至少一個目標(biāo)信息,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述標(biāo)準(zhǔn)信息對應(yīng)于企業(yè)/學(xué)校名稱,所述待匹配信息對應(yīng)于用戶編輯的信息。
8.一種信息匹配裝置,其特征在于,包括:
9.一種電子設(shè)備,所述電子設(shè)備包括:
10.一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)指令,所述計算機(jī)指令用于使處理器執(zhí)行如權(quán)利要求1-7任一所述的信息匹配方法。