一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種智能交互方法,更具體的說是涉及一種基于互聯(lián)網(wǎng)的智能問答方法。
【背景技術(shù)】
[0002]在傳統(tǒng)的智能交互中,智能交互的一般采用模板方式來應(yīng)對復(fù)雜的對話,準(zhǔn)確度較低,或者對信息進(jìn)行各種分詞后進(jìn)行分析,但一般的分詞結(jié)果種類多,準(zhǔn)確度較低。
【發(fā)明內(nèi)容】
[0003]本發(fā)明公開了一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),包括以下步驟:
[0004]A、對用戶發(fā)出的信息進(jìn)行分詞;
[0005]B、對步驟A所述分詞后的字、詞及詞組是否屬于實(shí)體進(jìn)行識別;
[0006]C、對步驟A所述分詞后的字、詞及詞組進(jìn)行語義標(biāo)注分析;
[0007]D、對步驟A所述分詞后的字、詞及詞組進(jìn)行文本糾錯;
[0008]E、對用戶發(fā)出的信息進(jìn)行句法分析;
[0009]F、對用戶發(fā)出的信息及步驟A所述分詞后的字、詞及詞組進(jìn)行權(quán)重校正;
[0010]G、對用戶發(fā)出的信息進(jìn)行上下文處理;
[0011]H、根據(jù)所述步驟B-G的結(jié)果,對用戶發(fā)出的信息進(jìn)行相似度計(jì)算,得到閾值;
[0012]1、根據(jù)閾值結(jié)果查詢預(yù)設(shè)知識庫,返回結(jié)果給用戶。
[0013]所述步驟C中的語義標(biāo)注分析包括領(lǐng)域、重要度、同類詞、同義詞、網(wǎng)絡(luò)用語。
[0014]所述步驟D中的文本糾錯包括在領(lǐng)域的業(yè)務(wù)類詞及詞組進(jìn)行拼音糾錯;
[0015]所述步驟F中的句法分析采用規(guī)則和標(biāo)注方法。
【附圖說明】
[0016]圖1-本體及實(shí)例化、繼承的實(shí)例
[0017]圖2-詞類管理
[0018]圖3-同義詞,權(quán)重校正
【具體實(shí)施方式】
[0019]本發(fā)明公開了一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),包括以下步驟:
[0020]A、對用戶發(fā)出的信息進(jìn)行分詞;
[0021]分詞是計(jì)算機(jī)語言學(xué)或人工智能領(lǐng)域的常用技術(shù)手段,一般采用“最大匹配分詞法”或“最大概率法分詞”,
[0022]B、對步驟A所述分詞后的字、詞及詞組是否屬于實(shí)體進(jìn)行識別;
[0023]對于實(shí)體,是本體的實(shí)例化,
[0024]所謂本體,是對概念的一種明確且詳細(xì)的說明,是對現(xiàn)實(shí)世界的一種描述方法?;蛘哒f,本體實(shí)際上就是對特定領(lǐng)域之中某套概念及其相互之間關(guān)系的形式化表達(dá)。一般包含:
[0025]——具體的本體實(shí)例(對象Object)
[0026]——本體的屬性
[0027]——所屬的本體類別。
[0028]本體實(shí)例化后,就可以繼承本體的屬性,為其后的語義標(biāo)注分析做好準(zhǔn)備;
[0029]具體來說,如附圖1,對于銀行業(yè)務(wù)有很多基礎(chǔ)業(yè)務(wù),所有的基礎(chǔ)業(yè)務(wù)就是一種本體,對于某一種具體的本體,比如辦理規(guī)則,營銷活動就是一種對基礎(chǔ)業(yè)務(wù)的繼承,其所有的屬性就可以繼承下來。
[0030]C、對步驟A所述分詞后的字、詞及詞組進(jìn)行語義標(biāo)注分析;
[0031]對于語義標(biāo)注分析,包括詞性標(biāo)注和詞義標(biāo)注兩個部分:
[0032]對于詞性標(biāo)注:一般采用隱馬爾科夫模型或者基于轉(zhuǎn)換的錯誤驅(qū)動的磁性標(biāo)注方法;
[0033]對于詞義標(biāo)注:一般采用基于互信息的詞義排歧方法或基于詞典的排歧方法;
[0034]對于該步驟,當(dāng)用戶在機(jī)器人前端輸入一個問題,這個問題會首先進(jìn)行分詞處理,然后根據(jù)分詞的結(jié)果進(jìn)行匹配,因此詞類的建設(shè)優(yōu)劣,與機(jī)器人的智能程度緊密相連。對詞類的增刪和修改都可在【詞類管理】中實(shí)現(xiàn)。
[0035]如圖2,【詞類管理】標(biāo)簽下有“公用詞類”,“專有詞類”,其中“公用詞類”下為本體類屬性對應(yīng)的詞類,“專有詞類”下為項(xiàng)目自定義的特有詞類。
[0036]D、對步驟A所述分詞后的字、詞及詞組進(jìn)行文本糾錯;
[0037]E、對用戶發(fā)出的信息進(jìn)行句法分析;
[0038]F、對用戶發(fā)出的信息及步驟A所述分詞后的字、詞及詞組進(jìn)行權(quán)重校正;
[0039]如圖3,選擇需要掛入的分類右單擊,在菜單中選擇【新建子分類】,在彈出框內(nèi)填入類型名稱保存完成。
[0040]本系統(tǒng)中,類別名稱旁邊標(biāo)注的“ * ” “ # ”分別用來區(qū)分詞類的重要度及相似度, 代表重要,權(quán)重較高;“#”代表不相似,相似度很低代表該分類下的詞具有拼音糾錯功能。子分類自動繼承父級分類的設(shè)定。
[0041]本系統(tǒng)還會根據(jù)用戶數(shù)據(jù)日志來調(diào)整權(quán)重。例如:“不”字基于統(tǒng)計(jì)學(xué)不重要,但經(jīng)過統(tǒng)計(jì)分析,“不”字出現(xiàn)及句尾比例較高,其含義完全不同,所以當(dāng)“不”字出現(xiàn)在句尾時(shí),例如“我能開通彩鈴不”調(diào)整“不”字權(quán)重。
[0042]G、對用戶發(fā)出的信息進(jìn)行上下文處理;
[0043]H、根據(jù)所述步驟B-G的結(jié)果,對用戶發(fā)出的信息進(jìn)行相似度計(jì)算,得到閾值;
[0044]此外,本系統(tǒng)還可以實(shí)現(xiàn)“語義表達(dá)式與普通問句的混合運(yùn)算”,
[0045]例如:一個標(biāo)準(zhǔn)問為:“化妝品標(biāo)識夸大功效、虛假表示,如何查處? ”
[0046]對應(yīng)該標(biāo)準(zhǔn)問的語義表達(dá)式可分解為:[化妝品|化妝品牌][虛假][標(biāo)志][懲罰][方法?]
[0047]對應(yīng)該標(biāo)準(zhǔn)問的某一擴(kuò)展問為:“化妝品標(biāo)識標(biāo)注虛假的信息,對于這種行為工商局采取什么方法懲處”
[0048]假設(shè)知識庫內(nèi)包含上述知識,系統(tǒng)對用戶給出的信息可以進(jìn)行混合處理。即判斷用戶的問題如貼近于標(biāo)準(zhǔn)問可直接回答;如可分解成語義表達(dá)式,則依據(jù)語義表達(dá)式回答;如不能分解成語義表達(dá)式而貼近于擴(kuò)展問,則依據(jù)擴(kuò)展問回答;而非單獨(dú)采用上述任意一方式,以獲得最大閾值。即最吻合用戶需求的答案。
[0049]1、根據(jù)閾值結(jié)果查詢預(yù)設(shè)知識庫,返回結(jié)果給用戶。
[0050]所述步驟C中的語義標(biāo)注分析包括領(lǐng)域、重要度、同類詞、同義詞、網(wǎng)絡(luò)用語。
[0051]具體來說,經(jīng)過根據(jù)上述方面進(jìn)行語義標(biāo)注分析過后,分過的詞的語義準(zhǔn)確,歧義基本消除。
[0052]所述步驟D中的文本糾錯包括在領(lǐng)域的業(yè)務(wù)類詞及詞組進(jìn)行拼音糾錯;
[0053]所述步驟E中的句法分析采用規(guī)則和標(biāo)注方法。
【主權(quán)項(xiàng)】
1.一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),所述系統(tǒng)采用以下步驟對用戶信息進(jìn)行處理:A、對用戶發(fā)出的信息進(jìn)行分詞;B、對步驟A所述分詞后的字、詞及詞組是否屬于實(shí)體進(jìn)行識別;C、對步驟A所述分詞后的字、詞及詞組進(jìn)行語義標(biāo)注分析;D、對步驟A所述分詞后的字、詞及詞組進(jìn)行文本糾錯;E、對用戶發(fā)出的信息進(jìn)行句法分析;F、對用戶發(fā)出的信息及步驟A所述分詞后的字、詞及詞組進(jìn)行權(quán)重校正;G、對用戶發(fā)出的信息進(jìn)行上下文處理;H、根據(jù)所述步驟B-G的結(jié)果,對用戶發(fā)出的信息進(jìn)行相似度計(jì)算,得到閾值;1、根據(jù)閾值結(jié)果查詢預(yù)設(shè)知識庫,返回結(jié)果給用戶。2.根據(jù)權(quán)利要求1所述的一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),其特征在于:所述步驟C中的語義標(biāo)注分析包括領(lǐng)域、重要度、同類詞、同義詞、網(wǎng)絡(luò)用語。3.根據(jù)權(quán)利要求1所述的一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),其特征在于:所述步驟D中的文本糾錯包括在領(lǐng)域的業(yè)務(wù)類詞及詞組進(jìn)行拼音糾錯。4.根據(jù)權(quán)利要求1所述的一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),其特征在于:所述步驟E中的句法分析采用規(guī)則和標(biāo)注方法。
【專利摘要】一種基于互聯(lián)網(wǎng)的智能交互系統(tǒng),所述系統(tǒng)采用以下步驟對用戶信息進(jìn)行處理:A、對用戶發(fā)出的信息進(jìn)行分詞;B、對步驟A所述分詞后的字、詞及詞組是否屬于實(shí)體進(jìn)行識別;C、對步驟A所述分詞后的字、詞及詞組進(jìn)行語義標(biāo)注分析;D、對步驟A所述分詞后的字、詞及詞組進(jìn)行文本糾錯;E、對用戶發(fā)出的信息進(jìn)行句法分析;F、對用戶發(fā)出的信息及步驟A所述分詞后的字、詞及詞組進(jìn)行權(quán)重校正;G、對用戶發(fā)出的信息進(jìn)行上下文處理;H、根據(jù)所述步驟B-G的結(jié)果,對用戶發(fā)出的信息進(jìn)行相似度計(jì)算,得到閾值;I、根據(jù)閾值結(jié)果查詢預(yù)設(shè)知識庫,返回結(jié)果給用戶。
【IPC分類】G06F17/30, G06F17/27
【公開號】CN105302859
【申請?zhí)枴緾N201510603622
【發(fā)明人】李波, 曾永梅, 姚貢之, 朱頻頻
【申請人】上海智臻智能網(wǎng)絡(luò)科技股份有限公司
【公開日】2016年2月3日
【申請日】2015年9月21日