一種內(nèi)容過濾方法及終端的制作方法
【技術領域】
[0001] 本發(fā)明涉及電子技術領域,尤其涉及一種內(nèi)容過濾方法及終端。
【背景技術】
[0002] 隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡已成為當今人們獲取知識、發(fā)布信息、交流溝通的主要工 具。對于當今視頻網(wǎng)站、博客、微博等互動式模式的發(fā)展,用戶不在被動的接收信息,而可以 隨時隨地將自己的觀點和想法通過以上的互動時模式進行發(fā)布。
[0003] 然而,在普通用戶對博文進行發(fā)表評論,或者對商品進行發(fā)表評價時,常常有大量 的垃圾評論也被其他懷有不同目的的網(wǎng)友、商家和不良分子等進行發(fā)表,使得整個評論區(qū) 的內(nèi)容充斥著垃圾評論,這不僅影響了整體的評論質量,也對其他用戶的閱覽造成的煩擾, 更可能降低普通用戶的訪問量,
[0004] 為解決上述問題,目前大多是采用人工對評論內(nèi)容進行審核,去掉低俗、無關等 需要屏蔽的垃圾評論,但是,由于評論需通過人工進行審核,導致處理效率過低,無法及時 顯示有效的評論,并且由于是人工審核,容易出現(xiàn)漏網(wǎng)之魚,無法全部濾除需進行過濾的評 論,從而給用戶帶來不便。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實施例所要解決的技術問題在于,提供一種內(nèi)容過濾方法及終端。可提高 內(nèi)容過濾的準確性和效率。
[0006] 為了解決上述技術問題,本發(fā)明實施例提供了一種內(nèi)容過濾方法,包括:
[0007] 獲取待過濾內(nèi)容,根據(jù)所述待過濾內(nèi)容確定待處理關鍵字;
[0008] 根據(jù)預置的關鍵字與推斷能力值的對應關系,獲取所述待處理關鍵字對應的待處 理推斷能力值;
[0009] 按預置的算法規(guī)則對所述待處理推斷能力值進行計算,獲取過濾值;
[0010] 根據(jù)所述過濾值確定是否對所述待過濾內(nèi)容進行過濾。
[0011] 其中,所述獲取待過濾內(nèi)容,根據(jù)所述待過濾內(nèi)容確定待處理關鍵字包括:
[0012] 判斷所述待過濾內(nèi)容是否包括預置數(shù)據(jù);
[0013] 當判斷結果為是時,按預置的處理規(guī)則對所述待過濾內(nèi)容進行處理,獲得待處理 片段;
[0014] 根據(jù)所述待處理片段確定所述待處理關鍵字。
[0015] 其中,所述獲取待過濾內(nèi)容,根據(jù)所述待過濾內(nèi)容確定待處理關鍵字之前包括:
[0016] 根據(jù)預置的包括至少一條已過濾內(nèi)容的數(shù)據(jù)庫和包括至少一條正常內(nèi)容的數(shù)據(jù) 庫,計算預置的關鍵字的推斷能力值;
[0017] 建立所述關鍵字與所述推斷能力值的對應關系。
[0018] 其中,所述根據(jù)所述過濾值確定是否對所述待過濾內(nèi)容進行過濾包括:
[0019] 判斷所述過濾值是否大于或等于預設的閾值;
[0020] 當判斷結果為是時,將所述待過濾內(nèi)容進行濾除。
[0021] 其中,所述當判斷結果為是時,將所述待過濾內(nèi)容進行濾除之后包括:
[0022] 將所述待過濾內(nèi)容添加進所述包括至少一條已過濾內(nèi)容的數(shù)據(jù)庫中。
[0023] 相應地,本發(fā)明實施例還提供了一種終端,包括:
[0024] 第一獲取單元,用于獲取待過濾內(nèi)容,根據(jù)所述待過濾內(nèi)容確定待處理關鍵字;
[0025] 第二獲取單元,用于根據(jù)預置的關鍵字與推斷能力值的對應關系,獲取所述待處 理關鍵字對應的待處理推斷能力值;
[0026] 第三獲取單元,用于按預置的算法規(guī)則對所述待處理推斷能力值進行計算,獲取 過濾值;
[0027] 過濾單元,用于根據(jù)所述過濾值確定是否對所述待過濾內(nèi)容進行過濾。
[0028] 其中,所述第一獲取單元包括:
[0029] 第一判斷子單元,用于判斷所述待過濾內(nèi)容是否包括預置數(shù)據(jù);
[0030] 獲取子單元,用于當判斷子單元判斷結果為是時,按預置的處理規(guī)則對所述待過 濾內(nèi)容進行處理,獲得待處理片段;
[0031] 確定子單元,用于根據(jù)所述待處理片段確定所述待處理關鍵字。
[0032] 其中,所述終端包括:
[0033] 計算單元,用于根據(jù)預置的包括至少一條已過濾內(nèi)容的數(shù)據(jù)庫和包括至少一條正 常內(nèi)容的數(shù)據(jù)庫,計算預置的關鍵字的推斷能力值;
[0034] 建立單元,用于建立所述關鍵字與所述推斷能力值的對應關系。
[0035] 其中,所述過濾單元包括:
[0036] 第二判斷子單元,用于判斷所述過濾值是否大于或等于預設的閾值;
[0037] 過濾子單元,用于當?shù)诙袛嘧訂卧袛嘟Y果為是時,將所述待過濾內(nèi)容進行濾 除。
[0038] 其中,所述過濾單元具體用于:
[0039] 將所述待過濾內(nèi)容添加進所述包括至少一條已過濾內(nèi)容的數(shù)據(jù)庫中。
[0040] 實施本發(fā)明實施例,具有如下有益效果:
[0041 ] 在本發(fā)實施例中,終端獲取待過濾內(nèi)容,根據(jù)所述待過濾內(nèi)容確定待處理關鍵字, 根據(jù)預置的關鍵字與推斷能力值的對應關系,獲取所述待處理關鍵字對應的待處理推斷能 力值,按預置的算法規(guī)則對所述待處理推斷能力值進行計算,獲取過濾值,根據(jù)所述過濾值 確定是否對所述待過濾內(nèi)容進行過濾,這使得終端可準確判斷是否需對待過濾內(nèi)容進行過 濾,從而提尚內(nèi)容過濾的準確和效率。
【附圖說明】
[0042] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0043] 圖1是本發(fā)明實施例提供一種內(nèi)容過濾方法的第一實施例流程示意圖;
[0044] 圖2是本發(fā)明實施例提供一種內(nèi)容過濾方法的第二實施例流程示意圖;
[0045] 圖3是本發(fā)明實施例提供一種內(nèi)容過濾方法的第二實施例流程示意圖;
[0046] 圖4是本發(fā)明實施例提供的一種終端的第一實施例結構圖;
[0047] 圖5是本發(fā)明實施例提供的一種終端的第二實施例結構圖;
[0048] 圖6是本發(fā)明實施例提供的一種終端的第三實施例結構圖。
【具體實施方式】
[0049] 下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于 本發(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0050] 本發(fā)明實施例中所描述的終端可包括:手機、平板電腦、掌上電腦或者移動互聯(lián)網(wǎng) 設備(MobileInternetDevice,MID)等,以及還可以包括路由器、網(wǎng)關等網(wǎng)元設備等,上述 終端僅是舉例,而非窮舉,包含但不限于上述終端。
[0051] 請參見圖1,為本發(fā)明一種內(nèi)容過濾方法的第一實施例流程示意圖。如圖1所示, 本實施例所述的一種內(nèi)容過濾方法包括步驟:
[0052] S100,獲取待過濾內(nèi)容,根據(jù)所述待過濾內(nèi)容確定待處理關鍵字。
[0053] 在本發(fā)明實施例中,待過濾內(nèi)容可以是一段文字,如用戶在微博、博客等網(wǎng)頁發(fā)表 的評論,當用戶在網(wǎng)頁上提交評論后,終端可通過網(wǎng)頁獲取用戶提交的評論。進一步的,待 過濾內(nèi)容還可以是全篇文字,如當用戶打開網(wǎng)頁時,終端可通過網(wǎng)頁獲取全篇文字。
[0054] 在本發(fā)明實施例中,當終端獲取到待過濾內(nèi)容時,終端可在待過濾內(nèi)容中查詢,獲 取與預置的關鍵字相匹配的字段作為待處理關鍵字。其中,關鍵字可以是詞、單字、或任意 多個字組合的字段,在此不進行限定。則,當終端獲取到待過濾內(nèi)容時,終端可在待過濾內(nèi) 容中查詢,獲取與預置的關鍵字相匹配的字段作為待處理關鍵字可以是:終端可在待過濾 內(nèi)容中查詢與預置的關鍵字一致的字段作為待處理關鍵字,例如:當預置的關鍵字包括"兼 職"、"會員"和"充值"等,待過濾內(nèi)容為:"淘寶兼職,聯(lián)系方式 :XXXXXX",終端可在待過濾 內(nèi)容中查詢與預置的關鍵字一致的字段為"兼職",此時"兼職"可為待處理關鍵字。在本發(fā) 明實施例中,用戶可預置關鍵字,例如,用戶可設置需要過濾的評論經(jīng)常出現(xiàn)的字段作為預 置的關鍵字,如"兼職","聯(lián)系方式"、"淘寶"等需屏蔽的字段,進一步的,預置的關鍵字還可 包括現(xiàn)有的敏感詞,如"槍"、"法輪功"、"色情"等不合法字段。
[0055] 進一步的,當終端獲取到待過濾內(nèi)容時,終端還可以根據(jù)關鍵字提取規(guī)則,在待過 濾內(nèi)容中提取待處理關鍵字。具體的,可以是終端根據(jù)關鍵字提取規(guī)則在待過濾內(nèi)容中提 取名詞、動詞等詞性的詞,而不選取語氣詞、組詞等詞性的詞,并當待過濾內(nèi)容中有超過7 個數(shù)字組合時可統(tǒng)一作為一個關鍵字,如關鍵字為"超過7個數(shù)字組合",當待過濾內(nèi)容中 有特殊符號時可統(tǒng)一作為一個關鍵字,如關鍵字為"特殊符號"等,其中,關鍵字提取規(guī)則的 具體實現(xiàn)方式還可以是由用戶進行自行設定,在此不進行贅述。
[0056] S101,根據(jù)預置的關鍵字與推斷能力值的對應關系,獲取所述待處理關鍵字對應 的待處理推斷能力值。
[0057] 在本發(fā)明實施例中,終端可預置每個關鍵字和與其對應的推斷能力值的對應關 系,其中,終端預置關鍵字與推斷能力值的對應關系可以是用戶進行自行設定,或者終端對 關鍵字進行訓練,獲得關鍵字與推斷能力