本發(fā)明涉及工程實(shí)踐領(lǐng)域、數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其是一種基于數(shù)據(jù)挖掘的采集故障預(yù)警系統(tǒng)的方法。
背景技術(shù):
電力用戶用電信息采集系統(tǒng)的全覆蓋使得每天生成大量的系統(tǒng)運(yùn)行日志與故障日志,但由于缺乏相應(yīng)的數(shù)據(jù)挖掘算法和工具,導(dǎo)致該部分?jǐn)?shù)據(jù)未能得到充分、有效地利用。通過利用數(shù)據(jù)挖掘技術(shù)對用電信息采集系統(tǒng)所存儲的海量運(yùn)行日志與故障日志數(shù)據(jù)進(jìn)行分析,設(shè)計一個采集系統(tǒng)故障智能預(yù)警系統(tǒng),該系統(tǒng)包括核心數(shù)據(jù)挖掘算法、技術(shù)架構(gòu)以及業(yè)務(wù)流程。該系統(tǒng)通過對數(shù)據(jù)的智能分析,確定故障類型,指導(dǎo)系統(tǒng)維護(hù)人員進(jìn)行針對性故障排查,提高故障定位的精確性,有效提高系統(tǒng)維護(hù)的工作效率。該系統(tǒng)為保障用電信息采集系統(tǒng)的穩(wěn)定運(yùn)行,建設(shè)堅強(qiáng)智能電網(wǎng)提供有力支撐。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種基于數(shù)據(jù)挖掘的采集系統(tǒng)故障預(yù)警方法,將數(shù)據(jù)挖掘算法巧妙的應(yīng)用在采集系統(tǒng)故障處理和預(yù)警中,從而達(dá)到及時高效地排查采集系統(tǒng)故障的作用。
為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種基于數(shù)據(jù)挖掘的采集故障預(yù)警系統(tǒng)的方法,包括如下步驟,
S1:根據(jù)積累的故障數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,建立分類器;
S2:利用分類器對實(shí)時數(shù)據(jù)流進(jìn)行處理,分析出故障類型;
S3:建立專家知識庫;
S4:根據(jù)故障類型和專家知識庫的比對得到結(jié)果,結(jié)合維護(hù)人員的反饋,建立一套反饋機(jī)制,把反饋結(jié)果和本次故障數(shù)據(jù)應(yīng)用在分類器的建立上。
在本發(fā)明一實(shí)施例中,所述步驟S1具體實(shí)現(xiàn)如下,
S11:對歷史故障數(shù)據(jù)進(jìn)行整理,建立故障數(shù)據(jù)庫用來保存故障數(shù)據(jù),對數(shù)據(jù)進(jìn)行預(yù)處理,除去噪音數(shù)據(jù),為下一步做準(zhǔn)備;
S12:對數(shù)據(jù)進(jìn)行異常點(diǎn)檢測,利用利群檢測算法、統(tǒng)計學(xué)方法、基于距離的方法、基于密度的局部離群點(diǎn)方法或基于偏差的方法進(jìn)行檢測;
S13:利用步驟S12處理后的數(shù)據(jù)進(jìn)行分類器的建立,應(yīng)用決策樹歸納算法,采用增益率作為分裂準(zhǔn)則,對采集系統(tǒng)最近5年的數(shù)據(jù)采取交叉驗(yàn)證的策略,隨機(jī)選擇2/3用于訓(xùn)練決策樹,剩余部分用于測試。
在本發(fā)明一實(shí)施例中,所述步驟S2具體實(shí)現(xiàn)如下,
S21:用電信息采集系統(tǒng)捕捉系統(tǒng)故障的實(shí)時數(shù)據(jù);
S22:對實(shí)時數(shù)據(jù)進(jìn)行實(shí)時監(jiān)測,主要進(jìn)行故障數(shù)據(jù)的篩選,接著利用分類器對故障數(shù)據(jù)進(jìn)行分類,得到故障的類型,發(fā)出帶有故障類型的警報,若診斷不出故障類型,則發(fā)出不確定故障類型的警報;
S23:根據(jù)故障類型的分類結(jié)果進(jìn)行專家知識庫的匹配,找到故障原因以及相應(yīng)的故障處理建議,提供給維護(hù)人員參考;
S24:維護(hù)人員進(jìn)行現(xiàn)場維護(hù),根據(jù)維護(hù)現(xiàn)場的結(jié)果對故障信息進(jìn)行一個反饋,最終將此次故障轉(zhuǎn)入故障數(shù)據(jù)庫并把維修經(jīng)驗(yàn)總結(jié)到專家知識庫。
在本發(fā)明一實(shí)施例中,所述步驟S22中,故障的類型包括:互感器故障、電能表故障、電能量采集終端故障、網(wǎng)絡(luò)通信故障、主站故障、其他故障。
相較于現(xiàn)有技術(shù),本發(fā)明具有以下有益效果:
本發(fā)明基于數(shù)據(jù)挖掘的采集故障預(yù)警的方法通過利用異常點(diǎn)檢測以及決策樹分類技術(shù)設(shè)計數(shù)據(jù)挖掘模塊,提出建立專家知識數(shù)據(jù)庫以及自適應(yīng)的學(xué)習(xí)系統(tǒng)的模塊,不斷地優(yōu)化和更新系統(tǒng),從而提供一個高效、完善的故障預(yù)警處理系統(tǒng)。該系統(tǒng)智能快速,能夠準(zhǔn)確地排給出運(yùn)行故障類型,為采集故障的維護(hù)提供技術(shù)保障,提高了解決故障的效率。
附圖說明
圖1為本發(fā)明實(shí)施例提供的一種基于數(shù)據(jù)挖掘采集故障系統(tǒng)方法分類器構(gòu)建的流程圖。
圖2為本發(fā)明實(shí)施例提供的一種基于數(shù)據(jù)挖掘采集故障系統(tǒng)方法整體系統(tǒng)用例圖。
具體實(shí)施方式
下面結(jié)合附圖,對本發(fā)明的技術(shù)方案進(jìn)行具體說明。
如圖1所示,本發(fā)明的一種基于數(shù)據(jù)挖掘的采集故障預(yù)警系統(tǒng)的方法,包括如下步驟,
S1:根據(jù)積累的故障數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,建立分類器;
S2:利用分類器對實(shí)時數(shù)據(jù)流進(jìn)行處理,分析出故障類型;
S3:建立專家知識庫(根據(jù)系統(tǒng)運(yùn)行維護(hù)專家和一線運(yùn)行維護(hù)人員先驗(yàn)經(jīng)驗(yàn)建立);
S4:根據(jù)故障類型和專家知識庫的比對得到結(jié)果,結(jié)合維護(hù)人員的反饋,建立一套反饋機(jī)制,把反饋結(jié)果和本次故障數(shù)據(jù)應(yīng)用在分類器的建立上。
所述步驟S1具體實(shí)現(xiàn)如下,
S11:對歷史故障數(shù)據(jù)進(jìn)行整理,建立故障數(shù)據(jù)庫用來保存故障數(shù)據(jù),對數(shù)據(jù)進(jìn)行預(yù)處理,除去噪音數(shù)據(jù),為下一步做準(zhǔn)備;
S12:對數(shù)據(jù)進(jìn)行異常點(diǎn)檢測,利用利群檢測算法、統(tǒng)計學(xué)方法、基于距離的方法、基于密度的局部離群點(diǎn)方法或基于偏差的方法進(jìn)行檢測;
S13:利用步驟S12處理后的數(shù)據(jù)進(jìn)行分類器的建立,應(yīng)用決策樹歸納算法,采用增益率作為分裂準(zhǔn)則,對采集系統(tǒng)最近5年的數(shù)據(jù)采取交叉驗(yàn)證的策略,隨機(jī)選擇2/3用于訓(xùn)練決策樹,剩余部分用于測試。
所述步驟S2具體實(shí)現(xiàn)如下,
S21:用電信息采集系統(tǒng)捕捉系統(tǒng)故障的實(shí)時數(shù)據(jù);
S22:對實(shí)時數(shù)據(jù)進(jìn)行實(shí)時監(jiān)測,主要進(jìn)行故障數(shù)據(jù)的篩選,接著利用分類器對故障數(shù)據(jù)進(jìn)行分類,得到故障的類型,發(fā)出帶有故障類型的警報,若診斷不出故障類型,則發(fā)出不確定故障類型的警報;
S23:根據(jù)故障類型的分類結(jié)果進(jìn)行專家知識庫的匹配,找到故障原因以及相應(yīng)的故障處理建議,提供給維護(hù)人員參考;
S24:維護(hù)人員進(jìn)行現(xiàn)場維護(hù),根據(jù)維護(hù)現(xiàn)場的結(jié)果對故障信息進(jìn)行一個反饋,最終將此次故障轉(zhuǎn)入故障數(shù)據(jù)庫并把維修經(jīng)驗(yàn)總結(jié)到專家知識庫。
所述步驟S22中,故障的類型包括:互感器故障、電能表故障、電能量采集終端故障、網(wǎng)絡(luò)通信故障、主站故障、其他故障。
以下為本發(fā)明的具體實(shí)施過程。
本發(fā)明實(shí)施例提供一種基于數(shù)據(jù)挖掘采集故障系統(tǒng)方法。如圖2所示,該方法主要包括如下步驟:
步驟1、故障類型分類器的建立。
本步驟具體通過如下三個步驟來實(shí)現(xiàn):
1)對歷史故障數(shù)據(jù)進(jìn)行整理,建立故障數(shù)據(jù)庫用來保存這些故障數(shù)據(jù),對數(shù)據(jù)進(jìn)行預(yù)處理,除去噪音數(shù)據(jù),為下一步做準(zhǔn)備;
2)對數(shù)據(jù)進(jìn)行異常點(diǎn)檢測,可以利用利群檢測算法(統(tǒng)計學(xué)方法、基于距離的方法、基于密度的局部離群點(diǎn)方法、基于偏差的方法)進(jìn)行檢測。
3)利用上述清潔的數(shù)據(jù)進(jìn)行分類器的建立,應(yīng)用決策樹歸納算法,采用增益率作為分裂準(zhǔn)則,對采集系統(tǒng)最近5年的數(shù)據(jù)采取交叉驗(yàn)證的策略,隨機(jī)選擇2/3用于訓(xùn)練決策樹,剩余部分用于測試。
步驟2、對實(shí)時數(shù)據(jù)進(jìn)行處理,利用分類器進(jìn)行分類,得到分類結(jié)果并查詢專家知識庫,分析此分類結(jié)果給出故障原因和處理建議,接著維護(hù)人員進(jìn)行故障的維護(hù),把維護(hù)結(jié)果和出現(xiàn)的問題進(jìn)行反饋,把此次故障轉(zhuǎn)入故障數(shù)據(jù)庫以及知識數(shù)據(jù)庫。
本步驟具體通過如下三個步驟來實(shí)現(xiàn):
1)用電信息采集系統(tǒng)捕捉系統(tǒng)故障的實(shí)時數(shù)據(jù)。
2)對實(shí)時數(shù)據(jù)進(jìn)行實(shí)時監(jiān)測,主要進(jìn)行故障數(shù)據(jù)的篩選,接著利用分類器對故障數(shù)據(jù)進(jìn)行分類,得到故障的類型,發(fā)出帶有故障類型的警報,如果診斷不出故障類型,則發(fā)出不確定故障類型的警報;
3)根據(jù)故障類型的分類結(jié)果進(jìn)行專家知識庫的匹配,找到故障原因以及相應(yīng)的故障處理建議,提供給維護(hù)人員參考。
4)維護(hù)人員進(jìn)行現(xiàn)場維護(hù),根據(jù)維護(hù)現(xiàn)場的結(jié)果對故障信息進(jìn)行一個反饋,最終把這次故障轉(zhuǎn)入故障數(shù)據(jù)庫并把維修經(jīng)驗(yàn)總結(jié)到專家知識數(shù)據(jù)庫。
本發(fā)明實(shí)施例的上述方案,通過將溫度作為電力負(fù)荷數(shù)據(jù)的刻畫指標(biāo),將電力負(fù)荷數(shù)據(jù)的預(yù)測與溫度有效的聯(lián)系了起來,同時,在處理過程中,沒有破壞數(shù)據(jù)的原始性;另外,針對數(shù)據(jù)集不充分的缺陷,設(shè)置邊際增量加以補(bǔ)充;而對于傳統(tǒng)的將負(fù)荷轉(zhuǎn)化為時間序列處理中,無法進(jìn)行中長期預(yù)測的問題,本方案得到了很好的解決。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例可以通過軟件實(shí)現(xiàn),也可以借助軟件以及必要的通用硬件平臺的方式來實(shí)現(xiàn)?;谶@樣的理解,上述實(shí)施例的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟件產(chǎn)品可以存儲在一個非易失性存儲介質(zhì)(可以是CD-ROM,U盤,移動硬盤等)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例所述的方法。
以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明披露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求書的保護(hù)范圍為準(zhǔn)。