專利名稱:基于盲源分離技術(shù)的掃描圖像去噪方法
技術(shù)領(lǐng)域:
本發(fā)明屬于數(shù)字圖像處理技術(shù)領(lǐng)域,涉及一種掃描圖像的去噪方法,具 體涉及一種基于盲源分離技術(shù)的掃描圖像去噪方法。
技術(shù)背景隨著計算機(jī)在圖像處理技術(shù)領(lǐng)域的快速擴(kuò)展,文字識別、圖像識別、圖 像復(fù)原等處理成為非常重要的技術(shù)手段,而它們處理的對象大多是通過掃描 文檔得到的數(shù)字化圖像。在掃描某些印刷品時,由于紙張質(zhì)量等客觀因素, 掃描圖像往往帶有反面圖像所帶來的噪聲干擾。這種帶有明顯噪聲的掃描圖 像對于后續(xù)的文本識別、圖像識別等工作會帶來不利的影響。因此必須對此 類掃描圖像進(jìn)行有效的去噪,從而提高對這類圖像識別的精度。目前對此類問題的圖像去噪較多的是簡單采用傳統(tǒng)的數(shù)字圖像去噪算 法,比如中值濾波或均值濾波算法來進(jìn)行處理。而這些常用的方法對高斯、 椒鹽等已知噪聲特征的噪聲能夠很好的濾除,但對印刷品正反兩面的圖像互 相的噪聲特征無法準(zhǔn)確的獲得,因此這些常用的算法不能取得很好的去噪效 果,同時印刷品正反兩面的圖像具有相關(guān)性,正面的圖像構(gòu)成了反面圖像的 噪聲,反面圖像又構(gòu)成了正面圖像的噪聲,如果充分的利用相關(guān)性條件,可 以有效的提高去噪的效率和效果。因此必須尋找一種針對未知圖像噪聲特 征,并且可以利用圖像噪聲相關(guān)性的掃描圖像去噪方法,提高圖像去噪和圖 像識別的效果。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于盲源分離技術(shù)的掃描圖像去噪方法,解決 了現(xiàn)有技術(shù)存在的對印刷品正反兩面的圖像相互性的噪聲特征無法準(zhǔn)確的 獲得,不能很好去噪的問題。本發(fā)明所采用的技術(shù)方案是, 一種基于盲源分離技術(shù)的掃描圖像去噪方 法,該方法按以下步驟實施,a、 對原始采集的圖像進(jìn)行線性化處理將掃描得到的兩幅二維噪聲圖像分別轉(zhuǎn)換成行向量L,、 L2,再將該行向量L,、 L2組成一個2行的矩陣》b、 將上步得到的矩陣Z進(jìn)行預(yù)白化處理即將矩陣I變?yōu)榫禐镺、 方差為1的矩陣Z,并且使信號的各分量互不相關(guān);c、 設(shè)定待提取的獨立分量數(shù)目為w,迭代次數(shù)為t ; 表示已提取混 合信號的個數(shù),并令迭代變量/7-1;d、 任意取估計的方陣的初值"(O),但要求||"(0)||2=1;e、 進(jìn)行分離矩陣t/的迭代迭代規(guī)則如下,其中/^為加權(quán)因子,w(A+1) = +/4 [/+tanh(h )《-少j;f、 對步驟e的結(jié)果進(jìn)行歸一化處理+ 1).g、 如果步驟f的結(jié)果未收斂,回到步驟e;如果步驟f的結(jié)果收斂,進(jìn) 入下一步;■、、h、 再令p加l,如/^w,則回到步驟e;否則獲得分離矩陣t/;i、 新圖像的生成將上步得到的分離矩陣t/和原混合信號矩陣相乘, 就可得到分離的信號矩陣F,再將矩陣r的兩個行向量還原成兩個二維無噪 圖像矩陣,獲得兩個單獨的二維無噪圖像;
j、圖像的優(yōu)化處理對步驟i得到的兩個二維無噪圖像的亮度進(jìn)行適 當(dāng)?shù)男U?,得到兩個去噪后的最佳圖像即成。本發(fā)明的有益效果在于,可以在不需要知道圖像噪聲數(shù)學(xué)特征的前提 下,禾,噪聲的相關(guān)性和盲源分離的基本原理,將印刷品正反面掃描圖像的 噪聲有效的去除,并有很強(qiáng)的抗干擾能力。
圖1是盲源分離技術(shù)的原理示意圖;圖2是Infomax算法處理流程圖。
具體實施方式
下面結(jié)合附圖和具體實施方式
對本發(fā)明進(jìn)行詳細(xì)說明。
確定解決掃描圖像去噪的盲源分離問題的數(shù)學(xué)模型。 一個系統(tǒng)的輸入信 號、輸出信號和系統(tǒng)特征這三者之間有著固定的相互聯(lián)系。如果己知其中任 意兩者,就能求出第三者。但在很多實際情況中,輸入信號和系統(tǒng)特征的信 息是事先未知的。盲源分離(Blind Source Separation, BSS)是指在不知道源 信號和傳輸信道的先驗信息的情況下,根據(jù)輸入源信號的統(tǒng)計特性,僅從觀 測到的混合信號來恢復(fù)或分離出源信號。典型的被觀測的混合信號是一系列 傳感器的輸出,而每一傳感器接收到的是源信號的不同組合。盲源分離的主 要任務(wù)是從觀測數(shù)據(jù)中恢復(fù)出源信號,感興趣的是真實的源信號。例如,用 多個麥克風(fēng)采集同時說話的多個人的語音信號,從而獲得多路語音,從這多 路語音中恢復(fù)出每個人的語音就是語音信號盲分離。此外,雷達(dá)和聲納等陣 列信號的處理,以及醫(yī)學(xué)上多個生物傳感器信號的處理,也都涉及到此類問 題。盲信源分離是指在完全不知道任何先驗知識或者知其少量先驗知識(如 非高斯性、統(tǒng)計獨立性、循環(huán)平穩(wěn)性等)的情況下,只利用傳感器輸出的觀 測信號提取或分離出各個源信號的方法。它的任務(wù)是由多通道系統(tǒng)的輸出數(shù) 據(jù)I來判斷其輸入S和系統(tǒng)的傳遞函數(shù)^。如圖1所示,盲信源分離方法的基本原理就是使觀測信號X (0經(jīng)過一個分離系統(tǒng)后,能恢復(fù)或分離出源信號^ (f)。 w個相互統(tǒng)計獨立的未知信 號源s經(jīng)過未知混合系統(tǒng)//的傳輸后,由M個傳感器獲得M個觀測信號x(Z)。盲信源分離的任務(wù)就是將觀測信號通過信號分離器,尋找方陣f/使輸出;;G) -U;c (。是源信號S G)的拷貝或者估計。本發(fā)明將印刷品的正反面掃描圖像作為觀測信號X, (/)和JC2 G),用盲源分離的理論去分離觀測信號,使分離的結(jié)果》G)和h G)是源信號 51 G)和& (/)的最佳估計。確定合適的盲源分離算法對觀測信號進(jìn)行分離。本發(fā)明采用解決盲源分 離問題的Infomax (Information Maximization)法。1988年Linsker提出了 Infomax原則,即信息傳輸極大原則,可描述為網(wǎng)絡(luò)的輸入端和輸出端的 互信息達(dá)到最大時,等價于輸出端各分量間的冗余信息得到去除從而完成分 離。如圖2所示,為Infomax算法框圖的基本思路,w = , w2 ,..., wn ] T為盲源分離結(jié)果,用來逼近真實源s。 g (u)為單調(diào)可逆的非線性函數(shù)。由于 源信號的概率密度分布函數(shù)未知,所以互信息也無法直接計算,于是就取合 適的非線性函數(shù)來逼近它,這里的g (u)就是所選取的非線性函數(shù);^為非線性輸出。從圖2可以看出,Infomax算法的特點是..在輸出端逐分量地引進(jìn)一個合適的非線性函數(shù)g(U),把Mi轉(zhuǎn)變?yōu)???梢宰C明當(dāng)沒有輸入噪聲時,I(x,
力的最大化可以通過輸出熵H(J)的最大化來實現(xiàn),即最大化信息傳輸?shù)葍r于最大化輸出熵。因此,基于信息極大判椐的Infomax算法可描述為調(diào)整 分離矩陣『,使非線性輸出ypgi ("i), /=1,2,...,"的聯(lián)合信息熵H (y) 達(dá)到最大。對分離后的結(jié)果進(jìn)行適當(dāng)?shù)奶幚?。由于盲源問題求解的特點,所分離出 的結(jié)果和真實信號的增益和順序會有差異,因此應(yīng)對分離的圖像亮度進(jìn)行適 當(dāng)?shù)奶幚硪越咏鎸嵉膱D像。本發(fā)明所述的基于盲源分離技術(shù)的掃描圖像去噪方法,在對印刷品的掃 描圖像去噪時,能夠在未知噪聲特征時,利用圖像噪聲的相關(guān)性及盲源分離 理論,將印刷品正反兩面的掃描圖像作為盲源問題中的兩個源信號的混合信 號,采用擴(kuò)展Infomax方法進(jìn)行分離,從而達(dá)到掃描圖像去噪的目的?;谏鲜龅拿ぴ捶蛛x技術(shù)原理對掃描圖像進(jìn)行去噪,本發(fā)明所述的方法 實施時按以下步驟進(jìn)行,a、 將原始采集的圖像進(jìn)行線性化處理。將掃描得到的兩幅二維圖像, 分別轉(zhuǎn)換成行向量L,、 L2,再將兩個向量組成一個2行的矩陣義;b、 將上步得到的矩陣Z進(jìn)行預(yù)白化處理。即變?yōu)榫禐?、方差為1 的矩陣Z,并且使信號的各分量互不相關(guān);c、 設(shè)定迭代次數(shù)m, /w為待提取獨立分量的數(shù)目,迭代次數(shù)為^在 本問題中,m取2。 p表示已提取混合信號的個數(shù),p取l和2。首先令迭代d、 任意取估計的方陣的初值W(O),但要求||"(())||2=1;e、 進(jìn)行分離矩陣f/的迭代。迭代規(guī)則如下,其中A)t為加權(quán)因子 +1) 二,+/4[/+tanh(^ly〖U〖]順通過調(diào)節(jié)加權(quán)因子,可以改變算法的收斂性能;其中^是迭代變量, W(&)是前一次迭代出來的分離矩陣,《A+l)表示當(dāng)前迭代所要計算的分離矩陣;少是要分離混合信號,下標(biāo)^表示其在第^次迭代計算;f、 對步驟e的結(jié)果進(jìn)行歸一化處理,令,+ i)ll『'(+ ^下標(biāo)/表示分離矩陣中的第/行;g、 如果步驟f結(jié)果未收斂,回到步驟e;如果步驟f的結(jié)果收斂,進(jìn)入下一步,h、 再令p加l,如psw,則回到步驟e;否則得到分離矩陣t/;i、 新圖像的生成用上步得到的分離矩陣^/和原混合信號矩陣相乘, 就可得到分離后的信號矩陣y,再將矩陣y的兩個行向量還原成兩個二維無 噪圖像矩陣,獲得兩個單獨的二維無噪圖像;j、圖像的優(yōu)化處理對步驟i得到的兩個二維無噪圖像的亮度進(jìn)行校 正,得到兩個去噪后的最佳圖像,即成。本發(fā)明涉及對掃描正反兩面印刷品的數(shù)字圖像進(jìn)行去噪的方法,簡化 了計算量,提高了運算的速度和準(zhǔn)確度。本發(fā)明所述方法可以應(yīng)用于掃描圖像去噪、圖像識別、OCR等技術(shù)領(lǐng)域,具有非常廣闊的應(yīng)用前景。
權(quán)利要求
1、一種基于盲源分離技術(shù)的掃描圖像去噪方法,其特征在于該方法按以下步驟實施,a、對原始采集的圖像進(jìn)行線性化處理將掃描得到的兩幅二維噪聲圖像分別轉(zhuǎn)換成行向量L1、L2,再將該行向量L1、L2組成一個2行的矩陣X;b、將上步得到的矩陣X進(jìn)行預(yù)白化處理即將矩陣X變?yōu)榫禐?、方差為1的矩陣Z,并且使信號的各分量互不相關(guān);c、設(shè)定待提取的獨立分量數(shù)目為m,迭代次數(shù)為k,p表示已提取混合信號的個數(shù),并令迭代變量p=1;d、任意取估計的方陣的初值u(0),但要求‖u(0)‖2=1;e、進(jìn)行分離矩陣U的迭代迭代規(guī)則如下,其中μk為加權(quán)因子,
全文摘要
本發(fā)明公開了一種基于盲源分離技術(shù)的掃描圖像去噪方法,該方法的步驟包括將原始圖像線性化得到的矩陣、將得到的矩陣預(yù)白化、設(shè)定迭代次數(shù)、方陣的迭代處理、歸一化處理、獲得分離矩陣、獲得分離的圖像、校正圖像。該方法在對印刷品的掃描圖像去噪時,能夠在未知噪聲特征時,利用圖像噪聲的相關(guān)性及盲源分離理論,將印刷品正反兩面的掃描圖像作為盲源問題中的兩個源信號的混合信號,采用擴(kuò)展Infomax方法進(jìn)行分離,簡化了計算量,提高了運算的速度和準(zhǔn)確度,從而達(dá)到掃描圖像去噪的目的。本發(fā)明所述方法可以應(yīng)用于掃描圖像去噪、圖像識別、OCR等技術(shù)領(lǐng)域,具有非常廣闊的應(yīng)用前景。
文檔編號G06K9/40GK101127084SQ20071001857
公開日2008年2月20日 申請日期2007年9月4日 優(yōu)先權(quán)日2007年9月4日
發(fā)明者涵 劉, 成斐鳴, 躍 趙 申請人:西安理工大學(xué)