用于噪聲環(huán)境下聲源分離和定位的助聽裝置及方法
【專利摘要】本發(fā)明涉及助聽裝置及方法,具體指一種用于噪聲環(huán)境下聲源分離和定位的助聽裝置及方法,包括麥克風(fēng)陣列、聲源位置顯示器、聲源分離與定位模塊、信號(hào)采集器、模擬信號(hào)放大器和聲源選擇鍵盤,聲源分離與定位模塊采用互相關(guān)法對(duì)采集的麥克風(fēng)信號(hào)進(jìn)行處理,得到8個(gè)聲源相對(duì)于麥克風(fēng)陣列的初始方位,采用基于空間搜索的盲源分離方法對(duì)采集的麥克風(fēng)信號(hào)進(jìn)行處理,得到包含交談對(duì)象和其他人說話聲音的聲源,用戶通過聲源選擇鍵盤選擇出屬于交談對(duì)象的聲源,根據(jù)選擇的聲源計(jì)算出交談對(duì)象相對(duì)于麥克風(fēng)陣列的準(zhǔn)確方位,并在聲源位置顯示器中顯示該聲源的方位;實(shí)現(xiàn)噪聲環(huán)境下交談雙方語(yǔ)音信號(hào)自動(dòng)分離,同時(shí)增加了語(yǔ)音信號(hào)源的定位功能,使用方便。
【專利說明】用于噪聲環(huán)境下聲源分離和定位的助聽裝置及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及助聽裝置及方法,具體指一種用于噪聲環(huán)境下聲源分離和定位的助聽 裝置及方法。
【背景技術(shù)】
[0002] 在戶外或工業(yè)現(xiàn)場(chǎng)等嘈雜環(huán)境的語(yǔ)音交流中,助聽裝置是增強(qiáng)語(yǔ)音品質(zhì)提高溝通 效果的重要設(shè)備。在嘈雜環(huán)境下用戶所感興趣的有用信號(hào)會(huì)受到環(huán)境噪音或其它語(yǔ)音干 擾,有用信號(hào)的信噪比較低,進(jìn)而嚴(yán)重影響用戶之間的正常交流?,F(xiàn)有的助聽設(shè)備大多數(shù)仍 采用簡(jiǎn)單的信號(hào)放大功能,少數(shù)具有語(yǔ)音清晰功能的設(shè)備也僅對(duì)環(huán)境背景噪聲有效,對(duì)于 交流現(xiàn)場(chǎng)中其它語(yǔ)音的干擾無(wú)能為力。
【發(fā)明內(nèi)容】
[0003] 針對(duì)現(xiàn)有技術(shù)存在的上述問題,本發(fā)明解決的技術(shù)問題是:實(shí)現(xiàn)噪聲環(huán)境下交談 雙方語(yǔ)音信號(hào)自動(dòng)分離,同時(shí)增加了語(yǔ)音信號(hào)源的定位功能,操作方便。
[0004] 解決該技術(shù)問題,本發(fā)明是這樣實(shí)現(xiàn)的:一種用于噪聲環(huán)境下聲源分離和定位的 助聽裝置,其特征在于:包括麥克風(fēng)陣列(1006)、聲源位置顯示器(1001)、聲源分離與定位 模塊(1002)、信號(hào)采集器(1003)、模擬信號(hào)放大器(1004)和聲源選擇鍵盤(1005);
[0005] 所述麥克風(fēng)陣列(1006)、模擬信號(hào)放大器(1004)、信號(hào)米集器(1003)、聲源分離 與定位模塊(1002)和聲源位置顯示器(1001)依次連接;
[0006] 所述聲源選擇鍵盤(1005)與聲源分離與定位模塊(1002)連接;
[0007] 所述聲源分離與定位模塊(1002)采用互相關(guān)法對(duì)采集的麥克風(fēng)信號(hào)進(jìn)行處理, 得到8個(gè)聲源相對(duì)于麥克風(fēng)陣列的初始方位;采用基于空間搜索的盲源分離方法對(duì)采集的 麥克風(fēng)信號(hào)進(jìn)行處理,得到包含交談對(duì)象(1009)和其他人(1010)說話聲音的聲源,用戶通 過聲源選擇鍵盤(1005)選擇出屬于交談對(duì)象(1009)的聲源,根據(jù)選擇的聲源計(jì)算出交談 對(duì)象(1009)相對(duì)于麥克風(fēng)陣列(1006)的準(zhǔn)確方位,并在聲源位置顯示器(1001)中顯示該 聲源的方位。
[0008] 進(jìn)一步,所述麥克風(fēng)陣列(1006)由微型麥克風(fēng)(1007)構(gòu)成;
[0009] 所述麥克風(fēng)陣列(1006)由8個(gè)獨(dú)立的微型麥克風(fēng)(1007)按照?qǐng)D中方式均勻排列 在正方形的邊上,正方形邊長(zhǎng)為10厘米,任意兩個(gè)微型麥克風(fēng)(1007)中心點(diǎn)之間的距離 (1008)為5厘米;
[0010] 所述微型麥克風(fēng)(1007)的指向性為全向型(無(wú)指向),直徑小于1厘米。
[0011] 本發(fā)明噪聲環(huán)境下聲源分離和定位方法,其特征在于:包括如下步驟:
[0012] a.采用權(quán)利要求1所述的助聽裝置對(duì)交談過程中的語(yǔ)音信號(hào)進(jìn)行采集;
[0013] al.所述助聽裝置采用模擬信號(hào)放大器(1004)對(duì)麥克風(fēng)陣列(1006)中8個(gè)微型 麥克風(fēng)(1007)的語(yǔ)音信號(hào)進(jìn)行放大,放大后的信號(hào)傳輸至信號(hào)米集器(1003);
[0014] a2.所述信號(hào)采集器(1003)對(duì)模擬信號(hào)放大器(1004)放大后的信號(hào)進(jìn)行濾波、模 /數(shù)轉(zhuǎn)換和采集,采樣頻率為16KHz,采樣精度為16位,并對(duì)采集的信號(hào)進(jìn)行儲(chǔ)存;
[0015] b.所述聲源分離與定位模塊(1002)采用基于空間搜索的盲源分離方法對(duì)采集的 麥克風(fēng)信號(hào)進(jìn)行處理,具體步驟如下:
[0016] bl.信號(hào)采集器得到8路觀測(cè)信號(hào)x(t) = [Xl(t),x2(t),...,x8(t)]T,t為采樣時(shí) 刻;
[0017] b2.觀測(cè)信號(hào)x(t)可以被建模為8個(gè)聲源s(t) = [sjt), s2(t), . . .,s8(t)]T的 線性混合:
[0018]
【權(quán)利要求】
1. 一種用于噪聲環(huán)境下聲源分離和定位的助聽裝置,其特征在于:包括麥克風(fēng)陣列 (1006)、聲源位置顯示器(1001)、聲源分離與定位模塊(1002)、信號(hào)采集器(1003)、模擬信 號(hào)放大器(1004)和聲源選擇鍵盤(1005); 所述麥克風(fēng)陣列(1006)、模擬信號(hào)放大器(1004)、信號(hào)采集器(1003)、聲源分離與定 位模塊(1002)和聲源位置顯示器(1001)依次連接; 所述聲源選擇鍵盤(1005)與聲源分離與定位模塊(1002)連接; 所述聲源分離與定位模塊(1002)采用互相關(guān)法對(duì)采集的麥克風(fēng)信號(hào)進(jìn)行處理,得到8 個(gè)聲源相對(duì)于麥克風(fēng)陣列的初始方位;米用基于空間搜索的盲源分離方法對(duì)米集的麥克風(fēng) 信號(hào)進(jìn)行處理,得到包含交談對(duì)象(1009)和其他人(1010)說話聲音的聲源,用戶通過聲 源選擇鍵盤(1005)選擇出屬于交談對(duì)象(1009)的聲源,根據(jù)選擇的聲源計(jì)算出交談對(duì)象 (1009)相對(duì)于麥克風(fēng)陣列(1006)的準(zhǔn)確方位,并在聲源位置顯示器(1001)中顯示該聲源 的方位。
2. 所述麥克風(fēng)陣列(1006)由微型麥克風(fēng)(1007)構(gòu)成; 所述麥克風(fēng)陣列(1006)由8個(gè)獨(dú)立的微型麥克風(fēng)(1007)按照?qǐng)D中方式均勻排列在正 方形的邊上,正方形邊長(zhǎng)為10厘米,任意兩個(gè)微型麥克風(fēng)(1007)中心點(diǎn)之間的距離(1008) 為5厘米; 所述微型麥克風(fēng)(1007)的指向性為全向型(無(wú)指向),直徑小于1厘米。
3. 噪聲環(huán)境下聲源分離和定位方法,其特征在于:包括如下步驟: a. 采用權(quán)利要求1所述的助聽裝置對(duì)交談過程中的語(yǔ)音信號(hào)進(jìn)行采集; al.所述助聽裝置采用模擬信號(hào)放大器(1004)對(duì)麥克風(fēng)陣列(1006)中8個(gè)微型麥克 風(fēng)(1007)的語(yǔ)音信號(hào)進(jìn)行放大,放大后的信號(hào)傳輸至信號(hào)采集器(1003); a2.所述信號(hào)采集器(1003)對(duì)模擬信號(hào)放大器(1004)放大后的信號(hào)進(jìn)行濾波、模/數(shù) 轉(zhuǎn)換和采集,采樣頻率為16KHz,采樣精度為16位,并對(duì)采集的信號(hào)進(jìn)行儲(chǔ)存; b. 所述聲源分離與定位模塊(1002)采用基于空間搜索的盲源分離方法對(duì)采集的麥克 風(fēng)信號(hào)進(jìn)行處理,具體步驟如下: bl.信號(hào)采集器得到8路觀測(cè)信號(hào)x(t) = [^(^,^(^,...,^(^^,七為采樣時(shí)刻; b2.觀測(cè)信號(hào)x(t)可以被建模為8個(gè)聲源s(t) = [Sl(t),s2(t),...,s8(t)]T的線性 混合:
(1) 式⑴中v為空氣中聲音傳播的速度,約為340米/秒;a",m,η = 1,2,... 8為第 η個(gè)聲源到達(dá)第m個(gè)微型麥克風(fēng)的距離,聲源信號(hào)的幅值衰減與距離a"成反比關(guān)系, 聲源sn, η = 1,2, . . .,8到達(dá)各微型麥克風(fēng)的時(shí)間延遲與距離成正比關(guān)系;η (t)= (ηια),il2(t),···,il8(t)) T為微型麥克風(fēng)的噪聲;公式(1)可以簡(jiǎn)寫為 x(t) =As(t)+n(t) (2)式⑵中A e □ 8X8為聲源混合矩陣; b3.采用互相關(guān)法對(duì)對(duì)采集的麥克風(fēng)信號(hào)進(jìn)行處理,計(jì)算得到聲源相對(duì)于麥克風(fēng)陣列 的初始方位,具體如下: b301 :為了降低聲源定位和分離算法的復(fù)雜度,構(gòu)建一個(gè)柵格化的正方體,并存儲(chǔ)每個(gè) 柵格頂點(diǎn)至微型麥克風(fēng)(2003)的距離。參見圖2,將麥克風(fēng)陣列正前方的正方體區(qū)域進(jìn)行 柵格化處理,正方體的邊長(zhǎng)為10厘米,柵格的邊長(zhǎng)為1厘米,最小柵格的邊長(zhǎng)為1厘米,記 柵格頂點(diǎn)(2001)為 gijk,i,j,k = 1,2,... 10 ; b302 :柵格頂點(diǎn)gijk距離第m個(gè)微型麥克風(fēng)(2003)的距離(2002)為dm,將gijk至8個(gè) 微型麥克風(fēng)(2003)的距離寫作列向量形式為d,將所有柵格頂點(diǎn)至微型麥克風(fēng)的距離寫作 矩陣形式為D,矩陣的第1列表示第(k-Ι) X 100+U-1) X ΙΟ+i個(gè)柵格點(diǎn); 匕303:由公式(1)可知,任意兩路觀測(cè)信號(hào)1111(1:)與1111,(1:),111,111 /£{1,2,...8}進(jìn)行 延遲相關(guān)運(yùn)算 CT =xm(t) ·χπ, (t-τ),τ e [-〇·414/ν,0·414/ν],τ 為延遲時(shí)間,必然 存在8個(gè)極大值C了,《 = 1,2,...,8?由于τ非采樣時(shí)間間隔的整數(shù)倍,在計(jì)算q時(shí)需要首先 對(duì)觀測(cè)信號(hào)x(t)進(jìn)行自然三次樣條插值,對(duì)于采樣時(shí)刻U懷...,t P,對(duì)應(yīng)的采樣點(diǎn)xm = [y〇, yp...,yp]T,P為采樣點(diǎn)數(shù)目,插值計(jì)算后得到的觀測(cè)信號(hào)為排),插值函數(shù)為:
(3) 系數(shù)be bi,...,bp可以通過求解式(4)所述方程得到。
(4) b304:參見圖3,分別計(jì)算微型麥克風(fēng)(3001)與(3002)、(3003)、(3004)采集到觀測(cè) 信號(hào)之間的延遲相關(guān)系數(shù)C,的極大值,并利用極大值(^,《 = 1,2,...,8處對(duì)應(yīng)的延遲時(shí)間 十\#,...,?^,#,4氣...,亍和48548,...,小可以計(jì)算出圖3所示的聲源相對(duì)于微型麥克 風(fēng)的方位; b305:利用延遲時(shí)間τ與聲速v相乘分別計(jì)算8個(gè)聲源與4個(gè)微型麥克風(fēng)(3001)、 (3002)、(3003)、(3004)的距離屯,d3, d6, d8,并通過計(jì)算
長(zhǎng)取與聲源 距離最近的柵格點(diǎn)gijk,進(jìn)而得到8個(gè)聲源距離8個(gè)微型麥克風(fēng)的距離,即聲源混合矩陣A ; b4.采用空間搜索的方法以最小化聲源之間互信息I為目標(biāo)函數(shù),同時(shí)分離出混合 在觀測(cè)信號(hào)x(t)中的所有聲源毛,,《 = 1,2,...,8,由于語(yǔ)音信號(hào)為短時(shí)平穩(wěn)信號(hào),通常認(rèn)為 在20毫秒的采樣時(shí)長(zhǎng)內(nèi)可以等效為平穩(wěn)信號(hào),因此,以下過程需要在有限時(shí)間T內(nèi)完成, T彡20ms,具體如下: b401 :初始化空間搜索次數(shù)r - 0,聲源混合矩陣A(CI) - A,互信息最小值Γ - + °〇,時(shí) 間 tc - 0 ; b402 :對(duì)聲源混合矩陣八(1:)進(jìn)行求逆運(yùn)算得到矩陣1?,利用
計(jì)算得到真 實(shí)聲源信號(hào)的估計(jì)信號(hào)SW,并對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理,使得各聲源估計(jì)信號(hào)均值為〇方差為 1 ; b403 :采用互信息度量聲源信號(hào)之間的相互獨(dú)立性,聲源之間的互信息是一個(gè)非負(fù)指 標(biāo),當(dāng)且僅當(dāng)各信號(hào)之間相互獨(dú)立時(shí)互信息為零。分別記xm= (xm(l),?,xm(P))為第m個(gè) 觀測(cè)信號(hào),= (1"(1),…》?"(Ρ))為真實(shí)聲源信號(hào)的估計(jì),p是采樣點(diǎn)數(shù)目。由此,估計(jì)聲源信 號(hào)氣,之間的互信息可以寫為:
(5) 式中,//(.?,,)為估計(jì)聲源信號(hào)4的邊緣熵,//(S)表示估計(jì)聲源信號(hào)的聯(lián)合熵; 由于邊緣熵//沃,)中含有概率分布項(xiàng),無(wú)法直接計(jì)算AT,實(shí)際計(jì)算中采用多項(xiàng)式密 度展開來近似熵,這種近似方法具有較高的計(jì)算效率,其形式為:
度,=£{.?0-3為規(guī)范化的峭度;估計(jì)聲源信號(hào)的聯(lián)合熵_§)為:
(7) 若ιω〈Γ,則置Γ - ιω,否則,進(jìn)入下一步; b404 :隨機(jī)搜索8個(gè)聲源附近的柵格點(diǎn),得到一組新的柵格點(diǎn)及其對(duì)應(yīng)的到達(dá)微型麥 克風(fēng)的距離,通過查詢距離矩陣D,得到新的聲源混合矩陣A ; b405 :若計(jì)算時(shí)間tc〈T,置迭代次數(shù)r - r+1,置下一次迭代的混合矩陣為Αω - A,返 回b402進(jìn)行迭代計(jì)算,否則,結(jié)束迭代過程。
【文檔編號(hào)】G10L21/0272GK104053107SQ201410249428
【公開日】2014年9月17日 申請(qǐng)日期:2014年6月6日 優(yōu)先權(quán)日:2014年6月6日
【發(fā)明者】柴毅, 屈劍鋒, 王坤朋, 楊志敏, 董勇 申請(qǐng)人:重慶大學(xué)