一種語音識別測試系統(tǒng)和方法與流程

文檔序號：11202326閱讀：1222來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明屬于語音識別領(lǐng)域，具體地涉及一種語音識別測試系統(tǒng)和方法。

背景技術(shù)：

語音交互是目前ai近年來發(fā)展速度較快的一種，它脫離常規(guī)的人與機(jī)器界面交互的方式，語音智能的產(chǎn)品在國內(nèi)外不斷的升溫，占據(jù)了市場上不小的份額，而語音識別測試繁冗而復(fù)雜，涉及各方面的因素較多，特別是針對前期麥克風(fēng)拾音方位、喚醒，回音消噪、背景消噪聲紋識別等評估。然而現(xiàn)有的語音識別測試系統(tǒng)功能都較單一，要完成整個語音識別測試則需要用到許多測試系統(tǒng)，使得整個測試流程復(fù)雜繁瑣，操作麻煩，測試效率低，且測試不夠系統(tǒng)全面，測試準(zhǔn)確率較低。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明目的在于為解決上述問題而提供一種系統(tǒng)集成度高，使整個測試流程操作簡便，測試效率高，測試系統(tǒng)全面，提高測試準(zhǔn)確率的語音識別測試系統(tǒng)和方法。

為此，本發(fā)明公開了一種語音識別測試系統(tǒng)，包括主控制模塊、實(shí)時信號測試模塊、錄音質(zhì)量測試模塊、標(biāo)準(zhǔn)環(huán)境下語音測試模塊和常規(guī)情景下語音測試模塊，所述實(shí)時信號測試模塊、錄音質(zhì)量測試模塊、標(biāo)準(zhǔn)環(huán)境下語音測試模塊和常規(guī)情景下語音測試模塊分別與主控制模塊連接，所述實(shí)時信號測試模塊用于測試拾取信號的質(zhì)量完整性及電性能參數(shù)，所述錄音質(zhì)量測試模塊用于測試錄音信號質(zhì)量的電性能參，所述標(biāo)準(zhǔn)環(huán)境下語音測試模塊用于測試標(biāo)準(zhǔn)環(huán)境下語音識別率，所述常規(guī)情景下語音測試模塊用于測試常規(guī)使用環(huán)境下語音識別率。

進(jìn)一步的，所述實(shí)時信號測試模塊包括標(biāo)準(zhǔn)信號源播放模塊、麥克風(fēng)、信號采集處理模塊、主控制模塊和信號分析儀，所述標(biāo)準(zhǔn)信號源播放模塊設(shè)置在消音室內(nèi)，用于播放標(biāo)準(zhǔn)信號聲源，所述麥克風(fēng)采集標(biāo)準(zhǔn)信號源，并將采集到的信號傳輸給信號采集處理模塊，信號采集處理模塊對信號進(jìn)行處理后傳輸給主控制模塊，主控制模塊對信號進(jìn)行處理后傳輸給信號分析儀，信號分析儀對信號的電性能進(jìn)行數(shù)據(jù)分析。

更進(jìn)一步的，所述信號采集處理模塊通過有線或無線與主控制模塊通信連接。

進(jìn)一步的，所述錄音質(zhì)量測試模塊包括標(biāo)準(zhǔn)信號源/聲源播放模塊、麥克風(fēng)、信號采集處理模塊、主控制模塊、功放模塊和信號分析儀，所述標(biāo)準(zhǔn)信號源/聲源播放模塊設(shè)置在消音室內(nèi)，用于播放智能合成的語音語料庫音頻文件，所述麥克風(fēng)采集標(biāo)準(zhǔn)信號源/聲源播放模塊播放的標(biāo)準(zhǔn)信號源/聲源，并將采集到的信號傳輸給信號采集處理模塊，信號采集處理模塊對信號進(jìn)行處理后傳輸給主控制模塊，主控制模塊對信號進(jìn)行錄制后將錄音信號傳輸給功放模塊，功放模塊對錄音信號進(jìn)行功放后傳輸給信號分析儀，信號分析儀對錄音信號的電性能進(jìn)行數(shù)據(jù)分析。

進(jìn)一步的，所述標(biāo)準(zhǔn)環(huán)境下語音測試模塊包括標(biāo)準(zhǔn)聲源播放模塊、麥克風(fēng)、信號采集處理模塊、主控制模塊和離線語音合成模塊，所述離線語音合成模塊將被測試的語音語料庫的內(nèi)容轉(zhuǎn)換成內(nèi)置文件傳輸至主控制模塊，所述標(biāo)準(zhǔn)聲源播放模塊設(shè)置在消音室內(nèi)，用于播放語音語料庫音頻文件，所述麥克風(fēng)采集標(biāo)準(zhǔn)聲源播放模塊播放的標(biāo)準(zhǔn)聲源，并將采集到的信號傳輸給信號采集處理模塊，信號采集處理模塊對信號進(jìn)行處理后傳輸給主控制模塊，主控制模塊對信號進(jìn)行語音合成，并與離線語音合成模塊的內(nèi)置文件進(jìn)行對比，顯示測試數(shù)據(jù)的分析結(jié)果并計算語音識別準(zhǔn)確率。

進(jìn)一步的，所述常規(guī)情景下語音測試模塊包括標(biāo)準(zhǔn)聲源播放模塊、麥克風(fēng)、信號采集處理模塊、主控制模塊和離線語音合成模塊，所述離線語音合成模塊將被測試的語音語料庫的內(nèi)容轉(zhuǎn)換成內(nèi)置文件傳輸至主控制模塊，所述標(biāo)準(zhǔn)聲源播放模塊設(shè)置在常規(guī)使用環(huán)境中，用于播放語音語料庫音頻文件，所述麥克風(fēng)采集標(biāo)準(zhǔn)聲源播放模塊播放的標(biāo)準(zhǔn)聲源，并將采集到的信號傳輸給信號采集處理模塊，信號采集處理模塊對信號進(jìn)行處理后傳輸給主控制模塊，主控制模塊對信號進(jìn)行語音合成，并與離線語音合成模塊的內(nèi)置文件進(jìn)行對比，顯示測試數(shù)據(jù)的分析結(jié)果并計算語音識別準(zhǔn)確率。

進(jìn)一步的，所述麥克風(fēng)包括麥克風(fēng)單體或麥克風(fēng)陣列。

更進(jìn)一步的，所述麥克風(fēng)為駐極體麥克風(fēng)、模擬mems麥克風(fēng)或數(shù)字mems麥克風(fēng)。

本發(fā)明還公開一種基于上述的語音識別測試系統(tǒng)的語音識別測試方法，包括如下步驟：

s1，采用實(shí)時信號測試模塊測試拾取信號的質(zhì)量完整性及電性能參數(shù)是否達(dá)到設(shè)計要求，如果是，則進(jìn)入步驟s2；如果否，則改善實(shí)時信號后重復(fù)步驟s1；

s2，采用錄音質(zhì)量測試模塊測試錄音信號質(zhì)量，確保其與實(shí)時測試信號電性能參數(shù)保持一致，進(jìn)入步驟s3；

s3，采用標(biāo)準(zhǔn)環(huán)境下語音測試模塊測試標(biāo)準(zhǔn)環(huán)境下語音識別率，進(jìn)入步驟s4；

s4，采用常規(guī)情景下語音測試模塊測試常規(guī)使用環(huán)境下語音識別率。

進(jìn)一步的，所述步驟s3中還包括整體在標(biāo)準(zhǔn)測試環(huán)境中對測試標(biāo)準(zhǔn)聲源的錄音質(zhì)量的維度進(jìn)行主觀音質(zhì)評價量化；所述步驟s4中還包括整體在情景交互測試環(huán)境中對測試標(biāo)準(zhǔn)聲源的錄音質(zhì)量的維度進(jìn)行主觀音質(zhì)評價量化。

本發(fā)明的有益技術(shù)效果：

1、方便評估前期單體麥克風(fēng)或陣列麥克風(fēng)模型聲學(xué)模型。

2、系統(tǒng)集成度高，提高測試效率：系統(tǒng)集成度高，包含實(shí)時信號測試、標(biāo)準(zhǔn)環(huán)境下語音測試、常規(guī)情景下語音測試和錄音質(zhì)量測試（兼容信號和語音質(zhì)量），方便各階段的測試數(shù)據(jù)分析，提高了測試效率。

3、提高測試準(zhǔn)確率：從拾取信號質(zhì)量分析到主客觀判定語音測試結(jié)果，整體綜合性強(qiáng)，減少誤差，提高了測試準(zhǔn)確率。

附圖說明

圖1為本發(fā)明具體實(shí)施例的系統(tǒng)結(jié)構(gòu)示意圖；

圖2為本發(fā)明具體實(shí)施例的實(shí)時信號測試模塊的結(jié)構(gòu)示意圖；

圖3為本發(fā)明的實(shí)時信號測試模塊的另一種結(jié)構(gòu)示意圖；

圖4為本發(fā)明具體實(shí)施例的錄音質(zhì)量測試模塊的結(jié)構(gòu)示意圖；

圖5為本發(fā)明具體實(shí)施例的標(biāo)準(zhǔn)環(huán)境下語音測試模塊的結(jié)構(gòu)示意圖；

圖6為本發(fā)明具體實(shí)施例的常規(guī)情景下語音測試模塊的結(jié)構(gòu)示意圖；

圖7為本發(fā)明具體實(shí)施例的方法流程圖；

圖8為本發(fā)明具體實(shí)施例的測試流程圖。

具體實(shí)施方式

現(xiàn)結(jié)合附圖和具體實(shí)施方式對本發(fā)明進(jìn)一步說明。

如圖1-6所示，一種語音識別測試系統(tǒng)，包括主控制模塊1、實(shí)時信號測試模塊2、錄音質(zhì)量測試模塊3、標(biāo)準(zhǔn)環(huán)境下語音測試模塊4和常規(guī)情景下語音測試模塊5，所述實(shí)時信號測試模塊2、錄音質(zhì)量測試模塊3、標(biāo)準(zhǔn)環(huán)境下語音測試模塊4和常規(guī)情景下語音測試模塊5分別與主控制模塊1連接，主控制模塊1控制實(shí)時信號測試模塊2、錄音質(zhì)量測試模塊3、標(biāo)準(zhǔn)環(huán)境下語音測試模塊4和常規(guī)情景下語音測試模塊5按照一定邏輯順序進(jìn)行測試。

本具體實(shí)施例中，主控制模塊1為mcu處理器，其操作系統(tǒng)可以是android或ios操作系統(tǒng)，當(dāng)然，在其它實(shí)施例中，主控制模塊1也可以是單片機(jī)、plc控制器等。

所述實(shí)時信號測試模塊2用于測試拾取信號的質(zhì)量完整性及電性能參數(shù)，得出信號的幅度、失真、信噪比、頻響范圍等參數(shù)，本具體實(shí)施例中，如圖2所示，實(shí)時信號測試模塊2為有線實(shí)時信號測試模塊，包括標(biāo)準(zhǔn)信號源播放模塊21、麥克風(fēng)3、信號采集處理模塊7、主控制模塊1和信號分析儀8，所述標(biāo)準(zhǔn)信號源播放模塊21設(shè)置在消音室內(nèi)，以排除環(huán)境的噪聲，混響，回音，簡正振動等對標(biāo)準(zhǔn)信號的干擾，標(biāo)準(zhǔn)信號源播放模塊21用于播放由主控制模塊1提供的標(biāo)準(zhǔn)信號源，所述麥克風(fēng)6采集標(biāo)準(zhǔn)信號源，并將采集到的信號傳輸給信號采集處理模塊7，信號采集處理模塊7對信號進(jìn)行處理后傳輸給主控制模塊1，主控制模塊1對信號進(jìn)行處理后即轉(zhuǎn)換成audio信號后傳輸給信號分析儀8，信號分析儀8對信號的電性能進(jìn)行數(shù)據(jù)分析，得出信號的幅度，失真，信噪比，頻響范圍等參數(shù)。

當(dāng)然，在其它實(shí)施例中，實(shí)時信號測試模塊2可以為無線實(shí)時信號測試模塊，如圖3所示，包括標(biāo)準(zhǔn)信號源播放模塊21、麥克風(fēng)3、信號采集處理模塊7、rf信號發(fā)射模塊22、rf信號接收模塊23、主控制模塊1和信號分析儀8，所述標(biāo)準(zhǔn)信號源播放模塊21設(shè)置在消音室內(nèi)，以排除環(huán)境的噪聲，混響，回音，簡正振動等對標(biāo)準(zhǔn)信號的干擾，標(biāo)準(zhǔn)信號源播放模塊21用于播放由主控制模塊1提供的標(biāo)準(zhǔn)信號源，所述麥克風(fēng)6采集標(biāo)準(zhǔn)信號源，并將采集到的信號傳輸給信號采集處理模塊7，信號采集處理模塊7對信號進(jìn)行處理后傳輸給rf信號發(fā)射模塊22，rf信號發(fā)射模塊22將信號無線發(fā)射給rf信號接收模塊23，rf信號接收模塊23接收后將信號傳輸給主控制模塊1，主控制模塊1對信號進(jìn)行處理后即轉(zhuǎn)換成audio信號后傳輸給信號分析儀8，信號分析儀8對信號的電性能進(jìn)行數(shù)據(jù)分析，得出信號的幅度，失真，信噪比，頻響范圍等參數(shù)。

所述錄音質(zhì)量測試模塊3用于測試錄音信號質(zhì)量的電性能參，本具體實(shí)施例中，如圖4所示，所述錄音質(zhì)量測試模塊3包括標(biāo)準(zhǔn)信號源/聲源播放模塊31、麥克風(fēng)6、信號采集處理模塊7、主控制模塊1、功放模塊32和信號分析儀8，所述標(biāo)準(zhǔn)信號源/聲源播放模塊31設(shè)置在消音室內(nèi)，用于播放主控制模塊1中存儲的智能合成的語音語料庫音頻文件，所述麥克風(fēng)6采集標(biāo)準(zhǔn)信號源/聲源播放模塊31播放的標(biāo)準(zhǔn)信號源/聲源，并將采集到的信號傳輸給信號采集處理模塊7，信號采集處理模塊7對信號進(jìn)行處理后傳輸給主控制模塊1，主控制模塊1對信號進(jìn)行錄制后將錄音信號傳輸給功放模塊32，功放模塊32對錄音信號進(jìn)行功放后傳輸給信號分析儀8，信號分析儀8對錄音信號的電性能進(jìn)行數(shù)據(jù)分析。

所述標(biāo)準(zhǔn)環(huán)境下語音測試模塊4用于測試標(biāo)準(zhǔn)環(huán)境下語音識別率，本具體實(shí)施例中，如圖5所示，標(biāo)準(zhǔn)環(huán)境下語音測試模塊4包括標(biāo)準(zhǔn)聲源播放模塊41、麥克風(fēng)6、信號采集處理模塊7、主控制模塊1和離線語音合成模塊9，所述離線語音合成模塊9將被測試的語音語料庫的內(nèi)容轉(zhuǎn)換成內(nèi)置文件傳輸至主控制模塊1，所述標(biāo)準(zhǔn)聲源播放模塊41設(shè)置在消音室內(nèi)，用于播放主控制模塊1存儲的被測試的語音語料庫音頻文件，所述麥克風(fēng)6采集標(biāo)準(zhǔn)聲源播放模塊41播放的標(biāo)準(zhǔn)聲源，并將采集到的信號傳輸給信號采集處理模塊7，信號采集處理模塊7對信號進(jìn)行處理后傳輸給主控制模塊1，主控制模塊1對信號進(jìn)行語音合成后與離線語音合成模塊9的內(nèi)置文件進(jìn)行對比，顯示測試數(shù)據(jù)的分析結(jié)果并計算語音識別準(zhǔn)確率。

本具體實(shí)施例中，標(biāo)準(zhǔn)環(huán)境下語音測試模塊4還包括錄音文件播放模塊10，主控制模塊1還對信號進(jìn)行錄音，并將錄音信號傳輸給錄音文件播放模塊10進(jìn)行播放，以進(jìn)行主觀音質(zhì)評價量化。

所述常規(guī)情景下語音測試模塊5用于測試常規(guī)使用環(huán)境下語音識別率，本具體實(shí)施例中，如圖6所示，常規(guī)情景下語音測試模塊5包括標(biāo)準(zhǔn)聲源播放模塊51、麥克風(fēng)6、信號采集處理模塊7、主控制模塊1和離線語音合成模塊9，所述離線語音合成模塊9將被測試的語音語料庫的內(nèi)容轉(zhuǎn)換成內(nèi)置文件傳輸至主控制模塊1，所述標(biāo)準(zhǔn)聲源播放模塊51設(shè)置在常規(guī)使用環(huán)境中，用于播放主控制模塊1存儲的被測試的語音語料庫音頻文件，所述麥克風(fēng)6采集標(biāo)準(zhǔn)聲源播放模塊51播放的標(biāo)準(zhǔn)聲源，并將采集到的信號傳輸給信號采集處理模塊7，信號采集處理模塊7對信號進(jìn)行處理后傳輸給主控制模塊1，主控制模塊1對信號進(jìn)行語音合成，并與離線語音合成模塊9的內(nèi)置文件進(jìn)行對比，顯示測試數(shù)據(jù)的分析結(jié)果并計算語音識別準(zhǔn)確率。

本具體實(shí)施例中，常規(guī)情景下語音測試模塊5還包括錄音文件播放模塊10，主控制模塊1還對信號進(jìn)行錄音，并將錄音信號傳輸給錄音文件播放模塊10進(jìn)行播放，以進(jìn)行主觀音質(zhì)評價量化。

本具體實(shí)施例中，所述麥克風(fēng)6可以是麥克風(fēng)單體或麥克風(fēng)陣列，麥克風(fēng)的類型可以是駐極體麥克風(fēng)、模擬mems麥克風(fēng)或數(shù)字mems麥克風(fēng)。

本具體實(shí)施例中，標(biāo)準(zhǔn)聲源可以可以是人工合成聲源，也可是人聲錄音標(biāo)準(zhǔn)普通話版聲源。

本具體實(shí)施例中，信號分析儀8可以是audioprecision音頻測試分析儀或b&k音頻測試儀等相關(guān)設(shè)備。

本具體實(shí)施例中，信號采集處理模塊7采用現(xiàn)有的信號采集處理芯片，功放模塊32采用現(xiàn)有的功率放大芯片，此是本領(lǐng)域技術(shù)人員可以輕易實(shí)現(xiàn)的，不再詳細(xì)說明。

本具體實(shí)施例中，常規(guī)使用環(huán)境可以是真實(shí)的常規(guī)使用環(huán)境，也可以是在室內(nèi)模擬常規(guī)使用環(huán)境。

本具體實(shí)施例中，標(biāo)準(zhǔn)信號源播放模塊21、標(biāo)準(zhǔn)信號源/聲源播放模塊31、標(biāo)準(zhǔn)聲源播放模塊41和標(biāo)準(zhǔn)聲源播放模塊51采用同一個高保真音響來實(shí)現(xiàn)，高保真音響校準(zhǔn)并根據(jù)所需音量進(jìn)行播放。當(dāng)然，在其它實(shí)施例中，也可以采用人工嘴來實(shí)現(xiàn)。錄音文件播放模塊10為高保真音響。

本具體實(shí)施例中，測試中可自由對被測麥克風(fēng)6的位置進(jìn)行變動。

如圖7所示，本發(fā)明還公開一種基于上述的語音識別測試系統(tǒng)的語音識別測試方法，包括如下步驟：

s1，采用實(shí)時信號測試模塊測試拾取信號的質(zhì)量完整性及電性能參數(shù)，包括幅度，失真，信噪比，頻響范圍等參數(shù)是否達(dá)到設(shè)計要求，如果是，則進(jìn)入步驟s2；如果否，則改善實(shí)時信號后重復(fù)步驟s1。

本步驟主要是確定測試系統(tǒng)的拾取信號線路是否完整，還原的波形是否異常，信號的完整的電性能測試否達(dá)到設(shè)計標(biāo)準(zhǔn)等環(huán)節(jié)定義拾音信號的質(zhì)量，為后續(xù)標(biāo)準(zhǔn)化測試做優(yōu)先平臺，從而提高測試準(zhǔn)確度。

s2，采用錄音質(zhì)量測試模塊測試錄音信號質(zhì)量，確保其與實(shí)時測試信號電性能參數(shù)保持一致，進(jìn)入步驟s3。

錄音質(zhì)量測試綜合反饋測試系統(tǒng)的錄制信號完整性，信號處理，信號質(zhì)量并對比實(shí)時信號參考要求，確認(rèn)錄音信號質(zhì)量與實(shí)時測試信號電性能參數(shù)保持一致

通過錄音信號質(zhì)量與實(shí)時信號質(zhì)量進(jìn)行對比，確認(rèn)錄音信號的電性能達(dá)到與實(shí)時信號電性能同樣的設(shè)計要求，另外通過對錄音的標(biāo)準(zhǔn)聲源進(jìn)行主觀音質(zhì)評價維度，綜合了主觀和客觀的數(shù)據(jù)分析。

s3，采用標(biāo)準(zhǔn)環(huán)境下語音測試模塊測試標(biāo)準(zhǔn)環(huán)境下語音識別率，進(jìn)入步驟s4。

具體的，本步驟的測試環(huán)境仍定義在消音室內(nèi)，主要目的是確認(rèn)標(biāo)準(zhǔn)環(huán)境下語音識別率，其結(jié)果可參照常規(guī)情境下測試的語音識別率作對比，為后續(xù)優(yōu)化語音識別或提高準(zhǔn)確提供參考依據(jù)，同時整體在標(biāo)準(zhǔn)測試環(huán)境中對測試標(biāo)準(zhǔn)聲源的錄音質(zhì)量的維度進(jìn)行主觀音質(zhì)評價量化。

s4，采用常規(guī)情景下語音測試模塊測試常規(guī)使用環(huán)境下語音識別率。

具體的，模擬常規(guī)使用環(huán)境測試，考慮室內(nèi)噪聲，混響，回音，簡正振動等因素，確認(rèn)其語音識別率，及結(jié)果更加偏向用戶使用模式，同時整體在情景交互測試環(huán)境中對測試標(biāo)準(zhǔn)聲源的錄音質(zhì)量的維度進(jìn)行主觀音質(zhì)評價量化。

具體測試流程圖可以參見圖8，此不再細(xì)說。

通過以上四個步驟測試對信號數(shù)據(jù)分析，并結(jié)合主觀音質(zhì)考評進(jìn)一步提高語音識別測試準(zhǔn)確率。

本發(fā)明同樣適用于在線語音識別測試，即聯(lián)網(wǎng)推送云端

盡管結(jié)合優(yōu)選實(shí)施方案具體展示和介紹了本發(fā)明，但所屬領(lǐng)域的技術(shù)人員應(yīng)該明白，在不脫離所附權(quán)利要求書所限定的本發(fā)明的精神和范圍內(nèi)，在形式上和細(xì)節(jié)上可以對本發(fā)明做出各種變化，均為本發(fā)明的保護(hù)范圍。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2