本發(fā)明屬于語音識別領(lǐng)域,具體地涉及一種語音識別測試系統(tǒng)和方法。
背景技術(shù):
語音交互是目前ai近年來發(fā)展速度較快的一種,它脫離常規(guī)的人與機(jī)器界面交互的方式,語音智能的產(chǎn)品在國內(nèi)外不斷的升溫,占據(jù)了市場上不小的份額,而語音識別測試繁冗而復(fù)雜,涉及各方面的因素較多,特別是針對前期麥克風(fēng)拾音方位、喚醒,回音消噪、背景消噪聲紋識別等評估。然而現(xiàn)有的語音識別測試系統(tǒng)功能都較單一,要完成整個語音識別測試則需要用到許多測試系統(tǒng),使得整個測試流程復(fù)雜繁瑣,操作麻煩,測試效率低,且測試不夠系統(tǒng)全面,測試準(zhǔn)確率較低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明目的在于為解決上述問題而提供一種系統(tǒng)集成度高,使整個測試流程操作簡便,測試效率高,測試系統(tǒng)全面,提高測試準(zhǔn)確率的語音識別測試系統(tǒng)和方法。
為此,本發(fā)明公開了一種語音識別測試系統(tǒng),包括主控制模塊、實(shí)時信號測試模塊、錄音質(zhì)量測試模塊、標(biāo)準(zhǔn)環(huán)境下語音測試模塊和常規(guī)情景下語音測試模塊,所述實(shí)時信號測試模塊、錄音質(zhì)量測試模塊、標(biāo)準(zhǔn)環(huán)境下語音測試模塊和常規(guī)情景下語音測試模塊分別與主控制模塊連接,所述實(shí)時信號測試模塊用于測試拾取信號的質(zhì)量完整性及電性能參數(shù),所述錄音質(zhì)量測試模塊用于測試錄音信號質(zhì)量的電性能參,所述標(biāo)準(zhǔn)環(huán)境下語音測試模塊用于測試標(biāo)準(zhǔn)環(huán)境下語音識別率,所述常規(guī)情景下語音測試模塊用于測試常規(guī)使用環(huán)境下語音識別率。
進(jìn)一步的,所述實(shí)時信號測試模塊包括標(biāo)準(zhǔn)信號源播放模塊、麥克風(fēng)、信號采集處理模塊、主控制模塊和信號分析儀,所述標(biāo)準(zhǔn)信號源播放模塊設(shè)置在消音室內(nèi),用于播放標(biāo)準(zhǔn)信號聲源,所述麥克風(fēng)采集標(biāo)準(zhǔn)信號源,并將采集到的信號傳輸給信號采集處理模塊,信號采集處理模塊對信號進(jìn)行處理后傳輸給主控制模塊,主控制模塊對信號進(jìn)行處理后傳輸給信號分析儀,信號分析儀對信號的電性能進(jìn)行數(shù)據(jù)分析。
更進(jìn)一步的,所述信號采集處理模塊通過有線或無線與主控制模塊通信連接。
進(jìn)一步的,所述錄音質(zhì)量測試模塊包括標(biāo)準(zhǔn)信號源/聲源播放模塊、麥克風(fēng)、信號采集處理模塊、主控制模塊、功放模塊和信號分析儀,所述標(biāo)準(zhǔn)信號源/聲源播放模塊設(shè)置在消音室內(nèi),用于播放智能合成的語音語料庫音頻文件,所述麥克風(fēng)采集標(biāo)準(zhǔn)信號源/聲源播放模塊播放的標(biāo)準(zhǔn)信號源/聲源,并將采集到的信號傳輸給信號采集處理模塊,信號采集處理模塊對信號進(jìn)行處理后傳輸給主控制模塊,主控制模塊對信號進(jìn)行錄制后將錄音信號傳輸給功放模塊,功放模塊對錄音信號進(jìn)行功放后傳輸給信號分析儀,信號分析儀對錄音信號的電性能進(jìn)行數(shù)據(jù)分析。
進(jìn)一步的,所述標(biāo)準(zhǔn)環(huán)境下語音測試模塊包括標(biāo)準(zhǔn)聲源播放模塊、麥克風(fēng)、信號采集處理模塊、主控制模塊和離線語音合成模塊,所述離線語音合成模塊將被測試的語音語料庫的內(nèi)容轉(zhuǎn)換成內(nèi)置文件傳輸至主控制模塊,所述標(biāo)準(zhǔn)聲源播放模塊設(shè)置在消音室內(nèi),用于播放語音語料庫音頻文件,所述麥克風(fēng)采集標(biāo)準(zhǔn)聲源播放模塊播放的標(biāo)準(zhǔn)聲源,并將采集到的信號傳輸給信號采集處理模塊,信號采集處理模塊對信號進(jìn)行處理后傳輸給主控制模塊,主控制模塊對信號進(jìn)行語音合成,并與離線語音合成模塊的內(nèi)置文件進(jìn)行對比,顯示測試數(shù)據(jù)的分析結(jié)果并計算語音識別準(zhǔn)確率。
進(jìn)一步的,所述常規(guī)情景下語音測試模塊包括標(biāo)準(zhǔn)聲源播放模塊、麥克風(fēng)、信號采集處理模塊、主控制模塊和離線語音合成模塊,所述離線語音合成模塊將被測試的語音語料庫的內(nèi)容轉(zhuǎn)換成內(nèi)置文件傳輸至主控制模塊,所述標(biāo)準(zhǔn)聲源播放模塊設(shè)置在常規(guī)使用環(huán)境中,用于播放語音語料庫音頻文件,所述麥克風(fēng)采集標(biāo)準(zhǔn)聲源播放模塊播放的標(biāo)準(zhǔn)聲源,并將采集到的信號傳輸給信號采集處理模塊,信號采集處理模塊對信號進(jìn)行處理后傳輸給主控制模塊,主控制模塊對信號進(jìn)行語音合成,并與離線語音合成模塊的內(nèi)置文件進(jìn)行對比,顯示測試數(shù)據(jù)的分析結(jié)果并計算語音識別準(zhǔn)確率。
進(jìn)一步的,所述麥克風(fēng)包括麥克風(fēng)單體或麥克風(fēng)陣列。
更進(jìn)一步的,所述麥克風(fēng)為駐極體麥克風(fēng)、模擬mems麥克風(fēng)或數(shù)字mems麥克風(fēng)。
本發(fā)明還公開一種基于上述的語音識別測試系統(tǒng)的語音識別測試方法,包括如下步驟:
s1,采用實(shí)時信號測試模塊測試拾取信號的質(zhì)量完整性及電性能參數(shù)是否達(dá)到設(shè)計要求,如果是,則進(jìn)入步驟s2;如果否,則改善實(shí)時信號后重復(fù)步驟s1;
s2,采用錄音質(zhì)量測試模塊測試錄音信號質(zhì)量,確保其與實(shí)時測試信號電性能參數(shù)保持一致,進(jìn)入步驟s3;
s3,采用標(biāo)準(zhǔn)環(huán)境下語音測試模塊測試標(biāo)準(zhǔn)環(huán)境下語音識別率,進(jìn)入步驟s4;
s4,采用常規(guī)情景下語音測試模塊測試常規(guī)使用環(huán)境下語音識別率。
進(jìn)一步的,所述步驟s3中還包括整體在標(biāo)準(zhǔn)測試環(huán)境中對測試標(biāo)準(zhǔn)聲源的錄音質(zhì)量的維度進(jìn)行主觀音質(zhì)評價量化;所述步驟s4中還包括整體在情景交互測試環(huán)境中對測試標(biāo)準(zhǔn)聲源的錄音質(zhì)量的維度進(jìn)行主觀音質(zhì)評價量化。
本發(fā)明的有益技術(shù)效果:
1、方便評估前期單體麥克風(fēng)或陣列麥克風(fēng)模型聲學(xué)模型。
2、系統(tǒng)集成度高,提高測試效率:系統(tǒng)集成度高,包含實(shí)時信號測試、標(biāo)準(zhǔn)環(huán)境下語音測試、常規(guī)情景下語音測試和錄音質(zhì)量測試(兼容信號和語音質(zhì)量),方便各階段的測試數(shù)據(jù)分析,提高了測試效率。
3、提高測試準(zhǔn)確率:從拾取信號質(zhì)量分析到主客觀判定語音測試結(jié)果,整體綜合性強(qiáng),減少誤差,提高了測試準(zhǔn)確率。
附圖說明
圖1為本發(fā)明具體實(shí)施例的系統(tǒng)結(jié)構(gòu)示意圖;
圖2為本發(fā)明具體實(shí)施例的實(shí)時信號測試模塊的結(jié)構(gòu)示意圖;
圖3為本發(fā)明的實(shí)時信號測試模塊的另一種結(jié)構(gòu)示意圖;
圖4為本發(fā)明具體實(shí)施例的錄音質(zhì)量測試模塊的結(jié)構(gòu)示意圖;
圖5為本發(fā)明具體實(shí)施例的標(biāo)準(zhǔn)環(huán)境下語音測試模塊的結(jié)構(gòu)示意圖;
圖6為本發(fā)明具體實(shí)施例的常規(guī)情景下語音測試模塊的結(jié)構(gòu)示意圖;
圖7為本發(fā)明具體實(shí)施例的方法流程圖;
圖8為本發(fā)明具體實(shí)施例的測試流程圖。
具體實(shí)施方式
現(xiàn)結(jié)合附圖和具體實(shí)施方式對本發(fā)明進(jìn)一步說明。
如圖1-6所示,一種語音識別測試系統(tǒng),包括主控制模塊1、實(shí)時信號測試模塊2、錄音質(zhì)量測試模塊3、標(biāo)準(zhǔn)環(huán)境下語音測試模塊4和常規(guī)情景下語音測試模塊5,所述實(shí)時信號測試模塊2、錄音質(zhì)量測試模塊3、標(biāo)準(zhǔn)環(huán)境下語音測試模塊4和常規(guī)情景下語音測試模塊5分別與主控制模塊1連接,主控制模塊1控制實(shí)時信號測試模塊2、錄音質(zhì)量測試模塊3、標(biāo)準(zhǔn)環(huán)境下語音測試模塊4和常規(guī)情景下語音測試模塊5按照一定邏輯順序進(jìn)行測試。
本具體實(shí)施例中,主控制模塊1為mcu處理器,其操作系統(tǒng)可以是android或ios操作系統(tǒng),當(dāng)然,在其它實(shí)施例中,主控制模塊1也可以是單片機(jī)、plc控制器等。
所述實(shí)時信號測試模塊2用于測試拾取信號的質(zhì)量完整性及電性能參數(shù),得出信號的幅度、失真、信噪比、頻響范圍等參數(shù),本具體實(shí)施例中,如圖2所示,實(shí)時信號測試模塊2為有線實(shí)時信號測試模塊,包括標(biāo)準(zhǔn)信號源播放模塊21、麥克風(fēng)3、信號采集處理模塊7、主控制模塊1和信號分析儀8,所述標(biāo)準(zhǔn)信號源播放模塊21設(shè)置在消音室內(nèi),以排除環(huán)境的噪聲,混響,回音,簡正振動等對標(biāo)準(zhǔn)信號的干擾,標(biāo)準(zhǔn)信號源播放模塊21用于播放由主控制模塊1提供的標(biāo)準(zhǔn)信號源,所述麥克風(fēng)6采集標(biāo)準(zhǔn)信號源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進(jìn)行處理后傳輸給主控制模塊1,主控制模塊1對信號進(jìn)行處理后即轉(zhuǎn)換成audio信號后傳輸給信號分析儀8,信號分析儀8對信號的電性能進(jìn)行數(shù)據(jù)分析,得出信號的幅度,失真,信噪比,頻響范圍等參數(shù)。
當(dāng)然,在其它實(shí)施例中,實(shí)時信號測試模塊2可以為無線實(shí)時信號測試模塊,如圖3所示,包括標(biāo)準(zhǔn)信號源播放模塊21、麥克風(fēng)3、信號采集處理模塊7、rf信號發(fā)射模塊22、rf信號接收模塊23、主控制模塊1和信號分析儀8,所述標(biāo)準(zhǔn)信號源播放模塊21設(shè)置在消音室內(nèi),以排除環(huán)境的噪聲,混響,回音,簡正振動等對標(biāo)準(zhǔn)信號的干擾,標(biāo)準(zhǔn)信號源播放模塊21用于播放由主控制模塊1提供的標(biāo)準(zhǔn)信號源,所述麥克風(fēng)6采集標(biāo)準(zhǔn)信號源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進(jìn)行處理后傳輸給rf信號發(fā)射模塊22,rf信號發(fā)射模塊22將信號無線發(fā)射給rf信號接收模塊23,rf信號接收模塊23接收后將信號傳輸給主控制模塊1,主控制模塊1對信號進(jìn)行處理后即轉(zhuǎn)換成audio信號后傳輸給信號分析儀8,信號分析儀8對信號的電性能進(jìn)行數(shù)據(jù)分析,得出信號的幅度,失真,信噪比,頻響范圍等參數(shù)。
所述錄音質(zhì)量測試模塊3用于測試錄音信號質(zhì)量的電性能參,本具體實(shí)施例中,如圖4所示,所述錄音質(zhì)量測試模塊3包括標(biāo)準(zhǔn)信號源/聲源播放模塊31、麥克風(fēng)6、信號采集處理模塊7、主控制模塊1、功放模塊32和信號分析儀8,所述標(biāo)準(zhǔn)信號源/聲源播放模塊31設(shè)置在消音室內(nèi),用于播放主控制模塊1中存儲的智能合成的語音語料庫音頻文件,所述麥克風(fēng)6采集標(biāo)準(zhǔn)信號源/聲源播放模塊31播放的標(biāo)準(zhǔn)信號源/聲源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進(jìn)行處理后傳輸給主控制模塊1,主控制模塊1對信號進(jìn)行錄制后將錄音信號傳輸給功放模塊32,功放模塊32對錄音信號進(jìn)行功放后傳輸給信號分析儀8,信號分析儀8對錄音信號的電性能進(jìn)行數(shù)據(jù)分析。
所述標(biāo)準(zhǔn)環(huán)境下語音測試模塊4用于測試標(biāo)準(zhǔn)環(huán)境下語音識別率,本具體實(shí)施例中,如圖5所示,標(biāo)準(zhǔn)環(huán)境下語音測試模塊4包括標(biāo)準(zhǔn)聲源播放模塊41、麥克風(fēng)6、信號采集處理模塊7、主控制模塊1和離線語音合成模塊9,所述離線語音合成模塊9將被測試的語音語料庫的內(nèi)容轉(zhuǎn)換成內(nèi)置文件傳輸至主控制模塊1,所述標(biāo)準(zhǔn)聲源播放模塊41設(shè)置在消音室內(nèi),用于播放主控制模塊1存儲的被測試的語音語料庫音頻文件,所述麥克風(fēng)6采集標(biāo)準(zhǔn)聲源播放模塊41播放的標(biāo)準(zhǔn)聲源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進(jìn)行處理后傳輸給主控制模塊1,主控制模塊1對信號進(jìn)行語音合成后與離線語音合成模塊9的內(nèi)置文件進(jìn)行對比,顯示測試數(shù)據(jù)的分析結(jié)果并計算語音識別準(zhǔn)確率。
本具體實(shí)施例中,標(biāo)準(zhǔn)環(huán)境下語音測試模塊4還包括錄音文件播放模塊10,主控制模塊1還對信號進(jìn)行錄音,并將錄音信號傳輸給錄音文件播放模塊10進(jìn)行播放,以進(jìn)行主觀音質(zhì)評價量化。
所述常規(guī)情景下語音測試模塊5用于測試常規(guī)使用環(huán)境下語音識別率,本具體實(shí)施例中,如圖6所示,常規(guī)情景下語音測試模塊5包括標(biāo)準(zhǔn)聲源播放模塊51、麥克風(fēng)6、信號采集處理模塊7、主控制模塊1和離線語音合成模塊9,所述離線語音合成模塊9將被測試的語音語料庫的內(nèi)容轉(zhuǎn)換成內(nèi)置文件傳輸至主控制模塊1,所述標(biāo)準(zhǔn)聲源播放模塊51設(shè)置在常規(guī)使用環(huán)境中,用于播放主控制模塊1存儲的被測試的語音語料庫音頻文件,所述麥克風(fēng)6采集標(biāo)準(zhǔn)聲源播放模塊51播放的標(biāo)準(zhǔn)聲源,并將采集到的信號傳輸給信號采集處理模塊7,信號采集處理模塊7對信號進(jìn)行處理后傳輸給主控制模塊1,主控制模塊1對信號進(jìn)行語音合成,并與離線語音合成模塊9的內(nèi)置文件進(jìn)行對比,顯示測試數(shù)據(jù)的分析結(jié)果并計算語音識別準(zhǔn)確率。
本具體實(shí)施例中,常規(guī)情景下語音測試模塊5還包括錄音文件播放模塊10,主控制模塊1還對信號進(jìn)行錄音,并將錄音信號傳輸給錄音文件播放模塊10進(jìn)行播放,以進(jìn)行主觀音質(zhì)評價量化。
本具體實(shí)施例中,所述麥克風(fēng)6可以是麥克風(fēng)單體或麥克風(fēng)陣列,麥克風(fēng)的類型可以是駐極體麥克風(fēng)、模擬mems麥克風(fēng)或數(shù)字mems麥克風(fēng)。
本具體實(shí)施例中,標(biāo)準(zhǔn)聲源可以可以是人工合成聲源,也可是人聲錄音標(biāo)準(zhǔn)普通話版聲源。
本具體實(shí)施例中,信號分析儀8可以是audioprecision音頻測試分析儀或b&k音頻測試儀等相關(guān)設(shè)備。
本具體實(shí)施例中,信號采集處理模塊7采用現(xiàn)有的信號采集處理芯片,功放模塊32采用現(xiàn)有的功率放大芯片,此是本領(lǐng)域技術(shù)人員可以輕易實(shí)現(xiàn)的,不再詳細(xì)說明。
本具體實(shí)施例中,常規(guī)使用環(huán)境可以是真實(shí)的常規(guī)使用環(huán)境,也可以是在室內(nèi)模擬常規(guī)使用環(huán)境。
本具體實(shí)施例中,標(biāo)準(zhǔn)信號源播放模塊21、標(biāo)準(zhǔn)信號源/聲源播放模塊31、標(biāo)準(zhǔn)聲源播放模塊41和標(biāo)準(zhǔn)聲源播放模塊51采用同一個高保真音響來實(shí)現(xiàn),高保真音響校準(zhǔn)并根據(jù)所需音量進(jìn)行播放。當(dāng)然,在其它實(shí)施例中,也可以采用人工嘴來實(shí)現(xiàn)。錄音文件播放模塊10為高保真音響。
本具體實(shí)施例中,測試中可自由對被測麥克風(fēng)6的位置進(jìn)行變動。
如圖7所示,本發(fā)明還公開一種基于上述的語音識別測試系統(tǒng)的語音識別測試方法,包括如下步驟:
s1,采用實(shí)時信號測試模塊測試拾取信號的質(zhì)量完整性及電性能參數(shù),包括幅度,失真,信噪比,頻響范圍等參數(shù)是否達(dá)到設(shè)計要求,如果是,則進(jìn)入步驟s2;如果否,則改善實(shí)時信號后重復(fù)步驟s1。
本步驟主要是確定測試系統(tǒng)的拾取信號線路是否完整,還原的波形是否異常,信號的完整的電性能測試否達(dá)到設(shè)計標(biāo)準(zhǔn)等環(huán)節(jié)定義拾音信號的質(zhì)量,為后續(xù)標(biāo)準(zhǔn)化測試做優(yōu)先平臺,從而提高測試準(zhǔn)確度。
s2,采用錄音質(zhì)量測試模塊測試錄音信號質(zhì)量,確保其與實(shí)時測試信號電性能參數(shù)保持一致,進(jìn)入步驟s3。
錄音質(zhì)量測試綜合反饋測試系統(tǒng)的錄制信號完整性,信號處理,信號質(zhì)量并對比實(shí)時信號參考要求,確認(rèn)錄音信號質(zhì)量與實(shí)時測試信號電性能參數(shù)保持一致
通過錄音信號質(zhì)量與實(shí)時信號質(zhì)量進(jìn)行對比,確認(rèn)錄音信號的電性能達(dá)到與實(shí)時信號電性能同樣的設(shè)計要求,另外通過對錄音的標(biāo)準(zhǔn)聲源進(jìn)行主觀音質(zhì)評價維度,綜合了主觀和客觀的數(shù)據(jù)分析。
s3,采用標(biāo)準(zhǔn)環(huán)境下語音測試模塊測試標(biāo)準(zhǔn)環(huán)境下語音識別率,進(jìn)入步驟s4。
具體的,本步驟的測試環(huán)境仍定義在消音室內(nèi),主要目的是確認(rèn)標(biāo)準(zhǔn)環(huán)境下語音識別率,其結(jié)果可參照常規(guī)情境下測試的語音識別率作對比,為后續(xù)優(yōu)化語音識別或提高準(zhǔn)確提供參考依據(jù),同時整體在標(biāo)準(zhǔn)測試環(huán)境中對測試標(biāo)準(zhǔn)聲源的錄音質(zhì)量的維度進(jìn)行主觀音質(zhì)評價量化。
s4,采用常規(guī)情景下語音測試模塊測試常規(guī)使用環(huán)境下語音識別率。
具體的,模擬常規(guī)使用環(huán)境測試,考慮室內(nèi)噪聲,混響,回音,簡正振動等因素,確認(rèn)其語音識別率,及結(jié)果更加偏向用戶使用模式,同時整體在情景交互測試環(huán)境中對測試標(biāo)準(zhǔn)聲源的錄音質(zhì)量的維度進(jìn)行主觀音質(zhì)評價量化。
具體測試流程圖可以參見圖8,此不再細(xì)說。
通過以上四個步驟測試對信號數(shù)據(jù)分析,并結(jié)合主觀音質(zhì)考評進(jìn)一步提高語音識別測試準(zhǔn)確率。
本發(fā)明同樣適用于在線語音識別測試,即聯(lián)網(wǎng)推送云端
盡管結(jié)合優(yōu)選實(shí)施方案具體展示和介紹了本發(fā)明,但所屬領(lǐng)域的技術(shù)人員應(yīng)該明白,在不脫離所附權(quán)利要求書所限定的本發(fā)明的精神和范圍內(nèi),在形式上和細(xì)節(jié)上可以對本發(fā)明做出各種變化,均為本發(fā)明的保護(hù)范圍。