本發(fā)明涉及音頻處理的,更具體地,涉及一種語音數(shù)據(jù)的片段劃分方法、語音片段語音評價方法、語音評價方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、隨著智能語音技術(shù)的發(fā)展,智能語音技術(shù)被應(yīng)用于各個領(lǐng)域,尤其是教學(xué)場景。在教學(xué)場景中,通過智能語音技術(shù)對學(xué)生的口語發(fā)音進(jìn)行評測,得出學(xué)生的發(fā)音評價。同樣地,也能夠?qū)蠋煹目谡Z發(fā)音進(jìn)行評測,得出老師的發(fā)音評價。
2、然而,上述的這類對發(fā)音進(jìn)行評價的方式幾乎都被集中應(yīng)用于專門的考試當(dāng)中,對于老師來說,平時上課時候的口語發(fā)音更為重要,更影響上課質(zhì)量。
3、因此,急需一套在普通的口語發(fā)音評價裝置的基礎(chǔ)之上的能用于對老師上課時候的口語發(fā)音進(jìn)行評價的方法。
技術(shù)實現(xiàn)思路
1、本發(fā)明為克服上述現(xiàn)有技術(shù)中的至少一種的缺陷,提供一種語音數(shù)據(jù)的片段劃分方法、語音片段語音評價方法、語音評價方法、裝置、設(shè)備及存儲介質(zhì),本發(fā)明采用的技術(shù)方案如下。
2、第一方面,本發(fā)明提供一種語音數(shù)據(jù)的片段劃分方法,包括:
3、接收語音數(shù)據(jù);
4、獲取預(yù)先定義的語音停頓間隔時長范圍;
5、基于所述語音停頓間隔時長范圍,查找出所述語音數(shù)據(jù)中的語音停頓位置;
6、根據(jù)所述語音停頓位置對所述語音數(shù)據(jù)進(jìn)行分割,得到各獨(dú)立的語音片段。
7、在一種實施方式中,還包括:
8、對各語音片段進(jìn)行字?jǐn)?shù)統(tǒng)計;
9、在單個語音片段的字?jǐn)?shù)少于預(yù)設(shè)閾值時,將字?jǐn)?shù)少于預(yù)設(shè)閾值的語音片段與相鄰的語音片段合并,重新生成語音片段,以使得所有語音片段的字?jǐn)?shù)均不少于預(yù)設(shè)閾值。
10、在一種實施方式中,所述預(yù)設(shè)閾值為300到500字。
11、第二方面,本發(fā)明提供一種語音片段語音評價方法,包括:
12、獲取語音片段;
13、將語音片段送入語音評估模型,得到語音片段中各個語句的語句評估得分;
14、根據(jù)語音片段的總字?jǐn)?shù)以及各個語句的字?jǐn)?shù),得出各個語句的權(quán)重;
15、根據(jù)各個語句的語句評估得分和各個語句的權(quán)重,得到語音片段的評價結(jié)果。
16、在一種實施方式中,所述根據(jù)語音片段的總字?jǐn)?shù)以及各個語句的字?jǐn)?shù),得出各個語句的權(quán)重的過程,包括:
17、計算各個語句的字?jǐn)?shù)在語音片段的總字?jǐn)?shù)中的占比;
18、根據(jù)各個語句的字?jǐn)?shù)在語音片段的總字?jǐn)?shù)中的占比,得出各個語句的權(quán)重。
19、第三方面,本發(fā)明提供一種語音評價方法,包括:
20、接收語音數(shù)據(jù);
21、利用前面所述的語音數(shù)據(jù)的片段劃分方法對接收到的語音數(shù)據(jù)進(jìn)行劃分,得到各語音片段;
22、利用前面所述的語音片段語音評價方法對各語音片段進(jìn)行評價,得到各個語音片段的評價結(jié)果;
23、根據(jù)語音數(shù)據(jù)的總字?jǐn)?shù)以及各個語音片段的字?jǐn)?shù),得出各個語音片段的權(quán)重;
24、根據(jù)各個語音片段的評價結(jié)果和各個語音片段的權(quán)重,得到語音數(shù)據(jù)的評價結(jié)果。
25、在一種實施方式中,所述根據(jù)語音數(shù)據(jù)的總字?jǐn)?shù)以及各個語音片段的字?jǐn)?shù),得出各個語音片段的權(quán)重的過程,包括:
26、計算各個語音片段的字?jǐn)?shù)在語音數(shù)據(jù)的總字?jǐn)?shù)中的占比;
27、根據(jù)各個語音片段的字?jǐn)?shù)在語音數(shù)據(jù)的總字?jǐn)?shù)中的占比,得出各個語音片段的權(quán)重。
28、第四方面,本發(fā)明提供一種語音數(shù)據(jù)的片段劃分裝置,包括:
29、獲取模塊,用于接收語音數(shù)據(jù),以及獲取預(yù)先定義的語音停頓間隔時長范圍;
30、查找模塊,用于基于所述語音停頓間隔時長范圍,查找出所述語音數(shù)據(jù)中的語音停頓位置;
31、分割模塊,用于根據(jù)所述語音停頓位置對所述語音數(shù)據(jù)進(jìn)行分割,得到各獨(dú)立的語音片段。
32、第五方面,本發(fā)明提供一種語音片段語音評價裝置,包括:
33、獲取模塊,用于獲取語音片段;
34、評估模塊,用于將語音片段送入語音評估模型,得到語音片段中各個語句的語句評估得分;
35、計算模塊,用于根據(jù)語音片段的總字?jǐn)?shù)以及各個語句的字?jǐn)?shù),得出各個語句的權(quán)重;
36、生成模塊,用于根據(jù)各個語句的語句評估得分和各個語句的權(quán)重,得到語音片段的評價結(jié)果。
37、第六方面,本發(fā)明提供一種語音評價裝置,包括:
38、接收模塊,用于接收語音數(shù)據(jù);
39、劃分模塊,用于利用前面所述的語音數(shù)據(jù)的片段劃分裝置對接收到的語音數(shù)據(jù)進(jìn)行劃分,得到各語音片段;
40、片段評價模塊,用于利用前面所述的語音片段語音評價裝置對各語音片段進(jìn)行評價,得到各個語音片段的評價結(jié)果;
41、計算模塊,用于根據(jù)語音數(shù)據(jù)的總字?jǐn)?shù)以及各個語音片段的字?jǐn)?shù),得出各個語音片段的權(quán)重;
42、生成模塊,用于根據(jù)各個語音片段的評價結(jié)果和各個語音片段的權(quán)重,得到語音數(shù)據(jù)的評價結(jié)果。
43、第七方面,本發(fā)明提供一種計算機(jī)設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計算機(jī)程序,所述處理器執(zhí)行所述程序時實現(xiàn)上述任一實施方式的方法。
44、第八方面,本發(fā)明提供一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)上述任一實施方式的方法。
45、本發(fā)明中,利用語音停頓間隔對音頻數(shù)據(jù)進(jìn)行分割,模擬自然語言的斷句,得到的音頻片段更自然,更加符合語音評測裝置中對語句的要求,并針對教學(xué)場景下老師說出的語句之間長短差異比較大的問題,根據(jù)語句的長度,對每個語句都賦予了對應(yīng)的權(quán)重,根據(jù)各個語句的權(quán)重得到語音片段的得分,最后針對分割方法會存在語音片段之間長短差異比較大的問題,根據(jù)語音片段的長度,對每個語音片段都賦予了對應(yīng)的權(quán)重,最終根據(jù)各個語音片段的權(quán)重得到語音數(shù)據(jù)的得分。本發(fā)明適用于普通的口語發(fā)音評價裝置,并且最終的語音評價更加準(zhǔn)確,更加符合教學(xué)等場景下對教室口語發(fā)音的要求。
1.一種語音數(shù)據(jù)的片段劃分方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的語音數(shù)據(jù)的片段劃分方法,其特征在于,還包括:
3.根據(jù)權(quán)利要求2所述的語音數(shù)據(jù)的片段劃分方法,其特征在于,所述預(yù)設(shè)閾值為300到500字。
4.一種語音片段語音評價方法,其特征在于,包括:
5.根據(jù)權(quán)利要求4所述的語音片段語音評價方法,其特征在于,所述根據(jù)語音片段的總字?jǐn)?shù)以及各個語句的字?jǐn)?shù),得出各個語句的權(quán)重的過程,包括:
6.一種語音評價方法,其特征在于,包括:
7.根據(jù)權(quán)利要求6所述的語音評價方法,其特征在于,所述根據(jù)語音數(shù)據(jù)的總字?jǐn)?shù)以及各個語音片段的字?jǐn)?shù),得出各個語音片段的權(quán)重的過程,包括:
8.一種語音數(shù)據(jù)的片段劃分裝置,其特征在于,包括:
9.一種語音片段語音評價裝置,其特征在于,包括:
10.一種語音評價裝置,其特征在于,包括:
11.一種計算機(jī)設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1-7中任一所述的方法。
12.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-7中任一所述的方法。