本發(fā)明涉及車輛控制,尤其涉及一種聲音混合方法、裝置、設備及存儲介質(zhì)。
背景技術:
1、無麥k歌是一種利用車輛原裝音頻采集器(如麥克風,簡稱為mic)替代手持mic進行車載k歌的方式,車輛根據(jù)配置會存在雙mic或多mic的配置。而由于車內(nèi)空間小,在有人k歌,而其他人交談的情況下,全部聲音都會通過成員對應區(qū)域的mic拾音并進行混音播放,會影響k歌效果,降低用戶的實際使用體驗。
技術實現(xiàn)思路
1、本發(fā)明的主要目的在于提供一種聲音混合方法、裝置、設備及存儲介質(zhì),旨在解決現(xiàn)有技術無法區(qū)分歌聲與無關噪聲,統(tǒng)一進行混音播放,導致用戶使用體驗差的技術問題。
2、為實現(xiàn)上述目的,本發(fā)明提供了一種聲音混合方法,所述方法包括以下步驟:
3、獲取車內(nèi)各音區(qū)對應的音頻數(shù)據(jù),并獲取各音區(qū)中音區(qū)成員的行為特征信息;
4、根據(jù)所述音頻數(shù)據(jù)及所述行為特征信息確定各音區(qū)對應的混音音量;
5、基于所述混音音量對各音區(qū)的音頻數(shù)據(jù)進行聲音混合。
6、可選的,所述根據(jù)所述音頻數(shù)據(jù)及所述行為特征信息確定各音區(qū)對應的混音音量的步驟,包括:
7、獲取音樂伴奏和音樂歌詞;
8、根據(jù)所述音頻數(shù)據(jù),以及所述音樂伴奏和所述音樂歌詞確定各音區(qū)對應的匹配度分值;
9、根據(jù)所述行為特征信息確定各音區(qū)對應的成員參與意愿;
10、根據(jù)所述匹配度分值及所述成員參與意愿為各音區(qū)設置對應的混音音量。
11、可選的,所述根據(jù)所述音頻數(shù)據(jù),以及所述音樂伴奏和所述音樂歌詞確定各音區(qū)對應的匹配度分值的步驟,包括:
12、對所述音頻數(shù)據(jù)進行識別,獲得音頻語義及音頻旋律;
13、將所述音頻語義與所述音樂歌詞進行比對,并將所述音頻語義與所述音樂歌詞進行比對,獲得各音區(qū)對應的匹配度分值。
14、可選的,所述行為特征信息包括成員注視方向、成員手勢行為、成員身體動作;
15、所述根據(jù)所述行為特征信息確定各音區(qū)對應的成員參與意愿的步驟,包括:
16、根據(jù)所述成員注視方向與車載顯示屏幕位置確定第一意愿分值;
17、根據(jù)所述成員手勢行為及所述成員身體動作確定成員情緒類別;
18、將所述成員情緒類別與音樂分類進行比較,確定第二意愿分值;
19、根據(jù)所述第一意愿分值及所述第二意愿分值確定各音區(qū)成員對應的參與意愿;
20、基于所述音區(qū)成員與音區(qū)之間的對應關系,根據(jù)所述音區(qū)成員對應的參與意愿確定各音區(qū)對應的成員參與意愿。
21、可選的,所述根據(jù)所述匹配度分值及所述成員參與意愿為各音區(qū)設置對應的混音音量的步驟,包括:
22、將所述匹配度分值與各預設分值區(qū)間進行比對,確定目標分值區(qū)間;
23、將所述成員參與意愿與各預設意愿區(qū)間進行比對,確定目標意愿區(qū)間;
24、根據(jù)所述目標分值區(qū)間及所述目標意愿區(qū)間為各音區(qū)設置對應的混音音量。
25、可選的,所述根據(jù)所述目標分值區(qū)間及所述目標意愿區(qū)間為各音區(qū)設置對應的混音音量的步驟,包括:
26、根據(jù)所述目標分值區(qū)間及所述目標意愿區(qū)間在預設區(qū)間音量映射表中查找各音區(qū)對應的音區(qū)音量映射記錄;
27、從所述音區(qū)音量映射記錄中提取目標音量;
28、根據(jù)所述目標音量為各音區(qū)設置對應的混音音量。
29、可選的,所述基于所述混音音量對各音區(qū)的音頻數(shù)據(jù)進行聲音混合的步驟,包括:
30、基于所述混音音量對各音區(qū)的音頻數(shù)據(jù)進行音量調(diào)整,生成各音區(qū)對應的調(diào)音音頻數(shù)據(jù);
31、根據(jù)所述調(diào)音音頻數(shù)據(jù)進行聲音混合。
32、此外,為實現(xiàn)上述目的,本發(fā)明還提出一種聲音混合裝置,所述聲音混合裝置包括:
33、獲取模塊,用于獲取車內(nèi)各音區(qū)對應的音頻數(shù)據(jù),并獲取各音區(qū)中音區(qū)成員的行為特征信息;
34、確定模塊,用于根據(jù)所述音頻數(shù)據(jù)及所述行為特征信息確定各音區(qū)對應的混音音量;
35、混合模塊,用于基于所述混音音量對各音區(qū)的音頻數(shù)據(jù)進行聲音混合。
36、此外,為實現(xiàn)上述目的,本發(fā)明還提出一種聲音混合設備,所述聲音混合設備包括:處理器、存儲器及存儲在所述存儲器上并可在所述處理器上運行的聲音混合程序,所述聲音混合程序被處理器執(zhí)行時實現(xiàn)如上所述的聲音混合方法的步驟。
37、此外,為實現(xiàn)上述目的,本發(fā)明還提出一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有聲音混合程序,所述聲音混合程序執(zhí)行時實現(xiàn)如上所述的聲音混合方法的步驟。
38、本發(fā)明通過獲取車內(nèi)各音區(qū)對應的音頻數(shù)據(jù),并獲取各音區(qū)中音區(qū)成員的行為特征信息;根據(jù)音頻數(shù)據(jù)及行為特征信息確定各音區(qū)對應的混音音量;基于混音音量對各音區(qū)的音頻數(shù)據(jù)進行聲音混合。由于是根據(jù)各音區(qū)對應的音頻數(shù)據(jù)以及音區(qū)中音區(qū)成員的行為特征為各音區(qū)設置對應的混音音量,可確定各音區(qū)中的音區(qū)成員是否參與k歌,從而可合理的為各音區(qū)設置混音音量,避免混音后的音頻中存在不必要的雜音、噪聲等,提高了車載k歌的實際效果,提高了用戶實際使用體驗。
1.一種聲音混合方法,其特征在于,所述聲音混合方法包括以下步驟:
2.如權(quán)利要求1所述的聲音混合方法,其特征在于,所述根據(jù)所述音頻數(shù)據(jù)及所述行為特征信息確定各音區(qū)對應的混音音量的步驟,包括:
3.如權(quán)利要求2所述的聲音混合方法,其特征在于,所述根據(jù)所述音頻數(shù)據(jù),以及所述音樂伴奏和所述音樂歌詞確定各音區(qū)對應的匹配度分值的步驟,包括:
4.如權(quán)利要求2所述的聲音混合方法,其特征在于,所述行為特征信息包括成員注視方向、成員手勢行為、成員身體動作;
5.如權(quán)利要求2所述的聲音混合方法,其特征在于,所述根據(jù)所述匹配度分值及所述成員參與意愿為各音區(qū)設置對應的混音音量的步驟,包括:
6.如權(quán)利要求5所述的聲音混合方法,其特征在于,所述根據(jù)所述目標分值區(qū)間及所述目標意愿區(qū)間為各音區(qū)設置對應的混音音量的步驟,包括:
7.如權(quán)利要求1-6任一項所述的聲音混合方法,其特征在于,所述基于所述混音音量對各音區(qū)的音頻數(shù)據(jù)進行聲音混合的步驟,包括:
8.一種聲音混合裝置,其特征在于,所述聲音混合裝置包括:
9.一種聲音混合設備,其特征在于,所述聲音混合設備包括:處理器、存儲器及存儲在所述存儲器上并可在所述處理器上運行的聲音混合程序,所述聲音混合程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-7任一項所述的聲音混合方法的步驟。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有聲音混合程序,所述聲音混合程序執(zhí)行時實現(xiàn)如權(quán)利要求1-7任一項所述的聲音混合方法的步驟。