實施例涉及音頻信號處理,且更具體來說,實施例涉及使用指定對音頻數(shù)據(jù)執(zhí)行高頻重建(“hfr”)的基本形式或hfr的增強形式的控制數(shù)據(jù)來編碼、解碼或轉碼音頻位流。
背景技術:
1、典型音頻位流包含指示音頻內容的一或多個頻道的音頻數(shù)據(jù)(例如經(jīng)編碼音頻數(shù)據(jù))及指示音頻數(shù)據(jù)或音頻內容的至少一個特性的元數(shù)據(jù)兩者。用于產(chǎn)生編碼音頻位流的一個熟知格式是mpeg標準iso/iec?14496-3:2009中所描述的mpeg-4先進音頻編碼(aac)格式。在mpeg-4標準中,aac表示“先進音頻編碼”且he-aac表示“高效先進音頻編碼”。
2、mpeg-4aac標準界定若干音頻配置文件,其確定兼容編碼器或解碼器中存在哪些對象及編碼工具。這些音頻配置文件中的三者是(1)aac配置文件、(2)he-aac配置文件及(3)he-aac?v2配置文件。aac配置文件包含aac低復雜性(或“aac-lc”)對象類型。aac-lc對象是mpeg-2aac低復雜性配置文件的對應物,具有一些調整,且不包含頻譜帶復制(“sbr”)對象類型及參數(shù)立體聲(“ps”)對象類型兩者。he-aac配置文件是aac配置文件的超集且另外包含sbr對象類型。he-aac?v2配置文件是he-aac配置文件的超集且另外包含ps對象類型。
3、sbr對象類型含有頻譜帶復制工具,其是可顯著提高感知音頻編解碼器的壓縮效率的重要高頻重建(“hfr”)編碼工具。sbr重建接收器側上(例如,解碼器中)的音頻信號的高頻分量。因此,編碼器僅需要編碼及傳輸?shù)皖l分量以允許低數(shù)據(jù)速率下的更高得多的音頻質量。sbr是基于從編碼器獲得的可用帶寬有限信號及控制數(shù)據(jù)復制先前為了降低數(shù)據(jù)速率而截斷的諧波序列。通過自適應逆濾波以及任選地添加噪聲及正弦曲線來維持音調分量與類噪聲分量之間的比率。在mpeg-4aac標準中,sbr工具執(zhí)行頻譜修補(也稱為線性平移或頻譜平移),其中將若干連續(xù)正交鏡像濾波器(qmf)子頻帶從音頻信號的經(jīng)傳輸?shù)皖l帶部分復制(或“修補”)到所述音頻信號的高頻帶部分(其在解碼器中產(chǎn)生)。
4、頻譜修補或線性平移可能不適合于某些音頻類型(例如具有相對低交叉頻率的音樂內容)。因此,需要用于改進頻譜帶復制的技術。
技術實現(xiàn)思路
1、第一類實施例涉及一種用于解碼經(jīng)編碼音頻位流的方法。所述方法包含接收所述經(jīng)編碼音頻位流且解碼所述音頻數(shù)據(jù)以產(chǎn)生經(jīng)解碼低頻帶音頻信號。所述方法進一步包含提取高頻重建元數(shù)據(jù)且使用分析濾波器組來對所述經(jīng)解碼低頻帶音頻信號濾波以產(chǎn)生經(jīng)濾波低頻帶音頻信號。所述方法進一步包含提取指示是對所述音頻數(shù)據(jù)執(zhí)行頻譜平移還是諧波轉置的標記且根據(jù)所述標記使用所述經(jīng)濾波低頻帶音頻信號及所述高頻重建元數(shù)據(jù)來再生所述音頻信號的高頻帶部分。最后,所述方法包含組合所述經(jīng)濾波低頻帶音頻信號及所述再生高頻帶部分以形成寬帶音頻信號。
2、第二類實施例涉及一種用于解碼經(jīng)編碼音頻位流的音頻解碼器。所述解碼器包含:輸入接口,其用于接收所述經(jīng)編碼音頻位流,其中所述經(jīng)編碼音頻位流包含表示音頻信號的低頻帶部分的音頻數(shù)據(jù);及核心解碼器,其用于解碼所述音頻數(shù)據(jù)以產(chǎn)生經(jīng)解碼低頻帶音頻信號。所述解碼器也包含:解復用器,其用于從所述經(jīng)編碼音頻位流提取高頻重建元數(shù)據(jù),其中所述高頻重建元數(shù)據(jù)包含用于高頻重建過程的操作參數(shù),所述高頻重建過程將若干連續(xù)子頻帶從所述音頻信號的低頻帶部分線性平移到所述音頻信號的高頻帶部分;及分析濾波器組,其用于對所述經(jīng)解碼低頻帶音頻信號濾波以產(chǎn)生經(jīng)濾波低頻帶音頻信號。所述解碼器進一步包含:解復用器,其用于從所述經(jīng)編碼音頻位流提取指示是對所述音頻數(shù)據(jù)執(zhí)行線性平移還是諧波轉置的標記;及高頻再生器,其用于根據(jù)所述標記使用所述經(jīng)濾波低頻帶音頻信號及所述高頻重建元數(shù)據(jù)來再生所述音頻信號的高頻帶部分。最后,所述解碼器包含用于組合所述經(jīng)濾波低頻帶音頻信號及所述再生高頻帶部分以形成寬帶音頻信號的合成濾波器組。
3、其它類實施例涉及編碼及轉碼音頻位流,所述音頻位流含有識別是否執(zhí)行增強頻譜帶復制(esbr)處理的元數(shù)據(jù)。
1.一種用于執(zhí)行音頻信號的高頻重建的方法,所述方法包括:
2.根據(jù)權利要求1所述的方法,其中以等于或低于每秒450萬次操作及等于或低于3千字存儲器的估計復雜性執(zhí)行通過相位聲碼器頻率展延的所述諧波轉置。
3.一種非暫時性計算機可讀介質,其具有在由計算裝置或系統(tǒng)執(zhí)行時使所述計算裝置或所述系統(tǒng)執(zhí)行根據(jù)權利要求1所述的方法的指令。
4.一種用于執(zhí)行音頻信號的高頻重建的音頻處理單元,所述音頻處理單元包括:
5.根據(jù)權利要求4所述的音頻處理單元,其中以等于或低于每秒450萬次操作及等于或低于3千字存儲器的估計復雜性執(zhí)行通過相位聲碼器頻率展延的所述諧波轉置。