專利名稱:多模式音頻編譯碼器及其適用的碼簿激勵線性預測編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多模式音頻編碼,諸如統(tǒng)一語音及音頻編譯碼器,或適用于一般音頻信號諸如音樂、語音、混合及其它信號的編譯碼器,及其適用的一種CELP編碼方案。
背景技術(shù):
混合不同編碼模式來編碼表示不同類型音頻信號諸如語音、音樂等的混合的一般音頻信號是有利的個別編碼模式可適用于特定的音頻類型,因此,多模式音頻編碼器可利用隨著時間與音頻內(nèi)容類型的改變相對應(yīng)地改變編碼模式的優(yōu)勢換言之,多模式音頻編碼器例如可判定使用特別專用于編碼語音的編碼模式來編碼該音頻信號的語音內(nèi)容部分,使用另一編碼模式來編碼該音頻內(nèi)容的表示非語音內(nèi)容諸如音樂的部分。線性預測編碼模式傾向于較為適合用以編碼語音內(nèi)容,而只要有關(guān)音樂的編碼,則頻域編碼模式傾向于表現(xiàn)效能優(yōu)于線性預測編碼模式。
但使用不同的編碼模式,使得其難以全域地調(diào)整已編碼的比特流內(nèi)增益,或更準確地說,已編碼的比特流的音頻內(nèi)容的譯碼表示型態(tài)的增益,無需實際上將該已編碼的比特流譯碼然后再度重新編碼增益已調(diào)整的譯碼表示型態(tài),迂回繞道必然減低已調(diào)整增益的比特流的質(zhì)量,原因在于再量化在重新編碼已譯碼且已調(diào)整增益的表示型態(tài)進行。舉例來說,在AAC中,通過改變8-位字段「全域增益」的值,在比特流層面可實現(xiàn)輸出電壓的調(diào)整。此比特流元素可簡單地被通過、編輯,而無需完整譯碼及重編碼。如此,此處理并未引入任何質(zhì)量下降,并且可毫無損耗地取消。有些應(yīng)用用途實際上使用了此選項。舉例來說,一種免費軟件稱作「AAC增益」,[AAC增益]恰應(yīng)用了前述方法。此種軟件為免費軟件「MP3增益」的衍生,其應(yīng)用與MPEC1/2層3相同的技術(shù)。在剛萌芽的USAC編譯碼器中,F(xiàn)D編碼模式從AAC繼承8-位全域增益。因此,若USAC只以FD模式執(zhí)行,例如用于較高比特率,則與AAC比較,全然保留電壓調(diào)整功能。但一旦允許模式轉(zhuǎn)換,則此項可能性不復存在。舉例來說,在TCX模式中,也有一個具相同功能的比特流元素也稱作「全域增益」,其具有7-位長度。換言之,編碼個別模式的個別增益元素的比特數(shù)主要適應(yīng)于各自的編碼模式,來實現(xiàn)一方面耗用較少比特于增益控制,另一方面避免質(zhì)量因增益調(diào)整的量化太過粗糙而降低間的最佳折衷。顯然此折衷在比較TCX模式與FD模式時導致不同的比特數(shù)。在目前萌生的USAC標準的ACELP模式中,電壓可通過具有2-位長度的比特流元素「平均能量」控制。再次,顯然過多比特用于平均能量與過少比特用于平均能量間的折衷,結(jié)果導致與其它編碼模式(即,TCX和FD編碼模式)相比不同的比特數(shù)。如此,到目前為止,全域地調(diào)整通過多模式編碼所編碼的已編碼比特流的譯碼表示型態(tài)的增益煩瑣且易于造成質(zhì)量的降低。執(zhí)行譯碼接著執(zhí)行增益調(diào)整及重新編碼,或單獨通過調(diào)整影響比特流的不同編碼模式部分的增益的不同模式的個別比特流元素,試探性地執(zhí)行響度電壓的調(diào)整。但后一可能性極其可能將假像(artifacts)引入已增益調(diào)整的已譯碼的表示型態(tài)。
因此,本發(fā)明的目的是提供一種多模式音頻編碼器,其允許全域增益調(diào)整,而無譯碼及重新編碼的繞道,就質(zhì)量及壓縮率而言只有中等降低,及提供一種適用于嵌入多模式音頻編碼而達成類似性質(zhì)的CELP編譯碼器。該目的可通過所附的獨立權(quán)利要求的主題實現(xiàn)。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的第一方面,本申請發(fā)明人了解當嘗試跨不同編碼模式使得全域增益調(diào)整協(xié)調(diào)時所遭遇的問題,系植基于實際上不同編碼模式具有不同幀尺寸且以不同方式分解成子幀。根據(jù)本發(fā)明的第一方面,此困難可通過將子幀的比特流元素不同地編碼成全域增益值,使得幀的全域增益值的改變導致該音頻內(nèi)容的譯碼表示型態(tài)的輸出電壓的調(diào)整。同時,不同的編碼可節(jié)省位,否則當將新語法元素導入編碼比特流時將出現(xiàn)位。另外,不同的編碼通過允許設(shè)定全域增益值的時間分辨率比前述比特流元素不同地編碼成全域增益值來調(diào)整各子幀的增益時的時間分辨率更低,而允許全域調(diào)整編碼的比特流的增益時的負 擔減輕。因此,根據(jù)本申請的第一方面,一種用以基于編碼比特流而提供音頻內(nèi)容的譯碼表示型態(tài)的多模式音頻譯碼器,該多模式音頻譯碼器被配置為譯碼該編碼比特流的每個幀的全域增益值,其中幀的第一子集以第一編碼模式編碼,及幀的第二子集以第二編碼模式編碼,而該第二子集的各個幀由多于一個子幀組成;對幀的該第二子集的子幀的至少一個子集的每個子幀,與各幀的全域增益值不同地譯碼相對應(yīng)的比特流元素;在譯碼幀的第二子集的子幀的至少一個子集的子幀時使用所述全域增益值及相對應(yīng)的比特流元素,及譯碼幀的第一子集時使用該全域增益值,完成所述比特流的譯碼,其中該多模式音頻譯碼器被配置為使得編碼比特流內(nèi)的幀的全域增益值變化導致該譯碼音頻內(nèi)容表示型態(tài)的輸出電壓的調(diào)整。根據(jù)本第一方面,一種多模式音頻編碼器被配置為將音頻內(nèi)容編碼成編碼的比特流而幀的第一子集以第一編碼模式編碼及幀的第二子集以第二編碼模式編碼,此時幀的第二子集由一個或多個子幀組成,此時該多模式音頻編碼器被配置為確定和編碼每幀的全域增益值,及對第二子集的子幀的至少一個子集的每個子幀與各幀的全域增益值不同地編碼和確定相對應(yīng)的比特流元素,其中執(zhí)行多模式音頻編碼方法,使得編碼比特流內(nèi)的幀的全域增益值的改變導致音頻內(nèi)容的譯碼表示型態(tài)在譯碼端的輸出電位的調(diào)整。根據(jù)本申請的第二方面,本申請發(fā)明人發(fā)現(xiàn)若CELP編譯碼器的碼簿激勵的增益連同變換編碼幀的變換或反變換電壓一起控制,則跨經(jīng)CELP編碼幀及變換編碼幀的通用增益控制可經(jīng)由維持前文概述的優(yōu)點實現(xiàn)。據(jù)此,根據(jù)第二方面,一種用以基于編碼比特流而提供音頻內(nèi)容的譯碼表示型態(tài)的多模式音頻譯碼器,其幀的第一子集以CELP編碼,及其幀的第二子集以變換編碼,該多模式音頻譯碼器包括CELP譯碼器,其被配置為解碼該第一子集的目前幀,該CELP譯碼器包括激勵發(fā)生器,其被配置為通過基于該編碼比特流內(nèi)的該第一子集的目前幀的碼簿指標及過去激勵而組成碼簿激勵,以及基于該編碼比特流內(nèi)部之全域增益值而設(shè)定該碼簿激勵之增益,來產(chǎn)生該第一子集的前幀的目前激勵;以及線性預測合成濾波器,其被配置為基于該編碼比特流內(nèi)的第一子集的目前幀的線性預測濾波系數(shù)而濾波目前激勵;變換譯碼器被配置為通過如下方式解碼該第二子集的目前幀由編碼比特流構(gòu)造第二子集的目前幀的頻譜信息,及對該頻譜信息進行頻域至時域變換來獲得時域信號,使得時域信號的電壓取決于全域增益值。同理,根據(jù)第二方面,一種多模式音頻編碼器,用于通過CELP編碼音頻內(nèi)容的幀的第一子集及通過變換編碼的第二幀子集而將該音頻內(nèi)容編碼成編碼比特流,該多模式音頻編碼器包括=CELP編碼器,被配置為編碼第一子集的目前幀,該CELP編碼器包括線性預測分析器,其被配置為對該第一子集的目前幀產(chǎn)生線性預測濾波系數(shù),并將其編碼成該編碼比特流;及激勵發(fā)生器,被配置為判定該第一子集的目前幀的目前激勵,當通過線性預測合成濾波器基于編碼比特流內(nèi)的線性預測濾波系數(shù)濾波時,其恢復由該第一子集的目前幀的碼簿指標及過去激勵所限定的第一子集的目前幀,及將該碼簿指標編碼成該編碼比特流;及變換編碼器,其被配置為通過對該第二子集的目前幀的時域信號執(zhí)行時域至頻域變換成而編碼第二子集的目前幀來獲得頻譜信息,及將該頻譜信息編碼成該編碼比特流,其中該多模式音頻編碼器被配置為將全域增益值編碼成編碼比特流,該全域增益值取決于第一子集的目前幀的音頻內(nèi)容根據(jù)線性預測系數(shù)而使用該線性預測分析濾波器來濾波的版 本的能量,或取決于該時域信號的能量。根據(jù)本申請的第三方面,發(fā)明人發(fā)現(xiàn)若CELP編碼的全域增益值經(jīng)運算且施加于激勵信號的加權(quán)域,而非直接使用普通激勵信號,則當改變各全域增益值時,CELP編碼比特流的響度變化更加適應(yīng)配合變換編碼電壓調(diào)整的表現(xiàn)。此外,當考慮CELP編碼模式排它地作為CELP的其它增益諸如碼增益及LTP增益在加權(quán)域運算時,在激勵信號的加權(quán)域運算與施加全域增益值也有其優(yōu)勢。如此,根據(jù)第三方面,一種CELP譯碼器,包括激勵發(fā)生器,其被配置為產(chǎn)生比特流的目前幀的目前激勵,概產(chǎn)生通過基于該比特流內(nèi)的目前幀的自適應(yīng)碼簿指標及過去激勵,構(gòu)造自適應(yīng)碼簿激勵;基于該比特流內(nèi)的目前幀的創(chuàng)新碼簿指標,構(gòu)造創(chuàng)新碼簿激勵;計算由該比特流內(nèi)的線性預測濾波系數(shù)所組成的加權(quán)線性預測合成濾波器而頻譜式加權(quán)的該創(chuàng)新碼簿激勵的能量的估值;基于該比特流內(nèi)的全域增益值與估算的能量間的比,設(shè)定該創(chuàng)新碼簿激勵的增益;及組合該自適應(yīng)碼簿激勵與該創(chuàng)新碼簿激勵來獲得該目前激勵;及線性預測合成濾波器,其被配置為基于該等線性預測濾波系數(shù)而濾波該目前激勵。同理,根據(jù)第三方面,一種CELP編碼器,包括線性預測分析器,其被配置生成對音頻內(nèi)容的目前幀的線性預測濾波系數(shù),以及將線性預測濾波系數(shù)編碼成比特流;激勵發(fā)生器,被配置為將目前幀的目前激勵確定為自適應(yīng)碼簿激勵與創(chuàng)新碼簿激勵的組合,而當基于線性預測濾波系數(shù)通過線性預測合成濾波器濾波時,恢復所述目前幀,通過造由目前幀的自適應(yīng)碼簿指標及過去激勵所限定的所述自適應(yīng)碼簿激勵,以及將自適應(yīng)碼簿指標編碼成比特流;及構(gòu)造由該目前幀的創(chuàng)新碼簿指標限定的創(chuàng)新碼簿激勵,及將該創(chuàng)新碼簿指標編碼成該比特流;及能量測定器,其被配置為確定加權(quán)濾波器濾波的該目前幀的音頻內(nèi)容的版本的能量,以獲得全域增益值,以及將該全域增益值編碼成該比特流,該加權(quán)濾波器由該線性預測濾波系數(shù)解釋。
本申請的優(yōu)選實施例為本申請所附的從屬權(quán)利要求的主旨。此外,本申請的優(yōu)選實施例在后文參考附圖進行說明,附圖中
圖I示出根據(jù)實施方式的多模式音頻編碼器的方塊圖;圖2示出根據(jù)第一替代例的圖I的編碼器的能量計算部分的方塊圖;圖3示出根據(jù)第二替代例的圖I的編碼器的能量計算部分的方塊圖;圖4示出根據(jù)實施方式且適用于譯碼由第I圖的編碼器編碼的比特流的多模式音頻譯碼器;圖5a及圖5b示出根據(jù)本發(fā)明又一實施方式的多模式音頻編碼器及多模式音頻譯碼器;圖6a及6b示出根據(jù)本發(fā)明又一實施方式的多模式音頻編碼器及多模式音頻譯碼器;以及
圖7a及圖7b示出根據(jù)本發(fā)明又一實施方式的CELP編碼器及CELP譯碼器。
具體實施例方式圖I示出根據(jù)本申請實施方式的一種多模式音頻編碼器的實施方式。圖I的多模式音頻編碼器適用于編碼混合型音頻信號,諸如語音與音樂的混合信號。為了獲得最適當?shù)乃俾?失真折衷,該多模式音頻編碼器被配置為在數(shù)種編碼模式間切換而調(diào)整編碼性質(zhì)適應(yīng)要編碼的音頻內(nèi)容的目前需求。更明確地,根據(jù)圖I的實施方式,多模式音頻編碼器通常使用三種不同的編碼模式,即FD (頻域)編碼及LP (線性預測)編碼,其又再劃分成TCX(變換編碼激勵)及CELP (碼簿激勵線性預測)編碼。在FD編碼模式中,要編碼的音頻內(nèi)容經(jīng)開窗、頻譜分解,且該頻譜分解經(jīng)根據(jù)心理聲學而量化及定標來隱藏在掩蔽臨界值下方的量化噪聲。在TCX及CELP編碼模式中,音頻內(nèi)容接受線性預測分析來獲得線性預測系數(shù),及這些線性預測系數(shù)在比特流內(nèi)連同激勵信號一起傳輸,其當使用比特流內(nèi)的線性預測系數(shù),以相對應(yīng)的線性預測合成濾波器濾波時,獲得音頻內(nèi)容的譯碼表示型態(tài)。在TCX的情況下,激勵信號經(jīng)變換編碼,而在CELP的情況下,激勵信號通過碼簿內(nèi)的檢索登錄項目編碼,或以合成方式組成所濾波樣本的碼簿向量。根據(jù)本實施方式使用的ACELP (代數(shù)碼簿激勵線性預測),激勵由自適應(yīng)碼簿激勵及創(chuàng)新碼簿激勵所組成。容后詳述,在TCX中,線性預測系數(shù)可在譯碼器端使用,也通過推導定標因子而在頻域直接采用來成形噪聲量化。在此種情況下,TCX被設(shè)定來變換原先信號,及將LPC結(jié)果只應(yīng)用在頻域。盡管編碼模式不同,但圖I的編碼器產(chǎn)生比特流,使得通過例如等量增或減全域增益值,例如,相等數(shù)量的比特數(shù)(其等于以對數(shù)底乘以位數(shù)的因子(或除數(shù))縮放),與該已編碼比特流的全部幀相關(guān)聯(lián)的某個語法元素(具體實例是與幀個別地或幀組群相關(guān)聯(lián))允許跨全部編碼模式的全域增益適應(yīng)。具體地,根據(jù)圖I的多模式音頻編碼器10支持的各種編碼模式,其包含F(xiàn)D編碼器12及LPC (線性預測編碼)編碼器14。LPC編碼器14又由TCX編碼部16、CELP編碼部18及編碼模式切換器20所組成。編碼器10所包含的又一編碼模式切換器相當概略地顯示為模式分配器22。模式分配器被配置為分析要編碼的音頻內(nèi)容24以便將其連續(xù)的時間部分與不同編碼模式相關(guān)聯(lián)。具體地,在圖I的情況下,模式分配器22將音頻內(nèi)容24的不同的連續(xù)時間部分分配至FD編碼模式及LPC編碼模式中的任一者。在圖I的說明例中,舉例來說,模式分配器22已將音頻內(nèi)容24的部分26分配至FD編碼模式,而緊隨后部分28分配至LPC編碼模式。根據(jù)模式分配器22分配的編碼模式,音頻內(nèi)容24可再細分成不同的連續(xù)幀。舉例來說,在圖I的實施方式中,部分26內(nèi)的音頻內(nèi)容24被編碼成等長幀30,而彼此有例如50%重迭。換言之,F(xiàn)D編碼器12被配置為以這些單元30編碼音頻內(nèi)容24的FD部分26。根據(jù)圖I的實施方式,LPC編碼器14也被配置以幀單位32編碼音頻內(nèi)容24的相關(guān)聯(lián)部分28,但這些幀并非必需與幀30大小相等。以圖I為例,幀32的大小小于幀30的大小。具體地,根據(jù)特定實施方式,幀30的長度為音頻內(nèi)容24的2048個樣本,而幀32的長度為1024個樣本??赡茉贚PC編碼模式與FD編碼模式間的邊界,最末幀與第一幀重迭。但在圖I的實施方式中,及如圖I示例性所示,在從FD編碼模式轉(zhuǎn)換至LPC編碼模式的情況下并無幀重迭,反之亦然。如第I圖所示,F(xiàn)D編碼器12接收幀30,并通過頻域變換編碼將其編碼成已編碼比特流36的個別幀34。為了實現(xiàn)該 目的,F(xiàn)D編碼器12包括一開窗器38、變換器40、量化及定標模塊42、無損耗編碼器44,以及心理聲學控制器46。原則上,F(xiàn)D編碼器12可根據(jù)AAC標準實施,只要下文描述并未教示FD編碼器12的不同表現(xiàn)即可。具體地,開窗器38、變換器40、量化及定標模塊42、及無損耗編碼器44系串接在FD編碼器12的輸入端48與輸出端50之間,及心理聲學控制器46具有輸入端連接至輸入端48,及輸出端連接至量化及定標模塊42的另一輸入端。須注意FD編碼器12還可包括額外的模塊用于其它編碼選項,但在此處并不關(guān)鍵。開窗器38可使用不同窗用來開窗進入輸入端48的目前幀。該開窗幀在變換器40諸如使用MDCT等接受時域至頻域的變換。變換器40可使用不同變換長度來變換開窗幀。具體地,開窗器38可支持長度與幀30的長度一致的窗,變換器40使用相同的變換長度以便獲得例如在MDCT的情況下與幀30的半數(shù)樣本相對應(yīng)的多個變換系數(shù)。但開窗器38也可被配置為支持編碼選項,根據(jù)這些編碼選項,時間上彼此相對偏移的諸如幀30的半長度的8窗的若干較短窗被施加至目前幀,變換器40使用符合開窗的變換長度變換目前幀的這些開窗版本,從而獲得該幀期間的不同時間,藉取樣該音頻內(nèi)容而對該幀獲得8頻譜。由開窗器38所使用的窗可為對稱或非對稱的,且可具有零前端及/或零后端。在施加若干短窗至目前幀的情況下,這些短窗的非零部分相對于彼此位移,但彼此重迭。當然,根據(jù)其它實施方式也可使用開窗器38及變換器40的窗及變換長度的其它編碼選項。由變換器40輸出的變換系數(shù)在模塊42量化及定標。特別,心理聲學控制器46分析輸入端48的輸入信號以確定掩蔽臨界值48,據(jù)此,由量化及定標所導入的量化噪聲形成為低于該掩蔽臨界值。具體地,定標模塊42可在定標因子帶運算,共同覆蓋頻譜域所再細分的變換器40的頻譜域。據(jù)此,成組連續(xù)的變換系數(shù)被分配至不同的定標因子帶。模塊42判定每個定標因子帶的定標因子,該定標因子當乘以分配給各定標因子頻帶的各變換系數(shù)值時,獲得變換器40所輸出的變換系數(shù)的重建版本。此外,模塊42設(shè)定頻譜上一致地定標該頻譜的增益值。如此,重建變換系數(shù)等于該變換系數(shù)值乘以相關(guān)聯(lián)的定標因子乘以各幀i的增益值gi。變換系數(shù)值、定標因子、及增益值在無損耗編碼器44接受無損耗編碼,諸如利用熵編碼,諸如算術(shù)編碼或霍夫曼編碼,連同其它語法元素,例如有關(guān)前述窗及變換長度決策的語法元素,及允許其它編碼選項的額外語法元素。有關(guān)此方面的進一步細節(jié),請參考AAC標準有關(guān)其它編碼選項。為了略為更加精確,量化及定標模塊42可被配置為傳輸每頻譜列k的量化變換系數(shù)值,當重新定標時,其獲得個別頻譜列k的重建變換系數(shù),即X_reScal,當乘以
增益=20.25.(Sf-CffSet)其中,sf為個別量化變換系數(shù)所屬的個別定標因子帶的定標因子,Sf_offSet為常數(shù),例如可設(shè)定為100。如此,定標因子在對數(shù)域內(nèi)定義。定標因子可在比特流36內(nèi)連同頻譜存取彼此差異編碼,亦即只有頻譜鄰近定標因子sf間的差異可在比特流內(nèi)傳輸。相對于前述全域增益值(global_gain value)被差異編碼的第一定標因子sf可在比特流內(nèi)傳輸。下文說明將關(guān)注此語法元素global_gain。global_gain值可在對數(shù)域在比特流內(nèi)傳輸。換言之,模塊42可被配置為取目前頻譜的第一定標因子sf作為global_gain。然后,此sf值可與零差異地傳輸,及隨后的sf值與個別前趨值差異傳輸。顯然,當一致地在全部幀30上進行時,改變global_gain,將改變重建變換的能 量,而如此轉(zhuǎn)譯成FD編碼部分26的響度變化。具體地,F(xiàn)D巾貞的global_gain在比特流內(nèi)傳輸,使得global_gain對數(shù)式地取決于重建的音頻時域樣本的移動平均,或反之亦然,重建的音頻時域樣本的移動平均指數(shù)式地取決于global_gain。類似于幀30,全部分配給LPC編碼模式的幀亦即幀32進入LPC編碼器14。在LPC編碼器14內(nèi),切換器20將各個幀32再劃分成一個或多個子幀52。各個子幀52可被分配給TCX編碼模式或CELP編碼模式。被分配給TCX編碼模式的子幀52傳遞至TCX編碼器16的輸入端54,而被分配給CELP編碼模式的子幀通過切換器20被傳遞至CELP編碼器18的輸入端56。須注意圖I示出的切換器20配置在LPC編碼器14的輸入端58與TCX編碼器16及CELP編碼器18個子的輸入端54及56僅為了說明的目的,實際上,有關(guān)幀32再劃分成子幀52并且將TCX及CELP中的各編碼模式與個別子幀關(guān)聯(lián)的編碼決策,可在TCX編碼器16與CELP編碼器18的內(nèi)部元素間以互動方式進行,以便最大化某個權(quán)值/失真測量值??偠灾?,TCX編碼器16包含激勵發(fā)生器60、LP分析器62、及能量測定器64,其中,該LP分析器62及該能量測定器64由CELP編碼器18共同使用(共同擁有),CELP編碼器18進一步包括其本身的激勵發(fā)生器66。激勵發(fā)生器60、LP分析器62及能量測定器64的各自的輸入端連接至TCX編碼器16的輸入端54。同理,LP分析器62、能量測定器64及激勵發(fā)生器66各自的輸入端連接至CELP編碼器18的輸入端56。LP分析器62被配置為分析目前幀即TCX幀或CELP幀內(nèi)音頻內(nèi)容來確定線性預測系數(shù),且連接至激勵發(fā)生器60、能量測定器64及激勵發(fā)生器66各自的系數(shù)輸入端來傳遞線性預測系數(shù)至這些組件。容后詳述,LP分析器可在原先音頻內(nèi)容的預強調(diào)版本上運算,及各預強調(diào)濾波器可為LP分析器的各輸入部分的一部分,或可連接至其輸入端的前方。同理適用于能量測定器64,容后詳述。但至于激勵發(fā)生器60,其可直接對原先信號操作。激勵發(fā)生器60、LP分析器62、能量測定器64及激勵發(fā)生器66各自的輸出端以及輸出端50連接至編碼器10的多路復用器68的各個輸入端,該多路復用器被配置為在輸出端70將所接收的語法元素多任務(wù)化成比特流36。如前文已述,LPC分析器62被配置為確定輸入的LPC幀32的線性預測系數(shù)。有關(guān)LP分析器62可能的功能的進一步細節(jié)請參考ACELP標準。一般而言,LP分析器62可使用自我相關(guān)法或協(xié)方差法來確定LPC系數(shù)。舉例來說,使用自我相關(guān)法,LP分析器62可使用李杜(Levinson-Durban)演繹法則,解出LPC系數(shù)來產(chǎn)生自我相關(guān)矩陣。如本領(lǐng)域已知的,LPC系數(shù)限定一種合成濾波器,其粗略地仿真人類聲道模型,而當通過激勵信號驅(qū)動時,大致上仿真氣流通過聲帶的模型。這種合成濾波器通過LP分析器62使用線性預測模型化。聲道形狀改變速率受限制,據(jù)此,LP分析器62可使用適應(yīng)于該限制的更新速率且與幀32的幀率不同的更新速率,來更新線性預測系數(shù)。LP分析器62執(zhí)行LP分析對組件60、64及66等某些濾波器提供信息,諸如線性預測合成濾波器H(Z);其反濾波器,亦即線性預測分析濾波器或白化濾波器A (z),其中"(:丨=士)■’聽覺加權(quán)濾波器諸如W(Z) =Α(ζ/λ),其中λ為加權(quán)因子LP分析器62將LPC系數(shù)上的信息傳輸至多路復用器68用以插入比特流36。此 信息72可表示在適當域諸如頻譜對域等的量化線性預測系數(shù)。甚至線性預測系數(shù)的量化可在此域進行。又,LP分析器62可以實際上以比解碼端重建LPC系數(shù)的速率更高的速率傳輸LPC系數(shù)或其上信息72。后述更新速率例如通過LPC傳輸時間間的內(nèi)插而實現(xiàn)。顯然,譯碼器只須存取量化LPC系數(shù),據(jù)此,由相對應(yīng)重建線性預測所定義的前述濾波器由H (z)、A (ζ)及W (ζ)標示。如前文摘述,LP分析器62分別定義LP合成濾波器H (ζ)及H (ζ),其當施加至各個激勵時,除了若干后處理外,恢復或重建原先音頻內(nèi)容,但為了便于說明,其在此處不予考慮。激勵發(fā)生器60及66用來定義此激勵,并分別通過多路復用器68及比特流36而傳輸其上各信息至譯碼端。至于TCX編碼器16的激勵發(fā)生器60,其通過允許例如通過某個最優(yōu)化方案所找出的適當激勵,接受時域至頻域變換來獲得該激勵的頻譜版本而編碼目前激勵,其中此頻譜信息74的頻譜版本被傳遞至多路復用器68用以插入比特流36,而該頻譜信息例如類似于FD編碼器12模塊42運算的頻譜,被量化及定標。換言之,定義目前子幀52的TCX編碼器16的激勵的頻譜信息74可具有相關(guān)聯(lián)的量化變換系數(shù),其根據(jù)單一定標因子而定標,而又相對于LPC幀語法元素(后文也稱global_gain)傳輸。如同于FD編碼器12的global_gain的情況,LPC編碼器14的global_gain也可在對數(shù)域定義。此數(shù)值的增加直接翻譯成各TCX子幀的音頻內(nèi)容的譯碼表示型態(tài)的響度增高,原因在于譯碼表示型態(tài)通過保持增益調(diào)整的線性運算,通過處理信息74內(nèi)的定標變換系數(shù)而實現(xiàn)。這些線性運算為時-頻反變換,及最終LP合成濾波。但容后詳述,激勵發(fā)生器60被配置為以高于LPC幀單位的時間分辨率編碼前述頻譜信息74的增益。具體地,激勵發(fā)生器60使用稱作delta_global_gain的語法元素來與比特流元素global_gain不同地編碼,用來設(shè)定激勵頻譜的增益的實際增益。delta_global_gain也可在對數(shù)域內(nèi)定義??蓤?zhí)行差異編碼使得delta_global_gain可定義為乘法修正global_gain亦即線性域內(nèi)的增益。與激勵發(fā)生器60相比,CELP編碼器18的激勵發(fā)生器66被配置為經(jīng)由使用碼簿指標編碼目前子幀的目前激勵。具體地,激勵發(fā)生器66被配置為通過自適應(yīng)碼簿激勵與創(chuàng)新碼簿激勵的組合確定目前激勵。激勵發(fā)生器66被配置為對目前幀組成自適應(yīng)碼簿激勵,以便通過過去激勵(即用于先前編碼CELP子幀的激勵)和目前幀的自適應(yīng)碼簿指標而定義。激勵發(fā)生器66通過傳遞至多路復用器68而將自適應(yīng)碼簿指標76編碼成比特流。另外,激勵發(fā)生器66組成通過目前幀的創(chuàng)新碼簿指標所定義的創(chuàng)新碼簿激勵,及通過傳遞至多路復用器68用以插入比特流36而將創(chuàng)新碼簿指標78編碼成比特流。實際上,兩個指標可整合成一個共享語法元素。兩個指標一起仍然允許譯碼器恢復如此藉激勵發(fā)生器所確定的碼簿激勵。為了保證編碼器與譯碼器的內(nèi)部狀態(tài)同步,激勵發(fā)生器66不僅確定用以允許譯碼器恢復目前碼簿激勵的語法元素,該位也通過實際上產(chǎn)生來使用目前碼簿激勵作為編碼下一 CELP幀的起點,亦即過去激勵,而實際上也更新其狀態(tài)。激勵發(fā)生器66可被被配置為在組成自適應(yīng)碼簿激勵及創(chuàng)新碼簿激勵時,相對于目前子幀的音頻內(nèi)容而最小化聽覺加權(quán)失真測量值,考慮所得激勵在解碼端接受LP合成濾波用以重建。實際上,指標76及78檢索某些在編碼器10及在譯碼端可取得的表,來檢索或以其它方式確定用作為LP合成濾波器的激勵信號的向量。與自適應(yīng)碼簿激勵相反,創(chuàng)新碼簿激勵與過去激勵不相干地確定。實際上,激勵發(fā)生器66可被配置為使用先前編碼的 CELP子幀的過去激勵及重建激勵而對目前幀確定自適應(yīng)碼簿激勵,該確定方式通過使用某個延遲與增益值及預定(內(nèi)插)濾波而修正后者,使得所得目前幀的自適應(yīng)碼簿激勵來當通過合成濾波器濾波時最小化與自適應(yīng)碼簿激勵恢復原先音頻內(nèi)容的某個目標值的差異。前述延遲、增益及濾波通過自適應(yīng)碼簿指標指示。其余的不一致性通過創(chuàng)新碼簿激勵補償。再度,激勵發(fā)生器66適合設(shè)定碼簿指標來找出最佳創(chuàng)新碼簿激勵,其當組合(諸如加至)自適應(yīng)碼簿激勵時,可獲得目前幀的目前激勵(當組成隨后CELP子幀的自適應(yīng)碼簿激勵時,則作為過去激勵)。換言之,自適應(yīng)碼簿搜尋可基于子幀基礎(chǔ)執(zhí)行,且包含執(zhí)行死循環(huán)音高搜尋,然后通過內(nèi)插過去激勵在選定的分量音高延遲而運算自適應(yīng)碼向量。實際上,激勵信號u (η)被激勵發(fā)生器66定義為自適應(yīng)碼簿向量V (η)及創(chuàng)新碼簿向量c (η)的加權(quán)和"(") = gpv(n) + gcc(n)。音高增益I由自適應(yīng)碼簿指標76定義。創(chuàng)新碼簿增益£由創(chuàng)新碼簿指標78和前述能量測定器6 爛W的LPC巾貞的global_gain語法元素確定,容后詳述。換言之,當最優(yōu)化創(chuàng)新碼簿指標78時,采用激勵發(fā)生器66并維持不變,創(chuàng)新碼簿增益I僅只最優(yōu)化創(chuàng)新碼簿指標來確定創(chuàng)新碼簿向量的脈沖的位置及符號,以及脈沖數(shù)目。通過能量測定器64設(shè)定前述LPC巾貞global_gain語法元素的第一方法(或替代的)將在后文參考圖2進行描述。根據(jù)下述兩個替代例,對各個LPC幀32確定語法元素globalgain。然后此語法元素用作屬于各巾貞32的TCX子巾貞的前述delta_global_gain語法元素,以及前述創(chuàng)新碼簿增益良的參考,創(chuàng)新碼簿增益良通過global_gain確定,容后詳述。如圖2所示,能量測定器64可被配置為確定語法元素global_gain 80,且可包括通過LP分析器62控制的線性預測分析濾波器82、能量運算器84、量化及編碼級86,以及用以再量化的譯碼級88。如第2所示,前置強調(diào)器或前置強調(diào)濾波器90可在原音頻內(nèi)容24在能量測定器64內(nèi)進一步處理之前,預強調(diào)原音頻內(nèi)容24,容后詳述。雖然未在圖I中示出,但前置強調(diào)濾波器也可呈現(xiàn)在圖I的方塊圖中直接位在LP分析器62及能量測定器64二者的輸入端前方。換言之,前置強調(diào)濾波器可由二者共同擁有或共同使用。前置強調(diào)濾波器90可如下給定Hemph(z) =l-a Z^10因此,前置強調(diào)濾波器可為高通濾波器。此處,其為第一排序高通濾波器,但通常為第η排序高通濾波器。本例屬第一排序高通濾波器的實例,α設(shè)定為0.68。圖2的能量測定器64的輸入端連接至前置強調(diào)濾波器90的輸出端。在能量測定器64的輸入端與輸出端80之間,LP分析濾波器82、能量運算器84、及量化及編碼級86以所述順序串接。譯碼階段88具有其輸入端被連接至量化及編碼級86的輸出端,及輸出由譯碼器可獲得的量化增益。具體地,線性預測分析濾波器82Α (ζ)施加至經(jīng)前置強調(diào)的音頻內(nèi)容,結(jié)果產(chǎn)生激勵信號92。如此,該激勵92等于由LPC分析濾波器A (ζ)濾波的原音頻內(nèi)容24的前置強調(diào)版本,亦即原音頻內(nèi)容24以下式濾波 Hemph(z). Α(ζ)0基于此激勵信號92,目前幀32的全域增益值通過對目前幀32內(nèi)部的此激勵信號92的每1024樣本運算能量而推定。具體地,能量運算器84通過下式求對數(shù)域中每節(jié)段64樣本的信號92的能量平均
乒 I , 吞 /e,\x‘|/.64 + 〃|*e'Yc|/.64 + = Ett-1oS2E λ--V;-
I O I 0 η O V64ο然后通過下式,基于平均能量nrg對對數(shù)域6位由量化及編碼級86而量化增益
gindex ·
&' 如=[_4.歷方+ο·5」。然后,此指標在比特流內(nèi)作為語法元素80亦即作為全域增益?zhèn)鬏?。此指標在對?shù)域內(nèi)定義。換言之,量化階的大小指數(shù)地增加。量化增益通過運算下式經(jīng)由解碼級88獲得
Smdex彥=2丁。此處使用的量化具有與FD模式的全域增益相等的粒度,據(jù)此,gindex定標LPC幀32的響度以FD幀30的global_gain語法元素的定標的相同方式定標,從而實現(xiàn)多模式編碼比特流36的增益控制的一種容易的方式,而無需執(zhí)行譯碼與重新編碼的迂回繞道而仍然
保持質(zhì)量。 如后文就譯碼器的進一步細節(jié)摘述,為了維持前述編碼器與譯碼器間的同步(激勵nupdate),在最優(yōu)化碼簿或已經(jīng)最優(yōu)化碼簿后,激勵發(fā)生器66可包括,a)基于global_gain,運算預測增益g' c,及b)預測增益g'。乘以創(chuàng)新碼簿修正因子f而獲得實際創(chuàng)新碼簿增益兔c)通過組合自適應(yīng)碼簿激勵及創(chuàng)新碼簿激勵來實際上產(chǎn)生碼簿激勵,其中,以實際創(chuàng)新碼簿增益I加權(quán)創(chuàng)新碼簿激勵。具體地,依據(jù)本替代例,量化及編碼級86在比特流內(nèi)傳輸gindex,而激勵發(fā)生器66接收量化增益#作為用以最佳化創(chuàng)新碼簿激勵的預定固定參考。
具體地,激勵發(fā)生器66僅使用(亦即最佳化)創(chuàng)新碼簿指標最優(yōu)化創(chuàng)新碼簿增益&,創(chuàng)新碼簿指標也定義創(chuàng)新碼簿增益修正因子。具體地,創(chuàng)新碼簿增益修正因子確定創(chuàng)新碼簿增益么為
權(quán)利要求
1.一種多模式音頻譯碼器(120 ;320),用于基于編碼比特流(36 ;304)而提供音頻內(nèi)容(24 ;302)的譯碼表示型態(tài)(322),所述多模式音頻譯碼器被配置為 譯碼所述編碼比特流(36 ;304)的每個幀(324 ;326)的全域增益值,其中,所述幀的第一子集(324)以第一編碼模式編碼,及所述幀的第二子集(326)以第二編碼模式編碼,所述第二子集的各個幀由多于一個子幀(328)組成, 對幀的所述第二子集的所述子幀(328)的至少一個子集的每個子幀,與各幀的所述全域增益值不同地譯碼相對應(yīng)的比特流元素,以及 在譯碼幀的所述第二子集的所述子幀(328)的至少一個子集的子幀時使用所述全域增益值及所述相對應(yīng)的比特流元素,及譯碼幀的所述第一子集時使用所述全域增益值,完成所述比特流(36; 304)的譯碼, 其中,所述多模式音頻譯碼器被配置為使得所述編碼比特流(36 ;304)內(nèi)的所述幀的所述全域增益值的變化導致所述音頻內(nèi)容(24 ;302)的譯碼表示型態(tài)(322)的輸出電壓(332)的調(diào)整(330)。
2.根據(jù)權(quán)利要求I所述的多模式音頻譯碼器,其中,所述第一編碼模式為頻域編碼模式,所述第二編碼模式為線性預測編碼模式。
3.根據(jù)權(quán)利要求2所述的多模式音頻譯碼器,其中,所述多模式音頻譯碼器被配置為在完成所述編碼比特流(36 ;304)的譯碼時,通過使用變換激勵線性預測譯碼來譯碼幀(310)的所述第二子集的所述子幀(328)的至少一個子集的子幀,及通過使用CELP來譯碼幀的所述第二子集的子幀的非連續(xù)子集。
4.根據(jù)權(quán)利要求I至3中任一項所述的多模式音頻譯碼器,其中,所述多模式音頻譯碼器被配置為對幀的所述第二子集(326)的每個幀譯碼又一比特流元素顯示個別幀分解成一個或多個子幀。
5.根據(jù)前述權(quán)利要求中任一項所述的多模式音頻譯碼器,其中,所述第二子集的幀具有相等長度,及幀的所述第二子集的子幀(328)的至少一個子集具有選自于由256、512及1024個樣本所組成的組群的不等樣本長度,子幀的非連續(xù)子集具有256樣本的樣本長度。
6.根據(jù)前述權(quán)利要求中任一項所述的多模式音頻譯碼器,其中,所述多模式音頻譯碼器被配置為基于固定位數(shù)目譯碼所述全域增益值及基于可變位數(shù)目譯碼所述比特流元素,所述數(shù)目取決于各子幀的樣本長度。
7.根據(jù)權(quán)利要求I至5中任一項所述的多模式音頻譯碼器,其中,所述多模式音頻譯碼器被配置為基于固定位數(shù)目譯碼所述全域增益值及基于固定位數(shù)目譯碼所述比特流元素。
8.一種多模式音頻譯碼器,用以基于編碼比特流(434)而提供音頻內(nèi)容的譯碼表示型態(tài)(432),其幀的第一子集以CELP編碼及其幀的第二子集以變換編碼,所述多模式音頻譯碼器包括 CELP譯碼器(436),被配置為譯碼所述第一子集的目前幀,所述CELP譯碼器包括 激勵發(fā)生器(440),被配置為通過基于所述編碼比特流內(nèi)的所述第一子集的目前幀的碼簿指標(448)及過去激勵(446)而構(gòu)造碼簿激勵,以及基于所述編碼比特流(434)內(nèi)的全域增益值(450)而設(shè)定所述碼簿激勵的增益,來產(chǎn)生所述第一子集的目前幀的目前激勵(444);以及 線性預測合成濾波器(442),被配置為基于所述編碼比特流內(nèi)的所述第一子集的目前幀的線性預測濾波系數(shù)(452)而濾波所述目前激勵(444); 變換譯碼器(438),被配置為通過如下方式解碼所述第二子集的目前幀 由所述編碼比特流(434)構(gòu)造所述第二子集的目前幀的頻譜信息,以及對所述頻譜信息進行頻域至時域的變換來獲得時域信號,使得所述時域信號的電壓取決于所述全域增益值(450)。
9.根據(jù)權(quán)利要求8所述的多模式音頻譯碼器,其中,所述激勵發(fā)生器(440)被配置為,在產(chǎn)生所述第一子集的目前幀的目前激勵(444)時, 基于所述編碼比特流內(nèi)的所述第一子集的目前幀的自適應(yīng)碼簿指標和過去激勵而構(gòu)造自適應(yīng)碼簿激勵; 基于所述編碼比特流內(nèi)的所述第一子集的目前幀的創(chuàng)新碼簿指標而構(gòu)造創(chuàng)新碼簿激 勵; 基于所述編碼比特流內(nèi)的所述全域增益值(450)而設(shè)定所述創(chuàng)新碼簿激勵的增益作為所述碼簿激勵的增益;以及 組合所述自適應(yīng)碼簿激勵和所述創(chuàng)新碼簿激勵而獲得所述第一子集的目前幀的目前激勵(444)。
10.根據(jù)權(quán)利要求8或9所述的多模式音頻譯碼器,其中,所述變換譯碼器(438)被配置為使得所述頻譜信息涉及所述第二子集的目前幀的目前激勵,所述變換譯碼器(438)進一步被配置為在譯碼所述第二子集的目前幀時,根據(jù)由所述編碼比特流(434)內(nèi)的所述第二子集的目前幀的線性預測濾波系數(shù)(454)限定的線性預測合成濾波器傳輸函數(shù),而頻譜形成所述第二子集的目前幀的目前激勵,使得在所述頻譜信息上執(zhí)行所述頻域至時域變換導致音頻內(nèi)容(302,402 )的所述譯碼表示型態(tài)(432 )。
11.根據(jù)權(quán)利要求10所述的多模式音頻譯碼器,其中,所述變換譯碼器(438)被配置為通過將所述線性預測濾波系數(shù)(454)轉(zhuǎn)變成線性預測頻譜,以及以所述線性預測頻譜加權(quán)所述目前激勵的所述頻譜信息而進行頻譜的形成。
12.根據(jù)權(quán)利要求8至11中任一項所述的多模式音頻譯碼器,其中,所述變換譯碼器(438)被配置為以所述全域增益值定標所述頻譜信息。
13.根據(jù)權(quán)利要求8或9所述的多模式音頻譯碼器,其中,所述變換譯碼器(438)被配置為通過使用所述編碼比特流(434)內(nèi)的頻譜變換系數(shù),以及所述編碼比特流內(nèi)的定標因子用以對定標因子帶的頻譜粒度的頻譜變換系數(shù)定標,基于所述全域增益值而定標所述定標因子,從而獲得所述音頻內(nèi)容的所述譯碼表示型態(tài),來構(gòu)造所述第二子集的目前幀的頻譜信息。
14.一種CELP譯碼器,包括 激勵發(fā)生器(540),被配置為產(chǎn)生比特流(544)的目前幀的目前激勵(542),該產(chǎn)生通過 基于所述比特流(544 )內(nèi)的目前幀的自適應(yīng)碼簿指標(550 )及過去激勵(548 ),構(gòu)造自適應(yīng)碼簿激勵(546); 基于所述比特流(544)內(nèi)的目前幀的創(chuàng)新碼簿指標(554),構(gòu)造創(chuàng)新碼簿激勵(552);計算由所述比特流(36,134,304,514)內(nèi)的線性預測濾波系數(shù)(556)所構(gòu)造的加權(quán)線性預測合成濾波器而頻譜加權(quán)的所述創(chuàng)新碼簿激勵(546)的能量的估值;基于所述比特流(544)內(nèi)的全域增益值(560)與估算的所述能量間的比,設(shè)定所述創(chuàng)新碼簿激勵(552)的增益;以及 組合所述自適應(yīng)碼簿激勵(546)和所述創(chuàng)新碼簿激勵(552)以獲得所述目前激勵(542);以及 線性預測合成濾波器(542),被配置為基于所述線性預測濾波系數(shù)(556)而濾波所述目前激勵(542)。
15.根據(jù)權(quán)利要求14所述的CELP譯碼器,其中,所述激勵發(fā)生器(60,66,146,416,440,444,540)被配置為在構(gòu)造所述自適應(yīng)碼簿激勵(556,520,546)時,根據(jù)所述自適應(yīng)碼簿指標(526,550,546,556)使用濾波器來濾波所述過去激勵(420,446,524,548)。
16.根據(jù)權(quán)利要求14或15所述的CELP譯碼器,其中,所述激勵發(fā)生器(540)被配置為構(gòu)造所述創(chuàng)新碼簿激勵(552),使得后者包括具有多個非零脈沖的零向量,所述非零脈沖的 數(shù)目及位置由所述創(chuàng)新碼簿指標(554)指示。
17.根據(jù)權(quán)利要求14至16中任一項所述的CELP譯碼器,其中,所述激勵發(fā)生器(540)被配置為在計算所述創(chuàng)新碼簿激勵的能量的估值時,用下式濾波所述創(chuàng)新碼簿激勵(552),A-)Hemph{z) 其中,所述線性預測合成濾波器被配置為根據(jù)濾波所述目前激勵(542),其中W(z)= λ(:/γ)及Y為聽覺加權(quán)因子,Heaiiph = Ι-αζ—1, α為高頻增強因子,其中,所述激勵發(fā)生器(540)進一步被配置為計算經(jīng)濾波的所述創(chuàng)新碼簿激勵的樣本的平方和以獲得所述能量的所述估值。
18.根據(jù)權(quán)利要求14至17中任一項所述的CELP譯碼器,其中,所述激勵發(fā)生器(540)被配置為在組合所述自適應(yīng)碼簿激勵(546)和所述創(chuàng)新碼簿激勵(552)時,形成根據(jù)所述自適應(yīng)碼簿指標(550)以加權(quán)因子加權(quán)的所述自適應(yīng)碼簿激勵(546)與以所述增益加權(quán)的所述創(chuàng)新碼簿激勵(552)的加權(quán)和。
19.一種SBR譯碼器,包括根據(jù)前述權(quán)利要求中任一項的用以譯碼比特流的核心編碼器部分而獲得核心頻帶信號的核心譯碼器,所述SBR譯碼器被配置為從所述比特流的SBR部分解碼要復制的頻帶的封裝能量,及根據(jù)所述核心頻帶信號的能量而定標所述封裝能量。
20.一種多模式音頻編碼器,被配置為通過以第一編碼模式(308)編碼幀的第一子集(306)以及以第二編碼模式(312)編碼幀的第二子集(310),將音頻內(nèi)容(302)編碼成編碼比特流(304),其中,幀的所述第二子集(310)分別由一個或多個子幀(314)組成,其中,所述多模式音頻編碼器被配置為確定并編碼每個幀的全域增益值,及對所述第二子集(310)的子幀(314)的至少一個子集的每個子幀,與各幀的所述全域增益值不同地確定并編碼相對應(yīng)的比特流元素,其中,所述多模式音頻編碼器被配置為使得所述編碼比特流內(nèi)的幀的所述全域增益值的改變導致所述音頻內(nèi)容(302)的譯碼表示型態(tài)在譯碼端的輸出電壓的調(diào)難iF. O
21.一種多模式音頻編碼器,用于通過CELP編碼音頻內(nèi)容(402)的幀的第一子集(406)及通過變換編碼幀的第二子集(408 )而將所述音頻內(nèi)容(402 )編碼成編碼比特流(404 ),所述多模式音頻編碼器包括 CELP編碼器,被配置為編碼所述第一子集的目前幀,所述CELP編碼器包括 線性預測分析器(414),被配置為對所述第一子集的目前幀產(chǎn)生線性預測濾波系數(shù)(418),并將其編碼成所述編碼比特流(404); 以及 激勵發(fā)生器(416),被配置為確定所述第一子集的目前幀的目前激勵(422),當通過線性預測合成濾波器基于編碼比特流(404)內(nèi)的所述線性預測濾波系數(shù)(418)濾波時,其恢復由所述第一子集的目前幀的碼簿指標(422)和過去激勵(420)限定的所述第一子集的目前幀,及將所述碼簿指標(422)編碼成所述編碼比特流(404); 以及 變換編碼器(412),被配置為通過對所述第二子集的目前幀的時域信號執(zhí)行時域至頻域變換而編碼所述第二子集的目前幀來獲得頻譜信息,及將所述頻譜信息編碼成所述編碼比特流, 其中,所述多模式音頻編碼器被配置為將全域增益值(426)編碼成所述編碼比特流(404),所述全域增益值取決于所述第一子集的目前幀的音頻內(nèi)容(402)根據(jù)線性預測系數(shù)(418)而使用所述線性預測分析濾波器來濾波的版本的能量,或取決于所述時域信號的能量。
22.—種CELP編碼器,包括 線性預測分析器(502),被配置生成對音頻內(nèi)容(512)的目前幀(510)的線性預測濾波系數(shù)(508),以及將所述線性預測濾波系數(shù)(508)編碼成比特流(514); 激勵發(fā)生器(504)被配置為將所述目前幀(510)的目前激勵(516)確定為自適應(yīng)碼簿激勵(520)與創(chuàng)新碼簿激勵(522)的組合,而當基于線性預測濾波系數(shù)通過線性預測合成濾波器濾波時,恢復所述目前幀(510),通過 構(gòu)造由所述目前幀(510)的自適應(yīng)碼簿指標(526)及過去激勵(524)所限定的所述自適應(yīng)碼簿激勵(520 ),以及將所述自適應(yīng)碼簿指標(526 )編碼成所述比特流(514);以及構(gòu)造由所述目前幀(510)的創(chuàng)新碼簿指標(528)限定的所述創(chuàng)新碼簿激勵(522),以及將所述創(chuàng)新碼簿指標(528)編碼成所述比特流(514);以及 能量測定器(506 ),被配置為確定加權(quán)濾波器濾波的所述目前幀的音頻內(nèi)容的版本的能量,以獲得全域增益值(530),以及將所述全域增益值(530)編碼成所述比特流(514),所述加權(quán)濾波器由所述線性預測濾波系數(shù)(508)解釋。
23.根據(jù)權(quán)利要求22所述的CELP編碼器,其中,所述線性預測分析器(502)被配置為通過將線性預測分析施加至開窗的且根據(jù)預定前置增強濾波器而前置增強的音頻內(nèi)容(512)的版本而確定所述線性預測濾波系數(shù)(508)。
24.根據(jù)權(quán)利要求22或23所述的CELP編碼器,其中,所述激勵發(fā)生器(504)被配置為在構(gòu)造所述自適應(yīng)碼簿激勵(520)和所述創(chuàng)新碼簿激勵(522)時,相對于所述音頻內(nèi)容(512)最小化聽覺加權(quán)失真測量值。
25.根據(jù)權(quán)利要求22至24中任一項所述的CELP編碼器,其中,所述激勵發(fā)生器(504)被配置為在構(gòu)造所述自適應(yīng)碼簿激勵(520)和所述創(chuàng)新碼簿激勵(522)時,使用聽覺加權(quán)濾波器相對于所述音頻內(nèi)容(512)最小化聽覺加權(quán)失真測量值,W(Z) =A(z/ y), 其中,Y為聽覺加權(quán)因子,A (z)為1/H (z),其中,H (z)為線性預測合成濾波器,及其中,所述能量測定器(506)被配置為使用所述聽覺加權(quán)濾波器作為加權(quán)濾波器。
26.根據(jù)權(quán)利要求22至25中任一項所述的CELP編碼器,其中,所述激勵發(fā)生器(504)被配置為執(zhí)行激勵更新以獲得下一幀的過去激勵,通過 使用下式通過濾波由所述創(chuàng)新碼簿指標(522)內(nèi)所含第一信息 所限定的創(chuàng)新碼簿向量來估算創(chuàng)新碼簿激勵能量估值,
27.一種多模式音頻譯碼方法,用于基于編碼比特流(36 ;304)而提供音頻內(nèi)容(24;302)的譯碼表示型態(tài)(322),所述方法包括 譯碼所述編碼比特流(36 ;304)的每個幀(324,326)的全域增益值,其中,所述幀的第一子集(324)以第一編碼模式編碼,及所述幀的第二子集(326)以第二編碼模式編碼,而所述第二子集的各個幀由多于一個的子幀(328)組成, 對幀的所述第二子集的子幀(328)的至少一個子集的每個子幀,以與各幀的全域增益值不同地譯碼相對應(yīng)的比特流元素,以及 在譯碼幀的所述第二子集的所述子幀(328)的至少一個子集的子幀時使用所述全域增益值及所述相對應(yīng)的比特流元素,及譯碼幀的所述第一子集時使用所述全域增益值,完成所述比特流(36;304)的譯碼, 其中,執(zhí)行所述多模式音頻譯碼方法,使得編碼比特流(36 ;304)內(nèi)的所述幀的所述全域增益值的變化導致所述音頻內(nèi)容(24 ;302)的所述譯碼表示型態(tài)的輸出電壓(332)的調(diào)整(330)。
28.一種多模式音頻譯碼方法,用于基于編碼比特流(434)提供音頻內(nèi)容的譯碼表示型態(tài)(432),所述編碼比特流的幀的第一子集以CELP編碼,其幀的第二子集以變換編碼,所述方法包括 CELP解碼所述第一子集的目前幀,所述CELP譯碼器包括 通過基于所述編碼比特流內(nèi)的所述第一子集的目前幀的一碼簿指標(448)和過去激勵(446)構(gòu)造碼簿激勵,以及基于所述編碼比特流(434)內(nèi)的全域增益值(450)而設(shè)定所述碼簿激勵的增益,來產(chǎn)生所述第一子集的目前幀的目前激勵(444);以及基于所述編碼比特流內(nèi)的所述第一子集的目前幀的線性預測濾波系數(shù)(452)而濾波所述目前激勵(444); 變換解碼所述第二子集的目前幀,通過 由所述編碼比特流(434)構(gòu)造所述第二子集的目前幀的頻譜信息,及對所述頻譜信息進行頻域至時域變換來獲得時域信號,使得所述時域信號的電壓取決于所述全域增益值(450)。
29.—種CELP譯碼方法,包括 通過下列處理產(chǎn)生比特流(544)的目前幀的目前激勵(542) 基于所述比特流(544 )內(nèi)的所述目前幀的自適應(yīng)碼簿指標(550 )和過去激勵(548 )而構(gòu)造自適應(yīng)碼簿激勵(546 ); 基于所述比特流(544)內(nèi)的所述目前幀的創(chuàng)新碼簿指標(554)而構(gòu)造創(chuàng)新碼簿激勵(552); 計算由所述比特流(36,134,304,514)內(nèi)的線性預測濾波系數(shù)(556)所構(gòu)造的加權(quán)線性預測合成濾波器而頻譜加權(quán)的所述創(chuàng)新碼簿激勵(546)的能量的估值; 基于所述比特流(544)內(nèi)的全域增益值(560)與估算的所述能量間的比,設(shè)定所述創(chuàng)新碼簿激勵(552)的增益;以及 組合所述自適應(yīng)碼簿激勵(546)和所述創(chuàng)新碼簿激勵(552)以獲得所述目前激勵(542);以及 通過線性預測合成濾波器(542)基于所述線性預測濾波系數(shù)(556)而濾波所述目前激勵(542)。
30.一種多模式音頻編碼方法,包括通過以第一編碼模式(308)編碼幀的第一子集(306)以及以第二編碼模式(312)編碼幀的第二子集(310),將音頻內(nèi)容(302)編碼成編碼比特流(304),其中,幀的所述第二子集(310)分別由一個或多個子幀(314)組成,其中,所述多模式音頻編碼方法進一步包括確定和編碼每個幀的全域增益值,以及對所述第二子集(310)的所述子幀(314)的至少一個子集的每個子幀,與各幀的所述全域增益值不同地確定和編碼相對應(yīng)的比特流元素,其中,執(zhí)行所述多模式音頻編碼方法,使得所述編碼比特流內(nèi)的幀的全域增益值的改變導致所述音頻內(nèi)容(302)的譯碼表示型態(tài)在譯碼端的輸出電位的調(diào)整。
31.一種多模式音頻編碼方法,用于通過以CELP編碼音頻內(nèi)容(402)的幀的第一子集(406)及以變換編碼幀的所述第二子集(408)來將所述音頻內(nèi)容(402)編碼成編碼比特流(404),所述多模式音頻編碼方法包括 編碼所述第一子集的目前幀,所述CELP編碼器包括 執(zhí)行線性預測分析來產(chǎn)生所述第一子的目前幀的線性預測濾波系數(shù)(418),及將其編碼成所述編碼比特流(404);以及 確定所述第一子集的目前幀的目前激勵(422),當由線性預測合成濾波器基于所述編碼比特流(404)內(nèi)的線性預測濾波系數(shù)(418)濾波時,其恢復由所述第一子集的目前幀的碼簿指標(422 )和過去激勵(420 )限定的所述第一子集的目前幀,及將所述碼簿指標(422 )編碼成所述編碼比特流(404);以及 通過對所述第二子集的目前幀的時域信號執(zhí)行時域至頻域變換而編碼所述第二子集的目前幀來獲得頻譜信息(424),以及將所述頻譜信息編碼成所述編碼比特流(404), 其中,所述多模式音頻編碼方法進一步包括將全域增益值(426)編碼成所述編碼比特流(404),所述全域增益值取決于所述第一子集的目前幀的音頻內(nèi)容(402)根據(jù)線性預測系數(shù)(418)而使用所述線性預測分析濾波器來濾波的版本的能量,或取決于所述時域信號的能量。
32.一種CELP編碼方法,包括 執(zhí)行線性預測分析來產(chǎn)生音頻內(nèi)容(512)的目前幀(510)的線性預測濾波系數(shù)(508),及將所述線性預測濾波系數(shù)(508)編碼成比特流(514); 確定目前幀(510)的目前激勵(516)為自適應(yīng)碼簿激勵(520)與創(chuàng)新碼簿激勵(522)的組合,當由線性預測合成濾波器基于線性預測濾波系數(shù)(508)濾波時,其通過如下處理恢復所述目前幀(510),構(gòu)造由所述目前幀(510)的自適應(yīng)碼簿指標(526)和過去激勵(524)所限定的自適應(yīng)碼簿激勵(520),及將所述自適應(yīng)碼簿指標(526)編碼成比特流(514);以及構(gòu)造由所述目前幀(510)的創(chuàng)新碼簿指標(528)所限定的創(chuàng)新碼簿激勵(522),及將所述創(chuàng)新碼簿指標(528)編碼成所述比特流(514);以及 確定以加權(quán)濾波器濾波的所述目前幀的音頻內(nèi)容的版本的能量,以獲得全域增益值(530),以及將所述全域增益值(530)編碼成所述比特流(514),所述加權(quán)濾波器由所述線性預測濾波系數(shù)(508)解釋。
33.一種具有程序代碼的計算機程序,當在計算機上運行所述計算機程序時,執(zhí)行根據(jù)權(quán)利要求27至32中任一項所述的方法。
全文摘要
根據(jù)本發(fā)明的第一方面,子幀的比特流元素與全域增益值不同地編碼,使得幀的全域增益值改變,結(jié)果導致該音頻內(nèi)容的譯碼表示型態(tài)的輸出電壓調(diào)整。同時,該不同的編碼節(jié)省位,否則位的節(jié)省將出現(xiàn)在當將新的語法元素導入編碼比特流時。此外,通過允許設(shè)定全域增益值的時間分辨率低于前述比特流元素差異編碼至該全域增益值而調(diào)整各子幀的增益的時間分辨率,該不同的編碼允許全域地調(diào)整編碼比特流的增益的負荷減輕。根據(jù)另一方面,通過共同句柄簿激勵線性預測(CELP)編譯碼器的碼簿激勵的增益,連同控制該變換編碼幀的變換或反變換電壓,可實現(xiàn)跨CELP編碼幀及變換編碼幀的全域增益控制。根據(jù)又另一方面,通過執(zhí)行在激勵信號的加權(quán)域的CELP編碼中的增益值確定,當改變個別增益值時,可更良好適應(yīng)于變換編碼電壓調(diào)整的表現(xiàn)而呈現(xiàn)CELP編碼比特流的響度變化。
文檔編號G10L19/08GK102859589SQ201080058349
公開日2013年1月2日 申請日期2010年10月19日 優(yōu)先權(quán)日2009年10月20日
發(fā)明者拉爾夫·蓋爾, 紀堯姆·福奇斯, 馬庫斯·穆賴特魯斯, 伯恩哈德·格里 申請人:弗蘭霍菲爾運輸應(yīng)用研究公司