本發(fā)明涉及利用音響信號的譜包絡對音響信號進行編碼、解碼的編碼裝置、解碼裝置、編碼方法、解碼方法、編碼程序、解碼程序、以及記錄介質(zhì)。
背景技術:
作為低比特(例如,10kbit/s~20kbit/s左右)的語音信號或音響信號的編碼方法,已知DFT(離散傅里葉變換)或MDCT(改進離散余弦變換)等對于正交變換系數(shù)的自適應編碼。例如在非專利文獻1中利用的TCX(transform coded excitation:變換編碼激勵)編碼方法中,求從作為被輸入的音響信號在頻域的表現(xiàn)的系數(shù)串X[1],…,X[N]去除了振幅譜包絡的影響的序列(歸一化序列串XN[1],…,XN[N]),并對其進行可變長度編碼。其中,[]內(nèi)的N是正整數(shù)。
振幅譜包絡通過以下的步驟算出。
(步驟1)以作為規(guī)定的時間區(qū)間的幀為單位,進行對于被輸入的時域的音響數(shù)字信號(以下,輸入音響信號)的線性預測分析而求線性預測系數(shù)α1,…,αP。其中,P是表示預測階數(shù)的正整數(shù)。例如,通過作為全極點模型的P階自回歸過程,在時刻t中的輸入音響信號x(t)根據(jù)追溯至P時刻為止的過去的自身的值x(t-1),…,x(t-P)與預測殘差e(t)以及線性預測系數(shù)α1,…,αp,通過式(1)來表示。
x(t)=α1x(t-1)+…+αp x(t-P)+e(t) (1)
(步驟2)對線性預測系數(shù)α1,…,αP進行量化,并求已量化線性預測系數(shù)^α1,…,^αP。利用已量化線性預測系數(shù)^α1,…,^αP求N點輸入音響信號的振幅譜包絡序列W[1],…,W[N]。例如,能夠通過式(2)求振幅譜包絡序列的各值W[n]。其中,n是1≦n≦N的整數(shù),exp(·)是以納皮爾數(shù)作為底數(shù)的指數(shù)函數(shù),j是虛數(shù)單位,σ是預測殘差信號的振幅。
【數(shù)1】
另外,在本說明書中,在右上角沒有方括號而標記的標號表示冪運算。也就是說,σ2表示σ的2次方。此外,在文中使用的標記“~”、“^”等本來應記載在其后的字符的正上方,但由于文本記載方法的限制,記載在了該字符的正前方。在公式中這些記號記載在本來的位置即字符的正上方。
現(xiàn)有技術文獻
非專利文獻
非專利文獻1:Anthony Vetro,“MPEG Unified Speech and Audio Coding”,Industry and Standards,IEEE MultiMedia,April-June,2013.
技術實現(xiàn)要素:
發(fā)明要解決的課題
在音響信號的編碼中,為了在解碼側(cè)也獲得譜包絡的信息,需要將與譜包絡對應的碼送到解碼側(cè)。在如非專利文獻1那樣根據(jù)線性預測系數(shù)求譜包絡的情況下,向解碼側(cè)送出的“與譜包絡對應的碼”是“與線性預測系數(shù)對應的碼”,具有僅需較少的碼量的優(yōu)點。另一方面,通過線性預測系數(shù)求得的譜包絡的信息,有時由于輸入音響信號的基音周期而導致峰值附近的近似精度變差,這種情況下有時導致對歸一化系數(shù)串進行可變長度編碼時的編碼效率的低下。
鑒于這樣的問題,在本發(fā)明中,提供能夠以較少的碼量再現(xiàn)由音響信號的基音周期引起的峰值附件的近似精度高的頻域的包絡序列的編碼裝置、解碼裝置。
用于解決課題的手段
本發(fā)明的編碼裝置具有周期性綜合包絡生成部以及可變長度編碼部。周期性綜合包絡生成部生成作為頻域的序列的周期性綜合包絡序列,所述周期性綜合包絡序列基于與根據(jù)規(guī)定時間區(qū)間的輸入音響信號而求出的線性預測系數(shù)碼對應的頻域的序列即譜包絡序列、以及與根據(jù)輸入音響信號而求出的周期碼對應的頻域的周期。可變長度編碼部以周期性綜合包絡序列的值越是大的頻率,輸入音響信號的振幅越大作為前提,對源于輸入音響信號的頻域的序列進行編碼。本發(fā)明的解碼裝置具有周期性綜合包絡生成部以及可變長度解碼部。周期性綜合包絡生成部生成作為頻域的序列的周期性綜合包絡序列,所述周期性綜合包絡序列基于與線性預測系數(shù)碼對應的頻域的序列即譜包絡序列、以及與周期碼對應的頻域的周期??勺冮L度解碼部以越是周期性綜合包絡序列的值大的頻率,音響信號的振幅越大作為前提,可變長度碼進行解碼而獲得頻域的序列。
發(fā)明效果
根據(jù)本發(fā)明的編碼裝置和解碼裝置,進行能夠以較少的碼量再現(xiàn)由輸入音響信號的基音周期引起的峰值附近的近似精度號的頻域的包絡序列的編碼、解碼,因此音響信號的編碼效率高。
附圖說明
圖1是表示實施例1的周期性綜合包絡序列生成裝置(periodic-combined-envelope-sequence generation device)的功能結(jié)構例的圖。
圖2是表示實施例1的周期性綜合包絡序列生成裝置的處理流程的圖。
圖3是表示周期性包絡序列P[1],…,P[N]的例子的圖。
圖4是表示用于說明對相同音響信號生成的序列的不同點的例子的圖。
圖5是表示實施例2的編碼裝置的功能結(jié)構例的圖。
圖6是表示實施例2的編碼裝置的處理流程的圖。
圖7是表示實施例2的解碼裝置的功能結(jié)構例的圖。
圖8是表示實施例2的解碼裝置的處理流程的圖。
圖9是表示實施例3的編碼裝置的功能結(jié)構例的圖。
圖10是表示實施例3的編碼裝置的處理流程的圖。
圖11是表示實施例3的解碼裝置的功能結(jié)構例的圖。
圖12是表示實施例3的解碼裝置的處理流程的圖。
具體實施方式
以下,詳細說明本發(fā)明的實施方式。另外,對具有相同功能的結(jié)構部分賦予相同標號,并省略重復說明。
【實施例1】
圖1表示本發(fā)明的周期性綜合包絡序列生成裝置的功能結(jié)構例,圖2表示本發(fā)明的周期性綜合包絡序列生成裝置的處理流程。周期性綜合包絡序列生成裝置100具有譜包絡序列計算部120、頻域變換部110、周期性分析部130、周期性包絡序列生成部140、以及周期性綜合包絡生成部150,將被輸入的時域的音響數(shù)字信號設為輸入音響信號x(t),基于系數(shù)串的頻率分量而生成變換了振幅譜包絡序列的周期性綜合包絡序列。
<譜包絡序列計算部120>
譜包絡序列計算部120基于輸入音響信號x(t)的時域線性預測,計算輸入音響信號的振幅譜包絡序列W[1],…,W[N](S120)。其中,N是正整數(shù)。譜包絡序列計算部120與現(xiàn)有技術相同,按照以下的順序計算即可。
(步驟1)以作為規(guī)定的時間區(qū)間的幀為單位,進行對于輸入音響信號的線性預測分析而求線性預測系數(shù)α1,…,αP。其中,P是表示預測階數(shù)的正整數(shù)。例如,通過作為全極點模型的P階自回歸過程,時刻t時的輸入音響信號x(t)根據(jù)追溯到P時刻為止的過去的自身的值x(t-1),…,x(t-P)和預測殘差e(t)以及線性預測系數(shù)α1,…,αp通過式(1)來表示。
(步驟2)利用線性預測系數(shù)α1,…,αP求N點的輸入音響信號的振幅譜包絡序列W[1],…,W[N]。例如,振幅普包絡序列的各值W[n]能夠利用與線性預測系數(shù)α1,…,αP對應的已量化線性預測系數(shù)^α1,…,^αP通過式(2)來求。此外,振幅譜包絡序列的各值W[n]能夠利用線性預測系數(shù)α1,…,αP通過將式(2)的^αp置換為αp的式來求。
<頻域變換部110>
頻域變換部110以規(guī)定的時間區(qū)間的幀為單位,將被輸入的時域的輸入音響信號變換為頻域的N點的系數(shù)串X[1],…,X[N]而輸出(S110)。向頻域的變換通過MDCT(改進離散余弦變化)或DFT(離散傅里葉變換)等方法來進行即可。
<周期性分析部130>
周期性分析部130將系數(shù)串X[1],…,X[N]作為輸入,求該系數(shù)串X[1],…,X[N]的周期T,輸出周期T(S130)。
周期T是與源于輸入音響信號的頻域的系數(shù)串、例如系數(shù)串X[1],…,X[N]的具有周期性的分量的間隔(系數(shù)串周期性地成為較大的值的間隔)對應的信息。以下,有時還將周期T表現(xiàn)為間隔T,但僅僅是表現(xiàn)上的不同,是相同的信息。T是正值,可以是整數(shù),也可以是小數(shù)(例如,5.0、5.25、5.5、5.75)。
此外,周期性分析部130根據(jù)需要,也可以將系數(shù)串X[1],…,X[N]作為輸入,還求表示周期性的程度的指標S而輸出。此時,例如,基于系數(shù)串X[1],…,X[N]的具有周期性的分量的部分的能量與除此之外的部分的能量之比,求表示周期性的程度的指標S。此時,指標S成為表示頻域的樣本串的周期性的程度的指標。另外,具有周期性的分量的大小越大,即,周期T的整數(shù)倍的樣本或處于其附近的樣本的振幅(樣本值的絕對值)越大,頻域的樣本串的“周期性的程度”越大。
另外,周期性分析部130也可以從時域的輸入音響信號求時域的周期,通過將求得的時域的周期變換為頻域的周期,求周期T。此外,也可以求將時域的周期變換為頻域的周期的常數(shù)倍或其附近的值作為周期T。同樣地,周期性分析部130也可以根據(jù)時域的輸入音響信號,基于例如時間偏移了與時域的周期對應的量的信號串之間的相關的大小等,求表示周期性的程度的指標S。
總之,根據(jù)時域的輸入音響信號或來源于此的頻域系數(shù)串求周期T或指標S的方法,從以往開始存在各種方法,因此也可以選擇其中任一種方法而利用。
<周期性包絡序列生成部140>
周期性包絡序列生成部140將間隔T作為輸入,輸出周期性包絡序列P[1],…,P[N](S140)。周期性包絡序列P[1],…,P[N]是以由基音周期引起的周期持有峰值的頻域的離散序列,即,是與諧波模式對應的離散序列。圖3表示周期性包絡序列P[1],…,P[N]的例子。周期性包絡序列P[1],…,P[N]是如圖3所示的波形那樣,只有間隔T的整數(shù)倍的附近的作為整數(shù)值的索引、以及與其前后規(guī)定數(shù)目的索引對應周期性包絡的值持正值,除此之外是0的序列。間隔T的整數(shù)倍的附近的作為整數(shù)值的索引周期性地取最大值(峰值),與其前后規(guī)定數(shù)目的索引對應的P[n]的值處于隨著其索引n從與峰值對應的索引遠離而單調(diào)遞減的關系。圖3的橫軸的1,2,…,表示離散樣本點的索引(以下,記為“頻率索引”)。
例如,將n設為表示頻率索引的變量,將τ設為與極大值(峰值)對應的頻率索引,從而通過以下的函數(shù)Q(n)表示峰值的形狀。其中,設間隔T的小數(shù)點以下的位數(shù)為L位,將間隔T’設為T’=T×2L。
【數(shù)2】
h=2.8·(1.125-exp(-0.07·T′/2L)),
PD=0.5·(2.6-exp(-0.05·T′/2L))
h表示峰值的高度,間隔T越大峰值的高度越高。此外,PD表示峰值部分的寬度,間隔T越大寬度越寬。
若將U設為表示1至峰值的數(shù)為止的正整數(shù)(例如,圖4的情況下為1~10),將v設為1以上的整數(shù)(例如,1至3左右),將floor(·)設為舍棄小數(shù)點以下而返回整數(shù)值的函數(shù),則周期性包絡序列P[n]例如如下計算即可。
【數(shù)3】
其中,(U×T’)/2L-v≦n≦(U×T’)/2L+v。例如,在L=2的情況下,若T=20.00則T’=80,若T=20.25則T’=81,若T=20.50則T’=82,若T=20.75則T’=83。另外,周期性包絡序列P[n]利用將小數(shù)點第一位四舍五入而返回整數(shù)值的函數(shù)Round(·)如下求即可。
【數(shù)4】
<周期性綜合包絡生成部150>
周期性綜合包絡生成部150至少將周期性包絡序列P[1],…,P[N]、以及振幅譜包絡序列W[1],…,W[N]作為輸入,求周期性綜合包絡序列WM[1],…,WM[N](S150)。具體來說,如下式那樣求周期性綜合包絡WM[n]。
【數(shù)5】
WM[n]=W[n]·(1+δ·P[n]) (6)
另外,δ是被決定為使得周期性綜合包絡WM[n]與系數(shù)X[n]的絕對值系數(shù)的形狀接近的值、或者是預先決定的值。
在周期性綜合包絡生成部150中決定δ使得周期性綜合包絡WM[n]與系數(shù)X[n]的絕對值序列的形狀接近的情況下,周期性綜合包絡生成部150只要將系數(shù)串X[1],…,X[N]也作為輸入,并輸出所決定的δ和那時的周期性綜合包絡序列WM[1],…,WM[N]即可。例如,δ被決定為從幾個δ的候選中,例如,0.4和0.8這兩個δ的候選中,通過以下的式定義的E最小的δ即可。換言之,只要將δ決定為周期性綜合包絡WM[n]與系數(shù)X[n]的絕對值序列的形狀接近即可。
【數(shù)6】
δ是決定在周期性綜合包絡WM[n]中將周期性包絡P[n]考慮到何種程度的值。換言之,δ可以稱為用于決定頻率綜合包絡WM[n]中的振幅譜包絡W[n]與周期性包絡P[n]混合比例的值。此外,式(9)的G是系數(shù)串X[1],…,X[N]的各系數(shù)X[n]的絕對值的序列與周期性綜合包絡序列的倒數(shù)的序列的內(nèi)積。式(8)的~WM[n]是通過G將周期性綜合包絡的各值WM[n]進行歸一化后的歸一化周期性綜合包絡。在式(7)中,計算系數(shù)串X[1],…,X[N]與歸一化周期性綜合包絡序列~WM[1],…,~WM[N]的內(nèi)積的四次方的目的在于,強調(diào)絕對值特別大的系數(shù)X[n]而減少取內(nèi)積的值(距離)。也就是說,意味著將δ決定為使得系數(shù)串X[1],…,X[N]中絕對值特別大的系數(shù)X[n]與周期性綜合包絡WM[n]接近。
此外,在周期性綜合包絡生成部150中根據(jù)周期性的程度而決定δ的候選數(shù)的情況下,周期性綜合包絡生成部150也可以將表示周期性的程度的指標S也作為輸入,在指標S表示是與周期性高的情況對應的幀的情況下從多個候選數(shù)的δ的候選中選擇在式(7)中定義的E最小的δ,在指標S表示是與周期性低的情況對應的幀的情況下將δ設為預先決定的值。即,在周期性綜合包絡生成部150中根據(jù)周期性的程度而決定δ的候選數(shù)的情況下,只要周期性越高δ的候選的數(shù)目越多即可。
<實施例1的發(fā)明效果>
圖4表示用于說明對相同的音響信號生成的序列的差異的例子。圖4(A)表示對系數(shù)串X[1],…,X[N]進行了插補的曲線的形狀,圖4(B)表示對周期性包絡序列P[1],…,P[N]進行了插補的曲線的形狀,圖4(C)表示對平滑化振幅譜包絡序列~W[1],…,~W[N]進行了插補的曲線的形狀,圖4(D)表示對周期性綜合包絡序列WM[1],…,WM[N]進行了插補的曲線的形狀。如圖4所示,周期性綜合包絡序列WM[1],…,WM[N]與平滑化振幅譜包絡序列~W[1],…,~W[N]相比,成為包含了系數(shù)串X[1],…,X[N]中表現(xiàn)的周期性的峰值的形狀。此外,周期性綜合包絡序列WM[1],…,WM[N],只要除了作為表示譜包絡的信息的線性預測系數(shù)或已量化線性預測系數(shù)之外,還有間隔T、或間隔T與值δ的信息就能夠生成。從而,對表示輸入音響信號的譜包絡的信息追加較少的信息量,就能夠根據(jù)由線性預測系數(shù)求出的譜包絡高精度地表現(xiàn)由于輸入音響信號的基音周期引起的振幅的峰值。即,能夠通過線性預測系數(shù)或已量化線性預測系數(shù)、間隔T或間隔T和值δ的較少的信息量高精度估計輸入音響信號的振幅。另外,平滑化振幅譜包絡~W[n]是可通過下式表現(xiàn)的包絡,γ是用于鈍化(平滑化)振幅譜系數(shù)的1以下的正常數(shù)。
【數(shù)7】
此外,在編碼裝置與解碼裝置中利用本發(fā)明的周期性綜合包絡序列生成裝置的情況下,用于確定在編碼裝置中包含的周期性綜合包絡序列生成裝置以外的處理部中獲得的已量化線性預測系數(shù)^αp的碼(線性預測系數(shù)碼CL)與用于確定周期T與時域的周期的碼(周期碼CT)被輸入到解碼裝置,因此,只要從本發(fā)明的周期性綜合包絡序列生成裝置輸出表示δ的信息的碼,在解碼側(cè)的周期性綜合包絡序列生成裝置也能夠生成與在編碼側(cè)的周期性綜合包絡序列生成裝置中生成的周期性綜合包絡序列相同的周期性綜合包絡序列。從而,從編碼裝置向解碼發(fā)送碼時增加的碼量較少。
<實施例1的發(fā)明點>
在實施例1的周期性綜合包絡序列生成裝置100中,周期性綜合包絡生成部150基于系數(shù)串X[1],…,X[N]的周期性分量,對振幅譜包絡序列W[1],…,W[N]進行變形,并設為周期性綜合包絡序列WM[1],…,WM[N],這一點是最重要的點。尤其只要系數(shù)串X[1],…,X[N]的周期性的程度越大,即,具有周期性的分量的大小越大,將振幅譜包絡序列W[1],…,W[N]中間隔T(周期)的整數(shù)倍以及它們的附近的樣本的值變更地越大,就容易獲得上述的效果?!案浇臉颖尽笔侵赣勺鳛殚g隔T的整數(shù)的附近的整數(shù)值的索引表示的樣本。此外,“附近”可以設為例如通過式(3)~(5)等預先決定的方法來決定的范圍。
此外,系數(shù)串X[1],…,X[N]的具有周期性的分量的間隔T越寬,由式(4)以及(5)表示的周期性包絡序列P[1],…,P[N]持較大的值,以較寬的幅度,即以間隔T(周期)的整數(shù)倍以及它們的附近的較多的樣本,持0以外的值。也就是說,系數(shù)串的具有周期性的分量的間隔T越寬,周期性綜合包絡生成部150將振幅譜包絡序列中的間隔T(周期)的整數(shù)倍以及它們的附近的樣本的值變更為較大。此外,系數(shù)串的具有的周期性的分量的間隔T越寬,周期性綜合包絡生成部150將振幅譜包絡序列以較寬的幅度,即以間隔T(周期)的整數(shù)倍以及它們的附近的較多的樣本,變更樣本值。“以附近的較多的樣本”是指增加在符合“附近”的范圍(通過預先決定的方法決定的范圍)內(nèi)存在的樣本。也就是說,若周期性綜合包絡生成部150如此變更振幅譜包絡序列,則容易獲得上述的效果。
另外,作為有效地利用周期性綜合包絡序列具有的“能夠高精度地表現(xiàn)由輸入音響信號的基音周期引起的振幅的峰值”的特征的例子,有編碼裝置和解碼裝置,通過實施例2、3來表示該裝置的例子。其中,周期性綜合包絡序列的特征的利用例除了編碼裝置和解碼裝置以外,還可以有噪音去除裝置或后置濾波器等。從而,在實施例1中說明周期性綜合包絡序列生成裝置。
[變形例1](通過歸一化系數(shù)串進行周期性分析的例子)
圖1還表示變形例1的周期性綜合包絡序列生成裝置。此外,圖2還表示變形例1的周期性綜合包絡序列生成裝置的處理流程。周期性綜合包絡序列生成裝置101與周期性綜合包絡序列生成裝置100的不同點在于,還具有頻域序列歸一化部111,且譜包絡序列計算部121、周期性分析部131不同,其他結(jié)構相同。以下僅說明不同點。
<譜包絡序列計算部121>
譜包絡序列計算部121不僅求振幅譜包絡序列W[1],…,W[N],還求平滑化振幅譜包絡序列~W[1],…,~W[N]。
具體來說,譜包絡序列計算部121除了在譜包絡序列計算部120中示出的(步驟1)、(步驟2)之外,還進行以下步驟的處理。
(步驟3)對已量化線性預測系數(shù)^αp的各系數(shù)乘以γp,求已量化平滑化線性預測系數(shù)^α1γ,^α2γ2,…,^αPγP。γ是用于進行平滑化的1以下的正常數(shù)。然后通過式(10),求平滑化振幅譜包絡序列~W[1],…,~W[N](S121)。當然,與譜包絡序列計算部120同樣地,也可以代替已量化線性預測系數(shù)^αp而利用線性預測系數(shù)αp。
<頻域序列歸一化部111>
頻域序列歸一化部111將序列串X[1],…,X[N]的各系數(shù)除以平滑化振幅譜包絡序列~W[1],…,~W[N]的各系數(shù)而獲得歸一化系數(shù)串XN[1],…,XN[N]。即,對n=1,…,N,進行
XN[n]=X[n]/~W[n] (11)
的計算,并求出歸一化序列串XN[1],…,XN[N](S111)。
<周期性分析部131>
周期性分析部131將歸一化序列串XN[1],…,XN[N]作為輸入,求該歸一化系數(shù)串XN[1],…,XN[N]的周期T,并輸出周期T(S131)。即,在本變形例中,求源于輸入音響信號的作為頻域的系數(shù)串的歸一化系數(shù)串XN[1],…,XN[N]的具有周期性的分量的間隔作為周期T。此外,周期性分析部131也可以根據(jù)需要,將系數(shù)串X[1],…,X[N]作為輸入,還求表示周期性的程度的指標S并輸出。
除此之外的處理與周期性綜合包絡序列生成裝置100相同。從而,獲得與實施例1同樣的效果。另外,周期性綜合包絡序列生成裝置101的情況下,也可以代替振幅譜包絡序列W[1],…,W[N]而利用平滑化振幅譜包絡序列~W[1],…,~W[N]。此時,代替式(6)而成為下式的計算。
【數(shù)8】
[變形例2](從外部輸入信息的例子)
在編碼裝置和解碼裝置在其內(nèi)部具有本發(fā)明的周期性綜合包絡序列生成裝置的情況下,在編碼裝置和解碼裝置中包含的周期性綜合包絡序列生成裝置以外的處理部中,有時會求系數(shù)串X[1],…,X[N]、歸一化系數(shù)串XN[1],…,XN[N]、已量化線性預測系數(shù)^αp、已量化平滑化線性預測系數(shù)^αpγp、振幅譜包絡W[1],…,W[N]、平滑化振幅譜包絡序列~W[1],…,~W[N]、周期T、指標S等。這樣的情況下,也可以設為在周期性綜合包絡序列生成裝置中不包含頻域變換部、頻域歸一化部、譜包絡序列計算部、周期性分析部的至少任意個的結(jié)構。此時,從編碼裝置內(nèi)的周期性綜合包絡序列生成裝置以外的處理部輸出用于確定已量化線性預測系數(shù)^αp的碼(線性預測系數(shù)碼CL)、用于確定周期T或時域的周期的碼(周期碼CT)、用于確定指標S的碼等,并輸入到解碼裝置。因此,這種情況下,從編碼裝置內(nèi)的周期性綜合包絡序列生成裝置不需要輸出用于確定已量化線性預測系數(shù)^αp的碼(線性預測系數(shù)碼CL)、用于確定周期T或時域的周期的碼(周期碼CT)、用于確定指標S的碼等。
此外,在編碼裝置和解碼裝置中利用本發(fā)明的周期性綜合包絡序列生成裝置的情況下,需要在編碼裝置和解碼裝置中獲得相同的周期性綜合包絡序列。因此,需要利用可根據(jù)由編碼裝置輸出并被輸入到解碼裝置中的碼而確定的信息,獲得周期性綜合包絡序列。例如,需要在編碼裝置中利用的周期性綜合包絡序列生成裝置的譜包絡序列計算部中,利用與線性預測系數(shù)碼CL對應的已量化線性預測系數(shù)來求振幅譜包絡序列,在解碼裝置中利用的周期性綜合包絡序列生成裝置的譜包絡序列計算部中,利用與從編碼裝置輸出而被輸入到解碼裝置中的線性預測系數(shù)碼CL對應的解碼線性預測系數(shù)來求振幅譜包絡序列。
另外,在編碼裝置和解碼裝置中利用周期性綜合包絡序列的情況下,并非如上述那樣在內(nèi)部具有周期性綜合包絡序列生成裝置,而是在編碼裝置和解碼裝置中具有周期性綜合包絡序列生成裝置內(nèi)所需的處理部即可。在實施例2中說明這樣的編碼裝置和解碼裝置。
【實施例2】
《編碼裝置》
圖5表示實施例2的編碼裝置的功能結(jié)構例子,圖6表示實施例2的編碼裝置的處理流程。編碼裝置200具有譜包絡序列計算部221、頻域變換部110、頻域序列歸一化部111、周期性分析部230、周期性包絡序列生成部140、周期性綜合包絡生成部250、可變長度編碼參數(shù)計算部260、可變長度編碼部270。編碼裝置200將被輸入的時域的音響數(shù)字信號作為輸入音響信號x(t),至少輸出表示已量化線性預測系數(shù)^α1,…,^αP的碼CL、表示歸一化系數(shù)串XN[1],…,XN[N]的周期的間隔T的碼CT、對歸一化系數(shù)串XN[1],…,XN[N]進行可變長度編碼后的可變長度碼CX。頻域序列歸一化部111與實施例1變形例1相同。頻域變換部110與周期性包絡序列生成部140和實施例1相同。以下說明不同的結(jié)構部。
<譜包絡序列計算部221>
譜包絡序列計算部221基于輸入音響信號x(t)的時域的線性預測,計算輸入音響信號的振幅譜包絡序列W[1],…,W[N]與平滑化振幅譜包絡序列~W[1],…,~W[N],且還求表示在計算的過程中獲得的已量化線性預測系數(shù)數(shù)^α1,…,^αP的碼CL(S221)。其中,N是正整數(shù)。譜包絡序列計算部221按照以下的步驟進行處理即可。
(步驟1)以作為規(guī)定的時間區(qū)間的幀為單位,進行對于輸入音響信號的線性預測分析而求線性預測系數(shù)α1,…,αP。其中,P是表示預測階數(shù)的正整數(shù)。例如,通過作為全級點模型的P階自回歸過程,根據(jù)追溯到P時刻為止的過去的自身的值x(t-1),…,x(t-P)與預測殘差e(t)以及線性預測系數(shù)α1,…,αp,通過式(1)表示時刻t值的輸入音響信號x(t)。
(步驟2)對線性預測系數(shù)α1,…,αP進行編碼而獲得碼CL并輸出,并求與碼CL對應的已量化線性預測系數(shù)^α1,…,^αP。此外,利用已量化線性預測系數(shù)^α1,…,^αP,求N點的輸入音響信號的振幅譜包絡序列W[1],…,W[N]。例如,振幅譜包絡序列的各值W[n]能夠通過式(2)來求。另外,對線性預測系數(shù)α1,…,αP進行編碼而獲得碼CL的方法可以利用如下的方法:將預測系數(shù)變換為LSP參數(shù)從而對LSP參數(shù)進行編碼而獲得碼CL等將可變換為線性預測系數(shù)的系數(shù)的任一個進行編碼而獲得碼CL的任意方法。
(步驟3)對已量化線性預測系數(shù)^αp的各個乘以γp,求已量化平滑化線性預測系數(shù)^α1γ,^α2γ2,…,^αPγP。γ是預先決定的用于平滑化的1以下的正常數(shù)。然后,通過式(10),求平滑化振幅譜包絡序列~W[1],…,~W[N]。
<周期性分析部230>
周期性分析部230將歸一化系數(shù)串XN[1],…,XN[N]作為輸入,求該歸一化系數(shù)串XN[1],…,XN[N]的間隔T(周期性地成為較大的值的間隔),輸出間隔T與表示間隔T的碼CT(S230)。此外,周期性分析部230根據(jù)需要還求表示周期性的程度的指標S(即,表示頻域的樣本串的周期性的程度的指標)并輸出。此外,周期性分析部230根據(jù)需要還獲得表示指標S的碼CS并輸出。另外,指標S與間隔T本身與實施例1變形例1的周期性分析部131相同。
<周期性綜合包絡生成部250>
周期性綜合包絡生成部250至少將周期性包絡序列P[1],…,P[N]、振幅譜包絡序列W[1],…,W[N]作為輸入,求周期性綜合包絡序列WM[1],…,WM[N]而輸出周期性綜合包絡WM[n]。此外,周期性綜合包絡生成部150在作為值δ,不是選擇預先決定的一個值而是從預先決定的多個候選值之中的任一個的情況下,還將系數(shù)串X[1],…,X[N]作為輸入,并作為值δ而求出預先決定的多個候選值中周期性綜合包絡WM[n]與系數(shù)X[n]的絕對值序列的形狀接近的候選值,且還輸出表示值δ的碼Cδ(S250)。
周期性綜合包絡WM[n]與值δ與實施例1相同,周期性綜合包絡WM[n]如式(6),……,(9)那樣來求即可。在周期性綜合包絡生成部150中根據(jù)周期性的程度而決定δ的候選數(shù)的情況下,周期性綜合包絡生成部150將表示周期性的程度的指標S也作為輸入,在指標S是與周期性高的情況對應的幀的情況下,從較多的候選數(shù)的δ的候選中選擇通過式(7)定義的E成為最小的δ,在指標S是與周期性低的情況對應的幀的情況下,也可以將δ設為一個預先決定的值。另外,當將δ設為預先決定的值的情況下,不需要輸出表示值δ的碼Cδ。
<可變長度編碼參數(shù)計算部260>
可變長度編碼參數(shù)計算部260將周期性綜合包絡序列WM[1],…,WM[N]、平滑化振幅譜包絡序列~W[1],…,~W[N]、以及歸一化系數(shù)串XN[1],…,XN[N]作為輸入,求可變長度編碼參數(shù)rn(S260)。可變長度編碼參數(shù)計算部260的特征在于,依據(jù)從周期性綜合包絡序列WM[1],…,WM[N]求得的振幅值,計算可變長度編碼參數(shù)rn。
可變長度編碼參數(shù)是用于確定編碼對象的信號即歸一化系數(shù)串XN[1],…,XN[N]的各系數(shù)的振幅可采用的范圍的參數(shù)。例如,在賴斯編碼的情況下,賴斯參數(shù)相當于可變長度編碼參數(shù),在算術編碼的情況下,相當于編碼對象的信號的振幅可采用的范圍的可變長度編碼參數(shù)。
在對每個樣本進行可變長度編碼的情況下,對歸一化系數(shù)串的各系數(shù)XN[n]計算可變長度編碼參數(shù)。在對每個由多個樣本組成的樣本群(例如每2個樣本)匯總而進行可變長度編碼的情況下,對每個樣本群計算可變長度編碼參數(shù)。也就是說,可變長度編碼參數(shù)計算部260按照作為歸一化系數(shù)串的一部分的歸一化部分系數(shù)串,計算可變長度編碼參數(shù)rn。在此,設歸一化部分系數(shù)串有多個,且在多個歸一化部分系數(shù)串幀中不重復地包含歸一化系數(shù)串的系數(shù)。以下,以對每一個樣本進行賴斯編碼的情況為例,說明可變長度編碼參數(shù)的計算方法。
(步驟1)作為成為基準的賴斯參數(shù)sb(成為基準的可變長度編碼參數(shù)),如下式那樣算出歸一化系數(shù)串XN[1],…,XN[N]的各系數(shù)的振幅的平均的對數(shù)。
【數(shù)9】
Sb對每個幀被編碼一次,作為與成為基準的賴斯參數(shù)(成為基準的可變長度編碼參數(shù))對應的碼Csb而被傳送到解碼裝置400?;蛘咴诟鶕?jù)被傳送到解碼裝置400的其他的信息能夠估計歸一化系數(shù)串XN[1],…,XN[N]的振幅的平均值的情況下,編碼裝置200與解碼裝置400幀也可以共同地預先決定根據(jù)振幅的平均值的估計值來近似地決定sb的方法。例如,在單獨使用表示包絡的傾斜的參數(shù)、表示每個區(qū)分頻帶的平均包絡的大小的參數(shù)的編碼的情況下,根據(jù)被傳送到解碼裝置400的其他信息能夠估計振幅的平均值。此時,也可以不對sb進行編碼并將與成為基準的賴斯參數(shù)對應的碼Csb輸出到解碼裝置400。
(步驟2)根據(jù)以下式算出閾值θ。
【數(shù)10】
θ是將周期性綜合包絡序列的各值WM[n]除以平滑化振幅譜包絡序列的各值~W[n]后的值的振幅的平均的對數(shù)。
(步驟3)|WM[n]/~W[n]|比θ越大,將用于對歸一化系數(shù)XN[n]進行賴斯編碼的賴斯參數(shù)rn決定為比sb越大的值。|WM[n]/~W[n]|比θ越小,將用于對歸一化系數(shù)XN[n]進行賴斯編碼的賴斯參數(shù)rn決定為比sb越小的值。
(步驟4)對所有的n=1,2,…,N反復進行步驟3的處理,從而求對各XN[n]的賴斯參數(shù)rn。
<可變長度編碼部270>
可變長度編碼部270利用在可變長度編碼參數(shù)計算部260中求得的可變長度編碼參數(shù)rn,對歸一化系數(shù)串XN[1],…,XN[N]進行可變長度編碼,輸出可變長度碼CX(S270)。例如,可變長度編碼部270利用在可變長度編碼參數(shù)計算部260中的求得的賴斯參數(shù)rn,對歸一化系數(shù)串XN[1],…,XN[N]進行賴斯編碼,將獲得的碼作為可變長度碼CX輸出。在可變長度編碼參數(shù)計算部260中求得的賴斯參數(shù)rn是依賴于周期性綜合包絡序列的振幅值的可變長度編碼參數(shù),越是周期性綜合包絡序列的值大的頻率,越成為大的值。賴斯編碼是依賴于振幅值的可變長度編碼的公知技術之一,其利用賴斯參數(shù)進行依賴于振幅值的可變長度編碼。此外,在周期性綜合包絡生成部250中生成的周期性綜合包絡序列高精度地表現(xiàn)輸入音響信號的譜包絡。即,可變長度編碼部270以越是周期性綜合包絡序列的值大的頻率,所述輸入音響信號的頻域的系數(shù)串即X[1],…,X[N]的振幅越大作為前提,對歸一化系數(shù)串XN[1],…,XN[N]進行可變長度編碼,換言之,利用可變長度編碼參數(shù),通過依賴于振幅值的可變長度編碼,對歸一化系數(shù)串XN[1],…,XN[N]進行編碼。這里所稱的振幅值是編碼對象的系數(shù)串的平均振幅值、系數(shù)串中包含的各系數(shù)的振幅的估計值、系數(shù)串的振幅的包絡的估計值等。
編碼裝置200輸出表示通過這樣的處理獲得的已量化線性預測系數(shù)^α1,…,^αP的碼CL、表示間隔T的碼CT、對歸一化系數(shù)串XN[1],…,XN[N]進行了可變長度編碼的可變長度碼CX。此外,根據(jù)需要還輸出表示值δ的碼Cδ、表示成為基準的可變長度編碼參數(shù)sb的碼Csb。從編碼裝置200輸出的碼被輸入到解碼裝置400。
[編碼裝置的變形例1](從外部輸入信息的例子)
另外,作為編碼裝置,還可以僅具有周期性包絡序列生成部140和周期性綜合包絡生成部250、可變長度編碼參數(shù)計算部260、以及可變長度編碼部270,將在編碼裝置的外部生成的平滑化振幅譜包絡序列~W[1],…,~W[N]、歸一化系數(shù)串XN[1],…,XN[N]、間隔T作為輸入,根據(jù)需要還將振幅譜包絡序列W[1],…,W[N]與指標S作為輸入,輸出可變長度碼CX。
[編碼裝置的變形例2](根據(jù)系數(shù)串X[n]求間隔T的例子)
在上述的周期性分析部230中將歸一化系數(shù)串XN[1],…,XN[N]作為輸入來求間隔T,但在周期性分析部230中也可以將由頻域變換部110輸出的系數(shù)串X[1],…,X[N]作為輸入來求間隔T。此時,通過與實施例1的周期性分析部130相同的方法求間隔T。
《解碼裝置》
圖7表示實施例2的解碼裝置的功能結(jié)構例子,圖8表示實施例2的解碼裝置的處理流程。解碼裝置400具有譜包絡序列計算部421、周期性包絡序列生成部440、周期性綜合包絡生成部450、可變長度編碼參數(shù)計算部460、可變長度解碼部470、頻域序列逆歸一化部411、以及頻域逆變換部410。解碼裝置400接受表示已量化線性預測系數(shù)^α1,…,^αP的碼CL、表示間隔T的碼CT、對歸一化系數(shù)串XN[1],…,XN[N]進行了可變長度編碼的可變長度碼CX,輸出音響信號。另外,根據(jù)需要還接受表示值δ的碼Cδ、表示成為基準的可變長度編碼參數(shù)sb的碼Csb、以及表示指標S的碼CS。以下,表示各結(jié)構部的細節(jié)。
<譜包絡序列計算部421>
譜包絡序列計算部421將碼CL作為輸入,計算振幅譜包絡序列W[1],…,W[N]、平滑化振幅譜包絡序列~W[1],…,~W[N]。(S421)。更具體來說,按照以下的步驟進行處理即可。
(步驟1)對碼CL進行解碼,獲得解碼線性預測系數(shù)^α1,…,^αP。
(步驟2)利用解碼線性預測系數(shù)^α1,…,^αP,求N點的振幅譜包絡序列W[1],…,W[N]。例如,振幅譜包絡序列的各值W[n]能夠通過式(2)來求。
(步驟3)對解碼線性預測系數(shù)^αp的每一個乘以γp,求解碼平滑化線性預測系數(shù)^α1γ,^α2γ2,…,^αPγP。γ是預先決定的用于平滑化的1以下的正常數(shù)。然后,通過式(10),求平滑化振幅譜包絡序列~W[1],…,~W[N]。
<周期性包絡序列生成部440>
周期性包絡序列生成部440將表示間隔T的碼CT作為輸入,對碼CT進行解碼,獲得間隔T。然后,通過與編碼裝置200的周期性包絡序列生成部140相同的方法求周期性包絡序列P[1],…,P[N]而輸出(S440)。
<周期性綜合包絡生成部450>
對周期性綜合包絡生成部450輸入周期性包絡序列P[1],…,P[N]、振幅譜包絡序列W[1],…,W[N]、符號Cδ、碼CS。其中,符號Cδ、碼CS有時還不被輸入。周期性綜合包絡生成部450對碼Cδ進行解碼,取得值δ。其中,在碼Cδ不被輸入的情況下,不進行碼Cδ的解碼,而取得在周期性綜合包絡生成部450中預先存儲的值δ。另外,周期性綜合包絡生成部450在被輸入了碼CS的情況下,對碼CS進行解碼而取得指標S,在所取得的指標S是與周期性高的情況對應的幀的情況下對碼Cδ進行解碼而取得值δ,在所取得的指標S是與周期性低的情況對應的幀的情況下不進行碼Cδ的解碼,而取得在周期性綜合包絡生成部450中預先存儲了的值δ。然后,周期性綜合包絡生成部450通過式(6),求周期性綜合包絡序列WM[1],…,WM[N]。(S450)
<可變長度編碼參數(shù)計算部460>
可變長度編碼參數(shù)計算部460將周期性綜合包絡序列WM[1],…,WM[N]、平滑化振幅譜包絡序列~W[1],…,~W[N]、以及碼Csb作為輸入,取得可變長度編碼參數(shù)rn(S460)。其中,在能夠根據(jù)被傳送到解碼裝置400的其他的信息估計振幅的平均值的情況下,也可以預先決定根據(jù)從其他的信息估計的振幅的平均值的估計值來近似地決定sb的方法。此時,碼Csb不被輸入。以下,以對每個樣本進行賴斯解碼的情況為例,說明可變長度編碼參數(shù)的計算方法。
(步驟1)對碼Csb進行解碼,獲得成為基準的賴斯參數(shù)sb(成為基準的可變長度編碼參數(shù))。另外,在編碼裝置200與解碼裝置400中共同地決定了根據(jù)振幅的平均值的估計值近似地決定sb的方法的情況下,通過該方法來求。
(步驟2)通過式(14)來算出閾值θ。
(步驟3)|WM[n]/~W[n]|比θ越大,將賴斯參數(shù)rn設為比sb越大的值,從而通過與編碼裝置200的可變長度編碼參數(shù)計算部260相同的方法來決定。|WM[n]/~W[n]|比θ越小,將賴斯參數(shù)rn設為比sb越小的值,從而通過與編碼裝置200的可變長度編碼參數(shù)計算部260相同的方法來決定。
(步驟4)對所有的n=1,2,…,N反復進行步驟3的處理,從而求對各XN[n]的賴斯參數(shù)rn。
<可變長度解碼部470>
可變長度解碼部470利用在可變長度編碼參數(shù)計算部460中求得的可變長度編碼參數(shù)rn,對可變長度碼CX進行解碼,從而獲得解碼歸一化系數(shù)串^XN[1],…,^XN[N](S470)。例如,可變長度解碼部470利用在可變長度編碼參數(shù)計算部460中求得的賴斯參數(shù)rn,對可變長度碼CX進行解碼,從而獲得解碼歸一化系數(shù)串^XN[1],…,^XN[N]??勺冮L度解碼部470的解碼方法對應于可變長度編碼部270的編碼方法。
<頻域序列逆歸一化部411>
頻域序列逆歸一化部411將解碼歸一化系數(shù)串^XN[1],…,^XN[N]以及平滑化振幅譜包絡序列~W[1],…,~W[N]作為輸入,如
^X[n]=^XN[n]·~W[n] (15)
那樣,求解碼系數(shù)串^X[1],…,^X[N]并輸出(S411)。
<頻域逆變換部410>
頻域逆變換部410將解碼系數(shù)串^X[1],…,^X[N]作為輸入,將解碼系數(shù)串^X[1],…,^X[N]變換為作為規(guī)定的時間區(qū)間的幀為單位的音響信號(時域)(S410)。
[解碼裝置的變形例1](從外部輸入信息的例子)
另外,作為解碼裝置,還可以僅具有周期性包絡序列生成部440、周期性綜合包絡生成部450、可變長度編碼參數(shù)計算部460、以及可變長度解碼部470,對解碼裝置除了將根據(jù)需要而輸入的碼Cδ與碼Csb作為輸入之外,還將在解碼裝置的外部獲得的平滑化振幅譜包絡序列~W[1],…,~W[N]、振幅譜包絡序列W[1],…,W[N]、間隔T、以及根據(jù)需要還將指標S作為輸入,并輸出歸一化系數(shù)串XN[1],…,XN[N],并在外部乘以平滑化振幅譜包絡序列而變換為時域的音響信號。
<實施例2的發(fā)明效果>
可變長度編碼是與編碼對象的輸入值的振幅可采用的范圍匹配而自適應地決定碼,從而提高編碼效率的編碼方法。在實施例2中,將作為頻域的系數(shù)串的歸一化系數(shù)串XN[1],…,XN[N]作為編碼對象,但若利用更準確地利用在編碼對象的系數(shù)串中包含的各系數(shù)的振幅的信息而求出的可變長度編碼參數(shù)進行可變長度編碼,則編碼裝置進行的可變長度編碼本身的編碼效率提高。但是,解碼裝置為了求可變長度編碼參數(shù),需要從編碼裝置對解碼裝置更準確地送出在編碼對象的系數(shù)串中包含的各系數(shù)的振幅的信息,將相應地導致從編碼裝置向解碼裝置發(fā)送的碼量增大。
為了抑制碼量增大,需要從較少的碼量的碼獲得在編碼對象的系數(shù)串中包含的各系數(shù)的振幅的估計值的方法。由于實施例2的周期性綜合包絡序列WM[1],…,WM[N]高精度地近似于系數(shù)串X[1],…,X[N],因此|WM[1]/~W[1]|,…,|WM[N]/~W[N]|能夠高精度地近似于作為可變長度編碼對象的系數(shù)的XN[1],XN[2],…,XN[N]的振幅包絡。也就是說,|WM[1]/~W[1]|,…,|WM[N]/~W[N]|成為與編碼對象的各系數(shù)的振幅具有正相關的序列。
此外,用于在解碼裝置側(cè)恢復|WM[1]/~W[1]|,|WM[2]/~W[2]|,…,|WM[N]/~W[N]|所需的信息是如下的信息。
·已量化線性預測系數(shù)^α1,…,^αP的信息(碼CL)
·表示間隔T的信息(碼CT)
·表示值δ的信息(碼Cδ)
即,根據(jù)實施例2的編碼裝置與解碼裝置,在解碼裝置中僅根據(jù)碼CL、碼CT、碼Cδ的較少的信息量,就能夠再現(xiàn)包含由于被輸入到編碼裝置的輸入音響信號的基音周期而引起的振幅的峰值的包絡。
另外,實施例2的編碼裝置與解碼裝置多數(shù)情況下與進行伴隨線性預測和基音預測的編碼以及解碼的編碼裝置以及解碼裝置一并被利用。此時,碼CL和碼CT是從處于編碼裝置200外的進行伴隨線性預測和基音預測的編碼的編碼裝置向解碼裝置400外的進行伴隨線性預測和基音預測的解碼的解碼裝置的碼。從而,為了在解碼裝置側(cè)恢復包含由于被輸入到編碼裝置側(cè)的輸入音響信號的基音周期而引起的振幅的峰值的包絡,需要從編碼裝置200向解碼裝置400發(fā)送的是碼Cδ。碼Cδ的碼量少(分別充其量是3比特左右,即使只是1比特也能夠獲得效果),比與按照在編碼對象的歸一化序列串中包含的每個部分序列的可變長度編碼參數(shù)對應的碼的總碼量還少。
從而,根據(jù)實施例2的編碼裝置、解碼裝置,通過較少的碼量增加,就能夠提高編碼效率。
<實施例2的發(fā)明點>
以獲得上述的效果的點考慮實施例2的編碼裝置、解碼裝置,只要其特征在于,
編碼裝置200具有:
周期性綜合包絡生成部250,生成作為頻域的序列的周期性綜合包絡序列,該頻域的序列基于作為與根據(jù)規(guī)定時間區(qū)間的輸入音響信號而求出的線性預測系數(shù)碼對應的頻域的序列的譜包絡序列、以及與根據(jù)輸入音響信號求得的周期碼對應的頻域的周期;以及
可變長度編碼部270,以越是周期性綜合包絡序列的值大的頻域,輸入音響信號的振幅越大作為前提,對源于輸入音響信號的頻域的序列進行編碼,
解碼裝置400具有:
周期性綜合包絡生成部450,生成作為頻域的序列的周期性綜合包絡序列,該頻域的序列基于作為與線性預測系數(shù)碼對應的頻域的序列的譜包絡序列、以及與周期碼對應的頻域的周期;
可變長度解碼部470,以周期性綜合包絡序列的值越是較大的頻域,音響信號的振幅越大作為前提,對可變長度碼進行解碼而獲得頻域的序列。另外,“以周期性綜合包絡序列的值越是較大的頻域,輸入音響信號的振幅越大作為前提”以及“以周期性綜合包絡序列的值越是較大的頻域,音響信號的振幅越大作為前提”是指周期性綜合包絡序列在輸入音響信號或音響信號的振幅的較大的頻率下成為較大的值。此外,“源于輸入音響信號”意味著根據(jù)輸入音響信號來求或與輸入音響信號對應。例如,系數(shù)串X[1],…,X[N]和歸一化系數(shù)串XN[1],…,XN[N]是源于輸入音響信號的頻域的序列。
【實施例3】
《編碼裝置》
圖9表示實施例3的編碼裝置的功能結(jié)構例子,圖10表示實施例3的編碼裝置的處理流程。編碼裝置300具有譜包絡序列計算部221、頻域變換部110、頻域序列歸一化部111、周期性分析部330、周期性包絡序列生成部140、周期性綜合包絡生成部250、可變長度編碼參數(shù)計算部260、第二可變長度碼參數(shù)計算部380、以及可變長度編碼部370。編碼裝置300將被輸入的時域的音響數(shù)字信號作為輸入音響信號x(t),至少輸出表示已量化線性預測系數(shù)^α1,…,^αP的碼CL、表示歸一化系數(shù)串XN[1],…,XN[N]的周期的間隔T的碼CT、表示系數(shù)串X[1],…,X[N]或歸一化系數(shù)串XN[1],…,XN[N]的周期性的程度的規(guī)定的指標S以及表示指標S的碼CS、對歸一化系數(shù)串XN[1],…,XN[N]進行了可變長度編碼的可變長度碼CX。頻域序列歸一化部111與實施例1變形例1相同。頻域變換部110和周期性包絡序列生成部140與實施例1相同。振幅譜包絡序列計算部221、周期性綜合包絡生成部250、可變長度編碼參數(shù)計算部260與實施例2相同。以下,說明不同的結(jié)構部分。
<周期性分析部330>
周期性分析部330將歸一化系數(shù)串XN[1],…,XN[N]作為輸入,求表示該歸一化系數(shù)串XN[1],…,XN[N]的周期性的程度的指標S與間隔T(周期性地成為較大的值的間隔),輸出指標S和表示指標S的碼CS、間隔T和表示間隔T的碼CT(S330)。另外,指標S與間隔T本身與實施例1變形例1的周期性分析部131相同。
然后,在編碼裝置300中,當指標S處于預先決定的表示周期性的程度大的范圍內(nèi)的情況下,可變長度編碼參數(shù)計算部260計算可變長度編碼參數(shù)rn,在指標S不處于預先決定的表示周期性的程度大的范圍內(nèi)的情況下,第二可變長度編碼參數(shù)計算部380計算可變長度編碼參數(shù)rn(S390)?!邦A先決定的表示周期性的程度大的范圍”例如設為指標S是規(guī)定的閾值以上時即可。
<第二可變長度編碼參數(shù)計算部380>
第二可變長度編碼參數(shù)計算部380將振幅譜包絡序列W[1],…,W[N]、平滑化振幅譜包絡序列~W[1],…,~W[N]、以及歸一化系數(shù)串XN[1],…,XN[N]作為輸入,求出可變長度編碼參數(shù)rn(S380)??勺冮L度編碼參數(shù)計算部260的特征在于,依賴于根據(jù)周期性綜合包絡序列WM[1],…,WM[N]而求得的振幅值,計算可變長度編碼參數(shù)rn,相對于此,第二可變長度編碼參數(shù)計算部380的特征在于,依賴于從振幅譜包絡序列求得的振幅值計算可變長度編碼參數(shù)。以下,以對每一個樣本進行賴斯編碼的情況為例,說明可變長度編碼參數(shù)的計算方法。
(步驟1)如式(13)那樣,作為成為基準的賴斯參數(shù)sb(成為基準的可變長度編碼參數(shù))而算出歸一化系數(shù)串XN[1],…,XN[N]的各系數(shù)的振幅的平均的對數(shù)。該處理與可變長度編碼參數(shù)計算部260相同。
(步驟2)通過以下式算出閾值θ。
【數(shù)11】
θ是將振幅譜包絡序列的各值W[n]除以平滑化振幅譜包絡序列的各值~W[n]的值的振幅的平均的對數(shù)。
(步驟3)|W[n]/~W[n]|比θ越大,將用于對歸一化系數(shù)XN[n]進行賴斯編碼的賴斯參數(shù)rn決定為比sb越大的值。|W[n]/~W[n]|比θ越小,將用于對歸一化系數(shù)XN[n]進行賴斯編碼的賴斯參數(shù)rn決定為比sb越小的值。
(步驟4)對所有的n=1,2,…,N反復進行步驟3的處理,從而求對各XN[n]的賴斯參數(shù)rn。
<可變長度編碼部370>
可變長度編碼部370利用可變長度編碼參數(shù)rn,對歸一化系數(shù)串XN[1],…,XN[N]進行可變長度編碼,輸出可變長度碼CX(S370)。其中,當指標S處于預先決定的表示周期性的程度大的范圍內(nèi)的情況下,可變長度編碼參數(shù)rn是由可變長度編碼參數(shù)計算部260算出的可變長度編碼參數(shù)rn,在指標S不處于預先決定的表示周期性的程度大的范圍內(nèi)的情況下,可變長度編碼參數(shù)rn是由第二可變長度編碼參數(shù)計算部380算出的可變長度編碼參數(shù)rn。
編碼裝置300輸出表示通過這樣的處理而獲得的已量化線性預測系數(shù)^α1,…,^αP的碼CL、表示用于表示周期性的程度的指標S的碼CS、表示間隔T的碼CT、以及對歸一化系數(shù)串XN[1],…,XN[N]進行了可變長度編碼的可變長度碼CX,并發(fā)送給解碼側(cè)。此外,根據(jù)需要還輸出表示值δ的碼Cδ以及表示成為基準的可變長度編碼參數(shù)sb的碼Csb,并發(fā)送給解碼側(cè)。
[編碼裝置的變形例1](從外部被輸入信息的例子)
另外,作為編碼裝置,也可以僅具有周期性包絡序列生成部140、周期性綜合包絡生成部250、可變長度編碼參數(shù)計算部260、第二可變長度編碼參數(shù)計算部380、以及可變長度編碼部370,將在編碼裝置的外部生成的平滑化振幅譜包絡序列~W[1],…,~W[N]、歸一化系數(shù)串XN[1],…,XN[N]、間隔T作為輸入,根據(jù)需要還將振幅譜包絡序列W[1],…,W[N]、指標S作為輸入,并輸出可變長度碼CX。
[編碼裝置的變形例2](根據(jù)系數(shù)串X[n]求出間隔T的例子)
在上述的周期性分析部330中將歸一化系數(shù)串XN[1],…,XN[N]作為輸入來求間隔T,但在周期性分析部330也可以將頻域變換部110輸出的系數(shù)串X[1],…,X[N]作為輸入而求間隔T。此時,通過與實施例1的周期性分析部130相同的方法來求間隔T。
《解碼裝置》
圖11表示實施例3的解碼裝置的功能結(jié)構例子,圖12表示實施例3的解碼裝置的處理流程。解碼裝置500具有譜包絡序列計算部421、指標解碼部530、周期性包絡序列生成部440、周期性綜合包絡生成部450、可變長度編碼參數(shù)計算部460、第二可變長度編碼參數(shù)計算部580、可變長度解碼部570、頻域序列逆歸一化部411、以及頻域逆變換部410。解碼裝置500接受表示已量化線性預測系數(shù)^α1,…,^αP的碼CL、表示指標S的碼CS、表示間隔T的碼CT、對歸一化系數(shù)串XN[1],…,XN[N]進行了可變長度編碼的可變長度碼CX,輸出音響信號。另外,根據(jù)需要還接受表示值δ的碼Cδ、以及表示成為基準的可變長度編碼參數(shù)sb的碼Csb。譜包絡序列計算部421、周期性包絡序列生成部440、周期性綜合包絡生成部450、可變長度編碼參數(shù)計算部460、頻域序列逆歸一化部411、頻域逆變換部410與實施例2相同。以下,說明不同的結(jié)構部。
<指標解碼部530>
指標解碼部530對碼CS進行解碼,獲得指標S。在解碼裝置500中,當指標S處于預先決定的表示周期性的程度大的范圍內(nèi)的情況下,可變長度編碼參數(shù)計算部460計算可變長度編碼參數(shù)rn,在指標S不處于預先決定的表示周期性的程度大的范圍內(nèi)的情況下,第二可變長度編碼參數(shù)計算部580計算可變長度編碼參數(shù)rn(S590)?!邦A先決定的表示周期性的程度大的范圍”是例與編碼裝置300相同的范圍。
<第二可變長度編碼參數(shù)計算部580>
第二可變長度編碼參數(shù)計算部580將振幅譜包絡序列W[1],…,W[N]、平滑化振幅譜包絡序列~W[1],…,~W[N]以及碼Csb作為輸入,求可變長度編碼參數(shù)rn(S580)。其中,在能夠根據(jù)被傳送到解碼裝置500的其他的信息而估計振幅的平均值的情況下,也可以預先決定基于根據(jù)其他的信息估計的振幅的平均值的估計值,近似地決定sb的方法。此時,碼Csb不被輸入。以下,以對每一個樣本進行賴斯解碼的情況為例,說明可變編碼參數(shù)的計算方法。
(步驟1)對碼Csb進行解碼,獲得成為基準的賴斯參數(shù)sb(成為基準的可變長度編碼參數(shù))。另外,在編碼裝置300與解碼裝置500中共同地決定了根據(jù)振幅的估計值近似地決定sb的方法的情況下,通過該方法來求出。
(步驟2)通過式(16)算出閾值θ。
(步驟3)|WM[n]/~W[n]|比θ越大,將賴斯參數(shù)rn設為比sb越大的值,從而通過與編碼裝置300的第二可變長度編碼參數(shù)計算部380相同的方法來決定。|WM[n]/~W[n]|越是比θ小,將賴斯參數(shù)rn設為越比sb小的值,從而通過與編碼裝置300的第二可變長度編碼參數(shù)計算部380相同的方法來決定。
(步驟4)對所有的n=1,2,…,N反復進行步驟3的處理,從而求對各XN[n]的賴斯參數(shù)rn。
<可變長度解碼部570>
可變長度解碼部570利用可變長度編碼參數(shù)rn,對可變長度碼CX進行解碼而求解碼歸一化系數(shù)串^XN[1],…,^XN[N](S570)。其中,在指標S處于預先決定的表示周期性的程度大的范圍內(nèi)的情況下,可變長度編碼參數(shù)rn是由可變長度編碼參數(shù)計算部460算出的可變長度編碼參數(shù)rn,在指標S不處于預先決定的表示周期性的程度大的范圍內(nèi)的情況下,,可變長度編碼參數(shù)rn是由第二可變長度編碼參數(shù)計算部580算出的可變長度編碼參數(shù)rn。
[解碼裝置的變形例1](從外部被輸入信息的例子)
另外,作為解碼裝置,也可以僅具有周期性包絡序列生成部440、周期性綜合包絡生成部450、可變長度編碼參數(shù)計算部460、第二可變長度編碼參數(shù)計算部580、以及可變長度解碼部570,對解碼裝置除了根據(jù)需要而將碼Cδ和碼Csb作為輸入之外,還將在解碼裝置的外部獲得的平滑化振幅譜包絡序列~W[1],…,~W[N]、振幅譜包絡序列W[1],…,W[N]、間隔T、指標S作為輸入,輸出歸一化系數(shù)串XN[1],…,XN[N],并在外部乘以平滑化振幅譜包絡序列而變換為時域的音響信號。
<實施例3的發(fā)明效果>
在輸入音響信號的周期性的程度小的情況下,由輸入音響信號的基音周期引起的振幅的峰值小。因此,實施例3的編碼裝置、解碼裝置在成為編碼的對象的音響信號的周期性的程度大的情況下,利用周期性綜合包絡序列求可變長度編碼參數(shù),在成為編碼的對象的音響信號的周期性的程度不大的情況下,利用振幅譜包絡序列求可變長度編碼參數(shù),因此有能夠利用更適當?shù)目勺冮L度編碼參數(shù)進行可變長度編碼,能夠提高編碼精度的效果。
在上述的實施例1~3中,說明了關于振幅譜包絡序列、平滑化振幅譜包絡序列、周期性綜合包絡序列等,利用振幅的序列的例子,但也可以代替振幅的序列而利用功率的序列,即利用功率譜包絡序列、平滑化功率譜包絡序列、作為功率的序列的周期性綜合包絡序列作為W[n]、~W[n]、WM[n]。
[程序、記錄介質(zhì)]
上述的各種處理不僅根據(jù)記載時序地執(zhí)行,也可以根據(jù)執(zhí)行處理的裝置的處理能力或需要,并列地或者單獨執(zhí)行。此外,在不脫離本發(fā)明的宗旨的范圍內(nèi)當然可以進行適當變更。
此外,在通過計算機來實現(xiàn)上述的結(jié)構的情況下,通過程序來記述各裝置應有的功能的處理內(nèi)容。然后,通過由計算機執(zhí)行該程序,從而在計算機上實現(xiàn)上述處理功能。
記述了該處理內(nèi)容的程序能夠預先記錄在計算機中可讀取的記錄介質(zhì)中。作為計算機中可讀取的記錄介質(zhì),例如可以是磁記錄介質(zhì)、光盤、光磁記錄介質(zhì)、半導體存儲器等任意介質(zhì)。
此外,該程序的流通通過例如將記錄了該程序的DVD、CD-ROM等可移動型記錄介質(zhì)進行銷售、轉(zhuǎn)讓、出租等而進行。進而,也可以設為如下的結(jié)構:通過將該程序預先存儲于服務器計算機的存儲裝置中,并經(jīng)由網(wǎng)絡從服務器計算機向其他計算機轉(zhuǎn)發(fā)該程序,從而使該程序流通。
執(zhí)行這樣的程序的計算機例如首先將記錄在可移動型記錄介質(zhì)中的程序或從服務器計算機轉(zhuǎn)發(fā)的程序暫時存儲在自己的存儲裝置中。然后,在執(zhí)行處理時,該計算機讀取在自己的記錄介質(zhì)中存儲的程序,執(zhí)行按照所讀取的程序的處理。此外,作為該程序的其他的執(zhí)行方式,也可以設為由計算機從可移動型記錄介質(zhì)直接讀取程序,并執(zhí)行按照該程序的處理,進而,也可以設為在每次該程序從服務器計算機被轉(zhuǎn)發(fā)到該計算機時,依次執(zhí)行按照接受到的程序的處理。此外,也可以設為如下的結(jié)構:不進行程序從服務器計算機向該計算機的轉(zhuǎn)發(fā),而是僅通過其執(zhí)行指示與結(jié)果取得來實現(xiàn)處理功能的、所謂的ASP(應用服務提供商(Application Service Provider))型的服務,執(zhí)行上述的處理。另外,設本方式中的程序中包含用于電子計算機進行的處理且基于程序的信息(不是對計算機的直接的指令但具有規(guī)定計算機的處理的性質(zhì)的數(shù)據(jù)等)。
此外,在該方式中,設為通過在計算機上執(zhí)行規(guī)定的程序,從而構成本裝置,但也可以設為通過硬件來實現(xiàn)這些處理內(nèi)容的至少一部分。
標號說明
100、101 周期性綜合包絡序列生成裝置
110 頻域變換部
111 頻域系數(shù)歸一化部
120、121、22、421 譜包絡序列計算部
130、131、230、330 周期性分析部
140、441 周期性包絡序列生成部
150、250、450 周期性綜合包絡生成部
200、300 編碼裝置
260、360、460 可變長度編碼參數(shù)計算部
270、370 可變長度編碼部
380、580 第二可變長度編碼參數(shù)計算部
400、500 解碼裝置
410 頻域逆變換部
411 頻域序列逆歸一化部
470、570 可變長度解碼部
530 指標解碼部