WO2012004998A1 - スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 - Google Patents
スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 Download PDFInfo
- Publication number
- WO2012004998A1 WO2012004998A1 PCT/JP2011/003884 JP2011003884W WO2012004998A1 WO 2012004998 A1 WO2012004998 A1 WO 2012004998A1 JP 2011003884 W JP2011003884 W JP 2011003884W WO 2012004998 A1 WO2012004998 A1 WO 2012004998A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- zero vector
- parameter
- zero
- unit
- vector region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
Definitions
- the time-domain signal S (n) is converted into a frequency-domain signal using a time-frequency conversion method (101) such as discrete Fourier transform (DFT) or modified discrete cosine transform (MDCT). Converted to S (f).
- a time-frequency conversion method (101) such as discrete Fourier transform (DFT) or modified discrete cosine transform (MDCT). Converted to S (f).
- the decoded frequency domain signal S 1- (f) is used to restore the decoded time domain signal S 1- (n), such as an inverse discrete Fourier transform (IDFT) or an inverse modified discrete cosine transform (IMDCT).
- IDFT inverse discrete Fourier transform
- IMDCT inverse modified discrete cosine transform
- TCX In TCX [2], the residual / excitation signal is efficiently transformed and encoded in the frequency domain.
- Some popular TCX codecs are 3GPP AMR-WB + and MPEG USAC. A simple configuration of the TCX codec is shown in FIG.
- bit stream information is demultiplexed in (208).
- FIG. 4 illustrates a simple configuration using split multi-rate vector quantization in the TCX codec.
- a bitstream is usually formed in two ways. The first method is illustrated in FIG. 7, and the second method is illustrated in FIG.
- the input signal S (f) is first divided into a certain number of vectors.
- the global gain is then obtained by the number of bits available and the energy level of the spectrum.
- the global gain is quantized by a scalar quantizer and S (f) / G is quantized by a multirate lattice vector quantizer.
- the global gain index forms the first part, all codebook indication values are grouped together to form the second part, and all the indices in the code vector are one. Group together to form the last part.
- the part If the number of zero vectors in the part is larger than Threshold, the part is classified as a zero vector region. Otherwise, a certain number of zero vectors and a certain number of adjacent non-zero vectors are congruent and classified as a non-zero vector region.
- the indication value in the zero vector area can be designed in various ways, with the only requirement that the indication value can be identified on the decoder side.
- the parameter to be transmitted is 1) Global gain quantization index 2) Codebook indication values for all vectors in the non-zero vector region 3) Code vector index for each of all vectors in the non-zero vector domain 4) Zero vector region indication value 5) Index (end index) of the end vector of the zero vector region (or the number of zero vectors in the zero vector region).
- Threshold is determined by equation 3.
- bit savings are achieved by the method proposed in the present invention (Bits save > 0).
- time-domain signal S (n) is converted into a frequency-domain signal using a time-frequency conversion method (1001) such as discrete Fourier transform (DFT) or modified discrete cosine transform (MDCT). Converted to S (f).
- a time-frequency conversion method such as discrete Fourier transform (DFT) or modified discrete cosine transform (MDCT). Converted to S (f).
- all bit stream information is demultiplexed in (107).
- the decoded frequency domain signal S 1- (f) is used to restore the decoded time domain signal S 1- (n), such as an inverse discrete Fourier transform (IDFT) or an inverse modified discrete cosine transform (IMDCT).
- IDFT inverse discrete Fourier transform
- IMDCT inverse modified discrete cosine transform
- FIG. 11 and FIG. 12 illustrate the proposed implementation method of spectrum cluster analysis and codebook indication value encoder.
- This method has 5 steps, and each step is illustrated with a drawing. In this illustration, there are a total of 22 vectors, and the vector index starts at 0 and ends at 21.
- FIG. 13 shows an indication value table of the conventional split multi-rate lattice VQ and an indication value table of the method according to the present invention.
- the indicated value of the zero vector region it can be seen that use of the indicated value were instructed Q 6 codebook.
- a 2-bit codebook is used to quantize the possible Index_end. Therefore, the total number of bits used for the zero vector region is 8.
- the codebook uses the indicated value of Qn + 1 (n 3 6), that is, the number of consumed bits is one bit greater than the original indicated value.
- the representative value is determined by the following equation.
- the total number of bits consumed for encoding all codebook indication values by the original method is as follows.
- the total number of bits consumed for encoding all codebook indication values by the original method is as follows.
- the Q0 instruction value of each zero vector is not transmitted, but the instruction value of the zero vector area and the quantized value of the end vector index (denoted as the end index) of the zero vector area are transmitted. .
- the value of the end index is quantized by a code book—the number of representative values is indicated as N.
- the range of possible values for the end index is divided into N parts. The minimum value in each part is selected as the representative value for that part.
- the number of zero vectors is quantized as a scalar multiple of the value of the start index. It is desirable to learn the scalar value in advance so that each scalar value is represented by one of the code vectors in the codebook.
- This embodiment has the advantage that it is possible to avoid rearranging the bitstreams in reverse order and the complexity is reduced.
- the range of possible values of Index_end is from Min to Max.
- Table 1 is a conventional instruction table
- Table 2 is a zero vector area instruction table in the first embodiment. Even if the input signal has M (M> 1) vectors quantized by Qn (n 3 6) and there is no zero vector region, the maximum number of bits wasted compared to the conventional method is 1. One bit is consumed to indicate which table is used for the entire spectrum, so that there are only bits.
- the global gain index, code vector index, and new codebook indication value are multiplexed (2509) and transmitted to the decoder side.
- the feature of this embodiment is that the spectrum cluster analysis method is applied to hierarchical coding (hierarchical coding, embedded coding) of CELP and transform coding.
- the codebook indication value is sent to the spectrum cluster analysis (2605). Information on the low density state of the spectrum is extracted by spectral cluster analysis and this information is used to convert the codebook indication value to another set of codebook indication values (2606).
- the encoding and decoding process is almost the same as in the eighth embodiment except that the global gain index or the global gain itself is sent from the split multirate to the adaptive gain quantization block (2706). Rather than directly quantizing the global gain, the adaptive gain quantization method quantizes with the composite signal and split multirate lattice vector quantization so that the global gain can be more efficiently quantized over a smaller range. The relationship with the coding error signal to be used is used.
- Step 1 Search for the maximum absolute value syn_max of the combined signal S syn (f).
- Step 4 Transmit Index2-index1 within the narrowed range (preferably, the narrowed range is learned in advance using various signal sequences).
- Embodiment 1 bits saved by the method proposed in Embodiment 1 are used to improve gain precision by applying adaptive vector gain correction to the global gain (2906). Is almost the same as in the first embodiment.
- the spectrum cluster analysis (SCA) method can be applied to a codec that encodes a spectrum coefficient sequence in units of multiple frames (or in units of multiple subframes).
- the bits saved by the SCA can be stored and used to encode the spectral coefficient sequence or some other parameter sequence in the next encoding stage.
- bits saved from the spectrum cluster analysis can be used for FEC (frame erasure concealment) so that sound quality can be maintained in frame loss situations.
- the present invention is also applicable to a case where a single processing program is actually used after recording or writing on a mechanically readable recording medium such as a memory, a disk, a tape, a CD, and a DVD. Thereby, the same operation and effect as the embodiment described here can be provided.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
1)グローバル利得の量子化インデックス
2)非零ベクトル領域中のすべてのベクトル各々のコードブック指示値
3)非零ベクトル領域中のすべてのベクトル各々のコードベクトル・インデックス
4)零ベクトル領域の指示値
5)零ベクトル領域の末尾ベクトルのインデックス(終了インデックス)(または零ベクトル領域中の零ベクトルの数)である。
図10は、スプリット・マルチレート格子ベクトル量子化の本発明による方式を適用した符号器と復号器を具備する、本発明によるコーデックを例示する。
零ベクトル領域がより低い周波数範囲にある場合には、終了インデックスの量子化に代えて、開始インデックス(零ベクトル領域中の先頭ベクトルのインデックス)が量子化される。終了インデックスが復号器側で知られるように、ビットストリームを逆順に並び替える。より多くのビットを節減する方法を利用できるように、開始インデックスの量子化と終了インデックスの量子化の間で節減ビット数を比較することが望ましい。
1)コードブック指示値のリスト中で零ベクトル領域を探索する。
2)零ベクトル領域が特定された後、順方向サーチに対比して節減ビット数を比較する。そしてより多くの節減ビット数を達成する方法が選択される。
3)逆方向サーチを使用すべきことが確認された後、コードブック指示値のリストを逆順に並び替え、主幹の実施形態において順方向サーチとして例示した方法と同様に、Cb_stepが決定される。
4)本発明で提案された方法によって、コードブック指示値のリストを圧縮する 。
1)順方向サーチと同様に、Cb_stepを特定する。
2)符号器側で行なわれた処理と逆の処理によって零ベクトル範囲を拡張する。
3)逆方向サーチが使用されていることを指示値が示す場合、コードブック指示値のリストを逆順に並び替える。
実施形態2では、逆順並び替え処理がより多くの演算処理能力を必要とする。本実施形態では、コードブック指示値のリストを逆順に並び替えなくてすむ方法が提案される。
本実施形態では、Index_endの可能な値の範囲に従って、消費ビット数を削減することができる。
実施形態1における零ベクトル領域の指示方法では、Qn(n36)の場合の各コードブック指示値は、従来の方法に対比して1ビット余分に消費する。入力信号がQn(n36)によって量子化されるM個のベクトルをもち、 零ベクトル領域がないとすれば、従来の方法に対比してM個の余分なビットがコードブック指示で浪費される。
最後のベクトルまでの零ベクトル領域をもつフレームについては、特別な指示値が使用される。それによって、Cb_stepに起因する零ベクトル数の誤差を回避できる。
本実施形態の特徴は、本発明による方法がTCXコーデックに適用されることである。
本実施形態の特徴は、スペクトル・クラスター分析法がCELPと変換符号化の階層的符号化(階層符号化、エンベディッド符号化)に適用されることである。
本実施形態では、図27に示すように、スペクトル・クラスター分析法が適応利得量子化法と組み合わされる。
ステップ1:合成信号Ssyn(f)の最大絶対値syn_maxを探索する。
ステップ2:AVQ利得/syn_maxの比を計算する。
ステップ3:狭められた範囲内でAVQ利得/syn_maxの比を量子化する(いろいろな信号系列を使用して、狭められた範囲を予め学習させておくことが望ましい)。
ステップ1:合成信号Ssyn(f)の最大絶対値syn_maxを探索する。
ステップ2:インデックス=Index1として、AVQ利得を量子化する。
ステップ3:インデックス=Index2として、syn_maxを量子化する。
ステップ4:狭められた範囲内でIndex2-index1を送信する(いろいろな信号系列を使用して、狭められた範囲を予め学習させておくことが望ましい)。
1)CELP合成信号Ssyn(f)の振幅情報を抽出する。
2)抽出された振幅情報に従って、グローバル利得のサーチ範囲を狭める。
3)狭められた範囲内で利得を量子化する。
本実施形態の特徴は、スペクトル・クラスター分析法により節減されたビットが、量子化されたベクトルの利得精密度を向上させるために利用されることである。
Claims (21)
- 入力信号のスペクトルを複数のサブバンドに分割する帯域分割部と、
各サブバンド中の個々のスペクトル係数を量子化するベクトル量子化部と、
ベクトル量子化によって生成されたサブバンドの一連の指示値を分析することによって、前記スペクトルを零ベクトル領域と非零ベクトル領域に分割するスペクトル分析部と、
前記零ベクトル領域中の零ベクトル各々の一連の指示値を零ベクトル領域の指示値とその零ベクトル領域の終了位置を示すパラメータに変換するパラメータ符号化部と、
を具備するオーディオ/音声符号化装置。 - 前記零ベクトル領域中の零ベクトル各々の一連の指示値を零ベクトル領域の指示値とその零ベクトル領域中の零ベクトルの数を示すパラメータに変換するパラメータ符号化部に、前記パラメータ符号化部を置き換える、
請求項1に記載のオーディオ/音声符号化装置。 - 前記パラメータ符号化部が、
前記零ベクトル領域中の零ベクトル各々の一連の指示値を零ベクトル領域の指示値とその零ベクトル領域の終了位置を示すパラメータに変換する第1のパラメータ符号化部と、
前記一連の指示値を逆順に並び替える逆順並び替え部と、
零ベクトル各々の逆順に並び替えられた一連の指示値を変換する第2のパラメータ符号化部と、
前記第1のパラメータ符号化部と前記第2のパラメータ符号化部のうちで、より少ないビット数を消費する符号化部を選択する選択部と、
を具備するパラメータ符号化部に置き換えられた、
請求項1に記載のオーディオ/音声符号化装置。 - 前記パラメータ符号化部が、
前記零ベクトル領域中の零ベクトル各々の一連の指示値を零ベクトル領域の指示値と、その零ベクトル領域の終了位置を示すパラメータに変換する第1のパラメータ符号化部と、
前記零ベクトル領域中の零ベクトル各々の一連の指示値を零ベクトル領域の指示値と予め決められたスカラー値のうちの一つに開始インデックスの値を掛けることによってその零ベクトル領域中の零ベクトルの数を示すパラメータに変換する第2のパラメータ符号化部と、
前記第1のパラメータ符号化部と前記第2のパラメータ符号化部のうちで、より少ないビット数を消費する符号化部を選択する選択部と、
を具備するパラメータ符号化部に置き換えられた、
請求項1に記載のオーディオ/音声符号化装置。 - 零ベクトル領域の終了位置を示す前記パラメータは、
前記終了位置の可能な値の数に従って、上記パラメータを量子化するためのビット数を適応的に割り当てるビット割当て部と、
割り当てられたビットを使用して上記パラメータを量子化する量子化部と、
によってさらに処理される、
請求項1に記載のオーディオ/音声符号化装置。 - 前記入力スペクトルの最後のサブバンドまでの零ベクトル領域を指示する、零ベクトル領域の特別な指示値が含まれる、
請求項1に記載のオーディオ/音声符号化装置。 - 符号化されたパラメータを生成するためにCELP符号器によって入力信号を符号化するCELP符号化部と、
復号された信号を生成するために前記符号化されたパラメータを復号するCELPローカル復号部と、
誤差信号を生成するために入力信号から前記復号された信号を引き算する引き算部と、
前記誤差信号と前記復号された信号を時間領域から周波数領域へ変換する時間-周波数領域変換部と、
前記誤差信号のスペクトル全体の平均エネルギーを示すグローバル利得を計算するグローバル利得計算部と、
前記復号された信号のスペクトルから振幅情報を抽出する抽出部と、
前記抽出された振幅情報に従って、前記グローバル利得の量子化のためのサーチ範囲を狭める狭化部と、
前記狭められたサーチ範囲内で前記グローバル利得を量子化する量子化部と、
周波数領域において前記量子化されたグローバル利得を使用して前記誤差信号を量子化するベクトル量子化部と、
を具備するオーディオ/音声符号化装置。 - 前記零ベクトル領域中の零ベクトル各々の一連の指示値の前記変換により節減されたビットは、前記スペクトルをサブバンド分割し、少なくとも一つのサブバンドに利得補正係数を付与することによって、前記グローバル利得により細かな分解を与えるために利用される、
請求項1に記載のオーディオ/音声符号化装置。 - 前記符号化装置は、ステレオまたはマルチチャネル入力信号の一つのチャネルまたは複数のチャネルの符号化に適用される、
請求項1に記載のオーディオ/音声符号化装置。 - 前記符号化装置は、複数フレーム単位または複数サブフレーム単位でスペクトル係数列を符号化する符号器に適用される、
請求項1に記載のオーディオ/音声符号化装置。 - 前記零ベクトル領域中の零ベクトル各々の一連の指示値の前記変換により節減されたビットは、フレーム消失隠蔽パラメータの符号化に利用される、
請求項1に記載のオーディオ/音声符号化装置。 - 零ベクトル領域の指示値を復号する指示値復号部と、
その零ベクトル領域の終了位置を示すパラメータを復号する終了位置復号部と、
零ベクトル領域の指示値とその零ベクトル領域の終了位置を示すパラメータをその零ベクトル領域中の零ベクトル各々の一連の指示値に変換するパラメータ変換部と、
各サブバンド中の個々のスペクトル係数を逆量子化するベクトル逆量子化部と、
出力信号を生成するために、前記逆量子化されたスペクトル係数を時間領域へ変換する周波数-時間領域変換部と、
を具備するオーディオ/音声復号装置。 - 零ベクトル領域の指示値とその零ベクトル領域中の零ベクトルの数を示すパラメータをその零ベクトル領域中の零ベクトル各々の一連の指示値に変換するパラメータ変換部に、
前記パラメータ変換部を置き換える、
請求項12に記載のオーディオ/音声復号装置。 - オーディオ/音声符号化装置において前記零ベクトル領域中の零ベクトル各々の一連の指示値が逆順に並び替えられているか否かを示す選択情報を復号する選択パラメータ復号部と、
前記選択情報が前記オーディオ/音声符号化装置での逆順並び替え処理を示す場合は、前記一連の指示値を逆順に並び替える逆順並び替え部と、
をさらに具備する、
請求項12に記載のオーディオ/音声復号装置。 - 零ベクトル領域の指示値とその零ベクトル領域の終了位置を示すパラメータをその零ベクトル領域中の零ベクトル各々の一連の指示値に変換する第1のパラメータ変換部と、
零ベクトル領域の指示値と予め決められたスカラー値のうちの一つに開始インデックスの値を掛けることによってその零ベクトル領域中の零ベクトルの数を示すパラメータをその零ベクトル領域中の零ベクトル各々の一連の指示値に変換する第2のパラメータ変換部と、
前記第1のパラメータ変換部または前記第2のパラメータ変換部のどちらが適用されるかを示す選択情報を復号する選択パラメータ復号部と、
をさらに具備する、
請求項14に記載のオーディオ/音声復号装置。 - 復号された信号を生成するために、符号化されたパラメータを復号するCELP復号部と、
前記復号された信号から振幅情報を抽出する抽出部と、
前記抽出された振幅情報に従って、グローバル利得のためのサーチ範囲を狭める狭化部と、
前記狭められたサーチ範囲内で前記グローバル利得を逆量子化する逆量子化部と、
周波数領域において誤差信号を逆量子化するベクトル逆量子化部と、
前記グローバル利得を掛けることによって前記復号された誤差信号のエネルギーを復元するエネルギー復元部と、
前記誤差信号を周波数領域から時間領域へ変換する周波数-時間領域変換部と、
出力信号を生成するために前記復号された信号と前記復号された誤差信号とを加算する加算部と、
を具備するオーディオ/音声復号装置。 - 前記復号されたスペクトルは、
復号されたスペクトルをある数のサブバンドに分割する帯域分割部と、
復号されたスペクトルを利得補正係数によってスケーリングする利得補正部と、
によりさらに処理される、
請求項12に記載のオーディオ/音声復号装置。 - 入力信号のスペクトルを複数のサブバンドに分割する帯域分割ステップと、
各サブバンド中の個々のスペクトル係数を量子化するベクトル量子化ステップと、
ベクトル量子化によって生成されたサブバンドの一連の指示値を分析することによって、前記スペクトルを零ベクトル領域と非零ベクトル領域に分割するスペクトル分析ステップと、
前記零ベクトル領域中の零ベクトル各々の一連の指示値を零ベクトル領域の指示値とその零ベクトル領域の終了位置を示すパラメータに変換するパラメータ符号化ステップと、
を含んでなるオーディオ/音声符号化方法。 - 符号化されたパラメータを生成するためにCELP符号器によって入力信号を符号化するCELP符号化ステップと、
復号された信号を生成するために前記符号化されたパラメータを復号するCELPローカル復号ステップと、
誤差信号を生成するために入力信号から前記復号された信号を引き算する引き算ステップと、
前記誤差信号と前記復号された信号を時間領域から周波数領域へ変換する時間-周波数領域変換ステップと、
前記誤差信号のスペクトル全体の平均エネルギーを示すグローバル利得を計算するグローバル利得計算ステップと、
前記復号された信号のスペクトルから振幅情報を抽出する抽出ステップと、
前記抽出された振幅情報に従って、前記グローバル利得の量子化のためのサーチ範囲を狭める狭化ステップと、
前記狭められたサーチ範囲内で前記グローバル利得を量子化する量子化ステップと、
周波数領域において前記量子化されたグローバル利得を使用して前記誤差信号を量子化するベクトル量子化ステップと、
を含んでなるオーディオ/音声符号化方法。 - 零ベクトル領域の指示値を復号する指示値復号ステップと、
その零ベクトル領域の終了位置を示すパラメータを復号する終了位置復号ステップと、
零ベクトル領域の指示値とその零ベクトル領域の終了位置を示すパラメータをその零ベクトル領域中の零ベクトル各々の一連の指示値に変換するパラメータ変換ステップと、
各サブバンド中の個々のスペクトル係数を逆量子化するベクトル逆量子化ステップと、 出力信号を生成するために、前記逆量子化されたスペクトル係数を時間領域へ変換する周波数-時間領域変換ステップと、
を含んでなるオーディオ/音声復号方法。 - 復号された信号を生成するために、符号化されたパラメータを復号するCELP復号ステップと、
前記復号された信号から振幅情報を抽出する抽出ステップと、
前記抽出された振幅情報に従って、グローバル利得のためのサーチ範囲を狭める狭化ステップと、
前記狭められたサーチ範囲内で前記グローバル利得を逆量子化する逆量子化ステップと、
周波数領域において誤差信号を逆量子化するベクトル逆量子化ステップと、
前記グローバル利得を掛けることによって前記復号された誤差信号のエネルギーを復元するエネルギー復元ステップと、
前記誤差信号を周波数領域から時間領域へ変換する周波数-時間領域変換ステップと、
出力信号を生成するために前記復号された信号と前記復号された誤差信号とを加算する加算ステップと、
を含んでなるオーディオ/音声復号方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US13/807,129 US9240192B2 (en) | 2010-07-06 | 2011-07-06 | Device and method for efficiently encoding quantization parameters of spectral coefficient coding |
| JP2012523770A JP5629319B2 (ja) | 2010-07-06 | 2011-07-06 | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010-154232 | 2010-07-06 | ||
| JP2010154232 | 2010-07-06 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2012004998A1 true WO2012004998A1 (ja) | 2012-01-12 |
Family
ID=45440987
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2011/003884 Ceased WO2012004998A1 (ja) | 2010-07-06 | 2011-07-06 | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US9240192B2 (ja) |
| JP (1) | JP5629319B2 (ja) |
| TW (1) | TW201209805A (ja) |
| WO (1) | WO2012004998A1 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013118476A1 (ja) * | 2012-02-10 | 2013-08-15 | パナソニック株式会社 | 音響/音声符号化装置、音響/音声復号装置、音響/音声符号化方法および音響/音声復号方法 |
| WO2013180164A1 (ja) * | 2012-05-30 | 2013-12-05 | 日本電信電話株式会社 | 符号化方法、符号化装置、プログラム、および記録媒体 |
| JP5738480B2 (ja) * | 2012-04-02 | 2015-06-24 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置及びプログラム |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106507111B (zh) * | 2016-11-17 | 2019-11-15 | 上海兆芯集成电路有限公司 | 使用残差补偿的视频编码方法以及使用该方法的装置 |
| CN110503977A (zh) * | 2019-07-12 | 2019-11-26 | 国网上海市电力公司 | 一种变电站设备音频信号采集分析系统 |
| US11575896B2 (en) * | 2019-12-16 | 2023-02-07 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, encoding method, and decoding method |
| CN113206673B (zh) * | 2021-05-24 | 2024-04-02 | 上海海事大学 | 用于网络化控制系统信号量化的差分缩放方法及终端 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004120623A (ja) * | 2002-09-27 | 2004-04-15 | Ntt Docomo Inc | 符号化装置、符号化方法、復号装置及び復号方法 |
| JP2009153157A (ja) * | 2006-02-17 | 2009-07-09 | Fr Telecom | 置換符号による特にベクトル量子化におけるディジタル信号の符号化/復号化の改善 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6006179A (en) * | 1997-10-28 | 1999-12-21 | America Online, Inc. | Audio codec using adaptive sparse vector quantization with subband vector classification |
| WO2003091989A1 (en) * | 2002-04-26 | 2003-11-06 | Matsushita Electric Industrial Co., Ltd. | Coding device, decoding device, coding method, and decoding method |
| EP2538405B1 (en) * | 2006-11-10 | 2015-07-08 | Panasonic Intellectual Property Corporation of America | CELP-coded speech parameter decoding method and apparatus |
| CN101842832B (zh) | 2007-10-31 | 2012-11-07 | 松下电器产业株式会社 | 编码装置和解码装置 |
-
2011
- 2011-07-06 WO PCT/JP2011/003884 patent/WO2012004998A1/ja not_active Ceased
- 2011-07-06 TW TW100123878A patent/TW201209805A/zh unknown
- 2011-07-06 US US13/807,129 patent/US9240192B2/en active Active
- 2011-07-06 JP JP2012523770A patent/JP5629319B2/ja not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004120623A (ja) * | 2002-09-27 | 2004-04-15 | Ntt Docomo Inc | 符号化装置、符号化方法、復号装置及び復号方法 |
| JP2009153157A (ja) * | 2006-02-17 | 2009-07-09 | Fr Telecom | 置換符号による特にベクトル量子化におけるディジタル信号の符号化/復号化の改善 |
Non-Patent Citations (5)
| Title |
|---|
| MINJIE XIE ET AL.: "Embedded algebraic vecto rquantizers (EAVQ) with application to wideband speech coding, Acoustics, Speech, and Signal Processing, 1996. ICASSP-96.", CONFERENCE PROCEEDINGS., 1996 IEEE INTERNATIONAL CONFERENCE ON, May 1996 (1996-05-01), pages 240 - 243 * |
| S. RAGOT ET AL.: "Low- complexity multi-rate lattice vector quantization with application to wideband TCX speech coding at 32 kbit/s", ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2004. PROCEEDINGS. (ICASSP '04). IEEE INTERNATIONAL CONFERENCE ON, May 2004 (2004-05-01), pages I-501 - I-504 * |
| SAIKAT CHATTERJEE ET AL.: "Split Vector Quantization of LSF Parameters using Conditional Pdf", ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2007. ICASSP 2007. IEEE INTERNATIONAL CONFERENCE ON, April 2007 (2007-04-01), pages IV-1101 - IV-1104 * |
| TONG SHI ET AL.: "On the use of splitting vectors with zero components for constrained encoder design, Communications, 1996.", ICC 96, CONFERENCE RECORD, CONVERGING TECHNOLOGIES FOR TOMORROW'S APPLICATIONS. 1996 IEEE INTERNATIONAL CONFERENCE ON, July 1996 (1996-07-01), pages 1542 - 1544 * |
| WOO-JIN HAN ET AL.: "Multicodebook split vector quantization of LSF parameters", SIGNAL PROCESSING LETTERS, IEEE, IEEE, December 2002 (2002-12-01), pages 418 - 421 * |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013118476A1 (ja) * | 2012-02-10 | 2013-08-15 | パナソニック株式会社 | 音響/音声符号化装置、音響/音声復号装置、音響/音声符号化方法および音響/音声復号方法 |
| US9454972B2 (en) | 2012-02-10 | 2016-09-27 | Panasonic Intellectual Property Corporation Of America | Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech |
| JP5738480B2 (ja) * | 2012-04-02 | 2015-06-24 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置及びプログラム |
| WO2013180164A1 (ja) * | 2012-05-30 | 2013-12-05 | 日本電信電話株式会社 | 符号化方法、符号化装置、プログラム、および記録媒体 |
| CN104321813A (zh) * | 2012-05-30 | 2015-01-28 | 日本电信电话株式会社 | 编码方法、编码装置、程序、以及记录介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20130103394A1 (en) | 2013-04-25 |
| US9240192B2 (en) | 2016-01-19 |
| TW201209805A (en) | 2012-03-01 |
| JPWO2012004998A1 (ja) | 2013-09-02 |
| JP5629319B2 (ja) | 2014-11-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101435893B1 (ko) | 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치 | |
| JP6170520B2 (ja) | オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置 | |
| KR101139172B1 (ko) | 스케일러블 음성 및 오디오 코덱들에서 양자화된 mdct 스펙트럼에 대한 코드북 인덱스들의 인코딩/디코딩을 위한 기술 | |
| CN102460570B (zh) | 用于对音频信号进行编码和解码的方法及设备 | |
| CN103098126B (zh) | 音频编码器、音频解码器及利用复预测处理多信道音频信号的相关方法 | |
| CN103052983B (zh) | 音频或视频编码器、音频或视频解码器及编码和解码方法 | |
| JP5695074B2 (ja) | 音声符号化装置および音声復号化装置 | |
| JP6027538B2 (ja) | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 | |
| EP2814028B1 (en) | Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech | |
| JP5629319B2 (ja) | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 | |
| MX2015004022A (es) | Aparato y metodo para codificar y decodificador una señal de audio codificada utilizando modelado de ruido temporal/de parche. | |
| CN101276587A (zh) | 声音编码装置及其方法和声音解码装置及其方法 | |
| WO2005096274A1 (en) | An enhanced audio encoding/decoding device and method | |
| CN101162584A (zh) | 使用带宽扩展技术对音频信号编码和解码的方法和设备 | |
| EP3685375B1 (en) | Method and device for efficiently distributing a bit-budget in a celp codec | |
| CN1677492A (zh) | 一种增强音频编解码装置及方法 | |
| WO2009022193A2 (en) | Devices, methods and computer program products for audio signal coding and decoding | |
| KR20160098597A (ko) | 통신 시스템에서 신호 코덱 장치 및 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 11803335 Country of ref document: EP Kind code of ref document: A1 |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2012523770 Country of ref document: JP |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 13807129 Country of ref document: US |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| 122 | Ep: pct application non-entry in european phase |
Ref document number: 11803335 Country of ref document: EP Kind code of ref document: A1 |