JP3894722B2 - Stereo audio signal high efficiency encoding device - Google Patents
Stereo audio signal high efficiency encoding device Download PDFInfo
- Publication number
- JP3894722B2 JP3894722B2 JP2000327885A JP2000327885A JP3894722B2 JP 3894722 B2 JP3894722 B2 JP 3894722B2 JP 2000327885 A JP2000327885 A JP 2000327885A JP 2000327885 A JP2000327885 A JP 2000327885A JP 3894722 B2 JP3894722 B2 JP 3894722B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- audio signal
- block length
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、ステレオオーディオ信号をブロックに分割して高能率で符号化するステレオオーディオ信号高能率符号化装置に関するものである。
【0002】
【従来の技術】
近年、オーディオ信号に対する高能率符号化方式として、変換符号化を利用した方式が広く用いられており、この変換符号化を利用した方式としては、MPEG2のAAC(Advanced Audio Coding)やドルビーディジタルが挙げられる。また、他の高能率符号化方式として、サブバンドフィルタと変換符号化とを組み合わせたハイブリッド符号化もあり、このハイブリッド符号化を利用した方式としては、MPEG1およびMPEG2のレーヤ3が挙げられる。
【0003】
以上の方式のうち変換符号化を利用して、ステレオオーディオ信号に対し、高能率に符号化する従来のステレオオーディオ信号高能率符号化装置について、以下に説明する。
【0004】
図6は変換符号化を利用したステレオオーディオ信号高能率符号化装置の全体構成を示すブロック図である。図6において、600と601は周波数変換部、610と611はブロック長決定部、620はジョイントステレオ信号生成部、630は量子化及び符号化部である。
【0005】
以上のように構成されたステレオオーディオ信号高能率符号化装置について、その動作を以下に述べる。
まず、入力された左チャンネル(Lch)の時間軸のオーディオ信号は、周波数変換部600において、ブロック長決定部610で決定された長さのブロックに分割され、直交変換されて周波数軸のスペクトル係数に変換される。
【0006】
これに対し、ハイブリッド符号化方式の場合には、入力されたオーディオ信号はフィルタバンクでサブバンド信号に分割され、各サブバンド信号はブロック長決定部610で決定された長さのブロックに分割され、その後は同様に直交変換されて周波数軸のスペクトル係数に変換される。
【0007】
この場合の直交変換としては、主としてMDCT(変形離散コサイン変換)やFFT(高速フーリエ変換)が用いられる。
同様に、入力された右チャンネル(Rch)の時間軸のオーディオ信号は、周波数変換部601において、ブロック長決定部611で決定された長さのブロックに分割され、直交変換されて周波数軸のスペクトル係数に変換される。
【0008】
ブロック長決定部610、611では、それぞれのチャンネルの信号に基づき周波数変換時のブロックの時間長(ブロック長)を決定する。また、ブロック長決定部610、611では、それぞれのチャンネルの信号の変化に応じてブロック長すなわち直交変換長を変化させることにより、プリエコーと呼ばれる疑似信号による音質の劣化を防止する。
【0009】
図7は従来のステレオオーディオ信号高能率符号化装置におけるブロック長とプリエコーの関係を示す説明図である。同図では、直交変換としてMDCTを用いたときの図であり、隣接ブロックは50%オーバーラップしている。
【0010】
なお、図7(a)は入力信号波形を、図7(b)は図7(a)の入力信号を長いブロック長を使って符号化・復号化した信号波形と変換に用いた窓の波形を、図7(c)は図7(a)の入力信号を短いブロック長を使って符号化・復号化した信号波形と変換に用いた窓の波形を示す。また、図7(b)でTLは長いブロック長の時間を、図7(c)でTSは短いブロック長の時間を示す。図7ではTSはTLの1/4の時間である。
【0011】
図7(a)に示すような急激な立ち上がりを含む信号を、図7(b)のような長いブロック長で変換符号化すると、振幅の大きな部分の引き起こす量子化ノイズが振幅の小さい部分に広がり、疑似信号を発生する。一方、図7(c)に示すように短いブロック長で変換符号化すると、振幅の大きな部分の引き起こす量子化ノイズは短いブロックの中に閉じ込められる。
【0012】
大きな振幅の信号による量子化ノイズは変換ブロック全体に発生するが、聴覚の前向性マスキング(フォワードマスキング)の方が後向性マスキング(バックワードマスキング)より作用を及ぼす時間が長いので、大きな信号の後のノイズは大きな信号の前に発生するノイズと比較して知覚されにくい。
【0013】
大きな信号の前に発生するノイズは本来の信号が聞こえる前に聞こえるのでプリエコーと呼ばれ、品質を大きく劣化させる。また、大きな信号の後に発生するノイズはポストエコーと呼ばれる。
【0014】
したがって、変換符号化方式やハイブリッド符号化方式では、急激な立ち上がり信号に対しては、短いブロック長を選択することによりプリエコーを抑圧する。また、急峻な立下り信号に対して短いブロック長を選択することによりポストエコーを抑圧する。ただし、前述のようにポストエコーはプリエコーより聞こえにくいので、ポストエコーを抑圧しないこともある。
【0015】
従来のステレオオーディオ信号高能率符号化装置におけるブロック長決定部610、611としては、例えば特開平3−263926号公報に記載されたものが知られている。
【0016】
図8は従来のステレオオーディオ信号高能率符号化装置における左チャンネルブロック長決定部610と右チャンネルブロック長決定部611の構成を示すブロック図である。図8において、800と801はセグメント信号レベル算出器、810と811はセグメント信号レベルメモリ、820と821は信号レベル変化検出器、830と831はブロック長判定器である。左チャンネルブロック長決定部610は、セグメント信号レベル算出器800、セグメント信号レベルメモリ810、信号レベル変化検出器820、ブロック長判定器830から構成され、また、右チャンネルブロック長決定部611は、セグメント信号レベル算出器801、セグメント信号レベルメモリ811、信号レベル変化検出器821、ブロック長判定器831から構成される。
【0017】
なお、左チャンネルブロック長決定部610と右チャンネルブロック長決定部611の構成と動作は同一であるので、以下、左チャンネルブロック長決定部610の動作について述べ、右チャンネルブロック長決定部611の動作については説明を省略する。
【0018】
まず、入力された左チャンネルオーディオ信号は、セグメント信号レベル算出器800で、最も短いブロックより小さい時間のセグメントに分割され、各セグメントの信号レベルをセグメント内の信号の2乗値の和、すなわちエネルギで算出する。
【0019】
セグメント信号レベルメモリ810では、セグメント信号レベル算出器800で算出された各セグメントの信号レベルを記憶する。信号レベル変化検出器820では、セグメント信号レベルメモリ810から読み出したセグメントの信号レベルを用いて、隣接するセグメントの信号レベルの比を求めて出力する。
【0020】
ブロック長判定器830では、信号レベル変化検出器820からの信号レベルの比が閾値を越えるときには、短いブロック長を表す信号を出力し、そうでないときには長いブロック長を表す信号を出力する。
【0021】
以上のようにして、信号の急激な上昇を検出したときには、短いブロック長を表す信号を出力することにより、プリエコーを抑圧することができる。
図6のジョイントステレオ信号生成部620では、ブロック長、スペクトル係数を入力として、ジョイントステレオ符号化に必要なジョイントステレオ信号を生成する。ここで、ジョイントステレオ信号とは、ミッド/サイドステレオ(和差信号)符号化に必要な左チャンネルと右チャンネルの周波数スペクトルの和信号と差信号、あるいはインテンシティステレオ符号化に必要な左チャンネルと右チャンネルの周波数スペクトルの和信号のことである。
【0022】
図9は従来のステレオオーディオ信号高能率符号化装置におけるミッド/サイドステレオ符号化の説明図である。図9に示すように、ミッド/サイドステレオ符号化とは、左右のチャンネルの周波数スペクトルを直接符号化する代わりに、左右のチャンネルの周波数スペクトルの和の1/2の信号(ミッド信号、もしくは和信号)と、差の1/2の信号(サイド信号、もしくは差信号)を符号化するものである。
【0023】
ミッド/サイドステレオでは、図9に示すように、左右両チャンネルの周波数スペクトルに類似性がある場合に、左/右周波数スペクトルを直接符号化するよりもミッド/サイド周波数スペクトルを符号化する方が、周波数スペクトルを符号化するのに必要なビット数は少なくて済む。以上のようにして、ミッド/サイドステレオ符号化を適用することにより、符号化効率を改善し、かつ音質を向上することができる。
【0024】
また、インテンシティステレオとは、所定の周波数(通常3kHzから6kHz)以上では、聴覚的には、スペクトルの微細構造よりもスペクトルのエンベロープの方が重要であることを利用して、上記の所定の周波数以上では、周波数スペクトルの情報としては左右のチャンネルの周波数スペクトルの和信号のみを符号化し、エンベロープ情報のみ左右のチャンネル別々に符号化することにより、符号化効率を改善するものである。
【0025】
エンベロープ情報としては、和信号と各チャンネルの信号のエネルギーの比を送る。インテンシティステレオ符号化では、ミッド/サイドステレオ符号化よりも高い符号化効率を実現できるが、スペクトルの微細構造が再現できないことにより、音質劣化が生じることがある。
【0026】
図6の量子化及び符号化部630では、左右ステレオ信号あるいはジョイントステレオ信号生成部620からのジョイントステレオ信号に対して、聴覚モデルに基づいて、スペクトル係数のマスキングレベル、すなわち許容量子化ノイズレベルを算出し、算出された許容量子化ノイズレベルに基づいてスペクトル係数の量子化を行い、ハフマン符号化等の符号化処理を行い、高能率符号化データを出力する。
【0027】
【発明が解決しようとする課題】
しかしながら上記のような従来のステレオオーディオ信号高能率符号化装置では、図8に示すように、Lchブロック長決定部610およびRchブロック長決定部611のそれぞれにおいて、入力信号に対するブロック長判定を各チャンネル毎に独立して行っているため、例えば左右のチャンネルで入力信号に対して判定したブロック長が異なっている時には、量子化及び符号化部630において、ミッド/サイドステレオ符号化やインテンシティステレオ符号化のような符号化効率の高いジョイントステレオ符号化が適用できなくなり、この場合には、ジョイントステレオ符号化を適用した場合と比較して、音質が劣化することがあるという問題点を有していた。
【0028】
本発明は、上記従来の問題点を解決するもので、ステレオオーディオ信号を、ジョイントステレオ符号化方式に対して、従来にくらべてより良好に適用させることができ、その適用によってステレオオーディオ信号に対する符号化効率を改善して、この符号化信号に基づいて得られるステレオオーディオ信号の音質を向上することができるステレオオーディオ信号高能率符号化装置を提供する。
【0029】
【課題を解決するための手段】
上記課題を解決するために本発明のステレオオーディオ信号高能率符号化装置は、ステレオオーディオ信号を入力信号として、各チャンネルのオーディオ信号をブロックに分割し、そのブロック長に基づいてジョイントステレオ符号化により高能率に符号化するステレオオーディオ信号高能率符号化装置であって、前記各チャンネルのオーディオ信号を所定の時間幅毎のセグメントに分割し、そのセグメントの信号レベルを算出する手段と、前記セグメントの信号レベルの変化から前記各チャンネル毎に独立にオーディオ信号の急激な上昇あるいは下降を検出する手段と、前記セグメントの信号レベルの変化量に基づいて、前記ジョイントステレオ符号化を適用しない場合に対応するブロックの時間長である単一チャンネルブロック長を、前記各チャンネルのオーディオ信号に対して独立に算出する手段と、各チャンネルの前記単一チャンネルブロック長が異なる場合には、各チャンネルのブロックの時間長を、共に前記単一チャンネルブロック長の短い方の時間長に決定し、そうでない場合には、各チャンネルの前記単一チャンネルブロック長を、そのまま各チャンネルのブロックの時間長に決定する手段とを備えた構成としたことを特徴とする。
【0030】
以上により、二つのチャンネルの単一チャンネルブロック長に基づき、両者を統合して各チャンネルのブロックの時間長を決定することができる。
【0031】
【発明の実施の形態】
本発明の請求項1に記載のステレオオーディオ信号高能率符号化装置は、ステレオオーディオ信号を入力信号として、各チャンネルのオーディオ信号をブロックに分割し、そのブロック長に基づいてジョイントステレオ符号化により高能率に符号化するステレオオーディオ信号高能率符号化装置であって、前記各チャンネルのオーディオ信号を所定の時間幅毎のセグメントに分割し、そのセグメントの信号レベルを算出する手段と、前記セグメントの信号レベルの変化から前記各チャンネル毎に独立にオーディオ信号の急激な上昇あるいは下降を検出する手段と、前記セグメントの信号レベルの変化量に基づいて、前記ジョイントステレオ符号化を適用しない場合に対応するブロックの時間長である単一チャンネルブロック長を、前記各チャンネルのオーディオ信号に対して独立に算出する手段と、各チャンネルの前記単一チャンネルブロック長が異なる場合には、各チャンネルのブロックの時間長を、共に前記単一チャンネルブロック長の短い方の時間長に決定し、そうでない場合には、各チャンネルの前記単一チャンネルブロック長を、そのまま各チャンネルのブロックの時間長に決定する手段とを備えた構成とする。
【0033】
これらの構成によると、二つのチャンネルの単一チャンネルブロック長に基づき、両者を統合して各チャンネルのブロックの時間長を決定する。
請求項2に記載のステレオオーディオ信号高能率符号化装置は、ステレオオーディオ信号を入力信号として、各チャンネルのオーディオ信号をブロックに分割し、そのブロック長に基づいてジョイントステレオ符号化により高能率に符号化するステレオオーディオ信号高能率符号化装置であって、前記各チャンネルのオーディオ信号を所定の時間幅毎のセグメントに分割し、そのセグメントの信号レベルを算出する手段と、前記セグメントの信号レベルの変化から前記各チャンネル毎に独立にオーディオ信号の急激な上昇あるいは下降を検出する手段と、前記セグメントの信号レベルの変化量に基づいて、前記ジョイントステレオ符号化を適用しない場合に対応するブロックの時間長である単一チャンネルブロック長を、前記各チャンネルのオーディオ信号に対して独立に算出する手段と、前記各チャンネル間で、前記セグメントの信号レベルの変化を比較して、前記信号レベルの変化の類似性を判定する手段と、各チャンネルの前記信号レベルの変化に類似性があり、かつ各チャンネルの前記単一チャンネルブロック長が異なる場合には、各チャンネルのブロックの時間長を、共に前記単一チャンネルブロック長の短い方の時間長に決定し、そうでない場合には、各チャンネルの前記単一チャンネルブロック長を、そのまま各チャンネルのブロックの時間長に決定する手段とを備えた構成とする。
【0034】
請求項3に記載のステレオオーディオ信号高能率符号化装置は、請求項2記載の各チャンネル間で、それらのセグメントの信号レベルが最も急激に変化したときの信号レベルの変化量と時間の違いが、所定の範囲内にある場合に、各チャンネルの信号レベルの変化に類似性があると判定する構成とする。
【0036】
これらの構成によると、二つのチャンネルの信号レベルの変化の類似性を考慮して、この信号レベルの変化の類似性により、ジョイントステレオ符号化が効率的に動作することが期待できる場合においてのみ、二つのチャンネルの単一チャンネルブロック長に基づいて各チャンネルのブロックの時間長を決定する。
【0037】
請求項4に記載のステレオオーディオ信号高能率符号化装置は、ステレオオーディオ信号を入力信号として、各チャンネルのオーディオ信号をブロックに分割し、そのブロック長に基づいてジョイントステレオ符号化により高能率に符号化するステレオオーディオ信号高能率符号化装置であって、前記各チャンネルのオーディオ信号を所定の時間幅毎のセグメントに分割し、そのセグメントの信号レベルを算出する手段と、前記セグメントの信号レベルの変化から前記各チャンネル毎に独立にオーディオ信号の急激な上昇あるいは下降を検出する手段と、前記セグメントの信号レベルの変化量に基づいて、前記ジョイントステレオ符号化を適用しない場合に対応するブロックの時間長である単一チャンネルブロック長を、前記各チャンネルのオーディオ信号に対して独立に算出する手段と、前記各チャンネル間で、前記セグメントの信号レベルを比較して、前記信号レベルの類似性を判定する手段と、各チャンネルの前記信号レベルに類似性があり、かつ各チャンネルの前記単一チャンネルブロック長が異なる場合には、各チャンネルのブロックの時間長を、共に前記単一チャンネルブロック長の短い方の時間長に決定し、そうでない場合には、各チャンネルの前記単一チャンネルブロック長を、そのまま各チャンネルのブロックの時間長に決定する手段とを備えた構成とする。
【0038】
請求項5に記載のステレオオーディオ信号高能率符号化装置は、請求項4記載の各チャンネル間の信号レベルの類似性を、各チャンネルで対応するセグメントの信号レベルの和と、前記信号レベルの差との比を用いて判定する構成とする。
【0040】
これらの構成によると、二つのチャンネルの信号レベルの類似性を考慮して、この信号レベルの類似性により、ジョイントステレオ符号化が効率的に動作することが期待できる場合においてのみ、二つのチャンネルの単一チャンネルブロック長に基づいて各チャンネルのブロックの時間長を決定する。
【0044】
以下、本発明の一実施の形態を示すステレオオーディオ信号高能率符号化装置について、図面を参照しながら具体的に説明する。
図1は本実施の形態のステレオオーディオ信号高能率符号化装置の全体構成を示すブロック図である。図1において、100と101は周波数変換部、110は統合ブロック長決定部、120はジョイントステレオ信号生成部、130は量子化及び符号化部である。
【0045】
以上のように構成されたステレオオーディオ信号高能率符号化装置について、その動作を以下に述べる。
入力された左チャンネル(Lch)の時間軸のオーディオ信号は、周波数変換部100において、統合ブロック長決定部110で決定された長さのブロックに分割され、直交変換されて周波数軸のスペクトル係数に変換される。同様に、入力された右チャンネル(Rch)の時間軸のオーディオ信号は、周波数変換部101において、統合ブロック長決定部110で決定された長さのブロックに分割され、直交変換されて周波数軸のスペクトル係数に変換される。本実施の形態では、直交変換としてMDCTを用いる。
【0046】
統合ブロック長決定部110では、左右両方のチャンネルの信号に基づいて、左チャンネルと右チャンネルの周波数変換時のブロックの時間長を決定する。また、統合ブロック長決定部110では、ジョイントステレオ符号化の適用を考慮してブロック長すなわち直交変換長を決定し、プリエコーあるいはポストエコーと呼ばれる疑似信号による音質の劣化を防止する。
【0047】
なお、ハイブリッド符号化方式の場合には、入力されたオーディオ信号はフィルタバンク(図示せず)でサブバンド信号に分割され、各サブバンド信号は統合ブロック長決定部110で決定された長さのブロックに分割され、直交変換されてスペクトル係数に変換される。
【0048】
ジョイントステレオ信号生成部120では、左右のチャンネルのブロック長およびスペクトル係数を入力として、量子化及び符号化部130におけるジョイントステレオ符号化に必要なジョイントステレオ信号を生成する。このジョイントステレオ符号化として、本実施の形態では、ミッド/サイドステレオ符号化とインテンシティステレオ符号化を用いる。
【0049】
すなわち、ジョイントステレオ信号生成部120で、ミッド/サイドステレオ符号化を適用する場合には、左チャンネルと右チャンネルの周波数スペクトルの和信号と差信号を生成し、またインテンシティステレオ符号化を適用する場合には、左チャンネルと右チャンネルの周波数スペクトルの和信号のみを生成する。
【0050】
量子化及び符号化部130では、左右ステレオ信号、あるいはジョイントステレオ信号生成部120からのジョイントステレオ信号に対して、聴覚モデルに基づいて、スペクトル係数のマスキングレベル、すなわち許容量子化ノイズレベルを算出し、算出された許容量子化ノイズレベルに基づいて、スペクトル係数の量子化を行い、ハフマン符号化等の符号化処理を行い、高能率符号化データを出力する。
【0051】
以上のように、本発明の特徴である統合ブロック長決定部を用いた実施の形態のステレオオーディオ信号高能率符号化装置について、統合ブロック長決定部110の各種構成例を挙げて、以下に詳細に説明する。
(実施の形態1)
図2は本実施の形態1のステレオオーディオ信号高能率符号化装置における統合ブロック長決定部の構成を示すブロック図である。図2において、200と201はそれぞれ左と右の各チャンネルのセグメント信号レベル算出器、210と211はそれぞれ左と右の各チャンネルのセグメント信号レベルメモリ、220と221はそれぞれ左と右の各チャンネルの信号レベル変化検出器、230と231はそれぞれ左と右の各チャンネルのブロック長判定器、240はブロック長統合判定器である。
【0052】
以上のように構成された本実施の形態1のステレオオーディオ信号高能率符号化装置における統合ブロック長決定部について、その動作を以下に述べる。
左チャンネルに入力されたオーディオ信号は、セグメント信号レベル算出器200で最も短いブロックの時間と同じかそれより小さい時間のセグメントに分割され、各セグメントの信号レベルがセグメント内の信号の2乗値の和で算出される。
【0053】
図3に本実施の形態におけるブロックとセグメントとの関係を示す。同図で上から順に長いブロック、短いブロック、セグメントを表し、破線は相対時間関係を示す。本実施の形態では、直交変換としてMDCTを用いているため、各ブロックは50%オーバーラップしている。
【0054】
また、通常は、長いブロックは512サンプルから2048サンプルで、また短いブロックは64から256サンプルで構成されるが、本実施の形態では、長いブロックは1024サンプル、短いブロックは256サンプル、セグメントは128サンプルで構成されている。すなわち、短いブロック長(TS)は長いブロック長(TL)の1/4の時間で、セグメント長(T)は短いブロック長(TS)の1/2の時間である。
【0055】
なお、セグメント信号レベル算出器200で算出されるセグメントの信号レベルとしては、ダイナミックレンジを小さくするため、あるいは処理量を減らすために、上記セグメント内の信号の2乗値の和の代わりに信号の絶対値の和、あるいは信号の絶対値の最大をもちいてもよい。また、ハイブリッド符号化方式の場合には、サブバンドフィルタ(帯域通過フィルタ)の出力であるサブバンド信号を、セグメント信号レベル算出器200に入力する。
【0056】
次に、セグメント信号レベルメモリ210では、セグメント信号レベル算出器200で算出された各セグメントの信号レベルをメモリに記憶する。ここで、セグメントiの信号レベルをS(i)とする。
【0057】
信号レベル変化検出器220では、信号の立ち上り検出するため、セグメント信号レベルメモリ210から読み出した信号レベルをもちいて、セグメントiの信号レベルS(i)に対する直前のセグメントの信号レベルS(i−1)の比、すなわちS(i)/S(i−1)を求め、その値を出力する。
【0058】
また、信号レベル検出器220では、信号の立下りを検出するため、セグメント信号レベルメモリ210から読み出した信号レベルをもちいて、4個のセグメントの信号レベルの和T(4×i)を求め、隣接する4個のセグメント毎の信号レベルの和の比、すなわちT(4×i)/T(4×i+4)の値を出力する。このように、信号の立下りの場合、4個のセグメントの信号レベルの和を用いるのは、前記したように聴覚の前向性マスキングの方が後向性マスキングより作用を及ぼす時間が長いことに基づく。
【0059】
次にブロック長判定器230は、信号レベル変化検出器220からのS(i)/S(i−1)の値が閾値を越えるときには、短いブロック長を表す信号を出力し、そうでないときには長いブロック長を表す信号を出力する。
【0060】
以上のようにして、信号の急激な上昇を検出したときには、短いブロック長を表す信号を出力することにより、プリエコーを抑圧することができる。さらに、ブロック長判定器230は、T(4×i)/T(4×i+4)の値が閾値を越えるときにも、短いブロック長を表す信号を出力する。また、信号の急激な下降を検出したときには短いブロック長を表す信号を出力することにより、ポストエコーを抑圧することができる。
【0061】
以上のようにブロック長判定器230は、左チャンネルに入力されたオーディオ信号に基づいて、ジョイントステレオ符号化を適用しないで符号化する場合に対応するブロックの時間長である単一チャンネルブロック長を、左チャンネルのオーディオ信号に対応させて算出し出力する。同様に、ブロック長判定器231は、右チャンネルに入力されたオーディオ信号に基づいて、ジョイントステレオ符号化を適用しないで符号化する場合に対応するブロックの時間長である単一チャンネルブロック長を、右チャンネルのオーディオ信号に対応させて算出し出力する。
【0062】
ブロック長統合判定器240では、ブロック長判定器230からの左チャンネルの単一チャンネルブロック長と、ブロック長判定器231からの右チャンネルの単一チャンネルブロック長とに基づいて、右チャンネルと左チャンネルのそれぞれのブロック長を決定する。
【0063】
この左右チャンネルの各ブロック長を決定する場合、ブロック長統合判定器240では、二つの単一チャンネルブロック長に基づき、二つの単一チャンネルブロック長が異なる場合には、両チャンネルのブロック長を共に、二つの単一チャンネルブロック長のうち短い方のブロック長に決定して出力する。また、二つの単一チャンネルブロック長が同一の場合には、各チャンネルの単一チャンネルブロック長を、そのまま各チャンネルのブロック長(各チャンネル間で同一)に決定して出力する。
【0064】
以上のように、両方のチャンネルをそれらの短い側のブロック長とすることにより、プリエコーやポストエコーを抑圧し、符号化効率の高いジョイントステレオ符号化の適用により音質を向上することができる。
【0065】
なお、信号レベルの変化の検出精度を高める目的で、セグメント信号レベル算出器200とセグメント信号レベル算出器201の入力として、オーディオ信号を直接入力する代わりに、高域通過フィルタ(HPF)あるいは帯域通過フィルタ(BPF)を通過したオーディオ信号を用いてもよい。
【0066】
以上のように本実施の形態では、ブロック長統合判定器240を設けることにより、二つのチャンネルの単一チャンネルブロック長が異なるときには、両方のチャンネルのブロック長を短いブロック長で統一することにより、ジョイントステレオ符号化を適用し易くし、ジョイントステレオ符号化による符号化効率の改善および音質の向上を実現することができる。
(実施の形態2)
図4は本実施の形態2のステレオオーディオ信号高能率符号化装置における統合ブロック長決定部の構成を示すブロック図である。図4において、400と401はそれぞれ左と右の各チャンネルのセグメント信号レベル算出器、410と411はそれぞれ左と右の各チャンネルのセグメント信号レベルメモリ、420と421はそれぞれ左と右の各チャンネルの信号レベル変化検出器、430と431はそれぞれ左と右の各チャンネルのブロック長判定器、440はブロック長統合判定器、450は信号レベル変化類似性判定器である。
【0067】
図2に示した実施の形態1と図4に示した実施の形態2の構成の違いは、実施の形態2では、信号レベル変化類似性判定器450が追加されている点である。以上のように構成された本実施の形態2のステレオオーディオ信号高能率符号化装置における統合ブロック長決定部について、その動作を以下に述べる。なお、セグメント信号レベル算出器400と401、セグメント信号レベルメモリ410と411、信号レベル変化検出器420と421、ブロック長判定器430と431の各動作は、実施の形態1の対応するブロックと同一であるので、ここでの説明は省略する。
【0068】
信号レベル変化検出器420と421は、それぞれ左と右の各チャンネルの信号レベルの上昇と下降の変化の度合いを示す値を出力するように構成されており、信号レベル変化類似性判定器450では、左チャンネルの信号レベル変化検出器420から出力される左チャンネルの信号レベルの上昇及び下降時の変化の度合いを示す値について、ブロック長決定時に考慮しなければならない時間の中での最大値とその最大値を与える時間を求めるとともに、右チャンネルについても、同様に、その信号レベル変化検出器421から出力される右チャンネルの信号レベルの上昇及び下降時の変化の度合いを示す値について、最大値とその最大値を与える時間を求める。
【0069】
両方のチャンネルの上昇及び下降時の変化量の最大値とその最大値を与える時間が所定の範囲内にあるときには、両方のチャンネルの信号は類似性があると判定し、一方、そうでないときには、両方のチャンネルの信号は類似性がないと判定して、その結果を示す信号を出力する。
【0070】
左チャンネルのブロック長判定器430は、ジョイントステレオ符号化を適用しないで符号化する場合に対応する左チャンネルの単一チャンネルブロック長を出力し、同様に、右チャンネルのブロック長判定器431は、ジョイントステレオ符号化を適用しないで符号化する場合に対応する右チャンネルの単一チャンネルブロック長を出力するように構成されており、ブロック長統合判定器440では、ブロック長判定器430からの左チャンネルの単一チャンネルブロック長とブロック長判定器431からの右チャンネルの単一チャンネルブロック長と信号レベル変化類似性判定器450からの類似性判定結果に基づいて、右チャンネルと左チャンネルのそれぞれにおいて、ブロックの時間長を決定し、その結果を示す各チャンネルのブロック長を示す信号を出力する。
【0071】
ブロック長統合判定器440では、信号レベル変化類似性判定器450で類似性があると判定され、かつ二つの単一チャンネルブロック長が異なる場合には、両チャンネルのブロック長を共に、二つの単一チャンネルブロック長のうち短い方のブロックの時間長に決定して、その結果信号を出力する。上記以外の場合には、各チャンネルの単一チャンネルブロック長をそのまま各チャンネルのブロックの時間長に決定して結果を出力する。
【0072】
以上のように二つのチャンネルの信号レベルの変化に類似性がある場合で、かつ二つのチャンネルの単一チャンネルブロック長が異なる場合には、両方のチャンネルのブロックを短い方の時間長とすることにより、プリエコーやポストエコーを抑圧し、符号化効率の高いジョイントステレオ符号化の適用により音質を向上することができる。
【0073】
また、前記の類似性がない場合には、ジョイントステレオ符号化による符号化効率改善が期待されないので、それぞれのチャンネル信号に適したブロックの時間長で符号化する。
【0074】
以上のように本実施の形態では、ブロック長統合判定器440と信号レベル変化類似性判定器450とを設けることにより、二つのチャンネルの信号レベルの変化に類似性があり、かつそれらの単一チャンネルブロック長が異なるときには、両方のチャンネルのブロックを短い時間長に統一することにより、ジョイントステレオ符号化を適用し易くし、ジョイントステレオ符号化による符号化効率の改善により音質を向上することができる。
(実施の形態3)
図5は本実施の形態3のステレオオーディオ信号高能率符号化装置における統合ブロック長決定部の構成を示すブロック図である。図5において、500と501はそれぞれ左と右の各チャンネルのセグメント信号レベル算出器、510と511はそれぞれ左と右の各チャンネルのセグメント信号レベルメモリ、520と521はそれぞれ左と右の各チャンネルの信号レベル変化検出器、530と531はそれぞれ左と右の各チャンネルのブロック長判定器、540はブロック長統合判定器、550は信号レベル類似性判定器である。
【0075】
図2に示した実施の形態1と図5に示した実施の形態3の構成の違いは、実施の形態3では、信号レベル類似性判定器550が追加されている点である。
以上のように構成された本実施の形態3のステレオオーディオ信号高能率符号化装置における統合ブロック長決定部について、その動作を以下に述べる。なお、セグメント信号レベル算出器500と501、セグメント信号レベルメモリ510と511、信号レベル変化検出器520と521、ブロック長判定器530と531の各動作は、実施の形態1の対応するブロックと同一であるので、ここでの説明は省略する。
【0076】
信号レベル類似性判定器550では、左チャンネルのセグメント信号レベルメモリ510と、右チャンネルのセグメント信号レベルメモリ511とから、それぞれのチャンネルの信号レベルを読み出して両者を比較することにより、両方のチャンネルの信号レベルの類似性を判定して、その結果信号を出力する。
【0077】
すなわち、信号レベル類似性判定器550では、二つののチャンネルの対応する時間が同一のセグメントの信号レベルの和に対する信号レベルの差の絶対値の比が所定の閾値以下となるときには、二つのチャンネルの信号レベルは類似性があると判定し、そうでないときには、二つのチャンネルの信号は類似性がないと判定し、その結果信号を出力する。
【0078】
左チャンネルのブロック長判定器530は、ジョイントステレオ符号化を適用しないで符号化する場合に対応する左チャンネルの単一チャンネルブロック長を出力し、同様に、右チャンネルのブロック長判定器531は、ジョイントステレオ符号化を適用しないで符号化する場合に対応する右チャンネルの単一チャンネルブロック長を出力するように構成されており、ブロック長統合判定器540では、ブロック長判定器530からの左チャンネルの単一チャンネルブロック長とブロック長判定器531からの右チャンネルの単一チャンネルブロック長と信号レベル類似性判定器550からの類似性判定結果に基づいて、右チャンネルと左チャンネルのそれぞれにおいて、ブロックの時間長を決定し、結果を示す各chのブロック長を示す信号を出力する。
【0079】
ブロック長統合判定器540では、信号レベル類似性判定器550で類似性があると判定され、かつ二つの単一チャンネルブロック長が異なる場合には、両チャンネルのブロック長を共に、二つの単一チャンネルブロック長のうち短い方のブロックの時間長に決定して、その結果信号を出力する。上記以外の場合には、各チャンネルの単一チャンネルブロック長をそのまま各チャンネルのブロックの時間長に決定して結果を出力する。
【0080】
以上のように二つのチャンネルの信号レベルに類似性がある場合で、かつ二つのチャンネルの単一チャンネルブロック長が異なる場合には、両方のチャンネルのブロック長を短い方の時間長とすることにより、プリエコーやポストエコーを抑圧し、符号化効率の高いジョイントステレオ符号化の適用により音質を向上することができる。
【0081】
また、前記の類似性がない場合には、ジョイントステレオ符号化による符号化効率改善が期待されないので、それぞれのチャンネル信号に適したブロックの時間長で符号化する。
【0082】
以上のように本実施の形態では、ブロック長統合判定器540と信号レベル類似性判定器550とを設けることにより、二つのチャンネルの信号レベルに類似性があり、かつそれらの単一チャンネルブロック長が異なるときには、両方のチャンネルのブロックを短い時間長で統一することにより、ジョイントステレオ符号化を適用し易くし、ジョイントステレオ符号化による符号化効率の改善により音質を向上することができる。
【0083】
【発明の効果】
以上のように本発明によれば、二つのチャンネルの単一チャンネルブロック長に基づき、両者を統合して各チャンネルのブロックの時間長を決定することができる。
【0084】
また、二つのチャンネルの信号レベルの変化の類似性を考慮して、この信号レベルの変化の類似性により、ジョイントステレオ符号化が効率的に動作することが期待できる場合においてのみ、二つのチャンネルの単一チャンネルブロック長に基づいて各チャンネルのブロックの時間長を決定することができる。
【0085】
また、二つのチャンネルの信号レベルの類似性を考慮して、この信号レベルの類似性により、ジョイントステレオ符号化が効率的に動作することが期待できる場合においてのみ、二つのチャンネルの単一チャンネルブロック長に基づいて各チャンネルのブロックの時間長を決定することができる。
【0086】
以上により、ステレオオーディオ信号を、ジョイントステレオ符号化方式に対して、従来にくらべてより良好に適用させることができ、その適用によってステレオオーディオ信号に対する符号化効率を改善して、この符号化信号に基づいて得られるステレオオーディオ信号の音質を向上することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態のステレオオーディオ信号高能率符号化装置の全体構成を示すブロック図
【図2】本発明の実施の形態1のステレオオーディオ信号高能率符号化装置における統合ブロック長決定部の構成を示すブロック図
【図3】本発明の実施の形態におけるブロック長とセグメントとの関係説明図
【図4】本発明の実施の形態2のステレオオーディオ信号高能率符号化装置における統合ブロック長決定部の構成を示すブロック図
【図5】本発明の実施の形態3のステレオオーディオ信号高能率符号化装置における統合ブロック長決定部の構成を示すブロック図
【図6】従来のステレオオーディオ信号高能率符号化装置の全体構成を示すブロック図
【図7】同従来例における動作を説明するためのブロック長とプリエコーとの関係説明図
【図8】同従来例における左右チャンネルのブロック長決定部の構成を示すブロック図
【図9】同従来例における動作を説明するためのミッド/サイドステレオ符号化の方式説明図
【符号の説明】
100,101 周波数変換部
110 統合ブロック長決定部
120 ジョイントステレオ信号生成部
130 量子化及び符号化部
200,201,400,401,500,501 セグメント信号レベル算出器
210,211,410,411,510,511 セグメント信号レベルメモリ
220,221,420,421,520,521 信号レベル変化検出器
230,231,430,431,530,531 ブロック長判定器
240,440,540 ブロック長統合判定器
450 信号レベル変化類似性判定器
550 信号レベル類似性判定器[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a stereo audio signal high-efficiency encoding apparatus that divides a stereo audio signal into blocks and encodes them with high efficiency.
[0002]
[Prior art]
In recent years, as a high-efficiency encoding method for audio signals, a method using transform coding has been widely used. Examples of the method using transform coding include MPEG2 Advanced Audio Coding (AAC) and Dolby Digital. It is done. As another high-efficiency encoding scheme, there is hybrid encoding combining a subband filter and transform encoding. As a scheme using this hybrid encoding, there is a layer 3 of MPEG1 and MPEG2.
[0003]
A conventional stereo audio signal high-efficiency encoding apparatus that performs high-efficiency encoding on a stereo audio signal using transform encoding among the above methods will be described below.
[0004]
FIG. 6 is a block diagram showing the overall configuration of a stereo audio signal high-efficiency encoding apparatus using transform encoding. In FIG. 6, 600 and 601 are frequency conversion units, 610 and 611 are block length determination units, 620 is a joint stereo signal generation unit, and 630 is a quantization and encoding unit.
[0005]
The operation of the stereo audio signal high-efficiency encoding apparatus configured as described above will be described below.
First, the input left-channel (Lch) time axis audio signal is divided into blocks of the length determined by the block
[0006]
On the other hand, in the case of the hybrid coding method, the input audio signal is divided into subband signals by the filter bank, and each subband signal is divided into blocks having a length determined by the block
[0007]
As orthogonal transform in this case, MDCT (modified discrete cosine transform) and FFT (fast Fourier transform) are mainly used.
Similarly, the input time channel audio signal of the right channel (Rch) is divided into blocks of the length determined by the block
[0008]
Block
[0009]
FIG. 7 is an explanatory diagram showing the relationship between the block length and the pre-echo in the conventional stereo audio signal high efficiency coding apparatus. In the figure, MDCT is used as orthogonal transform, and adjacent blocks overlap by 50%.
[0010]
7A shows an input signal waveform, FIG. 7B shows a signal waveform obtained by encoding and decoding the input signal shown in FIG. 7A using a long block length, and a window waveform used for conversion. FIG. 7C shows a signal waveform obtained by encoding and decoding the input signal of FIG. 7A using a short block length and a window waveform used for the conversion. In FIG. 7B, TL indicates a long block length time, and in FIG. 7C, TS indicates a short block length time. In FIG. 7, TS is 1/4 time of TL.
[0011]
When a signal including a sudden rise as shown in FIG. 7A is transcoded with a long block length as shown in FIG. 7B, the quantization noise caused by the large amplitude part spreads to the small amplitude part. , Generate a pseudo signal. On the other hand, when transform coding is performed with a short block length as shown in FIG. 7C, quantization noise caused by a portion with a large amplitude is confined in the short block.
[0012]
Quantization noise due to large amplitude signals occurs throughout the transform block, but the large amount of signal is due to the fact that auditory forward masking (forward masking) takes longer to act than backward masking (backward masking). The later noise is less perceptible than the noise that occurs before a large signal.
[0013]
Since noise generated before a large signal is heard before the original signal is heard, it is called a pre-echo and greatly deteriorates the quality. Noise generated after a large signal is called post-echo.
[0014]
Therefore, in the transform coding scheme and the hybrid coding scheme, the pre-echo is suppressed by selecting a short block length for a sudden rising signal. In addition, the post-echo is suppressed by selecting a short block length for the steep falling signal. However, since the post-echo is less audible than the pre-echo as described above, the post-echo may not be suppressed.
[0015]
As block
[0016]
FIG. 8 is a block diagram showing the configuration of the left channel block
[0017]
Since the configuration and operation of the left channel block
[0018]
First, the input left channel audio signal is segmented by a segment
[0019]
The segment
[0020]
The
[0021]
As described above, when a sudden increase in signal is detected, a pre-echo can be suppressed by outputting a signal representing a short block length.
The joint stereo
[0022]
FIG. 9 is an explanatory diagram of mid / side stereo coding in a conventional stereo audio signal high efficiency coding apparatus. As shown in FIG. 9, mid / side stereo encoding is not a direct encoding of the frequency spectrum of the left and right channels, but a signal half the sum of the frequency spectra of the left and right channels (mid signal or sum). Signal) and a signal of half the difference (side signal or difference signal).
[0023]
In the mid / side stereo, as shown in FIG. 9, when the frequency spectra of both the left and right channels are similar, it is better to encode the mid / side frequency spectrum than to directly encode the left / right frequency spectrum. The number of bits required to encode the frequency spectrum is small. By applying mid / side stereo coding as described above, coding efficiency can be improved and sound quality can be improved.
[0024]
Intensity stereo means that the above-mentioned predetermined stereophony is utilized by utilizing the fact that the spectral envelope is more important than the fine structure of the spectrum auditorily above a predetermined frequency (usually 3 kHz to 6 kHz). Above the frequency, only the sum signal of the frequency spectrum of the left and right channels is encoded as frequency spectrum information, and only the envelope information is encoded separately for the left and right channels, thereby improving the encoding efficiency.
[0025]
As envelope information, the ratio of the energy of the sum signal and the signal of each channel is sent. Intensity stereo coding can achieve higher coding efficiency than mid / side stereo coding, but sound quality may deteriorate due to the inability to reproduce the fine structure of the spectrum.
[0026]
In the quantization and
[0027]
[Problems to be solved by the invention]
However, in the conventional stereo audio signal high-efficiency encoding apparatus as described above, as shown in FIG. 8, in each of the Lch block
[0028]
The present invention solves the above-described conventional problems, and can apply a stereo audio signal to a joint stereo encoding method better than the conventional one. There is provided a stereo audio signal high-efficiency encoding device capable of improving the sound quality of a stereo audio signal obtained on the basis of the encoded signal by improving the conversion efficiency.
[0029]
[Means for Solving the Problems]
In order to solve the above problems, a stereo audio signal high-efficiency encoding device according to the present invention uses a stereo audio signal as an input signal, divides the audio signal of each channel into blocks, and performs joint stereo encoding based on the block length. A stereo audio signal high-efficiency encoding apparatus for encoding with high efficiency, the audio signal of each channel is divided into segments for each predetermined time width, and a signal level of the segment is calculated, For each channel from the change in signal level Independently A single channel block length which is a time length of a block corresponding to a case where the joint stereo coding is not applied based on means for detecting a sudden rise or fall of an audio signal and the amount of change in the signal level of the segment. , For each channel audio signal Independently When the single channel block length of each channel is different from the means for calculating, the time length of the block of each channel is determined to be the shorter time length of the single channel block length, otherwise Comprises a means for determining the single channel block length of each channel as the time length of the block of each channel as it is.
[0030]
As described above, based on the single channel block length of the two channels, the time length of the block of each channel can be determined by integrating both.
[0031]
DETAILED DESCRIPTION OF THE INVENTION
The stereo audio signal high-efficiency encoding apparatus according to
[0033]
According to these structures, based on the single channel block length of two channels, both are integrated and the block length of each channel is determined.
The stereo audio signal high-efficiency encoding apparatus according to
[0034]
Claim 3 The stereo audio signal high-efficiency encoding device according to
[0036]
According to these configurations, considering the similarity of the signal level changes of the two channels, only when the joint stereo coding can be expected to operate efficiently due to the similarity of the signal level changes, The block length of each channel is determined based on the single channel block length of the two channels.
[0037]
The stereo audio signal high-efficiency encoding apparatus according to
[0038]
Claim 5 The stereo audio signal high-efficiency encoding device according to
[0040]
According to these configurations, considering the similarity of the signal levels of the two channels, the similarity of the two channels can be used only when joint stereo coding can be expected to operate efficiently due to the similarity of the signal levels. The block length of each channel is determined based on the single channel block length.
[0044]
Hereinafter, a stereo audio signal high-efficiency encoding apparatus showing an embodiment of the present invention will be specifically described with reference to the drawings.
FIG. 1 is a block diagram showing the overall configuration of the stereo audio signal high-efficiency encoding apparatus of the present embodiment. In FIG. 1, 100 and 101 are frequency conversion units, 110 is an integrated block length determination unit, 120 is a joint stereo signal generation unit, and 130 is a quantization and coding unit.
[0045]
The operation of the stereo audio signal high-efficiency encoding apparatus configured as described above will be described below.
The input left-channel (Lch) time-axis audio signal is divided into blocks of the length determined by the integrated block
[0046]
The integrated block
[0047]
In the case of the hybrid coding scheme, the input audio signal is divided into subband signals by a filter bank (not shown), and each subband signal has a length determined by the integrated block
[0048]
The joint stereo
[0049]
That is, when mid / side stereo coding is applied in the joint stereo
[0050]
The quantization and
[0051]
As described above, the stereo audio signal high-efficiency encoding apparatus according to the embodiment using the integrated block length determining unit, which is a feature of the present invention, will be described in detail below by giving various configuration examples of the integrated block
(Embodiment 1)
FIG. 2 is a block diagram showing a configuration of an integrated block length determination unit in the stereo audio signal high efficiency coding apparatus according to the first embodiment. 2, 200 and 201 are segment signal level calculators for the left and right channels, 210 and 211 are segment signal level memories for the left and right channels, and 220 and 221 are left and right channels, respectively. Signal
[0052]
The operation of the integrated block length determination unit in the stereo audio signal high-efficiency encoding apparatus according to
The audio signal input to the left channel is divided into segments having a time equal to or shorter than the time of the shortest block by the segment
[0053]
FIG. 3 shows the relationship between blocks and segments in the present embodiment. In the figure, a long block, a short block, and a segment are shown in order from the top, and a broken line indicates a relative time relationship. In this embodiment, since MDCT is used as orthogonal transform, each block overlaps by 50%.
[0054]
In general, a long block is composed of 512 to 2048 samples and a short block is composed of 64 to 256 samples. In this embodiment, a long block is 1024 samples, a short block is 256 samples, and a segment is 128 samples. Consists of samples. That is, the short block length (TS) is 1/4 time of the long block length (TL), and the segment length (T) is 1/2 time of the short block length (TS).
[0055]
Note that the signal level of the segment calculated by the segment
[0056]
Next, the segment
[0057]
The signal
[0058]
The
[0059]
Next, the block
[0060]
As described above, when a sudden increase in signal is detected, a pre-echo can be suppressed by outputting a signal representing a short block length. Further, the block
[0061]
As described above, the block
[0062]
The block length integrated
[0063]
When determining the block lengths of the left and right channels, the block length integrated
[0064]
As described above, by setting both channels to block lengths on the short side, pre-echo and post-echo can be suppressed, and sound quality can be improved by applying joint stereo coding with high coding efficiency.
[0065]
For the purpose of improving the detection accuracy of the signal level change, instead of directly inputting an audio signal as an input to the segment
[0066]
As described above, in the present embodiment, by providing the block length integrated
(Embodiment 2)
FIG. 4 is a block diagram showing a configuration of an integrated block length determination unit in the stereo audio signal high efficiency coding apparatus according to the second embodiment. 4, 400 and 401 are segment signal level calculators for the left and right channels, 410 and 411 are segment signal level memories for the left and right channels, and 420 and 421 are left and right channels, respectively. The signal
[0067]
The difference in configuration between the first embodiment shown in FIG. 2 and the second embodiment shown in FIG. 4 is that a signal level change
[0068]
The signal
[0069]
When the maximum value of the rise and fall of both channels and the time for giving the maximum value are within a predetermined range, it is determined that the signals of both channels are similar. It is determined that the signals of both channels are not similar, and a signal indicating the result is output.
[0070]
The left channel
[0071]
In the block length integrated
[0072]
If there are similarities in the signal level changes of the two channels as described above and the single channel block lengths of the two channels are different, set the blocks of both channels to the shorter time length. Thus, pre-echo and post-echo can be suppressed, and sound quality can be improved by applying joint stereo coding with high coding efficiency.
[0073]
In addition, when there is no such similarity, since it is not expected to improve the coding efficiency by joint stereo coding, coding is performed with a block length suitable for each channel signal.
[0074]
As described above, in the present embodiment, by providing the block length integrated
(Embodiment 3)
FIG. 5 is a block diagram showing a configuration of an integrated block length determination unit in the stereo audio signal high efficiency coding apparatus according to the third embodiment. In FIG. 5, 500 and 501 are segment signal level calculators for the left and right channels, 510 and 511 are segment signal level memories for the left and right channels, and 520 and 521 are the left and right channels, respectively. Signal
[0075]
A difference in configuration between the first embodiment shown in FIG. 2 and the third embodiment shown in FIG. 5 is that a signal level
The operation of the integrated block length determination unit in the stereo audio signal high-efficiency encoding apparatus according to Embodiment 3 configured as described above will be described below. The operations of the segment
[0076]
The signal level
[0077]
That is, in the signal level
[0078]
The left channel
[0079]
In the block length integrated
[0080]
As described above, when the signal levels of the two channels are similar and the single channel block lengths of the two channels are different, the block length of both channels is set to the shorter time length. The sound quality can be improved by suppressing the pre-echo and post-echo and applying joint stereo coding with high coding efficiency.
[0081]
In addition, when there is no such similarity, since it is not expected to improve the coding efficiency by joint stereo coding, coding is performed with a block length suitable for each channel signal.
[0082]
As described above, in the present embodiment, by providing the block length integrated
[0083]
【The invention's effect】
As described above, according to the present invention, based on the single channel block length of two channels, the time length of the block of each channel can be determined by integrating both.
[0084]
In addition, considering the similarity of the signal level changes of the two channels, the similarity of the signal levels of the two channels can be used only when joint stereo coding can be expected to operate efficiently due to the similarity of the signal level changes. Based on the single channel block length, the block length of each channel can be determined.
[0085]
In addition, considering the similarity of the signal levels of the two channels, the single channel block of the two channels can be used only when joint stereo coding can be expected to operate efficiently due to the similarity of the signal levels. Based on the length, the time length of the block of each channel can be determined.
[0086]
As described above, the stereo audio signal can be applied to the joint stereo encoding method better than before, and the application improves the encoding efficiency for the stereo audio signal, and the encoded signal is converted into this encoded signal. The sound quality of the stereo audio signal obtained based on this can be improved.
[Brief description of the drawings]
FIG. 1 is a block diagram showing an overall configuration of a stereo audio signal high-efficiency encoding apparatus according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of an integrated block length determination unit in the stereo audio signal high-efficiency encoding apparatus according to
FIG. 3 is an explanatory diagram of a relationship between a block length and a segment in the embodiment of the present invention.
FIG. 4 is a block diagram showing a configuration of an integrated block length determination unit in the stereo audio signal high-efficiency encoding apparatus according to
FIG. 5 is a block diagram showing a configuration of an integrated block length determination unit in the stereo audio signal high-efficiency encoding apparatus according to Embodiment 3 of the present invention;
FIG. 6 is a block diagram showing the overall configuration of a conventional stereo audio signal high efficiency encoding device.
FIG. 7 is an explanatory diagram of the relationship between the block length and pre-echo for explaining the operation in the conventional example.
FIG. 8 is a block diagram showing a configuration of a block length determining unit for left and right channels in the conventional example
FIG. 9 is an explanatory diagram of a mid / side stereo encoding method for explaining the operation in the conventional example.
[Explanation of symbols]
100, 101 Frequency converter
110 Integrated block length determination unit
120 joint stereo signal generator
130 Quantization and Coding Unit
200, 201, 400, 401, 500, 501 Segment signal level calculator
210, 211, 410, 411, 510, 511 Segment signal level memory
220,221,420,421,520,521 Signal level change detector
230, 231, 430, 431, 530, 531 Block length determiner
240, 440, 540 Block length integrated decision unit
450 Signal level change similarity determiner
550 Signal level similarity determiner
Claims (5)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000327885A JP3894722B2 (en) | 2000-10-27 | 2000-10-27 | Stereo audio signal high efficiency encoding device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000327885A JP3894722B2 (en) | 2000-10-27 | 2000-10-27 | Stereo audio signal high efficiency encoding device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2002132295A JP2002132295A (en) | 2002-05-09 |
| JP3894722B2 true JP3894722B2 (en) | 2007-03-22 |
Family
ID=18804825
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000327885A Expired - Fee Related JP3894722B2 (en) | 2000-10-27 | 2000-10-27 | Stereo audio signal high efficiency encoding device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3894722B2 (en) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100501930B1 (en) * | 2002-11-29 | 2005-07-18 | 삼성전자주식회사 | Audio decoding method recovering high frequency with small computation and apparatus thereof |
| US7809579B2 (en) | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
| US7725324B2 (en) | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
| US7516064B2 (en) * | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
| WO2006000951A1 (en) * | 2004-06-21 | 2006-01-05 | Koninklijke Philips Electronics N.V. | Method of audio encoding |
| JP4809370B2 (en) | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Adaptive bit allocation in multichannel speech coding. |
| US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
| JP5163545B2 (en) * | 2009-03-05 | 2013-03-13 | 富士通株式会社 | Audio decoding apparatus and audio decoding method |
| KR101334134B1 (en) | 2012-08-09 | 2013-12-02 | 전자부품연구원 | Multi channel audio coding method and apparatus |
-
2000
- 2000-10-27 JP JP2000327885A patent/JP3894722B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2002132295A (en) | 2002-05-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111656442B (en) | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding | |
| JP4934427B2 (en) | Speech signal decoding apparatus and speech signal encoding apparatus | |
| CN103329197B (en) | For the stereo parameter coding/decoding of the improvement of anti-phase sound channel | |
| CN101030373B (en) | System and method for stereo perceptual audio coding using adaptive masking threshold | |
| CN1205755C (en) | Audio decoding method and device for restoring high-frequency components with a small amount of calculation | |
| US20080201152A1 (en) | Apparatus for Encoding and Decoding Audio Signal and Method Thereof | |
| US20080208600A1 (en) | Apparatus for Encoding and Decoding Audio Signal and Method Thereof | |
| US20040181403A1 (en) | Coding apparatus and method thereof for detecting audio signal transient | |
| US9293146B2 (en) | Intensity stereo coding in advanced audio coding | |
| US9992599B2 (en) | Method, device, encoder apparatus, decoder apparatus and audio system | |
| EP3762923B1 (en) | Audio coding | |
| KR101035104B1 (en) | Processing Multi-Channel Signals | |
| CA2556575A1 (en) | Multichannel audio coding | |
| KR20070003593A (en) | Method for Encoding and Decoding Multichannel Audio Signals | |
| EP2345026A1 (en) | Apparatus for binaural audio coding | |
| CN101421779A (en) | Apparatus and method for production of a surrounding-area signal | |
| CN105378832A (en) | Audio object separation from mixture signal using object-specific time/frequency resolutions | |
| US20100080397A1 (en) | Audio decoding method and apparatus | |
| WO2006003813A1 (en) | Audio encoding and decoding apparatus | |
| JP3894722B2 (en) | Stereo audio signal high efficiency encoding device | |
| US20120163608A1 (en) | Encoder, encoding method, and computer-readable recording medium storing encoding program | |
| CN102272830B (en) | Audio signal decoding device and method of balance adjustment | |
| CN100339886C (en) | Encoder capable of detecting transient position of sound signal and encoding method | |
| US20080161952A1 (en) | Audio data processing apparatus | |
| JP2006003580A (en) | Audio signal encoding apparatus and audio signal encoding method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050401 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050510 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050708 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060530 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060629 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060811 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061114 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061212 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091222 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101222 Year of fee payment: 4 |
|
| LAPS | Cancellation because of no payment of annual fees |