JP4091994B2

JP4091994B2 - ディジタルオーディオ符号化方法及び装置

Info

Publication number: JP4091994B2
Application number: JP01097095A
Authority: JP
Inventors: 尚▲いく▼ 金; 延培金; 亮錫徐
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 1994-06-30
Filing date: 1995-01-26
Publication date: 2008-05-28
Anticipated expiration: 2023-05-28
Also published as: DE4447257A1; US5673289A; KR100289733B1; KR960002276A; JPH0816195A

Description

【０００１】
【産業上の利用分野】
本発明はディジタルオーディオの符号化方法及び装置に係り、特に人間の音響心理特性によるビット数の割当と量子化誤差を減らすことにより、音質を向上させうるディジタルオーディオ符号化方法および装置に関する。
【０００２】
【従来の技術】
オーディオ機器は記録媒体に信号を記録し、使用者が必要時に記録された信号を記録媒体から再生してオーディオを楽しむ装置であって、最近ディジタル信号処理技術の発達により既存のアナログ信号によるロングプレイヤ（ＬＤ）と磁気テーププレイヤにおいてディジタル信号によるコンパクトディスクプレイヤとディジタルオーディオテーププレイヤへの開発が進行されて音質の向上を図っているが、ディジタル方式はデータの量が多くなる問題がある。
【０００３】
このような問題は最近ＩＳＯにより標準化作業が進行されているＭＰＥＧオーディオや商品化されたディジタルコンパクトカセット（ＤＣＣ）技術やミニディスク（ＭＤ）技術のように人間の音響心理特性を考慮して減らすことができる。
【０００４】
音響心理特性を用いた技術の概要は次の通りである。音声やオーディオデータの処理においては信号を帯域別に分割して処理する場合が多い。帯域別に分割して処理する理由には“量子化処理により発生する量子化誤差が復元時、広い帯域に影響を及ばないようにする”という信号処理側面の理由と、“人間の聴覚知覚特性を信号処理時に考慮するに適するようにする”という人間の感性能力を考慮した理由が代表的である。
【０００５】
人間の聴覚知覚特性に対する研究は音響心理学（psychoacustics）に発展して来たが、音響心理学によると、人間は処理帯域例えば、臨界帯域内の信号のパワーと発生する量子化雑音の量により外乱を感じる。これに、既存の方式は各処理帯域で存してもよいが、聞いても感じられない量子化雑音の最大量を利用してビットを割り当てた。
【０００６】
このような方式において、発生する量子化雑音はある処理帯域で存し得る最大量以下となるようにしているが、即ち処理帯域内における量子化雑音の総和と見た時には感じられない量子化誤差と見做したが、各周波数成分と見た時には特定周波数成分の値が、聞ける量子化雑音の限界を越える場合が発生しうる問題を有している。
【０００７】
【発明が解決しようとする課題】
本発明の目的はこのような従来の技術の問題点を解決するために各処理帯域で発生する雑音の総和を減少させ、各周波数成分の値で発生する量子化誤差を減らすため、各周波数成分で発生する量子化誤差を隣接信号に伝播するディジタルオーディオ符号化方法および装置を提供することである。
【０００８】
【課題を解決するための手段】
前記の目的を達成するために本発明の方法は、ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力する段階と、マッピングされたサブバンド信号に基づいて人間心理特性により各サブバンド信号に対するビット数を割り当てる段階と、伝播された以前の量子化誤差により前記各サブバンド信号分を補償し、補償されたサブバンド信号を対応する割り当てられたビット数に応じて量子化し、現在の量子化誤差を次の量子化処理に伝播する量子化段階と、量子化されたデータをフレーム単位で伝送ビットストリームを形成する段階とを具備し、前記ビット数を割り当てる段階は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とを具備したことを特徴とするディジタルオーディオ符号化方法である。
【０００９】
本発明のディジタルオーディオ符号化方法において、前記各サブバンドは、トーンが区別できない臨界帯域であることを特徴とする。
【００１１】
本発明のディジタルオーディオ符号化方法において、前記マスキングされたスレショルド値はアナログオーディオ信号を離散フーリエ変換し、変換された信号のサブバンドごとに各信号の量を求める過程と、信号のサブバンドにおけるスペクトル値を、トーンが区分できない複数の臨界帯域に分割し各臨界帯域におけるパワーの和を求める過程と、信号の周波数と前記パワーの和によりマスキングされたスレショルド値を求める過程と、前記各臨界で最大値を有するマスキングされたスレショルド値をその臨界帯域の臨時マスキングされたスレショルド値として決定する過程と、信号がない静かな状態におけるスレショルド値と前記臨時スレショルド値を比較して大きい値を有するものをその臨界帯域の最終マスキングされたスリショルド値として求める過程とを具備することを特徴とする。
【００１２】
本発明のディジタルオーディオ符号化方法において、前記各チャネルのチャネル比は帯域比のうち、最小帯域比と帯域数の乗をチャネル比から減算することによりオフセット補償することを特徴とする。
【００１３】
本発明のディジタルオーディオ符号化方法において、前記各帯域重要度による各帯域のビット割当は帯域の重要度を考慮して前記サブバンド信号のうち高周波成分からビット割り当てることを特徴とする。
【００１４】
本発明のディジタルオーディオ符号化方法において、前記各帯域比は帯域比のうち、最小帯域比を各帯域から減算することによりオフセット補償をすることを特徴とする。
【００１５】
本発明のディジタルオーディオ符号化方法において、前記帯域重要度は帯域のビット数割当が決定された帯域の帯域比を除いた残り帯域の帯域比を有して新たな重要度を求めることを特徴とする。
【００１６】
本発明のディジタルオーディオ符号化方法において、前記帯域ビット数を割り当てる過程は帯域加重値を考慮して割り当てることを特徴とする。
【００１７】
本発明のディジタルオーディオ符号化方法において、前記量子化段階は各帯域内の信号をトーンである信号とトーンでない信号に区分し、各信号で発生する量子化誤差をトーンである信号はトーンである信号により補償されるようにし、トーンでない信号はトーンでない信号により補償されるようにすることを特徴とする。
【００１８】
また、前記目的を達成するための本発明の他の方法は、ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力する段階と、マッピングされたサブバンド信号に基づいて人間心理特性に従って各サブバンドのサブバンド信号に対するビット数を割り当てる段階と、各サブバンド信号に対して加重値が考慮され、伝播された以前の量子化誤差により前記各サブバンド信号を補償し、補償されたサブバンド信号を前記割り当てられたビット数に従って量子化し、現在の量子化誤差を加重値を考慮して次の量子化処理に伝播する量子化段階と、量子化されたデータをフレーム単位で伝送ストリームを形成する段階とを具備し、前記ビット数を割り当てる段階は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とを具備したことを特徴とするディジタルオーディオ符号化方法。
【００１９】
また前記目的を達成するための本発明の装置は、ディジタルオーディオ信号を複数のサブバンドにマッピングして、マッピングされたサブバンド信号を出力するマッピング手段と、マッピングされたサブバンド信号に基づいて人間心理特性により各帯域のサブバンド信号に対するビット数を割り当てるビット数割当手段と、各サブバンド信号に対して伝播された以前の量子化誤差によりサブバンド信号を補償し、補償されたサブバンド信号を前記割り当てられたビット数に従って量子化し現在の量子化誤差を次の量子化処理に伝播する量子化手段と、量子化されたデータをフレーム単位で伝送ストリームを形成するフレームパッキング手段とを具備し、前記ビット数割当手段は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とによってビット数を割り当てるものであることを特徴とするディジタルオーディオ符号化装置。
【００２０】
【作用】
ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力し、マッピングされたサブバンド信号に基づいて人間心理特性により各サブバンド信号に対するビット数を割当てて、伝播された以前の量子化誤差により前記各サブバンド信号分を補償し、補償されたサブバンド信号を対応する割り当てられたビット数に従って量子化し、現在の量子化誤差を次の量子化処理に伝播して量子化し、量子化されたデータをフレーム段階で伝送ビットストリームを形成させる。
【００２１】
また、本発明の他の方法では、量子化段階で伝播された量子化の誤差のみならず、サブバンド加重値を鑑みて量子化を行うことで、さらに良質のオーディオ信号の符号化を可能とするものである。
【００２２】
さらに上述のように構成された本発明の装置は、マッピング手段によりディジタルオーディオ信号を複数のサブバンドにマッピングし、サブバンド信号に基づいてビット数割当手段が人間心理特性により各帯域のサブバンド信号に対するビット数を割り当て、量子化手段が各サブバンド信号に対して伝播された以前の量子化誤差によりサブバンド信号を補償し、補償されたサブバンド信号を前記割り当てられたビット数に従って量子化し現在の量子化誤差を次の量子化処理に伝播して、フレームパッキング手段が量子化されたデータをフレーム単位で伝送ストリームを形成することにより、前記各方法によるオーディオ信号の符号化を行う装置である。
【００２３】
【実施例】
以下、添付した図面に基づき本発明を詳細に説明する。
【００２４】
人間の音響心理特性を考慮したオーディオ機器は、符号化時に主な目標は発生された雑音の除去でなく、雑音を聞かせないように処理することであって、マスキング現像と臨界帯域を考慮して入力信号と他の信号が相互マスクされた時に変化する人間が聞いて感じられるレベル、即ちマスクされたスレショルド値を求めた後、マスクされたスレショルド値と量子化された雑音との比を利用して重要度に従ってビットを割り当てて処理している。
【００２５】
人間の音響心理特性中に使用されるマスキング現象と臨界帯域に対して調べてみると、マスキング（masking)現象とは、例えば電鉄駅で対話する時、電鉄が側を過ぎない際には小さい声でも意思伝達が可能であるが、電鉄が側を過ぎる時には同じ大きさの小さい声では意思伝達されないことのように対話音声と電鉄が過ぎる音の相互影響により聞きたい音が妨げられて聞きにくくなったり、全然聞こえない場合を言い、臨界帯域（critical band)というのは信号と雑音の周波数パワーが極めて類似な場合周波数領域でトーンが区分できない領域を言う。
【００２６】
一般的に音楽や音声で情報の伝達は音の時間的な流れによりなされ、マスキングの効果もこのような時間的な流れによっても起こる。プリマスキング（pre-masking ）は信号が現れてから現れる他の信号により前の信号がマスキングされる現象であり、同時にマスキングは信号と信号に影響を与える信号が同時に現れる時に発生し、ポストマスキング（post-masking or backward masking）は先に現れた信号により後に発生する信号が影響を受けてマスキングされる現象である。例えば、ディスコ場の大きい音楽を聞いてから外に出るとずっと音がよく聞こえないことと同一である。
【００２７】
各帯域において、特定周波数の信号のパワーが起こすマスキング効果は次のようなマスキング式により計算される。
【００２８】
【数１】
Ｅ（χ）＝Ｂ（χ）＊Ｓ（χ） …（１）
ここで、Ｓ（χ）は臨界帯域のパワーであり、Ｂ（χ）は人間の耳のマスク現象をモデリングした拡散関数（spreading fuction ）であり、Ｅ（χ）は変形された信号である。演算子＊は線形畳み込み（convolution)である。ここで、拡散関数Ｂ（χ）は次の式（２）と示される。
【００２９】
【数２】

このような過程を通じて得られたマスクされたスレショルド値は人間が音を聞く時、スレショルド値以下を聞いた時に感じられない信号の大きさを示す。このような信号の大きさは各帯域毎に一定するので階段波の形を有する。
【００３０】
本発明は重要度（ＩＭＦ；important factor) に従って各チャネルに使用されるビット数が決定された時、決定されたビット数により量子化処理時の処理帯域で、量子化処理時に発生する量子化雑音を最小化させる方法についたものである。
【００３１】
図１は本発明によるディジタルオーディオ符号化および復号化のブロック図を示す。符号化ブロックはマッピング１０、ビット割当部２０、量子化器３０およびフレームパッキング部４０より構成される。復号化ブロックはデータ解体部５０、復元部６０および逆マッピング部７０より構成される。
【００３２】
マッピング部１０はサブバンドフィルタリングにより入力信号を処理帯域別に分割して出す。このように帯域別に分割した理由は、入力信号を帯域別に分割して処理することにより、後に信号を復元した時に量子化処理時に発生した量子化雑音による影響が全帯域に広がる現象を減らすことができ、人間の音響心理中の臨界帯域効果を考慮するに便利な効果がある。
【００３３】
ビット割当部２０ではブロックの大きさ決定情報と周波数情報を入力して後述する方法に従ってビットを割り当てる。即ち、ビット割当部２０ではマッピング部１０で帯域別に分割された入力信号の各帯域に人間の音響心理を考慮してビット数を割り当てる部分で、入力信号がある時、その信号が一定した信号大きさ以上にならなければ人の耳を通じて聞いて感じられないと言う事実と様々な種類の入力信号がある時、入力信号相互間の影響により聞いて感じるに必要な最小限の大きさが一定した信号（absolute threshold) で変化するという事実を考慮して入力信号と変形された、人が聞いて感じるのに必要な最小の入力大きさ情報であるマスクされたスレショルド値を利用してビットを割り当てる処理をする。
【００３４】
マスクされたスレショルド値の計算とビット割当は次のように周波数領域でなされる。
【００３５】
１．入力信号をＤＦＴ変換により周波数成分別に各信号の量を求める。
【００３６】
２．周波数領域におけるスペクトル値を表１のようなトーンが区分できない臨界帯域に分けて各帯域におけるパワーの和を求める。
【００３７】
【表１】

【００３８】
３．パワーの和を求めた後には信号の周波数とパワーがどんなマスキング効果を起こすかをマスキング式（１）を通じて計算する。
【００３９】
４．結果として得られる各帯域において、値の中最大値をその帯域の臨時マスクされたスレショルド値とする。
【００４０】
５．各帯域の臨時マスクされたスレショルド値を信号がない静かな時のスレショルド値の各帯域値と比較して二つのうち、大きい値を各帯域の最終マスクされたスレショルド値とする。
【００４１】
６．入力信号とマスクされたスレショルド値との比であるＳＭＲ（signal to masked threshold ratio) を計算する。
【００４２】
７．各チャネル（ｊ）の各帯域（ｋ）別ＳＭＲ_jkを計算した後、各チャネルの全ての帯域ＳＭＲ_jkをオフセット補正して合算して各チャネルのＳＭＲＴ_jを求める。ここで、オフセット補正に使用される値はチャネルの各帯域のＳＭＲ_jkのうち最も少ない値を有する値であってＳＭＲ_jmin と示す。
【００４３】
【数３】

【００４４】
ここで、ｍは残った処理帯域の数である。
【００４５】
８．各チャネルの重要度ＩＭＦ_jは次のように計算される。
【００４６】
【数４】

【００４７】
ここでｎはチャネルの数である。
【００４８】
９．前記式（４）により各チャネルの重要度に従って各チャネルにビットが次の式により割り当てられる。
【００４９】
【数５】
ＢＴ_ch＝ＩＭＦ_jＢＴＴ …（５）
ここで、ＢＴ_chは各チャネルに割り当てられるビット数であり、ＢＴＴは時間がｔの時、データの圧縮比により決定される全てのチャネルにより使用可能なビット数の総和をいう。
【００５０】
１０．各チャネルに割り当てられたビット数ＢＴ_chから各帯域のオフセット補正されたＳＭＲ_jkにより各帯域の重要度ＩＭＦ_kを計算して各帯域で使用されるビット数を次のような方法で割り当てる。
【００５１】
１）．各帯域の重要度を求め、求めた重要度を考慮して高周波数成分から必要ビット数と比較した後、条件を満足すると該当帯域のビット数を割り当てる。
【００５２】
２）．使用可能なビット数と残りＳＭＲ_jkの和を補正した後に全てのビットを使用する時まで段階１と２を繰り返す。
【００５３】
より詳細に説明すれば、ＢＴ_chをもって帯域重要度ＩＭＦ_kに従って各ｉ番目チャネルの帯域ｋに使用可能な帯域ビット数ＢＴ_bdを推定することは次の通りである。
【００５４】
【数６】

【００５５】
１１．計算された帯域ビット数ＢＴ_bdが必要ビット数ＢＴ_Nより大きいかを比較する。ここで、必要ビット数ＢＴ_Nはある帯域入力データにビットを割り当てるにつれて付加的に使用されるようになるビット数の総和（スケールファクタと量子化時に使用される最小のビット数）をいう。ここで、計算された帯域ビット数が必要ビット数より小さい場合にはｊ番目チャネルの帯域ｋに割り当てられたビット数は０とする。
【００５６】
一帯域にビットを割り当てることにより、残り帯域のＳＭＲ値の重要度が変わる。変化する重要度を考慮するために一帯域でビット割当処理が遂行された後、ＳＭＲＴ_jで直ぐ以前のＳＭＲを減算し重要度の演算時に使用された帯域数の値を一つ減算することにより、容易に残っている帯域のみで評価される重要度の調節をする。
【００５７】
この過程が必要な理由はチャネルビット数と重要度によりビットが割り当てられる時に使用されたビット数のみを考慮して新たなチャネルビット数を求め、この値を新たな変化された重要度に従って各帯域にビットを割り当てる処理をするためである。このような過程を帯域数ほどすることにより、各帯域に割り当てられるビット数を計算しうる。
【００５８】
ここで、各サブバンドの帯域ビット数を割り当てる際、一般的な信号の属性上周波数帯域中、低周波帯域に多量の信号情報が集まっているということと高周波数帯域では少量の信号情報が集まっているということを考慮すると低周波数部分からビットを割り当てる時、情報がない部分が多い高周波数部分に対するスケールファクタなどの付加情報も考慮して処理するので、全体的なビット割当時高周波数帯域にビットが割り当てられる時、使用しないスケールファクタに対するビットの使用のような問題が発生するようになる。このような理由で与えられたビット数を効率的に使用する処理でないことが分る。
【００５９】
したがって、処理順序において高周波数部分から処理をすることにより、不要な部分をまず選び出した後に処理をすることになり、高周波数帯域で多く発生するスケールファクタの未使用の場合を考慮してビット割当の効率を図ることができる。
【００６０】
また、次の式のように使用される必要ビット数に各帯域の加重値Ｗ_jkを乗算することにより周波数帯域中の特定周波数帯域に一層多くのビットが割り当てられるように調節することもできる。
【００６１】
【数７】

【００６２】
以上のようにビット割当部２０で処理することにより、人間の音響心理特性を考慮してビットが割り当てられるようにすることができ、特に加重値を調節して高周波数帯域に一層多くのビットが割り当てられるようにしうる。これは音声信号の処理時に使用されるプリエンファシスで高周波数側信号を強調することと同一な効果を有する。
【００６３】
量子化器３０では次のような方法で量子化を遂行する。
【００６４】
各チャネルの各処理帯域にビットが割り当てられている時、各処理帯域で発生する量子化雑音の総和を減らすための方法は、次の通りである。ここで、各処理帯域で発生する量子化雑音の総和を減らす処理をする理由は音響心理学によれば、人間は処理帯域、例えば臨界帯域内の信号パワーと発生する量子化雑音の量に従って外乱を感じるためである。
【００６５】
各処理単位帯域において、各周波数成分の処理は周波数順に高周波数成分の値から低周波数成分の値まで又は低周波数成分から高周波数成分の値まで周波数成分の値を量子化して処理する。
【００６６】
量子化処理をするにおいて、一周波数成分の値を量子化処理をするにつれて発生する量子化誤差を隣接した次の周波数成分又は次の周波数成分で補償をした後に処理することにより、一処理単位帯域内の周波数成分の総和がある時、発生可能な誤差を最小に減らせる。
【００６７】
補償において、時間ｔと周波数位置ｋにおける周波数成分の値をＸ_t(k) とし、量子化器をＱとして量子化された周波数成分をＱＸ_t(k) とする時、量子化による誤差ＥＱ_t(k) は次の式により計算される。
【００６８】
【数８】
ＥＱ_t(k) ＝Ｘ_t(k) −ＱＸ_t(k) …（８）
計算された誤差を次の周波数成分に補償することはＸ_t(k+1) がＸ_t(k+1) ＋ＥＱ_t(k) により変形されるということを意味し、変形された新たなＸ_t(k+1) に対して量子化処理をする。ＱＸ_t(k+1) により新たな量子化誤差を計算しながら処理帯域に対して繰り返して処理帯域内で発生する誤差の総和を最小化する。
【００６９】
この場合、発生する誤差ＥＱ_t(k) を隣接した信号に加重値Ｗ(k+1) を考慮して伝播することにより、帯域内で発生する誤差の総和を減らすことがてきる。即ち、Ｘ_t(k+1) ＋ＥＱ_t(k) Ｗ(k+1) により誤差が補償された新たな値を求めて量子化処理に使用する。図２を参照して、本発明による量子化処理アルゴリズムは処理帯域ｉを設定し（１００段階）、この帯域に対する量子化を遂行し（１０２段階）、続けて前述した式（８）により量子化誤差を計算する（１０４段階）。計算された誤差を隣接周波数成分に伝播し（１０６段階）、処理帯域ｉの量子化が終了されたかをチェックして（１０８段階）、そうでないと周波数成分を増加した後に１０２段階を遂行する（１１０段階）。このように処理帯域ｉに対して全ての周波数成分の量子化が終了されると全ての帯域に対する量子化が終了されたかチェックし（１１２段階）、そうでないと処理帯域を増加させた後に１００段階を遂行する（１１４段階）。１１２段階で終了時には量子化を終了する。このような量子化処理時の誤差を隣接周波数成分に伝播することにより量子化雑音を減らすことを一実施例を挙げて説明すると次の通りである。
【００７０】
量子化段階は図３に示した量子化特性を有して、次の表２のような周波数成分値を有すると仮定する。
【００７１】
【表２】

【００７２】
前記表２に示したように一処理帯域内の周波数成分の値が 94,54,64,84,94,84である値を有する場合、既存の量子化方法によると 90,50,60,80,90,80となって処理帯域内で発生する誤差の総和が24となることが分る。これに反して、本発明の方式によると直ぐ前の全ての誤差を補償するようになると、処理帯域内で発生する量子化雑音が４と減ることが分る。
【００７３】
また、量子化処理において、信号の処理に差別をおくために処理帯域内の信号をトーンである信号とトーンでない信号に区分して処理することにより、各信号で発生する量子化誤差をトーンである信号はトーンである信号として補償するようにし、トーンでない信号はトーンでない信号として補償するようにすることにより、処理帯域内のトーンである信号のパワーとトーンでない信号のパワーの処理時に発生する量子化誤差を最小化することにより、音質の向上を図ることができる。量子化されたデータはデータ圧縮のためにコーティシング処理される。
【００７４】
フレームパッキング４０では量子化処理後に発生するデータをフレーム単位で伝送ビットストリームを形成する。
【００７５】
【発明の効果】
以上のように本発明では、人間の音響心理特性を考慮してビット数割当を最適化し、量子化誤差を隣接周波数成分に伝播して量子化雑音の総和を減らすことができるので、原音と再生音間の人間が感じる差異を最小化させうる。
【００７６】
また、本発明の他の方法では、量子化段階で伝播された量子化の誤差のみならず、サブバンド加重値を鑑みて量子化を行うこととしたので、さらに良質のオーディオ信号の符号化が可能となる。
【００７７】
さらに本発明の装置は、人間の音響心理特性を考慮してビット数割当を最適化し、量子化誤差を隣接周波数成分に伝播して量子化雑音の総和を減らすことができ、また、量子化段階で伝播された量子化の誤差のみならず、サブバンド加重値を鑑みて量子化を行うので、さらに良質のオーディオ信号の符号化が可能となり、原音と再生音間の人間が感じる差異を最小化させうる。
【図面の簡単な説明】
【図１】本発明による人間の音響心理特性を考慮したディジタルオーディオ符号化および復号化装置のブロック図である。
【図２】本発明による量子化処理アルゴリズムを説明するための図面である。
【図３】本発明を説明するための一実施例の量子化器の量子化構成を説明するための図面である。

Claims

複数のチャネルの各ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力する段階と、
前記マッピングされたサブバンド信号に基づいて人間心理特性により各サブバンド信号に対するビット数を割り当てる段階と、
伝播された以前の量子化誤差により前記各サブバンド信号を補償し、補償されたサブバンド信号を対応する割り当てられたビット数に応じて量子化し現在の量子化誤差を次の量子化処理に伝播する量子化段階と、
前記量子化されたデータをフレーム単位で伝送ビットストリームを形成する段階とを具備し、
前記ビット数を割り当てる段階は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とを具備したことを特徴とするディジタルオーディオ符号化方法。
前記各サブバンドは、トーンが区別できない臨界帯域であることを特徴とする請求項１記載のディジタルオーディオ符号化方法。
前記マスキングされたスレショルド値は前記アナログオーディオ信号を離散フーリエ変換し、変換された信号のサブバンドごとに各信号の量を求める過程と、
前記信号のサブバンドにおけるスペクトル値を、トーンが区分できない複数の臨界帯域に分割し各臨界帯域におけるパワーの和を求める過程と、
前記信号の周波数と前記パワーの和によりマスキングされたスレショルド値を求める過程と、
前記各臨界帯域で最大値を有するマスキングされたスレショルド値をその臨界帯域の臨時マスキングされたスレショルド値として決定する過程と、
信号がない静かな状態におけるスレショルド値と前記臨時スレショルド値を比較して大きい値を有することをその臨界帯域の最終マスキングされたスリショルド値として求める過程とを具備することを特徴とする請求項１記載のディジタルオーディオ符号化方法。
前記各チャネルのチャネル比は帯域比のうち、最小帯域比と帯域数の乗をチャネル比から減算することによりオフセット補償することを特徴とする請求項１記載のディジタルオーディオ符号化方法。
前記各帯域重要度による各帯域のビット割当は帯域の重要度を考慮して前記サブバンド信号のうち、高周波成分からビット割り当てることを特徴とする請求項１記載のディジタルオーディオ符号化方法。
前記各帯域比は帯域比のうち最小帯域比を各帯域比から減算することによりオフセット補償することを特徴とする請求項１記載のディジタルオーディオ符号化方法。
前記帯域重要度は帯域のビット数割当が決定された帯域の帯域比を除いた残り帯域の帯域比を有して新たな帯域重要度を求めることを特徴とする請求項１記載のディジタルオーディオ符号化方法。
前記帯域ビット数を割り当てる過程は帯域加重値を考慮して割り当てることを特徴とする請求項１記載のディジタルオーディオ符号化方法。
前記量子化段階は各帯域内の信号をトーンである信号とそうでない信号に区分し、各信号から発生する量子化誤差をトーンである信号はトーンである信号により補償されるようにし、トーンでない信号はトーンでない信号により補償されるようにすることを特徴とする請求項１記載のディジタルオーディオ符号化方法。
ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力する段階と、
前記マッピングされたサブバンド信号に基づいて人間心理特性により各サブバンドのサブバンド信号に対するビット数を割り当てる段階と、
前記各サブバンド信号に対してサブバンドの加重値が考慮されて伝播された以前の量子化誤差により前記各サブバンド信号を補償し、補償されたサブバンド信号を前記割り当てられたビット数に応じて量子化し、現在の量子化誤差を加重値を考慮して次の量子化処理に伝播する量子化段階と、
量子化されたデータをフレーム単位で伝送ビットストリームを形成する段階とを具備し、
前記ビット数を割り当てる段階は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とを具備したことを特徴とするディジタルオーディオ符号化方法。
ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力するマッピング手段と、
前記マッピングされたサブバンド信号に基づいて人間心理特性により各帯域のサブバンド信号に対するビット数を割り当てるビット数割当手段と、
前記各サブバンド信号に対して伝播された以前の量子化誤差により補償し、補償されたサブバンド信号を前記割り当てられたビット数に応じて量子化し、現在の量子化誤差を次の量子化処理に伝播する量子化手段と、
量子化されたデータをフレーム段階で伝送ビットストリームを形成するフレームパッキング手段とを具備し、
前記ビット数割当手段は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とによってビット数を割り当てるものであることを特徴とするディジタルオーディオ符号化装置。