JP4091994B2 - ディジタルオーディオ符号化方法及び装置 - Google Patents
ディジタルオーディオ符号化方法及び装置 Download PDFInfo
- Publication number
- JP4091994B2 JP4091994B2 JP01097095A JP1097095A JP4091994B2 JP 4091994 B2 JP4091994 B2 JP 4091994B2 JP 01097095 A JP01097095 A JP 01097095A JP 1097095 A JP1097095 A JP 1097095A JP 4091994 B2 JP4091994 B2 JP 4091994B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- channel
- signal
- subband
- bits
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
【産業上の利用分野】
本発明はディジタルオーディオの符号化方法及び装置に係り、特に人間の音響心理特性によるビット数の割当と量子化誤差を減らすことにより、音質を向上させうるディジタルオーディオ符号化方法および装置に関する。
【0002】
【従来の技術】
オーディオ機器は記録媒体に信号を記録し、使用者が必要時に記録された信号を記録媒体から再生してオーディオを楽しむ装置であって、最近ディジタル信号処理技術の発達により既存のアナログ信号によるロングプレイヤ(LD)と磁気テーププレイヤにおいてディジタル信号によるコンパクトディスクプレイヤとディジタルオーディオテーププレイヤへの開発が進行されて音質の向上を図っているが、ディジタル方式はデータの量が多くなる問題がある。
【0003】
このような問題は最近ISOにより標準化作業が進行されているMPEGオーディオや商品化されたディジタルコンパクトカセット(DCC)技術やミニディスク(MD)技術のように人間の音響心理特性を考慮して減らすことができる。
【0004】
音響心理特性を用いた技術の概要は次の通りである。音声やオーディオデータの処理においては信号を帯域別に分割して処理する場合が多い。帯域別に分割して処理する理由には“量子化処理により発生する量子化誤差が復元時、広い帯域に影響を及ばないようにする”という信号処理側面の理由と、“人間の聴覚知覚特性を信号処理時に考慮するに適するようにする”という人間の感性能力を考慮した理由が代表的である。
【0005】
人間の聴覚知覚特性に対する研究は音響心理学(psychoacustics)に発展して来たが、音響心理学によると、人間は処理帯域例えば、臨界帯域内の信号のパワーと発生する量子化雑音の量により外乱を感じる。これに、既存の方式は各処理帯域で存してもよいが、聞いても感じられない量子化雑音の最大量を利用してビットを割り当てた。
【0006】
このような方式において、発生する量子化雑音はある処理帯域で存し得る最大量以下となるようにしているが、即ち処理帯域内における量子化雑音の総和と見た時には感じられない量子化誤差と見做したが、各周波数成分と見た時には特定周波数成分の値が、聞ける量子化雑音の限界を越える場合が発生しうる問題を有している。
【0007】
【発明が解決しようとする課題】
本発明の目的はこのような従来の技術の問題点を解決するために各処理帯域で発生する雑音の総和を減少させ、各周波数成分の値で発生する量子化誤差を減らすため、各周波数成分で発生する量子化誤差を隣接信号に伝播するディジタルオーディオ符号化方法および装置を提供することである。
【0008】
【課題を解決するための手段】
前記の目的を達成するために本発明の方法は、ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力する段階と、マッピングされたサブバンド信号に基づいて人間心理特性により各サブバンド信号に対するビット数を割り当てる段階と、伝播された以前の量子化誤差により前記各サブバンド信号分を補償し、補償されたサブバンド信号を対応する割り当てられたビット数に応じて量子化し、現在の量子化誤差を次の量子化処理に伝播する量子化段階と、量子化されたデータをフレーム単位で伝送ビットストリームを形成する段階とを具備し、前記ビット数を割り当てる段階は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とを具備したことを特徴とするディジタルオーディオ符号化方法である。
【0009】
本発明のディジタルオーディオ符号化方法において、前記各サブバンドは、トーンが区別できない臨界帯域であることを特徴とする。
【0011】
本発明のディジタルオーディオ符号化方法において、前記マスキングされたスレショルド値はアナログオーディオ信号を離散フーリエ変換し、変換された信号のサブバンドごとに各信号の量を求める過程と、信号のサブバンドにおけるスペクトル値を、トーンが区分できない複数の臨界帯域に分割し各臨界帯域におけるパワーの和を求める過程と、信号の周波数と前記パワーの和によりマスキングされたスレショルド値を求める過程と、前記各臨界で最大値を有するマスキングされたスレショルド値をその臨界帯域の臨時マスキングされたスレショルド値として決定する過程と、信号がない静かな状態におけるスレショルド値と前記臨時スレショルド値を比較して大きい値を有するものをその臨界帯域の最終マスキングされたスリショルド値として求める過程とを具備することを特徴とする。
【0012】
本発明のディジタルオーディオ符号化方法において、前記各チャネルのチャネル比は帯域比のうち、最小帯域比と帯域数の乗をチャネル比から減算することによりオフセット補償することを特徴とする。
【0013】
本発明のディジタルオーディオ符号化方法において、前記各帯域重要度による各帯域のビット割当は帯域の重要度を考慮して前記サブバンド信号のうち高周波成分からビット割り当てることを特徴とする。
【0014】
本発明のディジタルオーディオ符号化方法において、前記各帯域比は帯域比のうち、最小帯域比を各帯域から減算することによりオフセット補償をすることを特徴とする。
【0015】
本発明のディジタルオーディオ符号化方法において、前記帯域重要度は帯域のビット数割当が決定された帯域の帯域比を除いた残り帯域の帯域比を有して新たな重要度を求めることを特徴とする。
【0016】
本発明のディジタルオーディオ符号化方法において、前記帯域ビット数を割り当てる過程は帯域加重値を考慮して割り当てることを特徴とする。
【0017】
本発明のディジタルオーディオ符号化方法において、前記量子化段階は各帯域内の信号をトーンである信号とトーンでない信号に区分し、各信号で発生する量子化誤差をトーンである信号はトーンである信号により補償されるようにし、トーンでない信号はトーンでない信号により補償されるようにすることを特徴とする。
【0018】
また、前記目的を達成するための本発明の他の方法は、ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力する段階と、マッピングされたサブバンド信号に基づいて人間心理特性に従って各サブバンドのサブバンド信号に対するビット数を割り当てる段階と、各サブバンド信号に対して加重値が考慮され、伝播された以前の量子化誤差により前記各サブバンド信号を補償し、補償されたサブバンド信号を前記割り当てられたビット数に従って量子化し、現在の量子化誤差を加重値を考慮して次の量子化処理に伝播する量子化段階と、量子化されたデータをフレーム単位で伝送ストリームを形成する段階とを具備し、前記ビット数を割り当てる段階は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とを具備したことを特徴とするディジタルオーディオ符号化方法。
【0019】
また前記目的を達成するための本発明の装置は、ディジタルオーディオ信号を複数のサブバンドにマッピングして、マッピングされたサブバンド信号を出力するマッピング手段と、マッピングされたサブバンド信号に基づいて人間心理特性により各帯域のサブバンド信号に対するビット数を割り当てるビット数割当手段と、各サブバンド信号に対して伝播された以前の量子化誤差によりサブバンド信号を補償し、補償されたサブバンド信号を前記割り当てられたビット数に従って量子化し現在の量子化誤差を次の量子化処理に伝播する量子化手段と、量子化されたデータをフレーム単位で伝送ストリームを形成するフレームパッキング手段とを具備し、前記ビット数割当手段は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とによってビット数を割り当てるものであることを特徴とするディジタルオーディオ符号化装置。
【0020】
【作用】
ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力し、マッピングされたサブバンド信号に基づいて人間心理特性により各サブバンド信号に対するビット数を割当てて、伝播された以前の量子化誤差により前記各サブバンド信号分を補償し、補償されたサブバンド信号を対応する割り当てられたビット数に従って量子化し、現在の量子化誤差を次の量子化処理に伝播して量子化し、量子化されたデータをフレーム段階で伝送ビットストリームを形成させる。
【0021】
また、本発明の他の方法では、量子化段階で伝播された量子化の誤差のみならず、サブバンド加重値を鑑みて量子化を行うことで、さらに良質のオーディオ信号の符号化を可能とするものである。
【0022】
さらに上述のように構成された本発明の装置は、マッピング手段によりディジタルオーディオ信号を複数のサブバンドにマッピングし、サブバンド信号に基づいてビット数割当手段が人間心理特性により各帯域のサブバンド信号に対するビット数を割り当て、量子化手段が各サブバンド信号に対して伝播された以前の量子化誤差によりサブバンド信号を補償し、補償されたサブバンド信号を前記割り当てられたビット数に従って量子化し現在の量子化誤差を次の量子化処理に伝播して、フレームパッキング手段が量子化されたデータをフレーム単位で伝送ストリームを形成することにより、前記各方法によるオーディオ信号の符号化を行う装置である。
【0023】
【実施例】
以下、添付した図面に基づき本発明を詳細に説明する。
【0024】
人間の音響心理特性を考慮したオーディオ機器は、符号化時に主な目標は発生された雑音の除去でなく、雑音を聞かせないように処理することであって、マスキング現像と臨界帯域を考慮して入力信号と他の信号が相互マスクされた時に変化する人間が聞いて感じられるレベル、即ちマスクされたスレショルド値を求めた後、マスクされたスレショルド値と量子化された雑音との比を利用して重要度に従ってビットを割り当てて処理している。
【0025】
人間の音響心理特性中に使用されるマスキング現象と臨界帯域に対して調べてみると、マスキング(masking)現象とは、例えば電鉄駅で対話する時、電鉄が側を過ぎない際には小さい声でも意思伝達が可能であるが、電鉄が側を過ぎる時には同じ大きさの小さい声では意思伝達されないことのように対話音声と電鉄が過ぎる音の相互影響により聞きたい音が妨げられて聞きにくくなったり、全然聞こえない場合を言い、臨界帯域(critical band)というのは信号と雑音の周波数パワーが極めて類似な場合周波数領域でトーンが区分できない領域を言う。
【0026】
一般的に音楽や音声で情報の伝達は音の時間的な流れによりなされ、マスキングの効果もこのような時間的な流れによっても起こる。プリマスキング(pre-masking )は信号が現れてから現れる他の信号により前の信号がマスキングされる現象であり、同時にマスキングは信号と信号に影響を与える信号が同時に現れる時に発生し、ポストマスキング(post-masking or backward masking)は先に現れた信号により後に発生する信号が影響を受けてマスキングされる現象である。例えば、ディスコ場の大きい音楽を聞いてから外に出るとずっと音がよく聞こえないことと同一である。
【0027】
各帯域において、特定周波数の信号のパワーが起こすマスキング効果は次のようなマスキング式により計算される。
【0028】
【数1】
E(χ)=B(χ)*S(χ) …(1)
ここで、S(χ)は臨界帯域のパワーであり、B(χ)は人間の耳のマスク現象をモデリングした拡散関数(spreading fuction )であり、E(χ)は変形された信号である。演算子*は線形畳み込み(convolution)である。ここで、拡散関数B(χ)は次の式(2)と示される。
【0029】
【数2】
このような過程を通じて得られたマスクされたスレショルド値は人間が音を聞く時、スレショルド値以下を聞いた時に感じられない信号の大きさを示す。このような信号の大きさは各帯域毎に一定するので階段波の形を有する。
【0030】
本発明は重要度(IMF;important factor) に従って各チャネルに使用されるビット数が決定された時、決定されたビット数により量子化処理時の処理帯域で、量子化処理時に発生する量子化雑音を最小化させる方法についたものである。
【0031】
図1は本発明によるディジタルオーディオ符号化および復号化のブロック図を示す。符号化ブロックはマッピング10、ビット割当部20、量子化器30およびフレームパッキング部40より構成される。復号化ブロックはデータ解体部50、復元部60および逆マッピング部70より構成される。
【0032】
マッピング部10はサブバンドフィルタリングにより入力信号を処理帯域別に分割して出す。このように帯域別に分割した理由は、入力信号を帯域別に分割して処理することにより、後に信号を復元した時に量子化処理時に発生した量子化雑音による影響が全帯域に広がる現象を減らすことができ、人間の音響心理中の臨界帯域効果を考慮するに便利な効果がある。
【0033】
ビット割当部20ではブロックの大きさ決定情報と周波数情報を入力して後述する方法に従ってビットを割り当てる。即ち、ビット割当部20ではマッピング部10で帯域別に分割された入力信号の各帯域に人間の音響心理を考慮してビット数を割り当てる部分で、入力信号がある時、その信号が一定した信号大きさ以上にならなければ人の耳を通じて聞いて感じられないと言う事実と様々な種類の入力信号がある時、入力信号相互間の影響により聞いて感じるに必要な最小限の大きさが一定した信号(absolute threshold) で変化するという事実を考慮して入力信号と変形された、人が聞いて感じるのに必要な最小の入力大きさ情報であるマスクされたスレショルド値を利用してビットを割り当てる処理をする。
【0034】
マスクされたスレショルド値の計算とビット割当は次のように周波数領域でなされる。
【0035】
1.入力信号をDFT変換により周波数成分別に各信号の量を求める。
【0036】
2.周波数領域におけるスペクトル値を表1のようなトーンが区分できない臨界帯域に分けて各帯域におけるパワーの和を求める。
【0037】
【表1】
【0038】
3.パワーの和を求めた後には信号の周波数とパワーがどんなマスキング効果を起こすかをマスキング式(1)を通じて計算する。
【0039】
4.結果として得られる各帯域において、値の中最大値をその帯域の臨時マスクされたスレショルド値とする。
【0040】
5.各帯域の臨時マスクされたスレショルド値を信号がない静かな時のスレショルド値の各帯域値と比較して二つのうち、大きい値を各帯域の最終マスクされたスレショルド値とする。
【0041】
6.入力信号とマスクされたスレショルド値との比であるSMR(signal to masked threshold ratio) を計算する。
【0042】
7.各チャネル(j)の各帯域(k)別SMRjkを計算した後、各チャネルの全ての帯域SMRjkをオフセット補正して合算して各チャネルのSMRTj を求める。ここで、オフセット補正に使用される値はチャネルの各帯域のSMRjkのうち最も少ない値を有する値であってSMRj min と示す。
【0043】
【数3】
【0044】
ここで、mは残った処理帯域の数である。
【0045】
8.各チャネルの重要度IMFj は次のように計算される。
【0046】
【数4】
【0047】
ここでnはチャネルの数である。
【0048】
9.前記式(4)により各チャネルの重要度に従って各チャネルにビットが次の式により割り当てられる。
【0049】
【数5】
BTch=IMFj BTT …(5)
ここで、BTchは各チャネルに割り当てられるビット数であり、BTTは時間がtの時、データの圧縮比により決定される全てのチャネルにより使用可能なビット数の総和をいう。
【0050】
10.各チャネルに割り当てられたビット数BTchから各帯域のオフセット補正されたSMRjkにより各帯域の重要度IMFk を計算して各帯域で使用されるビット数を次のような方法で割り当てる。
【0051】
1).各帯域の重要度を求め、求めた重要度を考慮して高周波数成分から必要ビット数と比較した後、条件を満足すると該当帯域のビット数を割り当てる。
【0052】
2).使用可能なビット数と残りSMRjkの和を補正した後に全てのビットを使用する時まで段階1と2を繰り返す。
【0053】
より詳細に説明すれば、BTchをもって帯域重要度IMFk に従って各i番目チャネルの帯域kに使用可能な帯域ビット数BTbdを推定することは次の通りである。
【0054】
【数6】
【0055】
11.計算された帯域ビット数BTbdが必要ビット数BTN より大きいかを比較する。ここで、必要ビット数BTN はある帯域入力データにビットを割り当てるにつれて付加的に使用されるようになるビット数の総和(スケールファクタと量子化時に使用される最小のビット数)をいう。ここで、計算された帯域ビット数が必要ビット数より小さい場合にはj番目チャネルの帯域kに割り当てられたビット数は0とする。
【0056】
一帯域にビットを割り当てることにより、残り帯域のSMR値の重要度が変わる。変化する重要度を考慮するために一帯域でビット割当処理が遂行された後、SMRTj で直ぐ以前のSMRを減算し重要度の演算時に使用された帯域数の値を一つ減算することにより、容易に残っている帯域のみで評価される重要度の調節をする。
【0057】
この過程が必要な理由はチャネルビット数と重要度によりビットが割り当てられる時に使用されたビット数のみを考慮して新たなチャネルビット数を求め、この値を新たな変化された重要度に従って各帯域にビットを割り当てる処理をするためである。このような過程を帯域数ほどすることにより、各帯域に割り当てられるビット数を計算しうる。
【0058】
ここで、各サブバンドの帯域ビット数を割り当てる際、一般的な信号の属性上周波数帯域中、低周波帯域に多量の信号情報が集まっているということと高周波数帯域では少量の信号情報が集まっているということを考慮すると低周波数部分からビットを割り当てる時、情報がない部分が多い高周波数部分に対するスケールファクタなどの付加情報も考慮して処理するので、全体的なビット割当時高周波数帯域にビットが割り当てられる時、使用しないスケールファクタに対するビットの使用のような問題が発生するようになる。このような理由で与えられたビット数を効率的に使用する処理でないことが分る。
【0059】
したがって、処理順序において高周波数部分から処理をすることにより、不要な部分をまず選び出した後に処理をすることになり、高周波数帯域で多く発生するスケールファクタの未使用の場合を考慮してビット割当の効率を図ることができる。
【0060】
また、次の式のように使用される必要ビット数に各帯域の加重値Wjkを乗算することにより周波数帯域中の特定周波数帯域に一層多くのビットが割り当てられるように調節することもできる。
【0061】
【数7】
【0062】
以上のようにビット割当部20で処理することにより、人間の音響心理特性を考慮してビットが割り当てられるようにすることができ、特に加重値を調節して高周波数帯域に一層多くのビットが割り当てられるようにしうる。これは音声信号の処理時に使用されるプリエンファシスで高周波数側信号を強調することと同一な効果を有する。
【0063】
量子化器30では次のような方法で量子化を遂行する。
【0064】
各チャネルの各処理帯域にビットが割り当てられている時、各処理帯域で発生する量子化雑音の総和を減らすための方法は、次の通りである。ここで、各処理帯域で発生する量子化雑音の総和を減らす処理をする理由は音響心理学によれば、人間は処理帯域、例えば臨界帯域内の信号パワーと発生する量子化雑音の量に従って外乱を感じるためである。
【0065】
各処理単位帯域において、各周波数成分の処理は周波数順に高周波数成分の値から低周波数成分の値まで又は低周波数成分から高周波数成分の値まで周波数成分の値を量子化して処理する。
【0066】
量子化処理をするにおいて、一周波数成分の値を量子化処理をするにつれて発生する量子化誤差を隣接した次の周波数成分又は次の周波数成分で補償をした後に処理することにより、一処理単位帯域内の周波数成分の総和がある時、発生可能な誤差を最小に減らせる。
【0067】
補償において、時間tと周波数位置kにおける周波数成分の値をXt (k) とし、量子化器をQとして量子化された周波数成分をQXt (k) とする時、量子化による誤差EQt (k) は次の式により計算される。
【0068】
【数8】
EQt (k) =Xt (k) −QXt (k) …(8)
計算された誤差を次の周波数成分に補償することはXt (k+1) がXt (k+1) +EQt (k) により変形されるということを意味し、変形された新たなXt (k+1) に対して量子化処理をする。QXt (k+1) により新たな量子化誤差を計算しながら処理帯域に対して繰り返して処理帯域内で発生する誤差の総和を最小化する。
【0069】
この場合、発生する誤差EQt (k) を隣接した信号に加重値W(k+1) を考慮して伝播することにより、帯域内で発生する誤差の総和を減らすことがてきる。即ち、Xt (k+1) +EQt (k) W(k+1) により誤差が補償された新たな値を求めて量子化処理に使用する。図2を参照して、本発明による量子化処理アルゴリズムは処理帯域iを設定し(100段階)、この帯域に対する量子化を遂行し(102段階)、続けて前述した式(8)により量子化誤差を計算する(104段階)。計算された誤差を隣接周波数成分に伝播し(106段階)、処理帯域iの量子化が終了されたかをチェックして(108段階)、そうでないと周波数成分を増加した後に102段階を遂行する(110段階)。このように処理帯域iに対して全ての周波数成分の量子化が終了されると全ての帯域に対する量子化が終了されたかチェックし(112段階)、そうでないと処理帯域を増加させた後に100段階を遂行する(114段階)。112段階で終了時には量子化を終了する。このような量子化処理時の誤差を隣接周波数成分に伝播することにより量子化雑音を減らすことを一実施例を挙げて説明すると次の通りである。
【0070】
量子化段階は図3に示した量子化特性を有して、次の表2のような周波数成分値を有すると仮定する。
【0071】
【表2】
【0072】
前記表2に示したように一処理帯域内の周波数成分の値が 94,54,64,84,94,84である値を有する場合、既存の量子化方法によると 90,50,60,80,90,80となって処理帯域内で発生する誤差の総和が24となることが分る。これに反して、本発明の方式によると直ぐ前の全ての誤差を補償するようになると、処理帯域内で発生する量子化雑音が4と減ることが分る。
【0073】
また、量子化処理において、信号の処理に差別をおくために処理帯域内の信号をトーンである信号とトーンでない信号に区分して処理することにより、各信号で発生する量子化誤差をトーンである信号はトーンである信号として補償するようにし、トーンでない信号はトーンでない信号として補償するようにすることにより、処理帯域内のトーンである信号のパワーとトーンでない信号のパワーの処理時に発生する量子化誤差を最小化することにより、音質の向上を図ることができる。量子化されたデータはデータ圧縮のためにコーティシング処理される。
【0074】
フレームパッキング40では量子化処理後に発生するデータをフレーム単位で伝送ビットストリームを形成する。
【0075】
【発明の効果】
以上のように本発明では、人間の音響心理特性を考慮してビット数割当を最適化し、量子化誤差を隣接周波数成分に伝播して量子化雑音の総和を減らすことができるので、原音と再生音間の人間が感じる差異を最小化させうる。
【0076】
また、本発明の他の方法では、量子化段階で伝播された量子化の誤差のみならず、サブバンド加重値を鑑みて量子化を行うこととしたので、さらに良質のオーディオ信号の符号化が可能となる。
【0077】
さらに本発明の装置は、人間の音響心理特性を考慮してビット数割当を最適化し、量子化誤差を隣接周波数成分に伝播して量子化雑音の総和を減らすことができ、また、量子化段階で伝播された量子化の誤差のみならず、サブバンド加重値を鑑みて量子化を行うので、さらに良質のオーディオ信号の符号化が可能となり、原音と再生音間の人間が感じる差異を最小化させうる。
【図面の簡単な説明】
【図1】 本発明による人間の音響心理特性を考慮したディジタルオーディオ符号化および復号化装置のブロック図である。
【図2】 本発明による量子化処理アルゴリズムを説明するための図面である。
【図3】 本発明を説明するための一実施例の量子化器の量子化構成を説明するための図面である。
Claims (11)
- 複数のチャネルの各ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力する段階と、
前記マッピングされたサブバンド信号に基づいて人間心理特性により各サブバンド信号に対するビット数を割り当てる段階と、
伝播された以前の量子化誤差により前記各サブバンド信号を補償し、補償されたサブバンド信号を対応する割り当てられたビット数に応じて量子化し現在の量子化誤差を次の量子化処理に伝播する量子化段階と、
前記量子化されたデータをフレーム単位で伝送ビットストリームを形成する段階とを具備し、
前記ビット数を割り当てる段階は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とを具備したことを特徴とするディジタルオーディオ符号化方法。 - 前記各サブバンドは、トーンが区別できない臨界帯域であることを特徴とする請求項1記載のディジタルオーディオ符号化方法。
- 前記マスキングされたスレショルド値は前記アナログオーディオ信号を離散フーリエ変換し、変換された信号のサブバンドごとに各信号の量を求める過程と、
前記信号のサブバンドにおけるスペクトル値を、トーンが区分できない複数の臨界帯域に分割し各臨界帯域におけるパワーの和を求める過程と、
前記信号の周波数と前記パワーの和によりマスキングされたスレショルド値を求める過程と、
前記各臨界帯域で最大値を有するマスキングされたスレショルド値をその臨界帯域の臨時マスキングされたスレショルド値として決定する過程と、
信号がない静かな状態におけるスレショルド値と前記臨時スレショルド値を比較して大きい値を有することをその臨界帯域の最終マスキングされたスリショルド値として求める過程とを具備することを特徴とする請求項1記載のディジタルオーディオ符号化方法。 - 前記各チャネルのチャネル比は帯域比のうち、最小帯域比と帯域数の乗をチャネル比から減算することによりオフセット補償することを特徴とする請求項1記載のディジタルオーディオ符号化方法。
- 前記各帯域重要度による各帯域のビット割当は帯域の重要度を考慮して前記サブバンド信号のうち、高周波成分からビット割り当てることを特徴とする請求項1記載のディジタルオーディオ符号化方法。
- 前記各帯域比は帯域比のうち最小帯域比を各帯域比から減算することによりオフセット補償することを特徴とする請求項1記載のディジタルオーディオ符号化方法。
- 前記帯域重要度は帯域のビット数割当が決定された帯域の帯域比を除いた残り帯域の帯域比を有して新たな帯域重要度を求めることを特徴とする請求項1記載のディジタルオーディオ符号化方法。
- 前記帯域ビット数を割り当てる過程は帯域加重値を考慮して割り当てることを特徴とする請求項1記載のディジタルオーディオ符号化方法。
- 前記量子化段階は各帯域内の信号をトーンである信号とそうでない信号に区分し、各信号から発生する量子化誤差をトーンである信号はトーンである信号により補償されるようにし、トーンでない信号はトーンでない信号により補償されるようにすることを特徴とする請求項1記載のディジタルオーディオ符号化方法。
- ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力する段階と、
前記マッピングされたサブバンド信号に基づいて人間心理特性により各サブバンドのサブバンド信号に対するビット数を割り当てる段階と、
前記各サブバンド信号に対してサブバンドの加重値が考慮されて伝播された以前の量子化誤差により前記各サブバンド信号を補償し、補償されたサブバンド信号を前記割り当てられたビット数に応じて量子化し、現在の量子化誤差を加重値を考慮して次の量子化処理に伝播する量子化段階と、
量子化されたデータをフレーム単位で伝送ビットストリームを形成する段階とを具備し、
前記ビット数を割り当てる段階は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とを具備したことを特徴とするディジタルオーディオ符号化方法。 - ディジタルオーディオ信号を複数のサブバンドにマッピングし、マッピングされたサブバンド信号を出力するマッピング手段と、
前記マッピングされたサブバンド信号に基づいて人間心理特性により各帯域のサブバンド信号に対するビット数を割り当てるビット数割当手段と、
前記各サブバンド信号に対して伝播された以前の量子化誤差により補償し、補償されたサブバンド信号を前記割り当てられたビット数に応じて量子化し、現在の量子化誤差を次の量子化処理に伝播する量子化手段と、
量子化されたデータをフレーム段階で伝送ビットストリームを形成するフレームパッキング手段とを具備し、
前記ビット数割当手段は前記各サブバンドの信号対マスキングされたスレショルド値の比を帯域比として求める過程と、各チャネルのチャネル比を求めるために各サブバンドの帯域比の総和を求める過程と、前記チャネル比の総和に対する各チャネルのチャネル比を各チャネルのチャネル重要度として求める過程と、前記求められたチャネル重要度により総ビット数からチャネルビット数を割り当てる過程と、前記各チャネル比に対する各サブバンドの帯域比の比に従って各サブバンドの帯域重要度を求める過程と、前記求められた帯域重要度によりチャネルビット数から各サブバンドの帯域ビット数を割り当てる過程とによってビット数を割り当てるものであることを特徴とするディジタルオーディオ符号化装置。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1019940015694A KR100289733B1 (ko) | 1994-06-30 | 1994-06-30 | 디지탈 오디오 부호화 방법 및 장치 |
| KR94P15694 | 1994-06-30 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0816195A JPH0816195A (ja) | 1996-01-19 |
| JP4091994B2 true JP4091994B2 (ja) | 2008-05-28 |
Family
ID=19387063
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP01097095A Expired - Lifetime JP4091994B2 (ja) | 1994-06-30 | 1995-01-26 | ディジタルオーディオ符号化方法及び装置 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US5673289A (ja) |
| JP (1) | JP4091994B2 (ja) |
| KR (1) | KR100289733B1 (ja) |
| DE (1) | DE4447257A1 (ja) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3255022B2 (ja) | 1996-07-01 | 2002-02-12 | 日本電気株式会社 | 適応変換符号化方式および適応変換復号方式 |
| JP3318825B2 (ja) * | 1996-08-20 | 2002-08-26 | ソニー株式会社 | デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置 |
| US5893066A (en) * | 1996-10-15 | 1999-04-06 | Samsung Electronics Co. Ltd. | Fast requantization apparatus and method for MPEG audio decoding |
| US5839098A (en) | 1996-12-19 | 1998-11-17 | Lucent Technologies Inc. | Speech coder methods and systems |
| US6091773A (en) * | 1997-11-12 | 2000-07-18 | Sydorenko; Mark R. | Data compression method and apparatus |
| JP3515903B2 (ja) * | 1998-06-16 | 2004-04-05 | 松下電器産業株式会社 | オーディオ符号化のための動的ビット割り当て方法及び装置 |
| JP2002014700A (ja) * | 2000-06-30 | 2002-01-18 | Canon Inc | 音声信号処理方法、装置および記憶媒体 |
| JP4506039B2 (ja) * | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
| KR100513729B1 (ko) * | 2003-07-03 | 2005-09-08 | 삼성전자주식회사 | 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법 |
| US7536301B2 (en) * | 2005-01-03 | 2009-05-19 | Aai Corporation | System and method for implementing real-time adaptive threshold triggering in acoustic detection systems |
| US7908103B2 (en) * | 2007-05-21 | 2011-03-15 | Nilanjan Senroy | System and methods for determining masking signals for applying empirical mode decomposition (EMD) and for demodulating intrinsic mode functions obtained from application of EMD |
| JP5262171B2 (ja) * | 2008-02-19 | 2013-08-14 | 富士通株式会社 | 符号化装置、符号化方法および符号化プログラム |
| KR20090110242A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 신호를 처리하는 방법 및 장치 |
| KR101599875B1 (ko) * | 2008-04-17 | 2016-03-14 | 삼성전자주식회사 | 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치 |
| KR20090110244A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치 |
| MY205241A (en) | 2009-01-16 | 2024-10-09 | Dolby Int Ab | Cross product enhanced harmonic transposition |
| JP5582027B2 (ja) * | 2010-12-28 | 2014-09-03 | 富士通株式会社 | 符号器、符号化方法および符号化プログラム |
| US10012694B2 (en) | 2016-04-27 | 2018-07-03 | Aai Corporation | Enhancing spectral purity in high-speed testing |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0506394A2 (en) * | 1991-03-29 | 1992-09-30 | Sony Corporation | Coding apparatus for digital signals |
| JP3141450B2 (ja) * | 1991-09-30 | 2001-03-05 | ソニー株式会社 | オーディオ信号処理方法 |
| US5508949A (en) * | 1993-12-29 | 1996-04-16 | Hewlett-Packard Company | Fast subband filtering in digital signal coding |
-
1994
- 1994-06-30 KR KR1019940015694A patent/KR100289733B1/ko not_active Expired - Lifetime
- 1994-12-21 US US08/360,354 patent/US5673289A/en not_active Expired - Lifetime
- 1994-12-30 DE DE4447257A patent/DE4447257A1/de not_active Withdrawn
-
1995
- 1995-01-26 JP JP01097095A patent/JP4091994B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| DE4447257A1 (de) | 1996-01-04 |
| US5673289A (en) | 1997-09-30 |
| KR100289733B1 (ko) | 2001-05-15 |
| KR960002276A (ko) | 1996-01-26 |
| JPH0816195A (ja) | 1996-01-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100269213B1 (ko) | 오디오신호의부호화방법 | |
| JP4091994B2 (ja) | ディジタルオーディオ符号化方法及び装置 | |
| JP2756515B2 (ja) | 可聴信号の知覚符号化方法および音声信号伝送方法 | |
| Johnston | Transform coding of audio signals using perceptual noise criteria | |
| JP3404837B2 (ja) | 多層符号化装置 | |
| JP3297051B2 (ja) | 適応ビット配分符号化装置及び方法 | |
| JP3153933B2 (ja) | データ符号化装置及び方法並びにデータ復号化装置及び方法 | |
| JP2906646B2 (ja) | 音声帯域分割符号化装置 | |
| JP3336618B2 (ja) | 高能率符号化方法及び高能率符号化信号の復号化方法 | |
| JP3278900B2 (ja) | データ符号化装置及び方法 | |
| JP3297240B2 (ja) | 適応的符号化システム | |
| US7003449B1 (en) | Method of encoding an audio signal using a quality value for bit allocation | |
| JPWO1995002925A1 (ja) | 高能率符号化方法,高能率符号の復号化方法,高能率符号の符号化装置,高能率符号の復号化装置,高能率符号化・復号化システム,及び記録メディア | |
| US7583804B2 (en) | Music information encoding/decoding device and method | |
| US6128593A (en) | System and method for implementing a refined psycho-acoustic modeler | |
| JP3557674B2 (ja) | 高能率符号化方法及び装置 | |
| JP3395001B2 (ja) | ディジタルオーディオ信号の適応的符号化方法 | |
| Davidson | Digital audio coding: Dolby AC-3 | |
| KR100289732B1 (ko) | 다채널 디지탈 오디오의 비트할당방법 및 회로 | |
| JP3291948B2 (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
| KR0144841B1 (ko) | 음향신호의 적응적 부호화 및 복호화장치 | |
| KR0140681B1 (ko) | 디지탈 오디오 데이타 부호화장치 | |
| JPH08204575A (ja) | 適応的符号化システム及びビット割当方法 | |
| KR0123274B1 (ko) | 사용자 기호 보상형 심리음향 모델 | |
| JPH07181996A (ja) | 情報処理方法、情報処理装置、及びメディア |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20041126 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041207 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050307 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050719 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080303 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110307 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110307 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120307 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130307 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140307 Year of fee payment: 6 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| EXPY | Cancellation because of completion of term |