[go: up one dir, main page]

JP4838361B2 - オーディオ信号のデコーディング方法及びその装置 - Google Patents

オーディオ信号のデコーディング方法及びその装置 Download PDF

Info

Publication number
JP4838361B2
JP4838361B2 JP2009537083A JP2009537083A JP4838361B2 JP 4838361 B2 JP4838361 B2 JP 4838361B2 JP 2009537083 A JP2009537083 A JP 2009537083A JP 2009537083 A JP2009537083 A JP 2009537083A JP 4838361 B2 JP4838361 B2 JP 4838361B2
Authority
JP
Japan
Prior art keywords
information
gain
correlation
downmix
downmix signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009537083A
Other languages
English (en)
Other versions
JP2010509884A (ja
Inventor
オ オウ,ヒェン
ウォン ジュン,ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2010509884A publication Critical patent/JP2010509884A/ja
Application granted granted Critical
Publication of JP4838361B2 publication Critical patent/JP4838361B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ信号のデコーディング方法及びその装置に係り、より詳細には、様々なデジタル媒体を介して受信したオーディオ信号をデコーディングする方法及びその装置に関する。
複数個のオブジェクト(object)をダウンミキシングしてモノ信号またはステレオ信号を生成すると同時に、それぞれのオブジェクトから情報(またはパラメータ)を抽出することができる。このような情報はオーディオ信号のデコーディングに利用することができる。また、マルチポイント制御ユニット(Multipoint Control Unit:MCU)における出力オーディオ信号は、それぞれのオブジェクトに対応する情報を用いて生成することができる。
マルチポイント制御ユニット(MCU)は、コンファレンスコール(conference call)を用いて遠隔の場所から提供された信号を統合することによってテレコンファレンス(teleconference)で使用できる装置である。近年、統合(convergence)技術が技術分野において脚光を浴びている。
従来のマルチポイント制御ユニット(MCU)結合部は、マルチチャネルオーディオ信号を受信して結合信号を生成した。しかし、マルチチャネル情報のみを持つマルチチャネルオーディオ信号をマルチポイント制御ユニットで利用する場合、それぞれのチャネルゲイン及びパニングは制御できるが、オブジェクトゲイン及びパニングは制御できないという不具合があった。
デコーディング装置は、ダウンミックス信号及び空間情報を受信し、空間情報を用いて出力信号を生成する。この出力信号は、ユーザ入力または再生構成のような他の入力信号に基づいてレンダリングすることができる。それぞれのオブジェクトを制御するために、デコーディング装置はマルチオブジェクト信号を受信し、これをデコーディングするために処理することができる。
しかしながら、全てのマルチオブジェクト信号をデコーディングする方法及び装置は、広い帯域幅を必要とする。したがって、新しいマルチオブジェクト信号をデコーディングする方法及び装置は、広い帯域幅などの要件を緩和しなければならない。また、チャネル基盤のデコーディングとの下位互換性(backward compatibility)のために、マルチチャネル情報に容易に変換されうる(オブジェクトに対応する)空間情報が必要である。
したがって、本発明は、上記技術的課題を解決するために実質的に従来技術の問題点を一つ以上除去したり従来技術の欠点を改善したりするオーディオ信号のデコーディング方法及び装置に関する。
上記課題を解決するために、本発明は、オブジェクトゲイン情報及びオブジェクトレベル情報を含むオブジェクト情報を用いてオーディオ信号をデコーディングし、各ダウンミックスチャネルに対してオブジェクトが含まれる割合を変化させることによってオーディオ信号のダウンミックスを変更するオーディオ信号処理方法及び装置を提供する。
また、上記課題を解決するために、本発明は、マルチポイント制御ユニット結合部で生成される結合ダウンミックス信号及び結合オブジェクト情報を含み、これらはオブジェクトゲインを調節して遠隔コンファレンス等に出力するようにするオーディオ信号処理方法及び装置を提供する。
付加的な本発明の長所、目的及び特徴は、以下で説明され、後述する内容は、本発明の属する技術分野における通常の知識を持つ者にとって明らかである。本発明の他の目的及び長所は、添付の図面の他に、以下に述べられる明細書及び請求項で明確に説明される。
本発明の様々な実施例は、処理時間及び必要なコンピュータ資源を減らすことによって、高速で效率よくマルチオブジェクトオーディオ信号をデコーディングする方法及びその装置を提供し、広い帯域幅のような要件を和らげることができる。本発明の一実施例によるオブジェクト情報は、チャネル基盤のデコーディング装置との下位互換性を提供することもできる。
本発明の理解を助けるために添付した図面は、本発明の好ましい実施例を図示し、詳細な説明と共に本発明の原理を説明するために提供される。
本発明の一実施例によるオーディオ信号のデコーディング装置を示すブロック図である。 本発明の一実施例によるオーディオ信号のデコーディング方法を示すフローチャートである。 本発明の他の実施例によるオーディオ信号のデコーディング装置を示すブロック図である。 本発明の一実施例による情報生成部を示すブロック図である。 本発明の一実施例によるオブジェクトゲイン情報生成部を示すブロック図である。 本発明の他の実施例による情報生成部を示すブロック図である。 本発明の他の実施例によるオーディオ信号の処理装置を示すブロック図である。 本発明の一実施例によるマルチポイント制御ユニット(MCU)を示すブロック図である。 本発明の一実施例による結合オブジェクト情報エンコーディング部を示すブロック図である。
本発明の意図に従って上記目的と利点を実現するため、以下で実施形態が広範に説明されるように、本発明に係るダウンミックス信号をデコーディングする方法は、ダウンミックス信号、オブジェクト情報及びミックス情報を受信する段階であって、前記オブジェクト情報は、オブジェクトレベル情報、オブジェクト相関情報及びオブジェクトゲイン情報を含み、前記オブジェクトレベル情報は、基準情報として前記オブジェクトレベルのうちの一つを用いてオブジェクトに対応するオブジェクトレベルを正規化して生成され、前記オブジェクト相関情報は、二つの選択されたオブジェクトの組合せから提供され、前記オブジェクトゲイン情報は、オブジェクトゲイン値情報及びオブジェクトゲイン率情報のうち少なくとも一つを含む、段階と、前記オブジェクト情報及び前記ミックス情報を用いてダウンミックス処理情報を生成する段階と、前記ダウンミックス処理情報を用いて前記ダウンミックス信号を処理する段階と、を含むことを特徴とする。
本発明に関する上述の概括的な説明及び以下の詳細な説明は、ともに例示や説明のためのものであり、特許請求の範囲に記載される本発明をさらに説明することを目的としている。
以下、添付の図面を参照しつつ図示された本発明の好適な実施例について詳細に説明する。可能な限り、全ての図面を通して同様又は類似の部分には同一の符号を使用する。
本発明を説明するに先立って、本発明において開示されるほとんどの用語は、従来技術において周知の一般的用語に対応している。しかしながら、一部の用語は本願で選んだものであり、本発明の以下の説明において開示される。したがって、出願人が定義した用語に関しては、本発明における意味に基づいて理解するのが望ましいことに留意されたい。
本発明の実施例は、当該技術分野における通常の知識を持つ者に本発明をより完全に説明するために提供されるもので、下記実施例は、様々な他の形態に変形することができ、本発明の範囲が下記の実施例に限定されるものではない。むしろ、これらの実施例は本開示をより充実した完全なものにし、当業者に本発明の思想を完全に伝達するために提供されるものである。
図1は、本発明の一実施例によるオーディオ信号のデコーディング装置1000を示すブロック図であり、図3は、本発明の他の実施例によるオーディオ信号のデコーディング装置2000を示すブロック図である。
オーディオ信号のデコーディング装置1000,2000の2つの実施例は、オーディオ信号デコーディング装置1000がマルチチャネルデコーディング部1300を有するのに対し、オーディオ信号デコーディング装置2000はマルチチャネルデコーディング部1300を有しないという点で異なる。情報生成部1100,2100及びダウンミックス信号処理部1200,2200等の他の構成要素は、図1及び図3のオーディオ信号デコーディング装置1000,2000において同様である。
図1を参照すると、オーディオ信号のデコーディング装置1000は、情報生成部1100、ダウンミックス信号処理部1200及びマルチチャネルデコーディング部1300を含む。情報生成部1100は、ユーザ入力またはビットストリームからオブジェクト情報(object information)及びミックス情報(mix information)を受信し、これを用いてダウンミックス信号処理情報(downmix processing information)を生成する。
ここで、オブジェクト情報は、オブジェクトレベル情報(object level information)、オブジェクト相関情報(object correlation information)及びオブジェクトゲイン情報(object gain information)を含む。オブジェクトレベル情報は、オブジェクトのレベルの一つである基準情報を用いて各オブジェクトに対応するオブジェクトレベルを正規化することによって生成することができる。オブジェクト相関情報は、二つの選択されたオブジェクトの組合せから提供することができる。オブジェクトゲイン情報は、オブジェクトゲイン値情報(object gain value information)及び/またはオブジェクトゲイン率情報(object gain ratio information)を含む。また、ダウンミックス信号処理情報は、オブジェクトゲイン及びパニングを調節するための情報を含み、これはダウンミックス信号処理部1200に入力される。
ダウンミックス信号処理部1200は、ダウンミックス信号と情報生成部1100からのダウンミックス信号処理情報を受信する。ダウンミックス信号処理部1200は、ダウンミックス信号処理情報を用いてダウンミックス信号を処理でき、これにより、処理済ダウンミックス信号(processed downmix signal)が生成される。例えば、ダウンミックス信号処理部1200は、ダウンミックス信号処理情報をダウンミックス信号に適用して、ダウンミックス信号に含まれた一つ以上のオブジェクトゲイン及びオブジェクトパニングを変化させることができ、これらオブジェクトゲイン及びパニングが変化した信号である処理済ダウンミックス信号を生成することができる。
処理済ダウンミックス信号はマルチチャネルデコーディング部1300に入力されてアップミキシングされ、スピーカーのような出力装置から出力されてもよい。情報生成部から出力されたマルチチャネル情報(multi-channel information)もマルチチャネルデコーディング部1300に入力してもよい。本発明の一部実施例において、マルチチャネルデコーディング部1300は、MPEGサラウンドシステム(MPEG surround system)のデコーディング部と同様なユニットとすることができる。
代替方法として、処理済ダウンミックス信号は、図3のデコーディング装置2000のように、出力装置に直接伝送されて出力されてもよい。処理済ダウンミックス信号がスピーカーから直接出力されるために、ダウンミックス信号処理部2200は、合成フィルタバンク(synthesis filter bank)の役割を果たし、PCMデータを出力することができる。また、上記処理済ダウンミックス信号を直接PCM信号として出力するか、マルチチャネルデコーディング部に入力するかは、ユーザ選択によって決定してもよい。
図2は、図1に基づいて本発明の一実施例によるオーディオ信号のデコーディング方法を示すフローチャートである。まず、ダウンミックス信号、オブジェクト情報及びミックス情報を受信する(S110)。オブジェクト情報及びミックス情報を用いてダウンミックス信号処理情報を生成する(S120)。この後、ダウンミックス信号処理情報を用いてダウンミックス信号を処理することによって、処理済ダウンミックス信号が生成される(S130)。
以下、情報生成部1100の構成を、図4〜図6を参照してより詳細に説明する。
1. オブジェクト情報
1.1 基準情報及びオブジェクトレベル情報
図4は、本発明の一実施例によるオーディオ信号処理装置の情報生成部の構成を例示するブロック図である。図4を参照すると、情報生成部1100は、オブジェクト情報を受け取り、該オブジェクト情報を用いてダウンミックス信号処理情報を生成する。
情報生成部1100は、オブジェクトレベル情報デコーディング部1110a、オブジェクトゲイン情報生成部1120a及びオブジェクト相関情報生成部1130aを含む。
ダウンミックス信号は、複数個のオブジェクトを含み、それらオブジェクトは、オブジェクトごとにオブジェクトレベルを有する。
オブジェクトレベル情報は、基準情報(reference information)を用いてオブジェクトレベルを正規化することによって生成される。この基準情報は、オブジェクトレベルのうちの一つとすることができ、より詳細には、全てのオブジェクトレベルのうち最も大きいオブジェクトレベルとすることができる。
例えば、ダウンミックス信号はオブジェクトs_iを含み、オブジェクトs_iに対応するオブジェクトレベルはPs_iと仮定する。
もし、オブジェクト情報をエンコーディングすることによってオブジェクトレベルエネルギーが伝送されるとすれば、このオブジェクト情報は、下記のような情報になりうる。
Ps_iは様々な方法を用いて獲得することができる。例えば、Ps_iは、"s_i(n)2"または"E[s_i(n)2]"でありうる。Ps_iは、各オブジェクトレベル情報に対応する情報として伝送することができる。本明細書で、"s_i(n)"は、i番目のオブジェクトを示し、時間ドメインの信号であるか、指定されたバンド内のサブバンド信号でありうる。
しかし、もし、それぞれのオブジェクトに対応するオブジェクトレベル情報がその値のまま伝送されるとすれば、該オブジェクトのオブジェクトレベルが広い範囲で変動するので、量子化が難しくなりうる。
したがって、オブジェクトレベル情報は、全てのオブジェクトエネルギーのうち最も大きいオブジェクトレベルエネルギーである基準情報を用いて正規化することができる。もし、この基準情報がr_1である場合、オブジェクトレベル情報は、下記数式1のように算出して伝送することができる。
Figure 0004838361
ここで、r_1(n)は、基準情報を表す。
全てのオブジェクトレベル情報は、1以下の範囲に含まれる。
したがって、変動範囲は、オーディオ信号がエンコーディングされうる範囲に圧縮することができる。また、オブジェクトレベル情報は、他の信号処理に利用するために、基準情報、デフォルト情報、原オブジェクトレベルエネルギーなどを含むことができる。このオブジェクトレベル情報はそれぞれのオブジェクトに対応し、オブジェクトレベル情報の個数は、ダウンミックス信号に含まれるオブジェクトの個数と同一である。
1.2 オブジェクトゲイン情報
オブジェクト情報は、オブジェクトゲイン値情報及びオブジェクトゲイン率情報のうち少なくとも一つを含むオブジェクトゲイン情報を含む。図5は、本発明の一実施例によるオーディオ信号処理装置を示すブロック図で、より詳細には、情報生成部1100のオブジェクトゲイン情報デコーディング部を例示するブロック図である。
オブジェクトゲイン情報生成部1120aは、オブジェクトゲイン値情報生成部1121及びオブジェクトゲイン率情報生成部1122を含む。オブジェクトゲイン情報は、一つより多いチャネルを有するダウンミックス信号を生成する目的で、一つのオブジェクトをダウンミックス信号の各チャネルに含めることと関連する。
1.2.1 オブジェクトゲイン値情報
オブジェクトゲイン値情報は、オブジェクトのゲイン値を含む。本発明の一部実施例では、オブジェクトゲインは、処理済ダウンミックス信号を生成する前にそれぞれのオブジェクトに適用される。
例えば、ダウンミックス信号が複数個のオブジェクトを含む場合、下記数式2のように、オブジェクトに対応するオブジェクトゲイン値情報をオブジェクトレベルに乗算することで、ゲインの適用されたオブジェクトを生成し、ゲインの適用された全てのオブジェクトは、処理済ダウンミックス信号を生成するために合算される。
Figure 0004838361
ここで、Xは、伝送される処理済モノダウンミックス信号で、s_iはオブジェクトレベルで、a_iは、各ダウンミックスチャネルに含まれるオブジェクトのオブジェクトゲイン値情報である。
1.2.2 オブジェクトゲイン率情報
オブジェクトゲイン情報は、オブジェクトゲイン値情報の他に、オブジェクトゲイン率情報をさらに含むことができる。このオブジェクトゲイン率情報は、処理済ダウンミックス信号の各チャネルに寄与する各オブジェクトゲイン間の比率値を含む。
オブジェクトゲイン率情報は、ダウンミックス信号処理部1200によってダウンミックスを処理するために利用することができ、これにより、モノラルまたはステレオチャネルで伝送される処理済ダウンミックス信号を獲得することができる。ステレオ信号である場合、処理済ダウンミックス信号は下記数式3のようになり、オブジェクトゲイン率情報は、下記数式4によって獲得することができる。
Figure 0004838361
ここで、x_1及びx_2は、ダウンミックス信号の各チャネル信号であり、s_iは、オブジェクトレベルであり、a_i及びb_iは、各ダウンミックス信号のチャネルに含まれるオブジェクトのオブジェクトゲイン値情報である。
Figure 0004838361
ここで、m_iは、オブジェクトゲイン率情報である。
オブジェクトゲイン情報、すなわち、オブジェクトゲイン値情報(a_i,b_i)及びオブジェクトゲイン率情報(m_i)は、ビットストリームに含まれたオブジェクトゲイン情報の多様な組合せで情報生成部1100に伝送することができる。この組合せは、例えば、(a_i,b_i),(m_i,a_i),(m_i,b_i)などである。情報生成部1100は、原オブジェクト情報を復元するために当該組合せをデコーディングすることができる。情報生成部1100により行なわれるこれらの組合せのデコーディングは、例えば、マルチチャネルデコーディング部1300のような他のデコーディング部で採択されうることは当業者には理解できる。
このオブジェクトゲイン情報が情報生成部1100にオブジェクトゲイン値情報(a_i,b_i)の組合せで伝送される時、このオブジェクトゲイン値情報は調整することができる。万一、b_iが1に調整されるように規定されている場合、a_iのみをオブジェクトゲイン情報として伝送することができる。この場合にも、情報生成部1100は、規定にしたがって原オブジェクト情報を復元することができる。オブジェクトゲイン値を調整することによって、情報生成部1100に伝送される情報の個数を減らすことができる。
選択的に、オブジェクトゲイン率情報(m_i)は、下記数式5のような様々な方法で獲得することができる。
Figure 0004838361
(α,βは、分子、分母が0に近づくのを防止するための極めて小さい数である。)
オブジェクトゲイン率情報がs_iを含む場合、s_iとm_iの値が同一であれば、m_iは同一値のs_iを含めなくてよい。例えば、1)a_i=0.5,b_i=0.5、2)a_i=2,b_i=2の場合、1)、2)両方とも1のm_i値を有する。しかし、これら両方におけるa_i,b_iは、相異なる値を有する。
各チャネルを通じて伝送される処理済ダウンミックス信号を獲得するために、新しい方法では、下記数式6を利用することができる。
Figure 0004838361
ここで、a_i'及びb_i'は、下記の条件を満たす値である。
(a_i'+b_i'=C)または(a_i'2+b_i'2=C)または(a_i'=Cまたはb_i'=C)
ただし、s_i'=g_i×s_i
最後に、オブジェクトゲイン率情報は、m_i'(=a_i'/b_i')として伝送されるので、情報生成部1100に伝送される情報の個数を減らすことができる。オーディオ信号デコーディング装置1000,2000におけるオーディオ信号の歪みを防止するためにm_iが伝送されてもよい。
1.3 オブジェクト相関情報
図4を参照すると、情報デコーディング部(情報生成部)1100は、オブジェクト相関情報(object correlation information)を受信する。このオブジェクト相関情報は、二つのオブジェクト間で推定されるもので、両オブジェクト間の相関度または一貫性を表す。
二つのオブジェクトが、元のチャネルが同じオブジェクト(objL,objR)であり、互いに異なるチャネルを通じて伝送される場合に、オブジェクト相関情報が存在することがある。
第一に、オブジェクトがステレオオブジェクトであれば、このステレオオブジェクトはダウンミキシングされてモノオブジェクトを生成し、ステレオオブジェクトのチャネル間の関係を表す子孫オブジェクト情報(descendant object information)を生成することができる。本明細書では、この第一の方法を“モノ方式(mono method)”という。この場合、モノオブジェクトのオブジェクトレベルを用いてオブジェクトレベル情報を生成することができる。
第二に、ステレオオブジェクトを二つの別個のモノオブジェクトとして認知する方法がある。この場合、二つの別個のモノオブジェクトのレベルを用いてオブジェクトレベル情報が生成される。本明細書では、この第二の方法を“ステレオ方式(stereo method)”と呼ぶ。この第二の方法を用いて伝送される情報の量は、第一の方法を利用する場合に比べて大きくなる。
ステレオオブジェクトを処理するために、例えば、それぞれのモノオブジェクトのように、ステレオオブジェクトのうち1番目のチャネル信号をs_i、2番目のチャネル信号をs_jとすることができる。
これらチャネル信号のオブジェクトレベルはPs_i,Ps_jでありうる。
ステレオオブジェクトの場合、同一オブジェクトの左側チャネル及び右側チャネルに該当するオブジェクト(s_i,s_j)を表すオブジェクト情報は互いに似ているので、オブジェクト相関情報は、それらオブジェクト情報の類似性を表すために利用することができる。
オブジェクト相関情報は代表値としてチャネル信号のパワー値のうちの一つを含む。例えば、チャネル信号のパワー値は、ステレオオブジェクトの左側チャネル及び下記数式7のように代表値を用いて正規化したパワー値でありうる。
Figure 0004838361
オブジェクト情報の伝送ビット数を減らすために、オブジェクト相関情報を利用することが効率的である。
一方、オブジェクト相関情報は、下記数式8のように代表値を用いて生成することができる。
Figure 0004838361
オブジェクト相関情報は、オブジェクト間の関連性を表すので、該オブジェクトがマルチチャネルオブジェクトまたはステレオオブジェクトの二つのチャネルオブジェクトなのか、換言すれば、それぞれのオブジェクトが同一オブジェクトのそれぞれ異なるチャネルオブジェクトなのか否かを表す。
また、二つのオブジェクトの関連性に関しては、差異情報を利用することもできる。
他の情報には、下記数式9のようにステレオオブジェクトの和または差信号を含むことができる。
Figure 0004838361
このM及びPs_Mを含むオブジェクト相関情報は、伝送効率を向上させ、エラー(error)を容易に修正することができる。
オブジェクト情報のビット率を減少させるために、オブジェクト相関情報の数は、同一オブジェクトにおいて様々に採択することができる。オブジェクトがステレオまたはマルチチャネルオブジェクトの一部か否かを表す相関フラグ情報(correlation_flag)は、オブジェクト情報から受信することができる。この相関フラグ情報を、オブジェクト情報に含め情報生成部1100で受信することができる。
相関フラグ情報の意味は、下記表1の通りである。
Figure 0004838361
相関フラグ情報が0の場合、オブジェクト相関情報は、オブジェクト相関情報デコーディング部1130aに伝送されない。もし、相関フラグ情報がデコーディング装置1000,2000に伝送されない場合には、ダウンミックス信号の処理のためにデフォルト値を利用することができる。
一方、相関フラグ情報が1の場合は、選択された二つのオブジェクトの類似性を表すオブジェクト相関情報が、オブジェクト相関情報デコーディング部1130aに伝送される。
また、オブジェクト情報は別途に基準情報をさらに含むことができる。基準情報が存在する場合、この基準情報はマルチポイント制御ユニット結合部(MCU combiner)のための識別子になりうる。
本発明によるオーディオ信号のエンコーディング方法は、マルチオブジェクトオーディオ信号を受信する段階と、ダウンミックス信号及びオブジェクト情報を生成する段階と、を含み、このオブジェクト情報は、オブジェクトレベル情報、オブジェクトゲイン情報及びオブジェクト相関情報を含む。オブジェクトレベル情報、オブジェクトゲイン情報及びオブジェクト相関情報は、前述した方法で生成される。この方法に本発明によるオーディオ信号のエンコーディング方法が限定されるわけではない。
また、本発明によるオーディオ信号のエンコーディング装置は、マルチオブジェクトオーディオ信号からダウンミックス信号を生成するダウンミキシング部と、マルチオブジェクトオーディオ信号からオブジェクトレベル情報、オブジェクトゲイン情報及びオブジェクト相関情報を含むオブジェクト情報を抽出するオブジェクト情報生成部と、を含む。同様に、この装置に本発明によるオーディオ信号のエンコーディング装置が限定されるわけではない。
2. マルチポイント制御ユニット結合部(MCU combiner)
マルチオブジェクト信号を含むオーディオ信号は、マルチポイント制御ユニット結合部で使用してオブジェクトゲインを調節し、遠隔のコンファレンス装置等に出力することができる。マルチオブジェクト信号を含むオーディオ信号を用いる場合、各オブジェクト信号の特性に対応してオブジェクトゲイン及びパニング(panning)を調節することが効果的である。
例えば、マルチチャネルオーディオ信号は、ボーカル信号、背景音楽(BMG)及びナレーション(narration)音を含むことができる。この場合、必要に応じて、聴取者がボーカル信号及びナレーション音無しで背景音楽のみを利用したり聞いたりしようとする時、または、テレコンファレンス(teleconference)を用いて対話しようとする時、特定オブジェクトのみを削除したり制御したりすることができる。このような場合、マルチオブジェクト信号を含むオーディオ信号を利用すると上記の問題点を解決することができる。
また、本発明によるデコーディング方法はオブジェクト情報を用いて改善されたカラオケシステムに利用することができる。
図6は、本発明の一実施例によるオーディオ信号の処理装置を示すブロック図である。図6を参照すると、オーディオ信号の処理装置は、第1エンコーダ3100、第2エンコーダ4100、そしてマルチポイント制御ユニット結合部5100及びダウンミキシング部5200を含む結合部5000を含む。第1エンコーダ3100及び第2エンコーダ4100はそれぞれ第1オーディオ信号及び第2オーディオ信号を受信することができ、第1エンコーダ3100では第1ダウンミックス信号及び第1オブジェクト情報を生成し、第2エンコーダ4100では第2ダウンミックス信号及び第2オブジェクト情報を生成することができる。
結合部5000は、第1エンコーダ3100から第1ダウンミックス信号及び第1オブジェクト情報を受信し、第2エンコーダ4100からは第2ダウンミックス信号及び第2オブジェクト情報を受信して、結合ダウンミックス信号及び結合オブジェクト情報を生成する。
結合部5000の出力信号である結合ダウンミックス信号は、一般のダウンミキシング部を用いて生成することができる。したがって、ダウンミキシング部5200についての詳細な説明は省略する。
2.1 結合オブジェクト情報
図7は、本発明の一実施例によるオーディオ信号の処理装置を示すブロック図であり、より詳細には、マルチポイント制御ユニット結合部5100を例示するブロック図である。図7を参照すると、マルチポイント制御ユニット結合部5100は、第1オブジェクト情報、第2オブジェクト情報及び制御情報を用いて結合オブジェクト情報を生成するように構成することができる。この結合オブジェクト情報は、第1エンコーダ3100から出力された第1ダウンミックス信号と第2エンコーダ4100から出力された第2ダウンミックス信号に対応する全ての情報を含む。
マルチポイント制御ユニット結合部5100は、オブジェクト情報デコーディング部5110及び結合オブジェクト情報エンコーディング部5120を含む。オブジェクト情報デコーディング部5110は、第1エンコーダ3100からの第1オブジェクト情報及び第2エンコーダ4100からの第2オブジェクト情報を受信し、第1基準値、第1オブジェクトレベル情報、第1オブジェクトゲイン情報、第2基準値、第2オブジェクトレベル情報及び第2オブジェクトゲイン情報を生成するように構成することができる。ここで、基準値、オブジェクトレベル情報及びオブジェクトゲイン情報は、図1〜図6における説明と同一である。したがって、このような情報を生成する方法についての詳細は省略する。
また、マルチポイント制御ユニット結合部5100は、入力信号が制限されることなく複数のエンコーダから少なくとも二つのオブジェクト情報を受信して、結合ダウンミックス信号に対応する複数の情報を含む結合オブジェクト情報を生成することができる。
2.2 制御情報
図8は、本発明の一実施例によるオーディオ信号の処理装置を示すブロック図であり、より詳細には、結合オブジェクト情報エンコーディング部5120を例示するブロック図である。図8を参照すると、結合オブジェクト情報エンコーディング部5120は、上記の情報(第1オブジェクト情報及び第2オブジェクト情報)及びユーザコントロールから制御情報(control information)を受信して、デコーダ(図示せず)に入力される結合オブジェクト情報を生成するように構成することができる。
ここで、制御情報は、第1オブジェクト情報及び第2オブジェクト情報を処理でき、結合オブジェクト情報エンコーディング部5120において第1オブジェクト情報及び第2オブジェクト情報の組合せに適用することができる。この結合オブジェクト情報は、この制御情報によって処理して生成することができ、制御情報は、結合オブジェクト情報に対応して結合するオブジェクトを表し、オブジェクト情報の組合せでオブジェクトゲインが調節されることを表す。
この制御情報は、オブジェクト制御情報、ゲイン制御情報及びあて先情報を含み、これらについては以下で説明する。
2.2.1 オブジェクト制御情報
オブジェクト制御情報は、結合オブジェクト情報を生成するためのターゲットオブジェクト(target object)を決定することができる。このオブジェクト制御情報は、第1オブジェクト情報または第2オブジェクト情報に対応するオブジェクトの必要な集合を決定することができる。
オブジェクト制御情報は、オブジェクトレベル情報エンコーディング部5122でオブジェクトレベル情報に適用されて、結合オブジェクトレベル情報を生成でき、この結合オブジェクトレベル情報は、オブジェクト制御情報によって決定される一部のオブジェクトに対する情報を含むことができ、様々な目的に応じて利用することができる。
例えば、第1オブジェクト情報は、ボーカル、ピアノ、ギターオブジェクトを含む音楽信号を含むことができる。この音楽信号からピアノ、ギター、バイオリンオブジェクトを含むオーディオ信号を生成するために、オブジェクト制御情報及びユーザコントロールを用いてボーカルオブジェクトのない結合オブジェクト情報を獲得することができる。
2.2.2 ゲイン制御情報
オブジェクトゲイン情報エンコーディング部5123は、第1オブジェクト情報からの第1ゲイン情報、第2オブジェクト情報からの第2ゲイン情報、ゲイン制御情報及びあて先情報を受信して、結合オブジェクトゲイン情報を生成するように構成することができる。
ゲイン制御情報は、マルチポイント制御ユニット結合部でオブジェクトゲインを調節するために用いることができる。オブジェクトレベル情報エンコーディング部5122で結合オブジェクトレベル情報に利用されるオブジェクトを選択するオブジェクト制御情報とは違い、ゲイン制御情報は、オブジェクトゲイン情報エンコーディング部5123で利用することができる。このゲイン制御情報は0〜1の範囲内の値にすることができる。
2.2.3 あて先情報
上記のゲイン制御情報の範囲内で、もしオブジェクトに対応するゲイン制御情報が0であれば、このオブジェクトに対するオブジェクト情報は結合オブジェクト情報に含まれない。ゲイン制御情報が0または1の場合、このゲイン制御情報はあて先情報(destination information)と呼ぶ。このあて先情報は、0または1の値を持つ特定ゲイン制御情報を含み、結合されたダウンミックス信号が出力されるあて先を表す識別子を含む。
あて先情報は、例えば、ささやき声モード(whisper mode)、秘密会議(secret meeting)のように特別なモードのために利用することができ、オブジェクトの使用を制御するために利用することができる。
図8を参照すると、あて先情報は、オブジェクトゲイン情報エンコーディング部5123に入力され、結合オブジェクト情報のオブジェクトゲインを調節するために第1オブジェクトゲイン情報及び第2オブジェクトゲイン情報に適用することができる。万一マルチポイント制御ユニット結合部が3つのポートを持つとすれば、あて先情報は各出力ポートに対応するそれぞれのゲイン値(例えば、0または1)を含むことができる。
上記のゲイン制御情報及びあて先情報はオブジェクトゲイン情報エンコーディング部5123に同時にまたは個別に入力してもよい。
2.3 結合オブジェクト情報を生成する方法
図8は、結合オブジェクト情報エンコーディング部5120を例示するブロック図である。図8を参照すると、結合オブジェクト情報エンコーディング部5120は、第1基準値(reference value_1)、第2基準値(reference value_2)、第1オブジェクトレベル情報、第2オブジェクトレベル情報、第1オブジェクトゲイン情報、第2オブジェクトゲイン情報、オブジェクト制御情報、ゲイン制御情報及びあて先情報を受信し、これらの情報を用いて結合オブジェクト情報を生成する。
2.3.1 基準情報の選定
図8を再び参照すると、結合オブジェクト情報エンコーディング部5120は、基準値生成部5121、オブジェクトレベル情報エンコーディング部5122及びオブジェクトゲイン情報エンコーディング部5123を含む。
結合オブジェクト情報を生成するために、まず、結合オブジェクト情報の基準情報を推定しなければならない。それぞれのオブジェクト情報は、各オブジェクトのレベルを正規化し、オブジェクトレベル情報を生成するための基準情報を含むことができる。しかし、結合オブジェクト情報を生成するために少なくとも二つのオブジェクト情報を結合する場合、結合オブジェクト情報は、結合オブジェクトレベル情報を構成するオブジェクトレベルを正規化するための基準情報を決定する。
この結合オブジェクト情報の基準情報は、様々な方法によって決定することができる。例えば、この基準情報は、(第1オブジェクト情報に含まれた)第1基準情報であるか、それぞれのオブジェクト情報の基準情報のうち最も大きい値でありうる。
この基準情報を変更する代わりに、結合オブジェクト情報は、それぞれのオブジェクト情報のオブジェクトレベル情報を利用することができる。
2.3.2 結合オブジェクト情報のオブジェクトレベル情報
基準情報生成部5121は、上記のような方法で結合オブジェクト情報の基準情報を推定する。結合オブジェクト情報の基準情報が変更される前に、オブジェクトレベル情報_iは基準情報_iで正規化される。
オブジェクト情報_1のオブジェクトレベル情報は下記数式10のように、結合オブジェクト情報のオブジェクトレベル情報は下記数式11のように仮定する。
Figure 0004838361
(ここで、OL_1nは、オブジェクト情報_1のオブジェクトレベル情報であり、EO_1nはオブジェクト情報_1のn番目のオブジェクトレベルエネルギーである。)
Figure 0004838361
(ここで、OL_kは、結合オブジェクト情報のk番目のオブジェクトレベル情報である。)
2.3.2 オブジェクトゲイン情報
オブジェクトゲイン情報エンコーディング部5123は、第1オブジェクトゲイン情報、第2オブジェクトゲイン情報、ゲイン制御情報及びあて先情報を受信して、オブジェクトゲイン情報を生成する。あて先情報がオブジェクト情報のオン/オフを表す場合、すなわち、あて先情報が0または1の場合、オブジェクトゲイン情報は0または1になりうる。ゲイン制御情報がユーザコントロールから入力されると、このゲイン制御情報を用いて第1オブジェクトゲイン情報及び第2オブジェクトゲイン情報を変更することができる。
2.3.3 オブジェクト相関情報
オブジェクト相関情報は、ステレオオブジェクトまたはマルチチャネルオブジェクトのチャネル間の類似度/非類似度を表す。したがって、オブジェクト相関情報は、マルチポイント制御ユニット結合部5100におけるオブジェクト情報の結合の影響を受けることがある。
結合オブジェクト情報のオブジェクト相関情報は、オブジェクト情報_iのオブジェクト相関情報をそのまま含むことができる。
以上説明してきた本発明は、前述した実施例及び添付の図面に限定されず、本発明の技術的思想を逸脱しない範囲内で様々な置換、変形及び変更が可能であるということは、本発明の属する技術分野における通常の知識を持つ者にとっては明白である。したがって、本発明は、添付の特許請求の範囲で規定される範囲内の変形及び変更を含むものである。
本発明は、オーディオ信号のエンコーディング及びデコーディングに利用することができる。

Claims (20)

  1. ダウンミックス信号、オブジェクト情報及びミックス情報を受信する段階であって、前記オブジェクト情報は、オブジェクトレベル情報、オブジェクト相関情報及びオブジェクトゲイン情報を含み、前記オブジェクトレベル情報は、基準情報として前記オブジェクトレベルのうちの一つを用いてオブジェクトに対応するオブジェクトレベルを正規化して生成され、前記オブジェクト相関情報は、二つの選択されたオブジェクトの組合せから提供され、前記オブジェクトゲイン情報は、オブジェクトゲイン値情報及びオブジェクトゲイン率情報のうち少なくとも一つを含む、段階と
    前記オブジェクト情報及び前記ミックス情報を用いてダウンミックス処理情報を生成する段階と、
    前記ダウンミックス処理情報を用いて前記ダウンミックス信号を処理する段階と、
    を含むことを特徴とするオーディオ信号のデコーディング方法。
  2. 前記基準情報は、前記全てのオブジェクトレベルのうち最も大きいオブジェクトレベルを含むことを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  3. 前記オブジェクトレベル情報の数は、前記ダウンミックス信号に含まれた前記オブジェクトの数と同一であることを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  4. 前記オブジェクト相関情報は、互いに異なるチャネルを通じて伝送される同一起源のオブジェクトを表す関連情報を含むことを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  5. 前記オブジェクト相関情報は、相関フラグ情報に基づいて存在することを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  6. 前記オブジェクト相関情報は、相関フラグ情報に基づくデフォルト値を含むことを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  7. 前記オブジェクトゲイン値情報は、前記ダウンミックス信号の生成のために前記オブジェクトに適用されるゲイン値を含むことを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  8. 前記オブジェクトゲイン率情報は、前記ダウンミックス信号の少なくとも2つのチャネルに相対的に含まれるゲイン率を含むことを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  9. 前記オブジェクト情報は、前記基準情報をさらに含むことを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  10. 前記オブジェクト情報は、相関フラグ情報をさらに含むことを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  11. 出力信号として前記処理されたダウンミックス信号を獲得する段階をさらに含むことを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  12. マルチチャネル情報を用いて前記処理されたダウンミックス信号をアップミキシングする段階をさらに含むことを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  13. 前記ダウンミックス信号は、デジタル媒体を通じて受信されることを特徴とする請求項1に記載のオーディオ信号のデコーディング方法。
  14. ダウンミックス信号、オブジェクト情報及びミックス情報を受信する段階であって、前記オブジェクト情報は、オブジェクトレベル情報、オブジェクト相関情報及びオブジェクトゲイン情報を含み、前記オブジェクトレベル情報は、基準情報として前記オブジェクトレベルのうちの一つを用いてオブジェクトに対応するオブジェクトレベルを正規化して生成され、前記オブジェクト相関情報は、二つの選択されたオブジェクトの組合せから提供され、前記オブジェクトゲイン情報は、オブジェクトゲイン値情報及びオブジェクトゲイン率情報のうち少なくとも一つを含む、段階と、
    前記オブジェクト情報及び前記ミックス情報を用いてダウンミックス処理情報を生成する段階と、
    前記ダウンミックス処理情報を用いて前記ダウンミックス信号を処理する段階と、を備える処理をプロセッサに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
  15. ダウンミックス信号、オブジェクト情報及びミックス情報を受信し、前記オブジェクト情報及び前記ミックス情報を用いてダウンミックス処理情報を生成する情報生成部であって、前記オブジェクト情報は、オブジェクトレベル情報、オブジェクト相関情報及びオブジェクトゲイン情報を含み、前記オブジェクトレベル情報は、基準情報として前記オブジェクトレベルのうちの一つを用いてオブジェクトに対応するオブジェクトレベルを正規化して生成され、前記オブジェクト相関情報は、二つの選択されたオブジェクトの組合せから提供され、前記オブジェクトゲイン情報は、オブジェクトゲイン値情報及びオブジェクトゲイン率情報のうち少なくとも一つを含む、情報生成部と、
    前記ダウンミックス信号及び前記ダウンミックス処理情報を受信し、前記ダウンミックス処理情報を用いて前記ダウンミックス信号を処理するダウンミックス信号処理部と、
    を含むことを特徴とするオーディオ信号の処理装置。
  16. マルチオブジェクトオーディオ信号を受信する段階と、
    ダウンミックス信号、オブジェクト情報及びミックス情報を生成する段階と、
    を含み、
    前記オブジェクト情報は、オブジェクトレベル情報、オブジェクト相関情報及びオブジェクトゲイン情報を含み、前記オブジェクトレベル情報は、基準情報として前記オブジェクトレベルのうちの一つを用いてオブジェクトに対応するオブジェクトレベルを正規化して生成され、前記オブジェクト相関情報は、二つの選択されたオブジェクトの組合せから提供され、前記オブジェクトゲイン情報は、オブジェクトゲイン値情報及びオブジェクトゲイン率情報のうち少なくとも一つを含むことを特徴とするオーディオ信号のエンコーディング方法。
  17. 前記基準情報は、前記全てのオブジェクトレベルのうち最も大きいオブジェクトレベルを含むことを特徴とする請求項16に記載のオーディオ信号のエンコーディング方法。
  18. 前記オブジェクトレベル情報の数は、前記ダウンミックス信号に含まれる前記オブジェクトの数と同一であることを特徴とする請求項16に記載のオーディオ信号のエンコーディング方法。
  19. 前記オブジェクト相関情報は、互い異なるチャネルを通じて伝送される同一起源のオブジェクトを表す関連情報を含むことを特徴とする請求項16に記載のオーディオ信号のエンコーディング方法。
  20. マルチオブジェクトオーディオ信号からダウンミックス信号を生成するダウンミキシング部と、
    前記マルチオブジェクトオーディオ信号からオブジェクトレベル情報、オブジェクトゲイン情報及びオブジェクト相関情報を含むオブジェクト情報を生成するオブジェクト情報生成部と、
    を含み、
    前記オブジェクトレベル情報は、基準情報として前記オブジェクトのうちの一つを用いてオブジェクトに対応するオブジェクトレベルを正規化することによって生成され、前記オブジェクト相関情報は、二つの選択されたオブジェクトの組合せから提供され、前記オブジェクトゲイン情報は、オブジェクトゲイン値情報及びオブジェクトゲイン率情報のうち少なくとも一つを含むことを特徴とするオーディオ信号のエンコーディング装置。
JP2009537083A 2006-11-15 2007-11-15 オーディオ信号のデコーディング方法及びその装置 Expired - Fee Related JP4838361B2 (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US86590806P 2006-11-15 2006-11-15
US60/865,908 2006-11-15
US86908006P 2006-12-07 2006-12-07
US86907706P 2006-12-07 2006-12-07
US60/869,077 2006-12-07
US60/869,080 2006-12-07
US88356707P 2007-01-05 2007-01-05
US60/883,567 2007-01-05
US88971507P 2007-02-13 2007-02-13
US60/889,715 2007-02-13
US95539507P 2007-08-13 2007-08-13
US60/955,395 2007-08-13
PCT/KR2007/005740 WO2008060111A1 (en) 2006-11-15 2007-11-15 A method and an apparatus for decoding an audio signal

Publications (2)

Publication Number Publication Date
JP2010509884A JP2010509884A (ja) 2010-03-25
JP4838361B2 true JP4838361B2 (ja) 2011-12-14

Family

ID=39401874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009537083A Expired - Fee Related JP4838361B2 (ja) 2006-11-15 2007-11-15 オーディオ信号のデコーディング方法及びその装置

Country Status (10)

Country Link
US (2) US20080269929A1 (ja)
EP (1) EP2092516A4 (ja)
JP (1) JP4838361B2 (ja)
KR (1) KR101100221B1 (ja)
CN (1) CN101536086B (ja)
AU (1) AU2007320218B2 (ja)
BR (1) BRPI0718614A2 (ja)
CA (1) CA2669091C (ja)
MX (1) MX2009005159A (ja)
WO (1) WO2008060111A1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9386269B2 (en) 2006-09-07 2016-07-05 Rateze Remote Mgmt Llc Presentation of data on multiple display devices using a wireless hub
US9319741B2 (en) 2006-09-07 2016-04-19 Rateze Remote Mgmt Llc Finding devices in an entertainment system
US8607281B2 (en) 2006-09-07 2013-12-10 Porto Vinci Ltd. Limited Liability Company Control of data presentation in multiple zones using a wireless home entertainment hub
US8935733B2 (en) 2006-09-07 2015-01-13 Porto Vinci Ltd. Limited Liability Company Data presentation using a wireless home entertainment hub
US9233301B2 (en) 2006-09-07 2016-01-12 Rateze Remote Mgmt Llc Control of data presentation from multiple sources using a wireless home entertainment hub
CN101652810B (zh) * 2006-09-29 2012-04-11 Lg电子株式会社 用于处理混合信号的装置及其方法
CN101529898B (zh) * 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
BRPI0710935A2 (pt) * 2006-11-24 2012-02-14 Lg Electronics Inc método para codificar e decodificação de sinal de áudio orientado a objeto e aparelhagem para o mesmo
EP2102855A4 (en) * 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
AU2008215232B2 (en) * 2007-02-14 2010-02-25 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
KR101453732B1 (ko) * 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
US20110282674A1 (en) * 2007-11-27 2011-11-17 Nokia Corporation Multichannel audio coding
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8139773B2 (en) * 2009-01-28 2012-03-20 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
WO2010087631A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
JP5678048B2 (ja) * 2009-06-24 2015-02-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ カスケード化されたオーディオオブジェクト処理ステージを用いたオーディオ信号デコーダ、オーディオ信号を復号化する方法、およびコンピュータプログラム
US20110054917A1 (en) * 2009-08-28 2011-03-03 Electronics And Telecommunications Research Institute Apparatus and method for structuring bitstream for object-based audio service, and apparatus for encoding the bitstream
US9042559B2 (en) * 2010-01-06 2015-05-26 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
CN103050124B (zh) * 2011-10-13 2016-03-30 华为终端有限公司 混音方法、装置及系统
WO2014128275A1 (en) 2013-02-21 2014-08-28 Dolby International Ab Methods for parametric multi-channel encoding
WO2014141577A1 (ja) 2013-03-13 2014-09-18 パナソニック株式会社 オーディオ再生装置およびオーディオ再生方法
KR102343453B1 (ko) * 2014-03-28 2021-12-27 삼성전자주식회사 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
US9774974B2 (en) * 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
CN106303897A (zh) 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
WO2016204125A1 (ja) 2015-06-17 2016-12-22 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US11322164B2 (en) * 2018-01-18 2022-05-03 Dolby Laboratories Licensing Corporation Methods and devices for coding soundfield representation signals
BR112021007089A2 (pt) 2018-11-13 2021-07-20 Dolby Laboratories Licensing Corporation processamento de áudio em serviços de áudio imersivos
ES2985934T3 (es) 2018-11-13 2024-11-07 Dolby Laboratories Licensing Corp Representar audio espacial por medio de una señal de audio y metadatos asociados
KR102799690B1 (ko) 2019-06-14 2025-04-23 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 매개변수 인코딩 및 디코딩

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003066994A (ja) * 2001-08-27 2003-03-05 Canon Inc データ復号装置及びデータ復号方法、並びにプログラム、記憶媒体
WO2006060279A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1416769A (en) * 1919-06-30 1922-05-23 Int Precipitation Co Process and apparatus for separation of suspended material from gases
DE3175209D1 (en) 1981-05-29 1986-10-02 Ibm Aspirator for an ink jet printer
DE69210689T2 (de) 1991-01-08 1996-11-21 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
US6141446A (en) 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
GB2295072B (en) * 1994-11-08 1999-07-21 Solid State Logic Ltd Audio signal processing
US5838664A (en) * 1997-07-17 1998-11-17 Videoserver, Inc. Video teleconferencing system with digital transcoding
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6128597A (en) * 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
WO1998058450A1 (en) 1997-06-18 1998-12-23 Clarity, L.L.C. Methods and apparatus for blind signal separation
US6026168A (en) * 1997-11-14 2000-02-15 Microtek Lab, Inc. Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
US6952677B1 (en) * 1998-04-15 2005-10-04 Stmicroelectronics Asia Pacific Pte Limited Fast frame optimization in an audio encoder
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US7103187B1 (en) * 1999-03-30 2006-09-05 Lsi Logic Corporation Audio calibration system
US6839438B1 (en) * 1999-08-31 2005-01-04 Creative Technology, Ltd Positional audio rendering
WO2001066008A1 (en) 2000-03-03 2001-09-13 Cardiac M.R.I., Inc. Magnetic resonance specimen analysis apparatus
ES2461167T3 (es) * 2000-07-19 2014-05-19 Koninklijke Philips N.V. Convertidor estéreo de múltiples canales para derivar una señal envolvente estéreo y/o central de audio
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7032116B2 (en) 2001-12-21 2006-04-18 Intel Corporation Thermal management for computer systems running legacy or thermal management operating systems
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
JP4714415B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメータによるマルチチャンネルオーディオ表示
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
JP4013822B2 (ja) 2002-06-17 2007-11-28 ヤマハ株式会社 ミキサ装置およびミキサプログラム
KR100542129B1 (ko) * 2002-10-28 2006-01-11 한국전자통신연구원 객체기반 3차원 오디오 시스템 및 그 제어 방법
JP4084990B2 (ja) 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
EP2665294A2 (en) * 2003-03-04 2013-11-20 Core Wireless Licensing S.a.r.l. Support of a multichannel audio extension
DE10321986B4 (de) * 2003-05-15 2005-07-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Pegel-Korrigieren in einem Wellenfeldsynthesesystem
US8205385B2 (en) * 2003-06-20 2012-06-26 Konvin Associates Ltd. Dual panel system for controlling the passage of light through architectural structures
JP4496379B2 (ja) 2003-09-17 2010-07-07 財団法人北九州産業学術推進機構 分割スペクトル系列の振幅頻度分布の形状に基づく目的音声の復元方法
US6937737B2 (en) * 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
TWI233091B (en) * 2003-11-18 2005-05-21 Ali Corp Audio mixing output device and method for dynamic range control
US7929708B2 (en) * 2004-01-12 2011-04-19 Dts, Inc. Audio spatial environment engine
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CA2992125C (en) 2004-03-01 2018-09-25 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US8843378B2 (en) 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
KR100663729B1 (ko) 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
KR100745688B1 (ko) 2004-07-09 2007-08-03 한국전자통신연구원 다채널 오디오 신호 부호화/복호화 방법 및 장치
US20060084916A1 (en) * 2004-07-14 2006-04-20 Taming Lo Self-destruction syringe
EP2175671B1 (en) 2004-07-14 2012-05-09 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
CN101228575B (zh) 2005-06-03 2012-09-26 杜比实验室特许公司 利用侧向信息的声道重新配置
KR100857104B1 (ko) 2005-07-29 2008-09-05 엘지전자 주식회사 인코딩된 오디오 신호 생성 및 처리 방법
US20070083365A1 (en) * 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal
EP1640972A1 (en) 2005-12-23 2006-03-29 Phonak AG System and method for separation of a users voice from ambient sound
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
JP4399835B2 (ja) 2006-07-07 2010-01-20 日本ビクター株式会社 音声符号化方法及び音声復号化方法
US8271290B2 (en) 2006-09-18 2012-09-18 Koninklijke Philips Electronics N.V. Encoding and decoding of audio objects
KR100987457B1 (ko) * 2006-09-29 2010-10-13 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
CN101529504B (zh) 2006-10-16 2012-08-22 弗劳恩霍夫应用研究促进协会 多通道参数转换的装置和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003066994A (ja) * 2001-08-27 2003-03-05 Canon Inc データ復号装置及びデータ復号方法、並びにプログラム、記憶媒体
WO2006060279A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information

Also Published As

Publication number Publication date
US7672744B2 (en) 2010-03-02
CA2669091C (en) 2014-07-08
KR20090082927A (ko) 2009-07-31
BRPI0718614A2 (pt) 2014-02-25
CN101536086B (zh) 2012-08-08
WO2008060111A1 (en) 2008-05-22
CN101536086A (zh) 2009-09-16
HK1136380A1 (en) 2010-06-25
EP2092516A4 (en) 2010-01-13
AU2007320218A1 (en) 2008-05-22
AU2007320218B2 (en) 2010-08-12
MX2009005159A (es) 2009-05-25
CA2669091A1 (en) 2008-05-22
EP2092516A1 (en) 2009-08-26
US20090171676A1 (en) 2009-07-02
JP2010509884A (ja) 2010-03-25
US20080269929A1 (en) 2008-10-30
KR101100221B1 (ko) 2011-12-28

Similar Documents

Publication Publication Date Title
JP4838361B2 (ja) オーディオ信号のデコーディング方法及びその装置
RU2460155C2 (ru) Кодирование и декодирование звуковых объектов
JP6010176B2 (ja) オーディオ信号のデコーディング方法及びその装置
TWI431610B (zh) 用以將以物件為主之音訊信號編碼與解碼之方法與裝置
JP5134623B2 (ja) 複数のパラメータ的に符号化された音源を合成するための概念
CN101479787B (zh) 用于编码和解码基于对象的音频信号的方法和装置
JP5455647B2 (ja) オーディオデコーダ
CN101542597B (zh) 用于编码和解码基于对象的音频信号的方法和装置
RU2417459C2 (ru) Способ и устройство для декодирования аудиосигнала
HK1136380B (en) A method and an apparatus for decoding an audio signal

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110929

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141007

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees