WO2008035654A1

WO2008035654A1 - Procédés et dispositifs de codage et de décodage d'image, dispositif et programmes de décodage d'image, et support de stockage desdits programmes

Info

Publication number: WO2008035654A1
Application number: PCT/JP2007/068041
Authority: WO
Inventors: Shinya Shimizu; Masaki Kitahara; Kazuto Kamikura; Yoshiyuki Yashima
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 2006-09-20
Filing date: 2007-09-18
Publication date: 2008-03-27
Anticipated expiration: 2009-03-20
Also published as: EP2066132A1; CN101536529A; RU2406257C2; US8385628B2; TWI348320B; BRPI0716814A2; CA2663084A1; CA2663084C; TW200822761A; US20100086222A1; JP4999853B2; JPWO2008035654A1; CN101536529B; EP2066132A4; KR20090053821A; KR101031624B1; RU2009107689A

Description

明細書

画像符号化方法及び復号方法、それらの装置、画像復号装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体

技術分野

[0001] 本発明は、多視点画像および多視点動画像の符号化および復号技術に関するものである。本願 (ま、 2006年 9月 20曰 ίこ出願された特願 2006— 254023号 ίこ基づき優先権を主張し、その内容をここに援用する。

背景技術

[0002] 多視点画像とは、複数のカメラで同じ被写体と背景を撮影した複数の画像のことであり、多視点動画像（多視点映像）とは、その動画像のことである。以下では 1つの力メラで撮影された動画像を" 2次元動画像"と呼び、同じ被写体と背景を撮影した 2次元動画像群を多視点動画像と呼ぶ。

[0003] 2次元動画像は、時間方向に関して強い相関があり、その相関を利用することによつて符号化効率を高めている。一方、多視点画像や多視点動画像では、各カメラが同期されていた場合、同じ時間に対応した各カメラの映像は全く同じ状態の被写体と背景を別の位置から撮影したものなので、カメラ間で強い相関がある。多視点画像や多視点動画像の符号化においては、この相関を利用することによって符号化効率を高めること力 Sでさる。

[0004] まず、 2次元動画像の符号化技術に関する従来技術を述べる。

[0005] 国際符号化標準である Η. 264、 MPEG— 2、 MPEG— 4をはじめとした従来の多くの 2次元動画像符号化方式では、動き補償、直交変換、量子化、エントロピー符号化という技術を利用して、高効率な符号化を行う。動き補償と呼ばれる技術が、フレーム間の時間相関を利用する方法である。

[0006] H. 264で使われている動き補償技術の詳細については、下記の非特許文献 1に記載されているが、以下で概要を説明する。

H. 264の動き補償では、符号化対象フレームを様々なサイズのブロックに分割し、ブロックごとに、参照フレームと呼ばれる既に符号化済みのフレームを選び、動きべクトルと呼ばれる対応点を示すベクトル情報を用いて、映像を予測する。このときに許されるブロック分害 ijは 16 X 16 (ピクセノレ）、 16 X 8、 8 X 16、 8 X 8、 8 X 4、 4 X 8、 4 X 4 の 7種類であり、被写体の動きの向きや大きさの違いに細かい単位で対応して映像を予測できるようになつている。これによつて、予測画像と原画像の差分で表される符号化対象の残差が小さくなるため、高い符号化効率を達成している。

[0007] 次に、従来の多視点画像や多視点動画像の符号化方式について説明する。

[0008] 多視点画像の符号化方法と、多視点動画像の符号化方法との違いは、多視点動画像にはカメラ間の相関に加えて、時間方向の相関が同時に存在するということである。しかし、カメラ間の相関を利用する方法はどちらの場合でも、同じ方法を用いることができる。そのため、ここでは多視点動画像の符号化において用いられる方法について説明する。

[0009] 多視点動画像の符号化については、カメラ間の相関を利用するために、動き補償を同じ時刻の異なるカメラの画像に適用した"視差補償"によって高効率に多視点動画像を符号化する方式が従来から存在する。ここで、視差とは、異なる位置に配置されたカメラの画像平面上で、被写体上の同じ位置が投影される位置の差である。

[0010] このカメラ間で生じる視差の概念図を図 21に示す。

この概念図では、光軸が平行なカメラの画像平面を垂直に見下ろしたものとなっている。このように、異なるカメラの画像平面上で被写体上の同じ位置が投影される位置は、一般的に対応点と呼ばれる。

視差補償はこの対応関係に基づいて、符号化対象フレームの各画素値を参照フレームから予測して、その予測残差と、対応関係を示す視差情報とを符号化する。

[0011] 多くの手法では、視差を画像平面上でのベクトルとして表現する。例えば、非特許文献 2では、ブロック単位で視差補償を行う仕組みが含まれている力、ブロック単位の視差を 2次元ベクトルで、すなわち 2つのパラメータ（X成分および y成分）で表現する。つまり、この手法では、 2パラメータで構成される視差情報と予測残差を符号化す

[0012] 一方、非特許文献 3では、カメラパラメータを符号化に利用し、ェピポーラ幾何拘束に基づき視差ベクトルを 1次元の情報として表現することにより、予測情報を効率的に符号化する。ェピポーラ幾何拘束の概念図を図 22に示す。

ェピポーラ幾何拘束によれば、 2台のカメラ（カメラ Aとカメラ B)において、片方の画像上の点に対応するもう片方の画像上の点は、ェピポーラ線という直線上に拘束される。非特許文献 3の手法では、ェピポーラ線上での位置を示すために、参照フレームを撮影しているカメラから被写体までの距離という 1つのパラメータで全符号化対象フレームに対する視差を表現している。

非特許文献 1 : ITU-T Rec.H.264/ISO/IEC 11496-10， "Editor's Proposed Draft Tex t Modifications for Joint Video Specification (ITU-T Rec. H.264 / ISO/IEC 14496-1 0 AVC), Draft 7", Final Committee Draft, Document JVT-E022, pp. 10-13， and 62 -68， September 2002.

非特許文献 2： Hideaki imata and Masaki itahara, "Preliminary results on multiple view video coding(3DAV)", document M10976 MPEG Redmond Meeting, July, 2004 非特許文献 3： Shinya SHIMIZU, Masaki KITAHARA, azuto AMI URA and Yoshi yuki YASHIMA, "Multi-view Video Coding based on 3_D Warping with Depth Map ，，， In Proceedings of Picture Coding Symposium 2006, SS3-6, April， 2006.

発明の開示

発明が解決しょうとする課題

[0013] 従来の多視点動画像の符号化方法によれば、カメラパラメータが既知である場合、ェピポーラ幾何拘束を利用して、カメラの台数にかかわらず、参照フレームに対してカメラから被写体までの距離という 1次元情報を符号化するだけで、全符号化対象フレームに対する視差補償が実現でき、視差情報を効率的に符号化することが可能である。

[0014] しかしながら、カメラパラメータを正確に測定するのは困難であるため、カメラパラメ一タには少なからず誤差が含まれる。その結果、参照フレームに対するェピポーラ幾何拘束に基づレ、た視差情報を、同じ時刻の全符号化対象フレームを視差補償する場合に最も効率よくなるように求める場合、求められる視差情報には、全てのカメラのカメラパラメータの誤差が含まれることになる。そのため、 1つの符号化対象フレームを選んだときの視差補償の予測精度は他のカメラに関する誤差の影響を受けて、その符号化対象フレームと参照フレームの組に対して求めた視差情報を用いる場合よりも低下してしまう。

[0015] 本発明は係る事情に鑑みてなされたものであって、多視点動画像の符号化において、参照フレームの符号化歪みやカメラパラメータの測定誤差が存在する場合にも、精度の高い視差補償を、少ない視差情報で実現することで、従来よりも高い符号化効率を達成することを目的とする。

課題を解決するための手段

[0016] 本発明による画像符号化方法の第 1の態様では、多視点画像全体から 1つの基準視点を選び、基準視点のカメラに対する他の全てのカメラの画像とのェピポーラ幾何拘束を鑑みた際に、尤もらしい視差情報であるグローバル視差情報を求めて符号化するステップと、基準視点以外のカメラごとに、グローバル視差情報とカメラパラメータとから、そのカメラの画像に対する他の全てのカメラの画像とのェピポーラ幾何拘束を鑑みた際に、尤もらしい視差情報であるベース視差情報を生成するステップと、そのカメラの画像に対し、視差補償に用いる既に符号化済みの参照視点画像との視差情報を示すために、ベース視差情報を補正する補正視差情報を求めて符号化するステップと、ベース視差情報を補正視差情報で補正することで得られる視差情報を用いて、そのカメラの画像を符号化するステップとを有する。

[0017] これによれば、補正視差情報が、符号化対象の画像に対して、視差補償の際の参照先の画像 (参照視点画像）のみを鑑みて求められるため、グローバル視差情報に含まれる全てのカメラパラメータの誤差の影響や参照フレームの符号化歪みの影響を、カメラごとに取り除くことができ、高い符号化効率を達成することができる。

また、グローバル視差情報が全体で共通するようなおおまかな視差情報を表すので、ベース視差情報の補正量は少なくて済み、補正視差情報の符号量は少ない。つまり、符号化対象の画像ごとに視差情報を求めて符号化する場合と比べて、共通部分にかかる符号量を節約できるので、全体として符号量を削減することができる

[0018] 本発明による画像符号化方法の第 2の態様では、多視点画像全体から 1つの基準視点を選び、基準視点のカメラに対する他の全てのカメラの画像とのェピポーラ幾何拘束を鑑みた際に、尤もらしい視差情報であるグローバル視差情報を求めて符号化するステップと、基準視点以外のカメラごとに、グローバル視差情報とカメラパラメータとから、そのカメラの画像に対する他の全てのカメラの画像とのェピポーラ幾何拘束を鑑みた際に、尤もらしい視差情報であるベース視差情報を生成するステップと、そのカメラの画像に対し、視差補償に用いる既に符号化済みの参照視点画像の最適な視差補償対応点を示すために、ベース視差情報によって与えられる対応点を補正する補正視差ベクトルを求めて符号化するステップと、ベース視差情報によって得られる対応点を補正視差ベクトルで補正することで視差補償を行レ、ながら、そのカメラの画像を符号化するステップとを有する。

[0019] これによれば、補正視差ベクトルが、符号化対象の画像に対して、視差補償の際の参照先の画像 (参照視点画像）のみを鑑みて求められるため、グローバル視差情報に含まれる全てのカメラパラメータの誤差の影響や参照フレームの符号化歪みの影響を、カメラごとに取り除くことができ、高い符号化効率を達成することができる。また、グローバル視差情報が全体で共通するようなおおまかな視差情報を表すので、ベース視差情報によって与えられる対応関係の補正量は少なく済み、補正視差ベクトルの符号量は少な!/、。

つまり、符号化対象の画像ごとに視差情報を求めて符号化する場合と比べて、共通部分にかかる符号量を節約できるので、全体として符号量を削減することができる

[0020] 前記第 1の態様において、ベース視差情報と補正視差情報とから得られる視差情報によって示される対応点情報（対応点ベクトル)を、さらに補正するために、 2次元の補正ベクトルを求めて、符号化するステップを有する。

[0021] これによれば、符号化対象画像を撮影するカメラのカメラパラメータの誤差やカメラのレンズ歪みによるェピポーラ幾何拘束に従った表現では補正できない微小な対応点の不一致を補正できるため、視差補償の予測効率が向上し、高い符号化効率の達成が可能である。

従来の 2次元のベクトルだけで補正を行う方式と異なり、幾何拘束による誤差が補正視差情報で取り除かれているため、補正に必要なベクトルは非常に小さくなり、より少な!/、符号量で精度の高!、予測を実現することができる。

[0022] 上記各態様に関し、基準視点のカメラの画像に対する領域分割を設定するステツプと、その領域分割を示す情報を符号化するステップとを有し、設定された領域分割ごとにグローバル視差情報を設定して符号化するようにしても良い。

[0023] これによれば、画像に映っている被写体によって変化する視差情報を正確に表すことができるため、グローバル視差情報の精度が向上することで、ベース視差情報を補正するための情報に必要な符号量を削減でき、高!/、符号化効率の達成が可能である。

[0024] ここで、基準視点の画像が、画像全体を領域分割されて、領域ごとに処理を加えて符号化されている場合には、その基準視点の画像を符号化するための領域分割と、グローバル視差情報を設定する単位を表す領域分割とを一致させることで、基準視点のカメラの画像の領域分割を示す情報を新たに符号化しないことも可能である。

[0025] また、映像自体と視差情報とでは性質が全く同じではないため、同じ映像の性質を持つ領域と同じ視差情報の性質を持つ領域が一致しない場合、基準視点の画像を符号化するための領域分割と完全に一致させずに、少しだけ領域分割を変更したほうがよい場合がある。

その場合、領域分割の違いのみを符号化することで、符号量を削減することが可能である。

[0026] また、符号化対象視点のカメラの画像に対する領域分割を設定するステップと、その領域分割を示す情報を符号化するステップとを有し、設定された領域分割ごとに補正視差情報や、補正視差ベクトルや、補正ベクトルを設定して符号化するようにしても良い。

[0027] これによれば、画像に映っている被写体によって変化する視差補償に用いる対応点の情報を正確に表すことができるため、視差補償時の映像予測精度が向上し、高 V、符号化効率の達成が可能である。

[0028] ここで、符号化対象視点の画像が、画像全体を領域分割されて、領域ごとに処理を加えて、この領域分割情報と共に符号化される場合には、その画像を符号化するための領域分割と、視差情報を設定する単位を表す領域分割を一致させることで、視差情報を設定する単位を表す領域分割を示す情報を符号化しないことが可能である

[0029] また、映像自体と視差情報とでは性質が全く同じではないため、同じ映像の性質を持つ領域と同じ視差情報の性質を持つ領域が一致しない場合、画像を符号化するための領域分割と、視差情報を設定する単位を表す領域分割とを完全に一致させずに、少しだけ領域分割を変更したほうがよい場合がある。その場合、領域分割の違いのみを符号化することで、符号量を削減することが可能である。

[0030] また、上記各態様に関し、視差補償時に参照するカメラを設定するステップと、そのカメラを示すインデックスを符号化するステップとを有し、符号化対象の画像ごとに求める補正視差情報や補正視差ベクトルや補正ベクトルを、上記インデックスで示されるカメラの符号化済みの画像を用いて視差補償する際に最適となるように求めるようにしても良い。

[0031] これによれば、基準視点のカメラだけでなぐ符号化対象の画像のカメラに近いカメラの映像を参照画像とすることができるため、ォクルージョンなどの影響で対応点の取れない部分が少なぐ正確な予測が可能になる。つまり、符号化する視差補償残差を減らし、効率的な符号化を実現することができる。

また、本発明におけるグローバル視差情報やベース視差情報は、参照対象によらなレヽ情報であるため、どの参照対象を用いても補正視差情報や補正ベクトルの符号量は少なく抑えることができる。

[0032] また、符号化対象画像に対して視差情報を求める際に、領域分割が設定されて!/、る場合、その領域ごとに最適な参照先を選択できるようにすることで、より正確な予測が可能となり、効率的な符号化を実現できる。

[0033] また、上記各態様に関し、グローバル視差情報を求める前に、各カメラの画像に対する視差情報であるローカル視差情報をェピポーラ幾何拘束に基づいて求めるステップと、その各カメラに対して求められたローカル視差情報とカメラパラメータを用いて、前記グローバル視差情報の候補を生成するステップとを有し、グローバル視差情報を求めるステップでは、同じ領域に対して得られたグローバル視差情報候補の平均値を、その領域のグローバル視差情報と設定するようにしても良い。

[0034] これによれば、視差補償時に各カメラで用いる最適な視差情報となるはずのロー力ル視差情報を最初に計算し、それらを用いてグローバル視差情報を生成することになる。

そのため、後続の処理で補正すべき視差情報を極力少なくするようなグローバル視差情報を求めることができる。つまり、無駄な情報を符号化することがなくなり、効率的な符号化を実現できる。

[0035] なお、グローバル視差情報候補からグローバル視差情報を決定する際に、平均値の代わりに、領域内で最も多く現れているグローバル視差情報候補に決定することで、後続の処理で補正すべき視差情報を少なくすることもできる。

[0036] さらに、ローカル視差情報とベース視差情報との差から、差分視差情報を設定するステップを有し、符号化対象視点のカメラの画像に対する領域分割を設定するステツプにおいて、この差分視差情報が領域内でほぼ同じになるような最大の領域分割を設定し、補正視差情報を求めるステップでは、領域内の差分視差情報から補正視差十青幸を設定するようにすることあできる。

[0037] このようにすれば、グローバル視差情報と補正視差情報とを一度の演算で求めることができるため、それらを個々に求める場合（大量の演算が必要）と比べ、演算量の削減を実現することができる。

[0038] また、領域分割の種類が限られて!/、る場合などでは、領域分割ごとに差分視差情報の分散を求めて、その分散の値を基準に領域分割を選ぶことで、領域分割を決める演算も高速に行うことが可能となる。

[0039] また、上記各態様に関し、ベース視差情報を設定するステップや、グローバル視差情報候補を設置するステップにおいて、変換前の視差情報が与えられた画像における連続性を用いて、変換後の画像上で視差情報が連続的に設定できるようにすることもできる。

[0040] 例えば、変換前で隣接する画素に対する視差情報がほぼ同じであるにもかかわらず、変換後では隣接しない画素に対して視差情報を設定するような場合に、その間に存在する画素に対する視差情報を、その両者の変換後の視差情報力補間して生成する。

[0041] このようにすれば、ベース視差情報やグローバル視差情報候補が与えられる領域が多くなり、補正すべき情報を少なくすることが可能となるため、符号量を抑え、高い符号化効率を達成することができる。

また連続性を隣接関係だけでなぐ三次元的な情報を示すことになる視差情報も用いてより正確に判断することができるため、誤ったベース情報やグローバル視差情報候補を生成して、逆に補正すべき情報を増加させることを防ぐことができる。

[0042] 以上の本発明による画像（映像を含む）符号化、および対応する画像復号では、各種の視差情報や視差情報を補正する情報や領域分割情報を、空間的変化もしくは時間的変化を鑑みて符号化することもできる。

[0043] 各種の視差情報や視差情報を補正する情報や領域分割情報は、映って!/、る映像に依存した情報であるため、画像内の相関や時間的な相関が非常に高い。

そのため、これによれば、各種の視差情報や視差情報を補正する情報や領域分割情報の冗長性を取り除いて符号化することができるため、その符号量を少なくし、高

V、符号化効率を達成することができる。

[0044] また、基準視点の符号化済み画像を縮小するステップを有し、グローバル視差情報を求める際に、生成した縮小画像に対して基準視点のカメラ力被写体までの距離を求めるようにする実施も可能である。

[0045] このようにすれば、画像を縮小して映像の細かい情報を削除することで、カメラパラメータ誤差などによって生じる視差情報の誤差や細かい変化を取り除くことができる。このような性質を持つグローバル視差情報によると、カメラパラメータの誤差等に左右されない大まかなカメラ間の対応関係が得られる。

そのため、カメラ毎に符号化する補正視差情報や補正ベクトルで重複して修正しなければならない誤差情報を減らし、全体としての符号化効率を向上させることが可能となる。また、縮小画像を用いることにより、視差情報を求める際に演算対象となる画素が減るため、演算量を削減することも可能となる。

[0046] なお、多視点動画像を符号化 (復号)する場合、各時刻のフレーム集合を多視点画像とみなして、本発明の画像符号化方法（画像復号方法）を適用することができる。さらに、多視点動画像では本発明の方法で画像全体を符号化するのではなぐ時間方向の相関を利用した動き補償など他の手法などを符号化処理対象ごとに選択して符号化することで、符号化効率を高めることもできる。

発明の効果

[0047] 本発明によれば、視差補償を行うための情報の大幅な増加を防ぎながら、カメラパラメータの推定誤差の影響を考慮した予測精度の高い視差補償を実現することで、多視点画像全体や多視点動画像全体としての高効率な符号化を実現することができる。

図面の簡単な説明

[0048] [図 1]本発明において定義した視差補償に用いる各情報のイメージ図である。

[図 2]実施例におけるカメラ構成例の概念図である。

[図 3]本発明の実施例 1の映像符号化装置を示す図である。

[図 4]図 3のグローバル視差補償情報設定部の詳細を示す図である。

[図 5]図 3の視差補償情報設定部の詳細を示す図である。

[図 6]実施例 1における映像符号化フローチャートである。

[図 7]図 6のステップ S2の処理に関する詳細フローチャートである。

[図 8]マクロブロックにおけるブロック分割の一例を示す図である。

[図 9]図 6のステップ S4の処理に関する詳細フローチャートである。

[図 10]図 6のステップ S5の処理に関する詳細フローチャートである。

[図 11]本発明の実施例 2の映像符号化装置を示す図である。

[図 12]図 11のローカル視差補償情報設定部の詳細を示す図である。

[図 13]図 11のグローバル視差補償情報設定部の詳細を示す図である。

[図 14]図 11の視差補償情報設定部の詳細を示す図である。

[図 15]実施例 2における映像符号化フローチャートである。

[図 16]図 15のステップ S402の処理に関する詳細フローチャートである。

[図 17]図 15のステップ S403の処理に関する詳細フローチャートである。

[図 18]図 15のステップ S406の処理に関する詳細フローチャートである。

[図 19]本発明の実施例 3の映像復号装置を示す図である。 [図 20]実施例 3における映像復号フローチャートである。園 21]カメラ間で生じる視差の概念図である。

[図 22]ェピポ' —ラ幾何拘束の概念図である。

符号の説明

100、 200 映像符号化装置

皿、 201 画像入力部

102、 202 画像メモリ

103、 203 基準視点画像入力部

104、 204 基準視点画像メモリ

105、 206 グロ一バル視差補償情報設定部

106、 207 ベース視差情報設定部

107、 208 視差補償情報設定部

108、 209 画像符号化部

109、 210 復号画像メモリ

205 ロー 'カル視差補償情報設定部

1051 基準視点画像ブロック分割設定部

1052 ブロック分割情報符号化部

1053 グロ一.バル視差情報推定部

1054 グロ一.バル視差情報符号化部

1071、 2081 符号化対象画像ブロック分割設定部

1072、 2082 ブロック分割情報符号化部

1073、 2085 参照視点インデックス設定部

1074、 2086 視点インデックス符号化部

1075、 2083 補正視差情報設定部

1076、 2084 補正視差情報符号化部

1077、 2087 補正ベクトル設定部

1078、 2088 補正ベクトル符号化部

1079、 2089 視差補償効率評価部 2051 ローカル視差情報ブロック分割設定部

2052 参照視点インデックス設定部

2053 ローカル視差情報設定部

2054 視差補償効率評価部

2061 基準視点画像ブロック分割設定部

2062 ブロック分割情報符号化部

2063 グローバル視差情報推定部

2064 グローバル視差情報符号化部

300 映像復号装置

301 符号化データ入力部

302 基準視点画像入力部

303 画像メモリ

304 グローバル視差補償情報復号部

305 ベース視差情報設定部

306 視差補償情報復号部

307 視差補償画像生成部

308 画像復号部

発明を実施するための最良の形態

本発明が従来技術と最も異なる点は、 1つの基準視点を設定し、その基準視点の符号化済み画像に対して、同時刻の他の全ての符号化対象画像を視差補償するためにェピポーラ幾何拘束に従ったグローバル視差情報を求め、このグローバル視差情報を各符号化対象画像に対するェピポーラ幾何拘束に従ったベース視差情報へ変換し、各符号化対象画像の性質や、カメラパラメータ誤差に応じて、そのベース視差情報を補正するための視差情報を、符号化対象画像ごとに符号化する点である。このェピポーラ幾何拘束に従った視差情報は、その画像の視点から被写体までの距離や、ェピポーラ直線上の基準点からの距離や、それらの距離に対応付けられたインデックス値で表すことができる。

なお、以下で、視差情報と述べた場合、これらのェピポーラ幾何拘束に基づいた視差情報を指すこととする。本発明で用いるグローバル視差情報とベース視差情報の概念について説明する。

[0051] 〔グローバル視差情報〕

グローバル視差情報は、基準視点の画像に対して与えられる視差情報のことである

。以下では、領域毎に視差情報が与えられるとして説明する。

[0052] ある領域 Aが視差情報 dを持つとすると、同時刻に撮影された他の視点（i= 1、 2、 3 、 ' · ·、Ν)の画像に対する対応領域 R (d、 i)がェピボーラ幾何拘束に従って得られる

A

。このとき、各対応領域間の画像の相違度を差分絶対値和や差分二乗和や差分の分散などや複数の基準の重み付和などで評価することができる。

[0053] この相違度を {A、 R (d、 i)

A I i= l、 2、 · · ·、 N}の全ての組合せに対して合計したものを、領域 Aにおける視差情報 dの評価値と呼ぶとすると、最も小さな評価値を与える視差情報をグローバル視差情報 Dと呼ぶ。

また、誤差の影響を減少させるために、実空間における物体の連続性を仮定して視差情報 dに対して補正項を追加して評価値を算出する場合もある。

[0054] 上記対応領域を求めるためにェピポーラ幾何拘束を利用する際に、カメラパラメ一タゃ計算に誤差が生じるため、特定の視点 i = kを考えた際に、符号化時の符号量 R ate (A、 d、 k)を最小化させる視差情報 dは、グローバル視差情報 Dでない場合があ

[0055] したがって、グローバル視差情報 Dは、その領域、およびその領域に対する他の全ての視点の画像における対応領域間で、類似度が最も高くなるような視差情報となる。概念的に述べるならば、その領域におけるカメラから被写体までのおよその距離と、精度の粗い距離を示すと言える。

[0056] 〔ベース視差情報〕

ベース視差情報が指すものは、グローバル視差情報と同じものである。ただ、その基準となる視点が、グローバル視差情報の場合は基準視点であり、ベース視差情報が基準視点以外の視点であるという点だけが異なる。

[0057] なお、対応している領城におけるグローバル視差情報とベース視差情報は、同じ 3 次元位置を表す情報となるが、一般に、視差情報はカメラから被写体までの距離で表されるため、視点が変わることによって、視差情報の具体的な値は異なるものとな

[0058] 図 1は、本発明において定義した視差補償に用いる各情報のイメージ図である。

本発明の画像符号化方法では、符号化対象の多視点画像の中から、 1つの基準視点を選んで符号化する。そして、基準視点以外の視点の画像を符号化する際に、既に符号化済みの他の視点の画像から映像予測をして符号化を行う。

この映像予測をするために用いる符号化済みの他の視点の画像を、参照視点画像と呼ぶ。この参照視点画像は、基準視点の画像と同じであっても、異なっていてもよい。図 1では、一般的な場合を示すために、異なる視点の画像であるように示してい

[0059] まず、上記で説明したグローバル視差情報力基準視点の画像に対して与えられる。グローバル視差情報によって与えられる被写体の 3次元位置は、符号化対象視点から見ればベース視差情報となる。そして、符号化対象画像上の画素に対して、参照視点画像だけを考えた際に、対応画素間の類似度が最も高くなる視差情報 (これをローカル視差情報と呼ぶ）を求め、その視差情報とベース視差情報の差分を補正視差情報と呼ぶ。

[0060] この符号化対象画像上の画素に対する視差情報はェピポーラ幾何拘束に従うため、図 22に示したとおり、どのような視差情報を与えたとしても、参照視点画像上の対応領域は、参照視点画像上で直線上に拘束されてしまい、与えられたカメラパラメ一タの誤差があると、その直線上に真の対応点が存在しなレ、。

そこで、ローカル視差情報によって与えられた対応点から真の対応点までのベタトルを補正ベクトルと呼ぷ。

[0061] グローバル視差情報（およびそれを変換したベース視差情報)だけでなぐこのようにして符号化対象画像上のある画素に対して、補正視差情報と補正ベクトルを与えて求められた参照視点画像上の対応点の画像情報を用いて、その画素の映像を予測する。

[0062] なお、この図 1では表されていないが、グローバル視差情報は多視点画像（多視点動画像の表示時刻が同じ画像群）に対して 1画像分を符号化し、補正視差情報と補正ベクトルは、基準視点を除く各視点に対して、 1画像分ずつ符号化される。また、ベース視差情報はグローバル視差情報から求められらるものであって、符号化されるものではない。

[0063] 以下、実施の形態に従って本発明を詳細に説明する。

ここで、以下に説明する実施の形態の例では、 3つのカメラで撮影された多視点動画像を符号化する場合を想定し、カメラ Aの基準視点としてカメラ Bとカメラ Cの画像を符号化する方法について説明を行う。

図 2に、本実施の形態の例で使用するカメラ構成の概念図を示す。なお、図中の四角型の図形は各カメラのフレームを表し、カメラ Bとカメラ Cの画像が図中の番号の順に入力されるものとして説明を行う。

[0064] まず、第 1の実施例（以下、実施例 1)について説明する。本発明の実施例 1に係る映像符号化装置の構成図を、図 3、図 4、図 5に示す。

図 3に示すように、実施例 1の映像符号化装置 100は、符号化対象となるカメラ Bとカメラ Cの原画像を入力する画像入力部 101と、入力された画像を格納する画像メモリ 102と、基準視点であるカメラ Aの復号画像を入力する基準視点画像入力部 103と、入力された基準視点の復号画像を格納する基準視点画像メモリ 104と、基準視点に対するェピポーラ幾何拘束に基づく視差情報であるグローバル視差情報を設定するグローバル視差補償情報設定部 105と、グローバル視差情報から符号化対象画像の視点に対するェピポーラ幾何拘束に基づく視差情報であるベース視差情報を設定するベース視差情報設定部 106と、符号化対象画像を視差補償するための情報を設定する視差補償情報設定部 107と、入力画像を実際に予測符号化する画像符号化部 108と、符号化した入力画像を復号した画像を格納する復号画像メモリ 10 9とを備える。

[0065] 図 4は、グローバル視差補償情報設定部 105の構成の詳細を示す図である。

この図に示すように、グローバル視差補償情報設定部 105は、基準視点の画像に対するブロック分割を設定する基準視点画像ブロック分割設定部; L051と、決定したブロック分割情報を符号化するブロック分割情報符号化部 1052と、入力された画像群から、ブロック毎にグローバル視差情報を推定するグローバル視差情報推定部 10 53と、求められたグローバル視差情報を符号化するグローバル視差情報符号化部 1 054とを備える。

[0066] ここで、グローバル視差情報推定部 1053によって求められたグローバル視差情報は、ベース視差情報設定部 106に通知されることになる。

また、ブロック分割情報符号化部 1052と、グローバル視差情報符号化部 1054とが出力する符号化データは、本映像符号化装置 100の出力の一部を構成する。

[0067] 図 5は、視差補償情報設定部 107の構成の詳細を示す図である。

この図に示すように、視差補償情報設定部 107は、符号化対象画像に対するプロック分割を設定する符号化対象画像ブロック分割設定部 1071と、決定したブロック分割情報を符号化するブロック分割情報符号化部 1072と、視差補償を行う際に参照画像として用いる画像の視点を示す視点インデックスを設定する参照視点インデッタス設定部 1073と、決定した視点インデックスを符号化する視点インデックス符号化部 1074と、ベース視差情報をェピポーラ幾何拘束に基づいて補正するための情報である補正視差情報を設定する補正視差情報設定部 1075と、決定した補正視差情報を符号化する補正視差情報符号化部 1076と、ベース視差情報と補正視差情報によって与えられる対応関係をェピポーラ幾何拘束とは関係なく補正するための補正ベクトルを設定する補正ベクトル設定部 1077と、決定した補正ベクトルを符号化する補正ベクトル符号化部 1078と、各部によって設定される視差補償のための情報で視差補償を行ったときの予測効率を評価する視差補償効率評価部 1079とを備え

[0068] ここで、視差補償効率評価部 1079によって、最も視差補償効率がよいと判断されたときの視差補償画像は、画像符号化部 108に通知されることになる。

また、ブロック分割情報符号化部 1072と、視点インデックス符号化部 1074と、補正視差情報符号化部 1076と、補正ベクトル符号化部 1078とが出力する符号化データは、本映像符号化装置 100の出力の一部を構成する。

[0069] 図 6〜図 10に、このように構成される映像符号化装置 100の実行する処理フローを示す。これらの処理フローに従って、実施例 1の映像符号化装置 100が実行する処理について詳細に説明する。 [0070] 図 6は、実施例 1の映像符号化装置 100で行われる、符号化処理全体の概要を示している。また、このフローでは、カメラ Bとカメラ Cで同時刻に撮影された 1枚ずつの画像を符号化する処理を説明する。

[0071] まず、画像入力部 101により、同時刻に撮影されたカメラ Bとカメラ Cの画像が 1枚ずつ入力され、画像メモリ 102に格納される [ステップ Sl]。なお、ここで入力された画像と同時刻に撮影されたカメラ Aの復号画像が、基準視点画像入力部 103によつて入力され、基準視点画像メモリ 104に格納されているものとする。

[0072] 次に、グローバル視差補償情報設定部 105において、画像メモリ 102と基準視点画像メモリ 104上の画像から、基準視点画像におけるェピポーラ幾何拘束を満たすグローバル視差情報を求め、それを符号化する [ステップ S2]。ここで行われる処理の詳細は、後で図 7を用いて説明する。

[0073] 以降のステップ S4〜S7の処理は、画像メモリ 102上の画像ごとに行われる。ここでは、カメラ Bの画像をカメラ Cの画像に先立って符号化するとして説明を行う。

つまり、画像メモリ 102からカメラ Bの画像を取り出して符号化対象画像に設定し [ステツプ S3]、ステップ S2の処理で求めたグローバル視差情報を、ベース視差情報設定部 106で符号化対象画像に対するェピポーラ幾何拘束に従ったベース視差情報に変換し [ステップ S4]、そのベース視差情報をもとに符号化効率を鑑みて、その他の視差補償情報であるところの参照視点インデックス、補正視差情報、補正べクトノレ等を求めて符号化し [ステップ S5]、それらの求められた視差補償情報を用いながら、符号化対象画像を画像符号化部 108で符号化する [ステップ S6]。

符号化した画像は復号され、復号画像メモリ 109に格納される [ステップ S 7]。そして、符号化した画像がカメラ Bの画像なら [ステップ S8]、次に、カメラ Cの画像を画像メモリ 102から取り出して、同様の手順 [ステップ S4〜S7]で符号化を行い、全ての処理を終了する。ステップ S4、ステップ S5で行う処理は、後で詳細に説明する。

[0074] 図 7に、グローバル視差補償情報設定部 105で行われるステップ S2の処理の詳細な処理フローを示す。

[0075] 本実施例 1では、縦横 16画素で構成されるマクロブロック単位でブロック分割を指定し、そのブロック分割で作成されるマクロブロック内のブロック（便宜上、以下では単に"ブロック"と呼ぶ）単位でグローバル視差情報を求めて符号化する。もちろん、マクロブロックより大きなサイズのブロックを用いてもょレ、。

[0076] マクロブロックで適用可能なブロック分割としては様々なものが考えられるが、例えば、図 8に示すようなものが考えられる。なお、図 8に記載のように、ブロック分割の種類に関するインデックスを WkModeとし、ブロック分害 iJblkModeにおけるブロック数を maxBlk[blkmode]と表す。ブロック分割の種類の数は maxBlkModeで表す。

[0077] また、マクロブロックのインデックスを MBBlkと表し、マクロブロック数を maxMBBlk と表す。

したがって、ここでの処理は、マクロブロックのインデックス MBBlkを 0に初期化した後 [ステップ S 101]、 MBBlkに 1を加算しながら [ステップ S116]、 MBBlkが maxM BBlkになるまで [ステップ S 117]、以下の処理 [ステップ S 102〜S 115]を繰り返す。その後、求まったブロック分割情報 BLKModeとグローバル視差情報 GDispInfoを、それぞれブロック分割情報符号化部 1052と、グローバル視差情報符号化部 1054 で符号化する [ステップ S 118]。

[0078] マクロブロック毎に繰り返される処理では、ブロック分割候補ごとに、その分割を評価し、最も評価の良いものをそのマクロブロックのブロック分割に設定するということを行う。

つまり、ブロック分害 iJblkModeを 0に、そのマクロブロックでの評価値の最良値 bVal ueを絶対に取り得ない最悪の評価値 wValueに初期化した後 [ステップ S102]、blk Modeに 1を加算しながら [ステップ SI 14]、 blkModeが maxBlkModeになるまで [ ステップ S 115]、ブロック分害 iJblkModeに対する評価値 valueを求め [ステップ S 10 3〜S 111]、 valueと bValueとを比較することで最良の評価値を与えるブロック分割を求め [ステップ S 112]、そのマクロブロックの分割を BLKMode [MBBlk]に、グロ一バル視差情報を GDispInf o [MBBlk]に格納する [ステップ S 113]と!/、う処理を繰り返す。

[0079] ブロック分害 iJblkModeに対する評価値 valueは、分割された各ブロックにおける視差補償のレート歪みコストを合計することで求められる。

すなわち、分割されたブロックのインデックスを blkで表すとすると、 blkを 0に初期化し、 valueを、ブロック分割力 ¾lkModeであることによる評価値 InitValue [blkMode] に初期化した後 [ステップ S 103]、 blkに 1を加え、 valueにブロック毎の最良レート歪みコスト bestBlkCostを加え、各ブロックの最良レート歪みコストを与えるグローバル視差情報を tempGDispInfo [blk]に格納しながら [ステップ S 110]、 blkが maxBlk [blkMode]になるまで [ステップ S 111]、各ブロックで最良レート歪みコストを与えるグローバル視差情報を求める処理 [ステップ S 104〜S 109]を繰り返す。

なお、 InitValue [blkMode]は、ブロック分割力 ¾lkModeであることを示すための情報を符号化するために必要な符号量に依存した値が予め定められているものとす

^ o

[0080] ブロックに対して、最良レート歪みコストを与えるグローバル視差情報を求める処理では、グローバル視差情報候補のインデックス gDispInfoの最大値を maxGDispInf oと表すとすると、 gDispInfoを 0に、そのブロックでのレート歪みコストの最良値 best BlkCostを絶対に取り得ない最悪の値 wBlkCostに初期化した後 [ステップ S 104]、 gDispInfoに 1を加算しながら [ステップ S 108]、 gDispInfoが maxGDispInfoを超えるまで [ステップ S 109]、グローバル視差情報 gDispInfoに対するレート歪みコスト WkCostを求め [ステップ S 105]、 blkCostと bestBlkCostとを比較することで、最良のレート歪みコストを与えるグローバル視差情報を求め [ステップ S 106]、そのグロ一バル視差情報を bestGDispInfoに保存する [ステップ S 107]という処理を繰り返す。

[0081] なお、グローバル視差情報 gDispInfoに対するレート歪みコスト blkCostは、以下の式に従って求められる。

[0082] [数 1] blkCost - Dj + λ - Rate{

で

Value cam. Trans pose, c m_tpix, rf {gDispInfo

[0083] ここで、 λ はラグランジュの未定乗数であり、予め設定された値が利用される。 Rat

1

e ()は引数で与えられるグローバル視差情報を符号化するのに必要な符号量またはその予測値を返す関数を表す。

[0084] ∑ は、 cam e {カメラ B、カメラ C }の和を表し、∑ は、 pix E {ブロック内の画素 } の和を表す。

d

base 0は引数として与えられるグローバル視差情報インデックスの示す基準視点から被写体までの距離を返す関数を表す。

Value ()は第一引数として与えられる視点における画像上の、第二引数として与えられる画素位置の画素値を返す関数を表し、 Trans (src、 dst、 pix、 d)は、視点 src における画像上の、位置 pixの画素の視点から被写体までの距離力の場合に、画素 pixの視点 dstにおける画像上における対応画素 pを返す関数を表している。この p は、以下の式で求められる。

[0085] [数 2]

[0086] ここで A、 R、 tはカメラパラメータであり、それぞれ内部パラメータ、回転パラメータ、並進パラメータを示す。内部パラメータと回転パラメータは 3 X 3行列であり、 tは 3次元のベクトノレである。

上記の「〜」が付加された pは、 pの斉次座標を示している。また、「Ίが付加された P kは、 pixの斉次座標のうち、特に第 3成分が 1であるものを表している。

斉次座標は、同次座標とも呼ばれる。 2次元座標に対する斉次座標は 3個の成分を持つ。この斉次座標の第 3成分の値で、第 1成分および第 2成分の値をそれぞれ除算した値を、第 1成分および第 2成分として持つ座標が、斉次座標に対する普通の座標となる。なお、カメラパラメータの表し方は様々であり、本実施例では、上記式によつてカメラ間の対応点が計算できるようなカメラパラメータであるとする。

[0087] 図 9に、ベース視差情報設定部 106で行われるステップ S4の処理の詳細な処理フローを示す。

[0088] ここでの処理は、基準視点から撮影された画像の画素ごとに行われる。

つまり、画素インデックス bpを 0に初期化した後 [ステップ S201]、 bpに 1を加算しながら [ステップ S213]、 bpが画像内画素数 numPixになるまで [ステップ S214]、以下の処理 [ステップ S202〜S212]を繰り返す。

また、ベース視差情報全体を BDispInfoと表し、 []を用いて指定された位置のベース視差情報を表すものとする。このベース視差情報はフローの最初で絶対に取り得ない大きな値で初期化される [ステップ S201]。

なお、処理を行う画素の順番はどのような順番でも問題ないが、本実施例 1では、ラスタースキャン順に処理を行うものとする。

[0089] 画素ごとに繰り返し行われる処理では、まず、画素 bpが含まれるマクロブロック MB

Blkと、グローバル視差情報を設定する際に求められたブロック分割に従った場合のブロックインデックス blkを求める [ステップ S202]。

次に、画素 bpが符号化対象画像で対応する画素 tpと、そこでのベース視差情報候補 bDispInfoを、グローバル視差情報 GDispInfo [MBBlk] [blk]から、次の数式を用いて求める [ステップ S203]。

[0090] 園 t dj p!nfo A

[0091] ここで tarは、符号化対象画像の視点を表し、 d

tar 0は、引数として与えられる視差情報インデックス（即ち、ベース視差情報候補 bDispInfo)の示す符号化対象画像の視点から被写体までの距離を返す関数を表す。

即ち、（i)画素 bp (の位置）、（ii)画素 bpにおけるグローバル視差情報が示す基準視点から被写体までの距離、（iii)基準視点のカメラパラメータ、および、（iv)符号化対象画像の視点のカメラパラメータから、画素 tp (の位置）および画素 tpにおけるベース視差情報候補を求める。

ただし、直接得られるのは画素 tp (の位置）と画素 tpにおける符号化対象画像の視点から被写体までの距離であり、後者が、関数 d の逆関数を用いて、上記の、画素

tar

tpにおけるベース視差情報候補 (bDispInfo)に変換される。

[0092] このようにして求められた bDispInfoは、その位置における既に求められたベース視差情報 BDispInfo [tp]と、それらが表す符号化対象画像の視点から被写体までの距離を尺度として比較され [ステップ S204]、 bDispInfoの表す距離のほうが小さくなレ、場合には、ォクルージョン (カメラで見えて!/、なかった部分）が発生して!/、るとレヽうことで、その画素に対する処理を終了する。 [0093] bDispInfoの表す距離のほうが小さい場合には、 bDispInfoで BDispInfo[tp]の値を更新する [ステップ S 205]。

次に、実空間上での物体の連続性を用いて、 BDispInfoの更新を行う。つまり、 bp の左もしくは上で隣接する画素の集合 NEIGHBORを生成し [ステップ S206]、 NEI GHBORが空集合になるまで [ステップ S207]、処理の完了した画素を NEIGHBO Rから取り除きながら [ステップ S212]、次の処理 [ステップ S208〜S211]を繰り返す。

[0094] NEIGHBORの要素ごとに行われる処理では、まず、 NEIGHBORの 1要素を nbp としたとき、 nbpにおけるグローバル視差情報を GDispInfoより求め、 nGDispInfoとする [ステップ S208]。

次に、 nGDispInfoと GDispInfo [MBBlk] [blk]との差分絶対値と予め与えられる閾値 THとを比較する [ステップ S209L

閾値以上の場合には、実空間上で物体は連続でないということなので、その要素に対する処理は終了する。

閾値より小さい場合には、上記ステップ S203の処理における式を用いて、画素 nb Pが符号化対象画像で対応する画素 ntpと、そこでのベース視差情報 nbDispInfoを求める [ステップ S210]。

そして、 tpと ntpとの間に存在する画素のベース視差情報を bDsipInfoと nbDispIn f oを用レ、て補完する [ステップ S 211]。

両端の情報から間の値を補完する方法であれば、どのような方法を用いることもできるが、最も単純な方法として、両端のベース視差情報から間を線形補完する方法力る。なお、計算される補完値に対して、それよりも小さなベース視差情報が既にある場合には、ォクルージョンが発生しているということで、更新を行わない。

[0095] 本実施例 1では、各画素に関して画素位置とグローバル視差情報から、符号化対象画像での対応画素とベース視差情報を求める計算が何度も適用されるが、ステツプ S210の処理の計算は、上記ステップ S203の処理の式を用いて行われるため、ステツプ S203の処理での結果を格納しておくことができるならば、そのときの値を用いることで各画素に対して一度の計算だけで全て済み、演算量を節約することが可能である。

[0096] 図 10に、視差補償情報設定部 107で行われるステップ S5の処理の詳細なフローを示す。

[0097] 本実施例 1では、マクロブロック毎にブロック分割を決定し、ブロック毎に参照視点ィンデッタスと、補正視差情報と、補正ベクトルとを求めて符号化する。本実施例では、このブロック毎に求める参照視点インデックスと、補正視差情報と、補正ベクトルとを視差補償情報と呼ぶことにする。なお、あるブロックにおいて視差補償に用いる情報には、この視差補償情報の他に、ベース視差情報も含まれる。即ち、ここでは、ベース視差情報を補正するための情報が視差補償情報である。

したがって、マクロブロックインデックス MBBlkを 0で初期化した後 [ステップ S301] 、 MBBlkに 1を加算しながら [ステップ S316]、 MBBlkが maxMBBlkになるまで [ステツプ S317]、視差補償情報を加味しながらブロック分割を決定する処理 [ステップ S302〜S315]を繰り返し、求められた視差補償情報を、ブロック分割情報符号化部 1072、視点インデックス符号化部 1074、補正視差情報符号化部 1076、補正べタトル符号化部 1078で符号化する [ステップ S318]。

[0098] 視差補償情報を加味しながらブロック分割を決定する処理では、ブロック分割情報 WkModeを 0に初期化した後 [ステップ S302]、 blkModeに 1を加算しながら [ステツプ S314]、 blkMode力 ¾iaxBlkModeになるまで [ステップ S315]、視差補償情報を加味したマクロブロックのレート歪みコスト MBCostを求め [ステップ S303〜S311]、それまでの最小コスト bestMBCostと比較して [ステップ S312]、より小さなコストとなるブロック分割を、そのマクロブロックのブロック分害 iJ_eBLKMode [MBBlk]に決定する [ステップ S313]と!/ヽぅ処理を繰り返す。

なお bestMBCostは最初に絶対に取り得ない最大値 wMBCostで初期化される [ ステップ S 302]。

[0099] 視差補償情報を加味したマクロブロックのレート歪みコストを求める処理では、プロックインデックス blkを 0に初期化した後 [ステップ S303]、blkに 1を加算しながら [ステツプ S310]、 blkが maxBlk[blkMode]になるまで [ステップ S311]、ブロック毎に最小のレート歪みコストを与える視差補償情報 bestEDispInfoと、そのときのレート歪みコスト bestBlkECostを求める処理 [ステップ S304〜S309]を繰り返す。

なお、マクロブロックに対するレート歪みコスト MBCostは、最初に 0で初期化された後 [ステップ S303]、ブロック毎の処理が終了した際に、ブロックに対する最小レート歪みコスト bestBlkECostを加算していくことで計算される [ステップ S310]。

また、ここで決定した視差補償情報は tempEDispInfo [blk]に格納され [ステップ S310]、最終的なマクロブロックのレート歪みコストを鑑みて、最良のものであれば E Displnfo [MBBlk]に格納する [ステップ S313]。

[0100] ブロックの最小レート歪みコストを与える視差情報を求める処理では、参照視点インデッタスと、補正視差情報と、補正ベクトルの組と対応付けられた視差補償情報インデッタス eDispInfoを 0で初期化した後 [ステップ S305]、 eDispInfoに 1を加算しな力 ¾ [ステップ S308]、 eDispInfoが参照視点インデックスと、補正視差情報と、補正ベクトルの組合せの数 maxEDispInfoになるまで [ステップ S 309]、 eDispInfoに対応する視差補償情報でのレート歪みコスト blkECostを求め [ステップ S305]、 blkE Costがそれまでの最小レート歪みコスト bestBlkECostよりも小さいならば [ステップ S306]、 bestEDispInfoに eDispInfoを格納し、 bestBlkECostを WkECostで更新する処理 [ステップ S307]を、繰り返す。

なお、 bestBlkECostは、最初に絶対に取り得ない最大値 wBlkECostで初期化される [ステップ S 304]。

[0101] ステップ S306の処理におけるレート歪みコストの計算には、以下の式が用いられる

〇

[0102] [数 4]

[0103] ここで、 λ ₂はラグランジュの未定乗数であり、予め設定された値が利用される。また、 tarは符号化対象画像の視点を示し、 ref、 md、 cmvはそれぞれ、視差補償情報 e Displnfoで示される参照視点インデックス、補正視差情報、補正ベクトルを示す。

[0104] 次に、第 2の実施例（以下、実施例 2)について説明する。本発明の実施例 2に係る映像符号化装置の構成図を、図 11、図 12、図 13、図 14に示す。

[0105] 図 11に示すように、実施例 2の映像符号化装置 200は、符号化対象となるカメラ B とカメラ Cの原画像を入力する画像入力部 201と、入力された画像を格納する画像メモリ 202と、基準視点であるカメラ Aの復号画像を入力する基準視点画像入力部 20 3と、入力された基準視点の復号画像を格納する基準視点画像メモリ 204と、符号化対象の画像に対するェピポーラ幾何拘束に基づく視差情報であるローカル視差情報を設定するローカル視差補償情報設定部 205と、各符号化対象の画像に対して設定されたローカル視差情報から、基準視点に対するェピポーラ幾何拘束に基づく視差情報であるグローバル視差情報を設定し符号化するグローバル視差補償情報設定部 206と、グローバル視差情報を変換することで、符号化対象画像の視点に対するェピポーラ幾何拘束に基づく視差情報であるベース視差情報を設定するベース視差情報設定部 207と、符号化対象画像を視差補償するための情報を設定する視差補償情報設定部 208と、入力画像を実際に予測符号化する画像符号化部 209と、符号化した入力画像を復号した画像を格納する復号画像メモリ 210とを備える。

[0106] なお、復号画像メモリ 210は、画像符号化部 209が既に符号化済みの画像を利用するために復号画像を蓄えるメモリを有する場合には、そのメモリと兼ねてもよい。

[0107] 図 12は、ローカル視差補償情報設定部 205の構成の詳細を示す図である。

この図に示すように、ローカル視差補償情報設定部 205は、ローカル視差情報を求める上での符号化対象画像のブロック分割を設定するローカル視差情報ブロック分割設定部 2051と、視差補償を行う際に参照画像として用いる画像の視点を示す視点インデックスを設定する参照視点インデックス設定部 2052と、ェピポーラ幾何拘束に基づ!/、た視差情報を設定するローカル視差情報設定部 2053と、設定されたブロック分割と、参照視点インデックスと、視差情報とで視差補償を行う場合の効率を評価し、各設定部にフィードバックをかける視差補償効率評価部 2054とを備える。

[0108] ここで、参照視点インデックス設定部 2052によって設定された一次視点インデックスは、視差補償情報設定部 208に通知され、ローカル視差情報設定部 2053によつて設定されたローカル視差情報は、グローバル視差補償情報設定部 206と視差補償情報設定部 208に通知される。 [0109] 図 13は、グローバル視差補償情報設定部 206の構成の詳細を示す図である。この図に示すように、グローバル視差補償情報設定部 206は、基準視点の画像に対するブロック分割を設定する基準視点画像ブロック分割設定部 2061と、決定したブロック分割情報を符号化するブロック分割情報符号化部 2062と、ローカル視差補償情報設定部 205内のローカル視差情報設定部 2053から通知されるローカル視差情報を用いて、ブロック毎にグローバル視差情報を推定するグローバル視差情報推定部 2063と、求められたグローバル視差情報を符号化するグローバル視差情報符号化部 2064とを備える。

[0110] ここで、グローバル視差情報推定部 2063によって求められたグローバル視差情報は、ベース視差情報設定部 207に通知されることになる。

また、ブロック分割情報符号化部 2062と、グローバル視差情報符号化部 2064とが出力する符号化データは、本映像符号化装置 200の出力の 1つとなる。

[0111] 図 14は、視差補償情報設定部 208の構成の詳細を示す図である。

この図に示すように、視差補償情報設定部 208は、ベース視差情報設定部 207から通知されるベース視差情報と、ローカル視差補償情報設定部 205内のローカル視差情報設定部 2053から通知されるローカル視差情報との差分を用いて、符号化対象画像に対するブロック分割を設定する符号化対象画像ブロック分割設定部 2081 と、決定したブロック分割情報を符号化するブロック分割情報符号化部 2082と、決定されたブロック分割情報と上記差分からベース視差情報をェピポーラ幾何拘束に基づいて補正するための情報である補正視差情報を設定する補正視差情報設定部 2083と、決定した補正視差情報を符号化する補正視差情報符号化部 2084と、ローカル視差補償情報設定部 205内の参照視点インデックス設定部 2052から通知される一次視点インデックスとブロック分割情報とを用いて、ブロック毎に参照視点インデックスを設定する参照視点インデックス設定部 2085と、決定した視点インデックスを符号化する視点インデックス符号化部 2086と、ェピポーラ幾何拘束に基づ!/、た情報によって与えられる対応関係をェピポーラ幾何拘束とは関係なく補正するための補正ベクトルを設定する補正ベクトル設定部 2087と、決定した補正ベクトルを符号化する補正ベクトル符号化部 2088と、各部によって設定された情報で視差補償を行つたときの予測効率を評価し補正ベクトル設定部 2087にフィードバックをかける視差補償効率評価部 2089とを備える。

[0112] ここで、視差補償効率評価部 2089によって、最も視差補償効率がよいと判断されたときの視差補償画像は画像符号化部 209に通知されることになる。

また、ブロック分割情報符号化部 2082と、補正視差情報符号化部 2084と、視点ィンデッタス符号化部 2086と、補正ベクトル符号化部 2088とが出力する符号化データは、本映像符号化装置 200の出力の 1つとなる。

[0113] 図 15〜図 18に、このように構成される映像符号化装置 200の実行する処理フローを示す。これらの処理フローに従って、実施例 2の映像符号化装置 200の実行する処理について詳細に説明する。

[0114] 図 15は、実施例 2の映像符号化装置 200で行われる、符号化処理全体の概要を示している。また、このフローでは、カメラ Bとカメラ Cで同時刻に撮影された 1枚ずつの画像を符号化する処理を説明する。

[0115] まず、画像入力部 201により、同時刻に撮影されたカメラ Bとカメラ Cの画像が 1枚ずつ入力され、画像メモリ 202に格納される [ステップ S401]。なお、ここで入力された画像と同時刻に撮影されたカメラ Aの復号画像が基準視点画像入力部 203によつて入力され、基準視点画像メモリ 204に格納されているものとする。

[0116] 次に、ローカル視差補償情報設定部 205において、画像メモリ 202と基準視点画像メモリ 204の画像から、画像メモリ上の画像ごとにローカル視差情報を求める [ステップ S402]。ここで行われる処理の詳細は後で図 16を用いて説明する。

[0117] そして、グローバル視差補償情報設定部 206において、ローカル視差情報を用いて、基準視点画像におけるェピポーラ幾何拘束を満たすグローバル視差情報を求め

、符号化する [ステップ S403]。ここで行われる処理の詳細は後で図 17を用いて説明する。

[0118] 以降の処理 [ステップ S405〜S408]は画像メモリ 202上の画像ごとに行われる。ここでは、カメラ Bの画像をカメラ Cの画像に先立って符号化するとして説明を行う。つまり、画像メモリ 202よりカメラ Bの画像を取り出して符号化対象画像に設定し [ステツプ S404]、ステップ S403の処理で求めたグローバル視差情報を、ベース視差情報設定部 207で符号化対象画像に対するェピポーラ幾何拘束に従ったベース視差情報に変換し [ステップ S405]、ローカル視差補償情報とベース視差情報とから、符号化効率を鑑みて、視差補償情報であるところの参照視点インデックス、補正視差情報、補正ベクトル等を視差補償情報設定部 208で求めて符号化し [ステップ S406]、それらの求められた視差補償情報を用いながら、符号化対象画像を画像符号化部 2 09で符号化する [ステップ S407]。符号化した画像は復号され、復号画像メモリ 210 に格納される [ステップ S408L

そして、符号化した画像がカメラ Bの画像なら [ステップ S409]、カメラ Cの画像を画像メモリ 202力、ら取り出して [ステップ S410]、同様の手 J噴 [ステップ S405〜S408] で符号化を行い、全ての処理を終了する。

ここで、ステップ S405で行われる処理は、既に説明したステップ S4で行われる処理（図 6)と同様の処理であるため説明を省略する。

なお、ステップ S406で行われる処理の詳細は、後で図 18を用いて説明する。

[0119] 図 16に、ローカル視差補償情報設定部 205で行われるステップ S402の処理の詳細な処理フローを示す。なお、ローカル視差補償情報設定部 205は、ここで示される処理を、画像メモリ 202上の画像ごとに適用する。

[0120] 本実施例 2では、縦横 16画素で構成されるマクロブロック単位でブロック分割を指定し、そのブロック分割で作成されるブロック単位でローカル視差情報を求める。マクロブロックで適用可能なブロック分割としては様々なものが考えられる力 S、例えば、図

8に示すようなものが考えられる。

実施例 1のときと同様に、ブロック分割の種類に関するインデックスを WkMode、ブロック分害 iJblkModeにおけるブロック数を maxBlk[blkMode]、ブロック分割の種類の数は maxBlkModeで表す。

[0121] ここでの処理は、まずマクロブロックのインデックス MBBlkを 0に初期化した後 [ステップ S501]、 MBBlkに 1を加算しながら [ステップ S516]、 MBBlkが画像内のマクロブロック数 maxMBBlkになるまで [ステップ S517]、ブロック分割とローカル視差情報を求める処理 [ステップ S502〜S515]を繰り返す。

[0122] ブロック分割とローカル視差情報を求める処理では、各ブロック分割に対して最適なローカル視差補償情報を求め、その中から最も評価の良いブロック分割を決定するということをネ亍う。

つまり、ブロック分害 iJblkModeを 0に、そのマクロブロックでの評価値の最良 bestM BLCostを絶対に取り得な!/、最大の評価値 wMBLCostに初期化した後 [ステップ S 502]、 blkModeに 1をカロ算しなカら [ステップ S514]、 blkMode力 ¾naxBlkModeになるまで [ステップ S515]、ブロック分害 iJblkModeに対する評価値 MBLCostを求め [ステップ S503〜S511]、 MBLCostが bestMBLCostよりも小さくなるようなら [ステップ S512]、 MBLCostを bestMBLCostに、そのときのブロック分害 iJblkModeを IB LKMode [MBBlk]に、そのときのブロック毎のローカル視差補償情報 tempLDispI nf oを LDispInf o [cam]に格納する [ステップ S 513]、と!/、う処理を繰り返す。

ここで camは画像メモリ 202上の画像に対するインデックスを表している。

[0123] ブロック分割に対する評価値を求める処理では、ブロック毎に最適なローカル視差補償情報を求め、その合計値をブロック分割に対する評価値とすることを行う。

つまり、ブロックインデックス blkを 0に、ブロック分割に対する評価値 MBLCostを 0 に初期化した後 [ステップ S503]、 blkに 1を加算しながら [ステップ S510]、 blkが ma xBlk[blkMode]になるまで [ステップ S511]、ブロック blkに対する最良のローカル視差補償情報 bestLDispInfoと評価値 bestBlkLCostとを求め [ステップ S504〜S 509]、 MBLCostに bestBlkLCostを加算し、 tempLDispInfo [blk]に bestLDisp Infoを格納する [ステップ S 510]、と!/、う処理を繰り返す。

[0124] ここでは、あるブロックに対する最良のローカル視差補償情報とは、対象となっているブロックを別の画像から予測する際に、レート歪みコストが最小となるような、予測に用いる画像を示す情報と、ェピポーラ幾何拘束に基づくローカル視差情報の組であるとする。

したがって、レート歪みコストが各ローカル視差補償情報に対する評価値となり、あるブロックに対する最良のローカル視差補償情報と評価値を求める処理は、レート歪みコストを最小化する参照視点インデックスとローカル視差情報との組を求める処理となる。

[0125] つまり、視点インデックスとローカル視差情報との組に対して対応付けられたロー力ル視差補償情報インデックス IDispInfoを 0に初期化し、最良レート歪みコスト bestBl kLCostを絶対に取り得ない最大値 wBlkLCostに初期化した後 [ステップ S 504]、 1 Displnfoに 1を加算しながら [ステップ S 508]、 IDispInfoが視点インデックスとローカル視差情報の組合せの数 maxLDispInfoになるまで [ステップ S 509]、 IDispInfo に対するレート歪みコスト blkLCostを求め [ステップ S505]、 blkLCostが bestBlkL Costよりも小さければ [ステップ S 506]、 blkLCostを bestBlkLCostに格納し、 IDis plnfoを bestLDispInfoに格納する [ステップ S 507]、という処理を繰り返す。

[0126] IDispInfoに対するレート歪みコスト blkLCostは以下の式で求められる。

[0127] [数 5] blkLCost = £>₃ + · CoifeilDispInfo )

i¾. ^ ^ IValue^amy p)- Valuefyeference, Rp

[0128] ここで、 λ はラグランジュの未定乗数であり、予め設定された値が利用される。また

、 dist ()と refer ()は、引数として与えられるローカル視差補償情報に対して、それぞれ、視点 cam力被写体までの距離、参照する視点を返す関数を表す。

[0129] なお、実際の符号化時には既に符号化済みの画像しか参照することができないので、本実施例 2においては、 camがカメラ Bのときには基準視点のみ、 camがカメラ C のときには基準視点とカメラ Bの視点が、参照視点の候補となる。

[0130] 図 17に、グローバル視差補償情報設定部 206で行われるステップ S403の処理の詳細な処理フローを示す。実施例 2でも、実施例 1と同様に、マクロブロック単位でブロック分割を指定し、そのブロック分割で作成されるブロック単位でグローバル視差情報を求めて符号化する。

[0131] まず、ローカル視差補償情報設定部 205で設定されたローカル視差補償情報 LDi splnfoの 1要素であるェピポーラ幾何拘束に基づくローカル視差情報から、グローバル視差情報候補 tGDispInf oを生成する [ステップ S 601 ]。

この処理は、ローカル視差情報をグローバル視差情報、ローカル視差情報が与えられた視点を基準視点、基準視点を符号化対象視点と見立てて、ベース視差情報を求める際の処理（図 9)を適用することで行われる。このように見立てて処理が行われた際に、ベース視差情報に該当するものがグローバル視差情報候補となる。なお、この処理は、画像メモリ 202上の画像ごとに行い、それぞれの画像に対するグローバル視差情報候補は、画像インデックス camを用いて tGDispInfo [cam]と表す。

[0132] 実施例 2では、このように求められた tGDispInfoを用いて、マクロブロック毎にブロック分割情報を設定し、ブロック毎にグローバル視差情報を設定する。

そのために、マクロブロックのインデックス MBBlkを 0に初期化した後 [ステップ S60 2]、 MBBlkに 1を加算しながら [ステップ S613]、 MBBlkがマクロブロック数 maxM BBlkになるまで [ステップ S614]、全てのブロック分割の中で最良のブロック分割とグローバル視差情報を求める処理 [ステップ S603〜S612]を行う。

その後、求められたブロック分割情報 BLKModeとグローバル視差情報 GDispInf oを、それぞれ、ブロック分割情報符号化部 2062と、グローバル視差情報符号化部 2 064で符号化する [ステップ S 615]。

[0133] 全てのブロック分割の中から最良のブロック分割とグローバル視差情報を求める処理では、ブロック分割候補ごとに、その分割を評価し、最も評価の良いものを最良のブロック分割とするとレ、うことを行う。

つまり、ブロック分害 iJblkModeを 0に初期化し、マクロブロックに対する最良の評価値 bestValueを絶対に取り得な!/、最悪の評価値 wValueに初期化した後 [ステップ S 603]、 blkModeに 1をカロ算しなカら [ステップ S611]、 blkMode力 ¾naxBlkModeになるまで [ステップ S 612]、ブロック分害 ijblkModeに対する評価値 valueを求め [ステップ S604〜S608]、 value力 ¾estValueより小さいならば [ステップ S609]、 valueを bestValueに、 blkModeを BLKMode [MBBlk]に格納し、そのときに求められたグローバル視差情報 tmpGDispInfoを GDispInfo [MBBlk]に格納する [ステップ S6 10]、という処理を繰り返す。

[0134] ブロック分害 IjblkModeに対する評価値 valueは、分割された各ブロックにおける視差補償のレート歪みコストを合計することで求められる。

すなわち、ブロックインデックス blkを 0に、 valueをブロック分割力 ¾lkModeであることによる評価値 InitValue [blkMode]に初期化した後 [ステップ S604]、 blkに 1を、 valueにブロック blkに対するレート歪みコスト WkCostを加え、そのときのグローバル視差情報 gDispInfoを tmpGDispInfo [blk]に格納しながら [ステップ S607]、 blk が maxBlk[blkMode]になるまで [ステップ S608]、ブロック blkに対する tGDispInf oから gDispInfoを求め [ステップ S605]、そのときの blkCostを求める [ステップ S60 6]、という処理を繰り返す。

なお、 InitValue [blkMode]は、ブロック分割力 ¾lkModeであることを示すための情報を符号化するために必要な符号量に依存した、予め定められた値である。

[0135] ブロック blkに対する tGDispInfoから gDispInfoを求める処理では、ブロック blk内の tGDispInf oの平均値を求め、 gDispInfoとする。このとき平均値ではなぐ最も多く現れる値を使う方法もある。

また、両者でレート歪みコストを算出し良い方を選ぶという方法や、それぞれの周辺の値全てに対してレート歪みコストを計算し最良のものを選ぶという方法も考えられる力 S、これらのケースについては本実施例の変更例として容易に適用可能であるので説明を省略する。

[0136] ブロック blkに対するグローバル視差情報が gDispInfoのときのレート歪みコスト blk Costは、実施例 1におけるステップ S 105 (図 7)の処理で用いる式と同様の式を用いて求めること力 Sできる。また、演算量を減らすために、次の数式を用いて評価を行つてもよい。

[0137] [数 6]

[0138] 図 18に、視差補償情報設定部 208で行われるステップ S406の処理の詳細なフロ一を示す。

[0139] 本実施例 2においても、実施例 1と同様に、マクロブロック毎にブロック分割を決定し、ブロック毎に参照視点インデックスと、補正視差情報と、補正ベクトルとからなる視差補償情報を求めて符号化する。

実施例 1と異なる点は、ローカル視差補償情報設定部 205内のローカル視差情報設定部 2053から通知されるローカル視差情報を用いて、ブロック分割、参照視点ィンデッタス、補正視差情報を決定した後に、補正ベクトルを求める点である。

[0140] つまり、最初にローカル視差情報とベース視差情報との差分を取ることで、補正視差情報候補 tEDispInfoを生成する [ステップ S 701]。

そして、マクロブロックインデックス MBBlkを 0に初期化した後 [ステップ S 702]、 M BBlkに 1を加算しながら [ステップ S710]、 MBBlkが画像に含まれるマクロブロック数 maxMBBlkになるまで [ステップ S711]、ブロック分害 iJeBLKMode [MBBlk]を決定し [ステップ S703]、視差補償情報 EDispInfoを求める処理 [ステップ S704〜 S709]を繰り返す。

その後、ブロック分割情報 eBLKModeと、視差補償情報 EDispInfoとを符号化する [ステップ S 712]。

[0141] ステップ S703の処理において、ブロック分割は、ブロックに含まれる全ての画素に対する tEDispInfoが同じ値となるようなブロック分割のなかで、ブロック数が最も少ないものに決定される。

上記の条件を満たすブロック分割が複数存在するときは、それぞれの最大ブロックサイズが大きいものに決定する。それでも決まらない場合には、条件を満たす任意のブロック分割に決定する。

なお、最初の条件を満たすブロック分割が存在しない場合には、ブロック数が最も多ぐ最小ブロックサイズが最も小さいものに決定する。

[0142] 視差補償情報を求める処理では、マクロブロックに対して決定されたブロック分割 e BLKMode [MBBlk]に従ったブロック毎に最良の視差補償情報を求める。

つまり、ブロックインデックス blkを 0に初期化した後 [ステップ S704]、 blkに 1を加算しながら [ステップ S708]、 blkがブロック数 maxBlk[eBLKMode [MBBlk] ]になるまで [ステップ S 709]、 tEDispInfoから補正視差情報 mdを、ローカル視差補償情報設定部 205内の参照視点インデックス設定部 2052から通知される一次視点インデッタスから参照視点インデックス refを求め [ステップ S705]、それらを用いてブロック blkのレート歪みコストを最小化する補正ベクトル cmvを求めた後 [ステップ S 706] 、 {md、 ref、 cmv}の組に対応する視差補償情報を求め、 EDispInfo [MBBlk] [blk ]に格納する [ステップ S707]、という処理を繰り返す。なお、ステップ S706の処理で用いられるブロックに対するレート歪みコストは、実施例 1のステップ S306 (図 10)の処理でコストを求める際に用いる式と同様の式を用いて計算することができる。

[0143] ステップ S705の処理において、補正視差情報はブロック内の画素に対応する tED isplnfoの中で最も多く現れるものに決定され、参照視点インデックスは決定された補正視差情報と tEDispInfoが同じ値を持つブロック内の画素に対応する一次視点ィンデッタスに決定される。なお、ここでは最も多く現れるものに決定した力ブロック内の値の平均値を用いてもよ!/、。

[0144] 本実施例 2の視差補償情報設定部 208では、ローカル視差補償情報誤定部 205 力、ら通知される情報を用いて、ブロック分割と補正視差情報と参照視点インデックスとをレート歪みコストを考慮せずに決定するが、実施例 1の視差補償情報設定部 107と同様にそれらをレート歪みコストを考慮して決定してもよい。

また、実施例 1とも異なり、ブロック分割、補正視差情報、参照視点インデックスの一部だけをレート歪みコストを考慮して決定する方法も考えられる力このケースについては実施例 1と実施例 2とを部分的に融合させた変更例として容易に適用可能であるので説明を省略する。

[0145] 実施例 1および実施例 2では、グローバル視差補償情報設定部 105または 206の内部の基準視点画像ブロック分割設定部 1051または 2061で、ブロック分割の方法を決定し、その結果のブロック分割情報をブロック分割情報符号化部 1052または 20 62で符号化している。

しかし、基準視点画像ブロック分割設定部 1051または 2061で設定するブロック分割を、基準視点画像をブロック符号化した際のブロック分割と一致させることで、プロック分割情報を符号化しなレ、ことにしてもょレ、。

その場合、ブロック分割情報を示すための符号量の分だけ符号量を削減することが可能となる。

[0146] さらに、実施例 1および実施例 2では、符号化対象画像を既に符号化済みの他の視点の画像から視差補償をして符号化しているが、符号化対象画像のブロック毎に、視差補償と動き補償とで、予測効率のよい方法を選びながら符号化するようにしても良い。この場合

、適用外のブロックに対する視差補償情報は符号量が最も小さくなるように設定可能である力 S、本実施例の変更例として容易に適用可能であるので説明を省略する。

[0147] また、符号化装置の各部分で用いるブロック分割の種類は全て同じである必要はない。特に、他のブロック分割の大きさに比べて、グローバル視差情報を求める際の基準視点画像のブロック分割の大きさを大きくすることで、グローバル視差情報の符号量を抑え、カメラパラメータの誤差等に左右されない全体の大まかな視差情報を表すことカでさるようになる。

[0148] 図 19に、本発明の映像復号装置 300の実施の形態の一例（実施例 3)を示す。

この映像復号装置 300は、符号化データを入力する符号化データ入力部 301と、基準視点であるカメラ Aの復号画像を入力する基準視点画像入力部 302と、基準視点の画像を含む全ての視差補償の参照対象になりうる画像を格納する画像メモリ 30 3と、入力された符号化データから基準視点に対するブロック分割情報とェピポーラ幾何拘束に基づくグローバル視差情報とを復号するグローバル視差補償情報復号部 304と、グローバル視差情報から復号対象の画像の視点に対するェピポーラ幾何拘束に基づくベース視差情報を設定するベース視差情報設定部 305と、入力された符号化データから、復号対象の画像に対するブロック分割情報と、視差補償を行う際の参照画像を示す参照視点インデックスと、ェピポーラ幾何拘束に従い視差情報を補正する補正視差情報と、視差補償をする際の対応点を補正する補正ベクトルとを復号する視差補償情報復号部 306と、復号したデータに基づき復号対象の画像の視点に対する視差補償画像を生成する視差補償画像生成部 307と、入力された符号化データと生成した視差補償画像とから復号対象の画像を復号する画像復号部 3 08とを備える。

[0149] 画像を復号する際に、既に復号済みの画像を参照する場合、画像復号部 308はその内部に、復号画像を格納するメモリを有することがある。その場合、画像メモリ 303 として、そのメモリを用いてもよい。

[0150] 図 20に、本実施例の復号処理フローを示す。これはカメラ Bとカメラ Cの同時刻のフレームを 1フレームずつ復号する際のフローを示している。以下でフローを詳細に説明していく。

なお、復号するフレームと同時刻のカメラ Aのフレームが先立って復号されており、各カメラのカメラパラメータも得られて!/、るものとする。

[0151] まず、符号化データ入力部 301に符号化データが入力される [ステップ S801]。また、ここで入力された符号化データに含まれるフレームと同時刻のカメラ Aの復号画像力基準視点画像入力部 302によって入力され、画像メモリ 303に格納されているものとする。入力される符号化データは、実施例 1または実施例 2などの映像符号化装置が出力する 1フレーム分の全符号化データである。

[0152] 次に、グローバル視差補償情報復号部 304で、入力された符号化データのうち、基準視点画像に対するブロック分割情報を復号し、そのブロック分割に従って、ブロック毎にグローバル視差情報を復号し、基準視点画像に対する画素ごとのグローバル視差情報 decGDispInfoを得る [ステップ S802]。

[0153] そして、ベース視差情報設定部 305で、 decGDispInfoからカメラ Bの視点に対するベース視差情報 decBDispInfoを得る [ステップ S803L

この処理は、上記で説明を行った図 9の処理フローに従って実現される。ただし、図

9における BDispInfoは decBDispInfo、 GDispInfoは decGDispInfo、符号化対象画像は復号対象画像となる。

[0154] ベース視差情報が得られたら、視差補償情報復号部 306で、入力された符号化データのうちカメラ Bに対するブロック分割情報を復号し、そのブロック分割に従って、参照視点インデックスと、補正視差情報と、補正ベクトルとを復号し、カメラ Bに対する画素ごとの参照視点インデックス decRefと、補正視差情報 decMdと、補正ベクトル d ecCmvとを得る [ステップ S804]。

[0155] そして、画像メモリ 303の画像を参照しながら、視差補償画像生成部 307で、カメラ

Bに対する視差補償画像 DCImageを次の式に従って生成する [ステップ S805L

[0156] DCImage [PIX] = Value (decRef [PIX] , RP)

RP = Trans (camB, decRef [PIX] , PIX,

d (decBDispInfo [PIX] + decMd [PIX] ) )

+ decCmv[PIX] ここで、 camBはカメラ Bの視点を表し、 PIXは復号対象画像の画素位置を示すこの視差補償画像を用いて、画像復号部 308で、入力された符号化データからカメラ Bの画像が復号される [ステップ S806]。なお、復号された画像は画像メモリ 303に格納される。

その後、ステップ S803〜S806と同様の処理をカメラ Cに対して施すことで、カメラ Cの復号画像が復号されることになる [ステップ S807〜S810]。

[0157] 以上の映像符号化および映像復号の処理は、ハードウェアやファームウェアによつて実現できるが、コンピュータとソフトウェアプログラムとによっても実現することができ、そのプログラムをコンピュータ読み取り可能な記録媒体に記録して提供することも、ネットワークを通して提供することも可能である。

[0158] 以上、図面を参照して本発明の実施の形態を説明したが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものでないことは明らかである。したがって、本発明の精神および範囲を逸脱しない範囲で、上記実施の形態に対し構成要素の追加、省略、置換、その他の変更を行ってもよい。

産業上の利用可能性

[0159] 本発明によれば、視差補償を行うための情報の大幅な増加を防ぎながら、カメラパラメータの推定誤差の影響を考慮した予測精度の高い視差補償を実現することで、多視点画像全体や多視点動画像全体としての高効率な符号化を実現することができる。

Claims

請求の範囲

[1] 多視点画像を符号化するにあたり、一つの基準視点を定め、既に符号化済みの前記基準視点の画像を用いて、前記基準視点以外の視点の画像を符号化する画像符号化方法であって、

前記基準視点の符号化済み画像であるところの参照基準視点画像に対し、ェピポーラ幾何拘束に基づいて該基準視点以外の全ての視点の画像との視差を与えるグローバル視差情報を推定し設定するグローバル視差情報設定ステップと、

前記設定したグローバル視差情報を符号化するグローバル視差情報符号化ステツプと、

前記設定したグローバル視差情報を、前記基準視点以外の視点の画像であるところの各符号化対象視点画像における、前記ェピポーラ幾何拘束に基づいて他の全ての視点との視差を与えるベース視差情報へと変換するベース視差情報設定ステツプと、

前記符号化対象視点画像を符号化する際に行う視差補償に用いる既に符号化済みの参照視点画像と該符号化対象視点画像との視差を与える視差情報の、前記べース視差情報に対する差分で定められる補正視差情報を設定する補正視差情報設前記補正視差情報を符号化する補正視差情報符号化ステップと、

前記ベース視差情報と前記補正視差情報とによって与えられる対応点情報を用いて、前記参照視点画像から視差補償を行いながら、前記符号化対象視点画像を符号化する視点画像符号化ステップとを有する

ことを特徴とする画像符号化方法。

[2] 多視点画像を符号化するにあたり、一つの基準視点を定め、既に符号化済みの前記基準視点の画像を用いて、前記基準視点以外の視点の画像を符号化する画像符号化方法であって、

前記基準視点の符号化済み画像であるところの参照基準視点画像に対し、ェピポーラ幾何拘束に基づいて該基準視点以外の全ての視点の画像との視差を与えるグローバル視差情報を推定し設定するグローバル視差情報設定ステップと、前記設定したグローバル視差情報を符号化するグローバル視差情報符号化ステツプと、

前記符号化対象視点画像を符号化する際に行う視差補償に用いる既に符号化済みの参照視点画像と該符号化対象視点画像との対応点を与える視差ベクトルの、前記ベース視差情報によって与えられる視差ベクトルに対する差分で定められる補正視差ベクトルを設定する補正視差ベクトル設定ステップと、

前記補正視差ベクトルを符号化する補正視差ベクトル符号化ステップと、前記ベース視差情報と前記補正視差ベクトルとを用いて、前記参照視点画像から視差補償を行レ、ながら、前記符号化対象視点画像を符号化する視点画像符号化ステツプとを有する

ことを特徴とする画像符号化方法。

[3] 請求項 1に記載の画像符号化方法にお!/、て、

前記ベース視差情報設定ステップで設定されたベース視差情報と、前記補正視差情報設定ステップで設定された補正視差情報とを用いて表される視差情報によって示される、前記符号化対象視点画像と前記参照視点画像との間の対応点ベクトルに対し、前記視差補償に用いる視差補償ベクトルからの変位である補正ベクトルを設定する補正ベクトル設定ステップと、

前記補正ベクトルを符号化するステップとを有し、

前記視点画像符号化ステップでは、前記補正ベクトルにより補正された前記視差補償ベクトルを用いて視差補償を行う

ことを特徴とする画像符号化方法。

[4] 請求項 1および請求項 2のいづれかに記載の画像符号化方法において、

前記参照基準視点画像における領域分割を設定する基準視点領域分割設定ステップを有し、前記グローバル視差情報設定ステップでは、前記基準視点領域分割設定ステップで設定された領域ごとに、前記グローバル視差情報を推定し設定する

ことを特徴とする画像符号化方法。

[5] 請求項 4に記載の画像符号化方法において、

前記参照基準視点画像が、画像全体を領域分割されて各領域ごとに符号化処理されている場合に、

前記基準視点領域分割設定ステップでは、前記参照基準視点画像の符号化データに含まれる領域分割情報に従って、同様の領域分割を設定する

ことを特徴とする画像符号化方法。

[6] 請求項 4に記載の画像符号化方法において，

前記参照基準視点画像が，画像全体を領域分割されて各領域ごとに符号化処理されている場合に，

前記基準視点領域分割符号化ステップでは，前記参照基準視点画像の符号化データに含まれる領域分割情報との違いを示す情報のみを符号化する

ことを特徴とする画像符号化方法。

[7] 請求項 4に記載の画像符号化方法において、

前記基準視点領域分割設定ステップで設定された領域分割を示す領域分割情報を符号化する基準視点領域分割符号化ステップを更に有する

ことを特徴とする画像符号化方法。

[8] 請求項 1および請求項 2のいづれかに記載の画像符号化方法において、

前記符号化対象視点画像における領域分割を設定する符号化対象視点領域分割設定ステップを有し、

前記視点画像符号化ステップでは、前記符号化対象視点領域分割設定ステップで設定された領域ごとに、視差補償の参照先を変更しながら符号化対象視点画像を符号化する

ことを特徴とする画像符号化方法。

[9] 請求項 8に記載の画像符号化方法において、

前記視点画像符号化ステップにおいて、前記符号化対象視点画像が、画像全体を領域分割され、各領域ごとに、その領域分割情報と共に符号化されている場合に、前記視点画像符号化ステップでは、前記符号化対象視点領域分割符号化ステツプで設定された領域分割を用いて符号化を行う、

ことを特徴とする画像符号化方法。

[10] 請求項 8に記載の画像符号化方法において、

前記符号化対象視点領域分割設定ステップで設定された領域分割を示す領域分割情報を符号化する符号化対象視点領域分割符号化ステップを更に有することを特徴とする画像符号化方法。

[11] 請求項 10に記載の画像符号化方法において、

前記視点画像符号化ステップにおいて、前記符号化対象視点画像が、画像全体を領域分割され、各領域ごとに、その領域分割情報と共に符号化されている場合に、前記符号化対象視点領域分割符号化ステップでは、前記視点画像符号化ステツプで用いた領域分割との違!/、を示す情報のみを符号化する

ことを特徴とする画像符号化方法。

[12] 請求項 1および請求項 2のいづれかに記載の画像符号化方法において、

前記参照視点画像の視点となる参照視点を設定する参照視点設定ステップと、前記参照視点を示す視点インデックスを符号化するステップとを有し、

前記視点画像符号化ステップでは、前記設定された参照視点の符号化済み画像を前記参照視点画像として用いる

ことを特徴とする画像符号化方法。

[13] 請求項 8に記載の画像符号化方法において、

前記符号化対象視点領域分割設定ステップで設定された領域ごとに、前記参照視点画像の視点となる参照視点を設定する参照視点設定ステップと、

前記参照視点を示す視点インデックスを符号化するステップとを有し、

前記視点画像符号化ステップでは、前記符号化対象視点領域分割設定ステップで設定された領域ごとに、前記設定された参照視点の符号化済み画像を前記参照視点画像として用いる

ことを特徴とする画像符号化方法。

[14] 請求項 1および請求項 2のいづれかに記載の画像符号化方法において、前記符号化対象視点画像における領域分割を設定する領域分割設定ステップと、前記領域分割設定ステップにおレ、て設定された領域ごとに、前記ェピポーラ幾何拘束に基づいて、前記符号化対象視点画像を視差補償するための対応点を与えるローカル視差情報を求めるステップと、

前記ローカル視差情報を、前記グローバル視差情報へと変換するグローバル視差情報候補を設定するグローバル視差情報候補設定ステップとを有し、

前記グローバル視差情報設定ステップでは、各領域内の前記グローバル視差情報候補の平均値または各領域内のグローバル視差情報候補のうち最も多く現れる値を前記グローバル視差情報として設定する

ことを特徴とする画像符号化方法。

[15] 多視点画像の符号化データを復号するにあたり、一つの基準視点が存在し、既に復号済みの前記基準視点の画像であるところの参照基準視点画像を用いて、前記基準視点以外の視点の画像を復号する画像復号方法であって、

符号化データから、前記参照基準視点画像における前記基準視点以外の全ての視点の画像との視差をェピポーラ幾何拘束に基づいて与えるグローバル視差情報を復号するグローバル視差情報復号ステップと、

前記復号したグローバル視差情報を、前記基準視点以外の視点の画像であるところの各復号対象視点画像における、前記ェピポーラ幾何拘束に基づいて他の全ての視点との視差を与えるベース視差情報へと変換するベース視差情報設定ステップと、

前記符号化データから、前記復号対象視点画像を復号する際に行う視差補償に用いる既に復号済みの参照視点画像と該復号対象視点画像との視差を与える視差情報の、前記ベース視点情報に対する差分で定められた補正視差情報を復号する補正視差情報復号ステップと、

前記ベース視差情報と前記補正視差情報とによって与えられる対応点情報を用いて、前記参照視点画像から視差補償を行いながら、前記符号化データから、前記復号対象視点画像を復号する視点画像復号ステップとを有することを特徴とする画像復号方法。

[16] 多視点画像の符号化データを復号するにあたり、一つの基準視点が存在し、既に復号済みの前記基準視点の画像であるところの参照基準視点画像を用いて、前記基準視点以外の視点の画像を復号する画像復号方法であって、

前記符号化データから、前記復号対象視点画像を復号する際に行う視差補償に用いる既に復号済みの参照視点画像と該復号対象視点画像との対応点を与える視差ベクトルの、前記ベース視点情報によって与えられる視差ベクトルに対する差分で定められた補正視差ベクトルを復号する補正視差ベクトル復号ステップと、

前記ベース視差情報と前記補正視差ベクトルとによって与えられる対応点情報を用いて、前記参照視点画像から視差補償を行いながら、前記符号化データから、前記復号対象視点画像を復号する視点画像復号ステップとを有する

ことを特徴とする画像復号方法。

[17] 請求項 15に記載の画像復号方法において、

前記符号化データから、前記視差補償に用いる視差補償ベクトルに対する、前記ベース視差情報設定ステップで設定されたベース視差情報と、前記補正視差情報復号ステップで復号された補正視差情報とを用いて表される、前記復号対象視点画像と前記参照視点画像との間の対応点ベクトルからの差分で定められた補正べタトルを復号する補正ベクトル復号ステップを有し、

前記視点画像復号ステップでは、前記補正ベクトルにより補正された前記視差補償ベクトルを用いて視差補償を行う

ことを特徴とする画像復号方法。

[18] 請求項 15および請求項 16のいづれかに記載の画像復号方法において、前記符号化データから、前記参照基準視点画像における領域分割を示す情報を復号する基準視点領域分割復号ステップを有し、

前記グローバル視差情報復号ステップでは、前記基準視点領域分割復号ステップで得られた領域分割の領域ごとに、前記グローバル視差情報を復号する

ことを特徴とする画像復号方法。

[19] 請求項 18に記載の画像復号方法において、

前記基準視点領域分割復号ステップでは、前記参照基準視点画像の符号化データに含まれる領域分割を示す情報力領域分割を設定する

ことを特徴とする画像復号方法。

[20] 請求項 18に記載の画像復号方法において，

参照基準視点画像が，画像全体を領域分割されて各領域ごとに符号化処理されている場合に，

前記基準視点領域分割復号ステップでは，前記参照基準視点画像の符号化データに含まれる領域分割を示す情報との違いを示す情報を復号し、該領域分割を示す情報と該違レ、を示す情報とを用いることで、前記グローバル視差情報復号時の領域分割を設定する

ことを特徴とする画像復号方法。

[21] 請求項 15および請求項 16のいづれかに記載の画像復号方法において、

前記符号化データから、前記復号対象視点画像における領域分割を示す情報を復号する復号対象視点領域分割復号ステップを有し、

前記視点画像復号ステップでは、前記符号化対象視点領域分割復号ステップで復号された情報によって示される領域分割の領域ごとに、前記視差補償に用いる視差補償ベクトルを変更しながら復号対象視点画像を復号する

ことを特徴とする画像復号方法。

[22] 請求項 21に記載の画像復号方法におレ、て、前記復号対象視点画像が、画像全体を領域分割され、各領域ごとに、その領域分割情報と共に符号化されている場合に、

前記復号対象視点領域分割復号ステップでは、前記復号対象視点画像の符号化データに含まれる領域分割を示す情報から、領域分割を設定する

ことを特徴とする画像復号方法。

[23] 請求項 21に記載の画像復号方法にお!/、て、

前記復号対象視点画像が、画像全体を領域分割され、各領域ごとに、その領域分割情報と共に符号化されている場合に、

前記復号対象視点領域分割復号ステップでは、前記符号化データから、領域分割に関する前記領域分割情報との違!/、を示す情報を復号し、該領域分割情報と該違いを示す情報とを用いることで、前記視差補償ベクトル変更用の領域分割を設定する

ことを特徴とする画像復号方法。

[24] 請求項 15および請求項 16のいづれかに記載の画像復号方法において、

前記符号化データから、前記参照視点画像の視点を示す視点インデックスを復号する視点インデックス復号ステップと、

前記視点インデックスによって示される視点を参照視点として設定するステップとを有し、

前記視点画像復号ステップでは、前記参照視点の復号済み画像を前記参照視点画像として用いる

ことを特徴とする画像復号方法。

[25] 請求項 21に記載の画像復号方法にお!/、て、

前記復号対象視点領域分割復号ステップで設定された領域ごとに、符号化データから、前記参照視点画像の視点を示す視点インデックスを復号する視点インデックス復号ステップと、

前記復号対象視点領域分割復号ステップで設定された領域ごとに、前記視点インデッタスによって示される視点を参照視点として設定するステップとを有し、

前記視点画像復号ステップでは、前記復号対象視点領域分割復号ステップで設定された領域ごとに、前記設定された参照視点の復号済み画像を前記参照視点画像として用いる

ことを特徴とする画像復号方法。

[26] 請求項 1および請求項 2のいづれかに記載の画像符号化方法における各ステップを実行するための手段を備える

ことを特徴とする画像符号化装置。

[27] 請求項 1および請求項 2のいづれかに記載の画像符号化方法における各ステップをコンピュータに実行させるための画像符号化プログラム。

[28] 請求項 1および請求項 2のいづれかに記載の画像符号化方法における各ステップをコンピュータに実行させるための画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。

[29] 請求項 15および請求項 16のいづれかに記載の画像復号方法における各ステップを実行するための手段を備える

ことを特徴とする画像復号装置。

[30] 請求項 15および請求項 16のいづれかに記載の画像復号方法における各ステップをコンピュータに実行させるための画像復号プログラム。

[31] 請求項 15および請求項 16のいづれかに記載の画像復号方法における各ステップをコンピュータに実行させるための画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体。