[go: up one dir, main page]

JP5640979B2 - 動画像符号化装置、動画像符号化方法および動画像符号化プログラム - Google Patents

動画像符号化装置、動画像符号化方法および動画像符号化プログラム Download PDF

Info

Publication number
JP5640979B2
JP5640979B2 JP2011529781A JP2011529781A JP5640979B2 JP 5640979 B2 JP5640979 B2 JP 5640979B2 JP 2011529781 A JP2011529781 A JP 2011529781A JP 2011529781 A JP2011529781 A JP 2011529781A JP 5640979 B2 JP5640979 B2 JP 5640979B2
Authority
JP
Japan
Prior art keywords
picture
encoding
refresh
prediction
reference picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011529781A
Other languages
English (en)
Other versions
JPWO2011027507A1 (ja
Inventor
啓史 青木
啓史 青木
裕三 仙田
裕三 仙田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011529781A priority Critical patent/JP5640979B2/ja
Publication of JPWO2011027507A1 publication Critical patent/JPWO2011027507A1/ja
Application granted granted Critical
Publication of JP5640979B2 publication Critical patent/JP5640979B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像データを符号化する動画像符号化装置、動画像符号化方法および動画像符号化プログラムに関する。
動画像データを符号化する際に、圧縮効率を高めるために、MPEG(Moving Picture Experts Group)−2、MPEG−4、H.264/MPEG−4 AVC(Advanced Video Coding )等の規格にもとづく符号化方式が用いられる。それらの符号化方式では、他のピクチャからの予測を行うことなく符号化されたイントラ符号化ピクチャ(Iピクチャ)と、符号化対象のピクチャに対して画像の表示順において過去のピクチャ、または過去および未来のピクチャからの予測を利用して符号化されたピクチャ間予測符号化ピクチャ(PピクチャまたはBピクチャ)とを使用することができる。なお、「ピクチャ」は、インターレース方式の動画像をフィールド単位で符号化する場合にはフィールドに相当し、非インターレース方式(プログレッシブ方式)の動画像の場合にはフレームに相当する。また、動画像データを符号化する際に、インターレース方式の動画像において2フィールドを1フレームにまとめてフレーム単位で符号化することも可能であり、その場合には、「ピクチャ」はフレームに相当する。以下、ピクチャ間予測符号化を、インター符号化ということがある。
イントラ符号化ピクチャは、動画像の最初のピクチャの符号化で用いられる他、動画像の符号化データが伝送される場合に生じた伝送誤りにもとづいて発生した乱れた画像を正常な画像に復旧させたり、動画像の中途から再生するときに正常な画像を再生できるようにする等の目的で使用される。
符号化データを送信する側の符号化装置および符号化データを受信する側の復号装置には、一般に、受信した符号化データを蓄積する適当な容量のバッファメモリが設けられている。バッファメモリは、MPEG−2やMPEG−4 part.2ではVBV(Video Buffering Verifier)バッファと呼ばれ、MPEG−4 AVCではCPB(Coded Picture Buffer)と呼ばれる。また、バッファメモリの容量は、例えば、(伝送レート×0.5秒)である。イントラ符号化ピクチャの圧縮効率は、インター符号化ピクチャの圧縮効率に比べて低いので、イントラ符号化ピクチャの符号量は、インター符号化ピクチャの符号量よりも多い。従って、イントラ符号化ピクチャとインター符号化ピクチャが混在する場合には、ピクチャ毎に符号量が変動する状況が生ずる。バッファメモリは、符号量の変動の影響を吸収する役割も果たす。
また、Bピクチャの利用に際して、Bピクチャよりも表示順において未来のIピクチャおよびPピクチャを先に復号することが求められるので、動画像を構成する各画像の入力順序に対して、符号化後のピクチャの順序が変更される。すなわち、ピクチャの並び替えが実行される。図10は、ピクチャの並び替えを説明するための説明図である。図10(A)に例示されたような順序で動画像が符号化装置に入力される場合に、図10(B)に例示するように、伝送される符号化データのストリームにおけるピクチャの順序は、図10(A)に示された順序とは異なる。なお、図10(A),(B)において、”B”はBピクチャを示し、”I”はIピクチャを示し、”P”はPピクチャを示す。図10(A),(B)において、数字は、入力された順番を示す。また、図10(B)において、I,B,Pに”’”が付されているが、図10(A)におけるI,B,Pが符号化前の動画像の構成要素を表しているのに対して、図10(B)における”’”が付されたI,B,Pが符号化後のビットストリームの構成要素を表すというデータ上の差異を区別するために付されているにすぎない。
伝送された符号化データがバッファメモリに一時滞在することに起因して、また、図10に示すようにピクチャの並び替えに起因して遅延が生ずる。すなわち、動画像が符号化装置に入力された時点に対して、復号装置から出力される再生された動画像の出力時点が遅れる。以下、符号化された動画像中にイントラ符号化ピクチャとインター符号化ピクチャとが存在することになる符号化を、通常遅延符号化ということがある。なお、遅延として、符号化処理および復号処理における遅延や伝送路における遅延もあるが、以下の説明では、符号化データがバッファメモリに一時滞在することに起因する遅延と、ピクチャの並び替えに起因する遅延とに着目する。
通常遅延符号化では、ピクチャ間予測で他のピクチャから参照されるピクチャである参照ピクチャと、他のピクチャから参照されないピクチャである非参照ピクチャとがある。図11に示すように、参照ピクチャには、IピクチャおよびPピクチャが含まれ、非参照ピクチャにはBピクチャが含まれる。なお、MPEG−4 AVCでは、参照構造を階層化することも可能であり、Bピクチャを参照することもできる。例えば、I0,B1,B2,B3,P4の順で入力されるピクチャ群について、I0をIピクチャ、P4をPピクチャ、B1,B2,B3をBピクチャとして符号化するとき、B2を参照ピクチャとして、B2がI0,P4の2枚のピクチャを参照し、B1がI0,B2の2枚のピクチャを参照し、B3がB2,P4の2枚のピクチャを参照するといった参照構造を取ることができる。いずれにせよ、非参照ピクチャは、他のピクチャから参照されないので、非参照ピクチャで発生した誤差は他のピクチャに伝搬しない。しかし、参照ピクチャにおける画質低下は、他のピクチャに影響を及ぼす。
そこで、符号化装置において、通常遅延符号化が行われる場合には、非参照ピクチャになるピクチャにおける量子化幅を大きくして符号化後の符号量が増大することを抑制し、参照ピクチャになるピクチャにおける量子化幅を小さくして画質低下を防止する制御が実行されることが多い(例えば、特許文献1参照)。
なお、図11において、”B”はBピクチャを示し、”I”はIピクチャを示し、”P”はPピクチャを示す。図11において、数字は、入力された順番を示す。また、矢印で指し示されているピクチャが参照ピクチャに相当する。
上記のように、通常遅延符号化を用いる場合には遅延が生ずるが、動画像を用いた双方向コミュニケーションを実現する場合などには、適度な圧縮効率を維持しつつ、遅延を抑制することが好ましい。バッファメモリの容量を小さくするために各ピクチャの符号量をほぼ均一化すること、およびピクチャの並び替えを実行しないようにすることによって、遅延を抑制することができる。ピクチャの並び替えを実行しないようにするには、インター符号化ピクチャを使用しないようにするか、または、インター符号化ピクチャを使用する場合に片方向予測のみを用いるようにすればよい。
各ピクチャの符号量のばらつきを小さくし、かつ、ピクチャの並び替えを実行しないようにするとともに、適度な圧縮効率を維持し、かつ、リフレッシュの効果が損なわれないようにするために、伝送路の帯域が広い場合には、インター符号化ピクチャを使用せず、イントラ符号化ピクチャのみを使用することが好ましい。また、伝送路の帯域が狭い場合には、例えば、スライスリフレッシュが使用される。スライスリフレッシュは、イントラ符号化ピクチャを使用せず、インター符号化ピクチャのみを使用しながら画面をリフレッシュする技術であり、イントラスライスリフレッシュとも呼ばれる。
図12は、Iピクチャによって画像(画面)がリフレッシュされる様子を示す説明図である。図12において、破線による矩形で囲まれた各領域Rj−1,R,Rj+1は、それぞれ、予測制限範囲を示す。図12に示すように、予測制限範囲を越える参照を行わないようにすることによって、誤差の伝搬が予測制限範囲内に限定される。
図13は、スライスリフレッシュを説明するための説明図である。スライスリフレッシュは、図12に例示されたようなIピクチャによって画像(1画面)全体をリフレッシュするのではなく、図13に示すように、ピクチャ内の一部のスライス(1または数行の帯状のマクロブロックの集合)をイントラ符号化領域にし、連続するピクチャのそれぞれにおけるイントラ符号化領域のスライスをずらし、所定時間が経過すると、画面全体にイントラ符号化領域のスライスが行き渡るようにするリフレッシュである(例えば、特許文献2参照)。図13において、破線で囲まれた各領域Rj−2,Rj−1,R,Rj+1は、それぞれ、予測制限範囲を示す。なお、本明細書および図面において、「スライス」のように画像を構成する部分領域のことを「セグメント」と表現することがある。特に、リフレッシュの対象セグメント(リフレッシュ領域)を「リフレッシュセグメント」と表現することがある。また、以下、「セグメント」と表現する場合は、帯状に限らない任意形状のマクロブロックの集合または1個のマクロブロックのいずれかを指す。例えば、ピクチャを構成するマクロブロック数がn個で、N枚のピクチャが経過すると画面全体にイントラ符号化領域が行き渡るように行うリフレッシュの場合には、N/n個のマクロブロックからなる任意のピクチャ内の部分領域をリフレッシュセグメントとして用いてもよい。また、図13において、「イントラ符号化セグメント」がリフレッシュ領域に相当する。「一般符号化セグメント」は、イントラ符号化またはインター符号化が使用される領域である。
また、図14の説明図に示すように、破線で囲まれた領域Rj−2,Rj−1,R,Rj+1である各予測制限範囲を定めるが、それぞれの予測制限範囲内では、イントラ符号化領域のスライスを定めることなく、インター符号化を使用することも可能であるようにした場合も、リフレッシュを実現することができる。
ただし、一般に、予測制限範囲ではイントラ符号化を行った方が符号化効率が高くなるので、図13に例示されたようなイントラ符号化セグメントによるリフレッシュが使用されることが多い。以下、図13および図14に例示されたようなリフレッシュを漸次リフレッシュという。
テレビジョン放送システムにおいて、記録媒体に記録されている映像および音声を視聴者に提供する場合の他に、スポーツ番組の提供やニュース報道の場合など撮影した映像と採取した音声とをリアルタイムで視聴者に提供する場合がある。撮影場所が放送局から離れている場合には、撮影場所から複数の中継設備を経て映像および音声が放送局に伝送される(例えば、特許文献3参照)。その後、放送局から、視聴者が有する受信設備に対して、映像および音声が放送される。以下、撮影場所を、映像取得地点ということがある。
ディジタルテレビジョン放送の場合には、一般に、映像取得地点に存在する撮像装置において符号化された動画像データが放送局に伝送される。その後、放送局から、視聴者が有する受信設備に対して、映像および音声がディジタルデータとして送信される。また、中継設備において、受信された符号化データが復号された後、再符号化された符号化データが放送局に向けて送信されることもある。
特開2002−125232号公報(段落0007) 特開2007−221411号公報(段落0005,0006) 特開2008−252755号公報(段落0003−0005)
テレビジョン放送システムにおいて、撮影した映像と採取した音声とをリアルタイムで視聴者に提供する場合等には、映像取得地点から視聴者が有する受信設備までの間において生ずる遅延は小さいことが望ましい。しかし、一般に、放送局から視聴者が有する受信設備に至る伝送路の帯域は広くない。よって、放送局から視聴者が有する受信設備に送信される動画像データについては、遅延を小さくすることによりも、画質の維持が優先され、通常遅延符号化が使用される。しかし、一般に、映像取得地点から放送局までの間の伝送路の帯域は広い。そこで、映像取得地点から視聴者が有する受信設備までの間での遅延量を少なくするために、映像取得地点では、イントラ符号化のみによる符号化を使用すること、または、漸次リフレッシュを用いた符号化を使用することが考えられる。
放送局から視聴者が有する受信設備に送信される動画像データについては通常遅延符号化が使用される場合に、映像取得地点ではイントラ符号化のみによる符号化を使用したり漸次リフレッシュを用いた符号化を使用するときには、放送局等において、映像取得地点から伝送されたイントラ符号化ピクチャのみを含むデータストリームや漸次リフレッシュを用いたデータストリームを一旦復号し、通常遅延符号化による再符号化が行われる。
以下、映像取得地点で実行される符号化処理を前段における符号化処理といい、放送局等で実行される再符号化を後段における符号化処理という。
映像取得地点から中継設備や放送局を経て視聴者が有する受信設備に映像の符号化データが伝送される動画像データ伝送システムにおいて、前段の符号化処理における量子化制御、すなわち映像取得地点で実行されるイントラ符号化のみによる符号化処理や漸次リフレッシュを用いた符号化処理の実行時における量子化制御において、後段における通常遅延符号化による符号化処理を考慮しない場合には、再符号化時に参照ピクチャとされるか非参照ピクチャとされるかに関わらず、同じ量子化制御が施されることになる。
図15は、前段の符号化処理による符号化データのデータストリーム(図15(A)参照)と、後段において再符号化される符号化データのデータストリーム(図15(B)参照)との関係の一例を示す説明図である。後段における符号化処理で通常遅延符号化が行われ、その通常遅延符号化において、非参照ピクチャにおける量子化幅を大きくし参照ピクチャにおける量子化幅を小さくする制御が行われることを想定する(図15(B)参照)。図15において、”B”はBピクチャを示し、”I”はIピクチャを示し、”P”はPピクチャを示す。また、図15(B)において、大きく描かれている”I”および”P”が示すIピクチャおよびPピクチャは、相対的に小さい量子化幅で量子化されたピクチャであることを示す。また、図15(A)において、各Pピクチャの量子化幅が同じであることを想定する。
後段の再符号化処理で、前段の符号化処理で作成された符号化データを復号した後に再符号化を行う場合には、参照ピクチャにおける量子化幅を小さくする制御を実行しても、画質の劣化を抑える効果が低減する可能性がある。図15(A)に示すように、一律な量子化幅を用いて全てのピクチャをPピクチャにする前段の符号化処理において、全てのピクチャの画質はある程度劣化しているからである。
図16は、前段の符号化処理で漸次リフレッシュが実行される場合の符号化データのデータストリーム(図16(A)参照)と、後段において再符号化される符号化データのデータストリーム(図16(B)参照)との関係の一例を示す説明図である。図16において、”B”はBピクチャを示し、”I”はIピクチャを示し、”P”はPピクチャを示す。図16(A)において斜線で示されている領域がリフレッシュ領域である。また、図16(B)において、大きく描かれている”I”および”P”が示すIピクチャおよびPピクチャは、相対的に小さい量子化幅で量子化されたピクチャであることを示す。
後段の再符号化処理において、一般に、参照ピクチャではないピクチャ(非参照ピクチャ)になるピクチャにおける量子化幅を大きくして符号化後の符号量が増大することを抑制し参照ピクチャになるピクチャにおける量子化幅を小さくするような制御が実行されるので、前段の符号化処理における漸次リフレッシュが、後段の再符号化処理における量子化幅の制御が考慮されずに実行される場合には、後段の再符号化処理で非参照ピクチャとされるピクチャについての量子化幅が前段の符号化処理での量子化幅に比べて相対的に大きくなり、前段の符号化処理において当該ピクチャに対して割り当てた符号量が無駄になってしまうおそれがある。すなわち、動画像データ伝送システム全体において、符号化効率が低下するおそれがある。換言すれば、同一の符号量を費やして得られる画質が低下したり、同一の画質を得るための所要符号量が増加したりするおそれがある。
そこで、本発明は、伝送路を介して符号化データを受信する装置において再符号化が行われる場合に、動画像データ伝送システム全体において、符号化効率を改善することができる動画像符号化装置、動画像符号化方法および動画像符号化プログラムを提供することを目的とする。
本発明による動画像符号化装置は、画像データとインター予測部またはイントラ予測部が生成した予測値とから予測誤差信号を生成する予測誤差生成手段と、予測誤差生成手段が生成した予測誤差信号を量子化する量子化手段と、ピクチャが後段の再符号化処理で参照ピクチャとされるか否か判定する再符号化時ピクチャタイプ判定手段と、ピクチャにおける一部の領域をリフレッシュ単位領域とし、リフレッシュ単位領域をピクチャごとにずらすようなリフレッシュを行うリフレッシュ手段とを備え、リフレッシュ手段は、ピクチャが後段の再符号化処理で非参照ピクチャとされると再符号化時ピクチャタイプ判定手段によって判定された場合には当該ピクチャにリフレッシュ単位領域を設定せず、参照ピクチャとされると判定された場合に、非参照ピクチャとされるピクチャに設定されるべきであったリフレッシュ単位領域の分も含めて当該参照ピクチャとされるピクチャにリフレッシュ単位領域を設定することを特徴とする。
本発明による動画像符号化方法は、画像データとインター予測処理またはイントラ予測処理で生成された予測値とから予測誤差信号を生成し、生成された予測誤差信号を量子化し、ピクチャが後段の再符号化処理で参照ピクチャとされるか否か判定し、ピクチャにおける一部の領域をリフレッシュ単位領域とし、複数のピクチャで構成される予測制限範囲内で、リフレッシュ単位領域をピクチャごとにずらすようなリフレッシュを行い、予測誤差信号を生成する際に、予測制限範囲を越えるインター予測処理またはイントラ予測処理による予測値を除外し、ピクチャが後段の再符号化処理で非参照ピクチャとされると判定された場合には当該ピクチャにリフレッシュ単位領域を設定せず、参照ピクチャとされると判定された場合に、非参照ピクチャとされるピクチャに設定されるべきであったリフレッシュ単位領域の分も含めて当該参照ピクチャとされるピクチャにリフレッシュ単位領域を設定することを特徴とする。
本発明による動画像符号化プログラムは、コンピュータに、画像データとインター予測処理またはイントラ予測処理で生成された予測値とから予測誤差信号を生成する処理と、生成された予測誤差信号を量子化する処理と、ピクチャが後段の再符号化処理で参照ピクチャとされるか否か判定する処理と、ピクチャにおける一部の領域をリフレッシュ単位領域とし、複数のピクチャで構成される予測制限範囲内で、リフレッシュ単位領域をピクチャごとにずらすようなリフレッシュを行う処理と、予測誤差信号を生成する際に、予測制限範囲を越えるインター予測処理またはイントラ予測処理による予測値を除外する処理と、ピクチャが後段の再符号化処理で非参照ピクチャとされると判定された場合には当該ピクチャにリフレッシュ単位領域を設定せず、参照ピクチャとされると判定された場合に、非参照ピクチャとされるピクチャに設定されるべきであったリフレッシュ単位領域の分も含めて当該参照ピクチャとされるピクチャにリフレッシュ単位領域を設定する処理とを実行させることを特徴とする。
本発明によれば、伝送路を介して符号化データを受信する装置において再符号化が行われる場合に、動画像データ伝送システム全体において、符号化効率を改善することができる。
本発明による動画像符号化装置の第1の実施形態を示すブロック図である。 本発明による符号化装置を適用することが可能な動画像データ伝送システムの一例を示すブロック図である。 符号化装置の動作を示すフローチャートである。 符号化データのストリームと後段において再符号化される符号化データのストリームとの関係の一例を示す説明図である。 第2の実施形態の符号化装置の構成例を示すブロック図である。 第3の実施形態の符号化装置の構成例を示すブロック図である。 符号化装置の動作を示すフローチャートである。 符号化データのストリームと後段において再符号化される符号化データのストリームとの関係の一例を示す説明図である。 本発明による符号化装置における主要部を示すブロック図である。 ピクチャの並び替えを説明するための説明図である。 ピクチャの参照関係を示す説明図である。 Iピクチャによって画面がリフレッシュされる様子を示す説明図である。 スライスリフレッシュを説明するための説明図である。 予測制限範囲を説明するための説明図である。 符号化データのストリームと後段において再符号化される符号化データのストリームとの関係の一例を示す説明図である。 漸次リフレッシュが実行される場合の符号化データのストリームと、後段において再符号化される符号化データのストリームとの関係の一例を示す説明図である。
実施形態1.
図1は、本発明による動画像符号化装置の第1の実施形態を示すブロック図である。図1に示す動画像符号化装置において、入力動画像を構成する各入力画像は、減算器11、量子化制御部12および動き検出部19に入力される。以下、ピクチャとして、フレームを例にする。減算器11は、入力画像におけるマクロブロック単位で、予測誤差信号を生成する。マクロブロックは、入力画像を分割した部分領域を意味し、典型的には、16×16画素の矩形領域である。減算器11は、マクロブロックのデータから、フレーム内予測部(イントラ予測部)17またはフレーム間予測部(インター予測部)18が出力する予測値を減算することによって予測誤差信号を生成する。以下、動画像符号化装置を符号化装置という。
量子化制御部12は、入力画像と発生符号量とにもとづいて量子化パラメータを決定し、決定した量子化パラメータを出力する。量子化パラメータには、量子化ステップサイズまたは量子化幅の概念が含まれる。
周波数変換/量子化部13における周波数変換部は、減算器11が生成した予測誤差信号に離散コサイン変換(DCT:Discrete Cosine Transform )を施すことによって、予測誤差信号を空間領域の信号から周波数領域の信号に変換し、DCT係数を作成する。周波数変換/量子化部13における量子化部は、周波数変換部が作成したDCT係数を、量子化制御部12が決定した量子化幅で量子化する。可変長符号化部21は、量子化されたDCT係数を可変長符号化し、符号化データのストリームとして出力する。
逆量子化/逆周波数変換部14における逆量子化部は、周波数変換/量子化部13が出力するDCT係数を逆量子化する。逆量子化/逆周波数変換部14における逆周波数変換部は、逆量子化されたDCT係数に対して逆DCTを施すことによって、空間領域の予測誤差信号を再生する。
加算器15は、逆量子化/逆周波数変換部14が出力する予測誤差信号と、フレーム内予測部17またはフレーム間予測部18が出力する予測値とを加算することによって画像フレームを再生し、再生した画像フレームを参照フレームとしてフレームメモリ16に格納する。
動き検出部19は、フレームメモリ16に格納されている参照フレームから、入力画像のマクロブロックの予測誤差信号を最小にする動きベクトルを検出し、フレーム間予測部18に対して出力する。
適応予測選択部20は、減算器11に対して出力する信号として、フレーム内予測部17の出力またはフレーム間予測部18の出力を選択するためのスイッチである。適応予測選択部20は、イントラ符号化が実行されるときにはフレーム内予測部17の出力を選択し、インター符号化が実行されるときにはフレーム間予測部18の出力を選択する。
なお、図1に示された符号化装置を、ハードウェア回路で実現することができるが、プログラムにもとづいて処理を実行するプロセッサで実現することもできる。従って、以下で説明する符号化装置における処理は、ソフトウェアで実現することもできる。
また、本実施形態で特徴的なことは、入力画像にもとづいて量子化制御部12に与える制御信号を作成する再符号化ピクチャタイプ判定部10が設けられていることである。
また、本実施形態では、フレーム間予測部18は、符号化対象のピクチャに対して画像の表示順において過去のピクチャを参照ピクチャにする符号化処理のみを実行し、符号化対象のピクチャに対して過去および未来のピクチャからの予測を利用する符号化処理を実行しない。すなわち、符号化装置は、フレーム間予測を使用して符号化処理を実行する場合には、一方向予測のみを利用する符号化処理を実行する。具体的には、符号化装置は、Pピクチャのみを出力する。
図2は、本発明による符号化装置を適用することが可能な動画像データ伝送システムの一例を示すブロック図である。図2に示すシステムでは、映像取得地点に存在するカメラ31が撮像した動画像にもとづく符号化データのストリームが、通信ネットワーク32を介して地方局33に伝送される。通信ネットワーク32は、例えば、無線伝送路を含むIP網である。地方局33における放送設備(図示せず)とキー局35における放送設備(図示せず)とは、伝送路34を介して通信を行う。
また、例えば、中継車(図示せず)に搭載されたカメラ41が撮像した動画像にもとづく符号化データのストリームは、マイクロ波回線42などを介して、中継地点における無線中継装置であるFPU(Field Pickup Unit )43に伝送される。中継地点が複数存在することもある。そして、FPU43からストリームが伝送路44を介して地方局33に伝送される。
地方局33において、放送設備から視聴者の受信設備(例えば、テレビジョン受信機)51,52に対して、符号化データのストリームを用いたディジタル信号による放送(ディジタル放送)が行われる。また、キー局35において、放送設備から視聴者の受信設備61,62に対して、符号化データのストリームを用いたディジタル放送が行われる。
カメラ31,41から地方局33に至る伝送路の帯域は比較的広い。また、地方局33とキー局35との間の伝送路の帯域も比較的広い。よって、それらの伝送路に動画像の符号化データを送信する場合には、イントラ符号化のみによる符号化を使用するか、または、漸次リフレッシュを用いた符号化を使用することが多い。
しかし、地方局33と受信設備51,52との間の伝送路の帯域、およびキー局35と受信設備61,62との間の伝送路の帯域は、それほど広くない。また、ディジタル放送では、所定の規格にもとづく符号化を行うことが求められる。従って、例えば、地方局33およびキー局35では、通常遅延符号化による符号化データを用いてディジタル放送を行う。カメラ31,41が取得した動画像を即時に視聴者に配信する場合には、地方局33およびキー局35において、イントラ符号化のみによる符号化や漸次リフレッシュを用いた符号化にもとづくデータを復号し、次いで、通常遅延符号化による再符号化が行われる。
なお、図2に示すシステムは一例であって、本発明による符号化装置が適用可能なシステムは、図2に示すシステムに限定されない。
また、図2に例示されたシステムでは、映像取得地点に存在するカメラ31,41に、図1に例示された符号化装置が搭載される。
地方局33およびキー局35において通常遅延符号化による再符号化が行われる場合に、非参照ピクチャになるピクチャにおける量子化幅を大きくし、参照ピクチャになるピクチャにおける量子化幅を小さくする制御(図15(B)参照)が行われることを想定する。以下、再符号化が行われる地点を再符号化地点という。
また、伝送路の帯域が広いことから符号量の増大をある程度許容できるので、映像取得地点における符号化装置は、参照ピクチャ(IピクチャおよびPピクチャ)になりうるピクチャタイプのみを用いて符号化を行うことを想定する。
そして、映像取得地点における符号化装置は、再符号化地点において実行される再符号化において参照ピクチャになるピクチャを推定し、参照ピクチャになると推定したピクチャを符号化する際の量子化幅を、参照ピクチャにならないと推定したピクチャを符号化する際の量子化幅よりも小さくする。そのような制御を行わない場合には、再符号化地点での再符号化の際に量子化幅が小さくされるピクチャについて、映像取得地点において符号化の際に粗い量子化幅が用いられるという状況が生ずる可能性がある。映像取得地点において符号化の際に粗い量子化幅が用いられたピクチャについて、再符号化の際に量子化幅を小さくしても画質劣化の防止を期待することはできない。しかし、本実施形態では、映像取得地点において、再符号化地点での再符号化の際に参照ピクチャになると推定されるピクチャの量子化幅を小さくするので、画質劣化を防止することができる。換言すれば、映像取得地点から視聴者の受信設備に至るまでのシステム全体における符号化効率が改善される。
次に、図3のフローチャートを参照して符号化装置の動作を説明する。
再符号化ピクチャタイプ判定部10は、入力動画像データを構成する各ピクチャ(本実施形態では、フレーム)について、後段における再符号化で選択されると考えられるピクチャタイプを判定する(ステップS1)。ピクチャタイプの判定の方法として、公知のいずれの方法を用いてもよいが、再符号化ピクチャタイプ判定部10は、一例として、以下のような方法を用いる。
各ピクチャを符号化したときのピクチャ内の平均量子化幅をQ、発生符号量をSとした場合に、(S×Q)で表される特徴量X(=S×Q)を複雑度とする。直近にIピクチャとして符号化した複雑度をX、直近にPピクチャとして符号化した複雑度をXとしたときに、ビットレートで定まるしきい値Tに対して、
(X/X)>T
であるときには、参照ピクチャ間距離を「1」にする。それ以外の場合には、参照ピクチャ間距離を「3」にする。
参照ピクチャ間距離は、参照ピクチャになりうるピクチャと、次に参照ピクチャになりうるピクチャとの間の時間的な距離である。参照ピクチャ間距離が「1」であるということは、参照ピクチャになりうるピクチャの直後のピクチャも、参照ピクチャになりうるピクチャにすることを意味する。また、参照ピクチャ間距離が「3」であるということは、参照ピクチャになりうるピクチャの3つ後のピクチャを、参照ピクチャになりうるピクチャにすることを意味する。
再符号化ピクチャタイプ判定部10は、入力動画像データを構成する各ピクチャについて、ピクチャタイプを示す制御信号を量子化制御部12に出力する(ステップS2)。
量子化制御部12は、制御信号が参照ピクチャを示している場合には、制御信号が参照ピクチャを示していない場合に比べて、量子化ステップのサイズを小さくする(ステップS3,S4)。換言すれば、量子化幅を小さくする。制御信号が参照ピクチャを示していない場合すなわち制御信号が非参照ピクチャを示している場合には、制御信号が参照ピクチャを示している場合に比べて、量子化ステップのサイズを大きくする(ステップS3,S5)。換言すれば、量子化幅を大きくする。
なお、再符号化ピクチャタイプ判定部10からの制御信号が参照ピクチャを示している場合とは、図1に例示されている符号化装置と伝送路を介して通信可能に接続されている後段の装置で実行される再符号化において参照ピクチャとされることを意味する。また、再符号化ピクチャタイプ判定部10からの制御信号が非参照ピクチャを示している場合とは、図1に例示されている符号化装置と伝送路を介して通信可能に接続されている後段の装置で実行される再符号化において非参照ピクチャとされることを意味する。
また、本実施形態では、量子化制御部12は、再符号化ピクチャタイプ判定部10からの制御信号が参照ピクチャを示している場合と非参照ピクチャを示している場合とで量子化幅を違えるが、符号化装置は、実際に符号化するピクチャの符号化タイプを全てIピクチャまたはPピクチャにする。実際に符号化するピクチャの符号化タイプを全てIピクチャにする場合には、適応予測選択部20は、常にフレーム内予測部17の出力を選択する。また、実際に符号化するピクチャの符号化タイプを全てPピクチャにする場合には、適応予測選択部20は、フレーム内予測部17の出力とフレーム間予測部18の出力のどちらか一方を選択するが、フレーム間予測部18は、一方向予測のみを利用した予測値を出力する。
図4は、図1に例示された符号化装置による符号化データのストリームと、後段において再符号化される符号化データのストリームとの関係の一例を示す説明図である。図4(A)には、符号化装置がPピクチャのみからなるデータストリームを送信することが例示されている。図4(A)において、”P”はPピクチャを意味するが、大きく描かれている”P”が示すPピクチャは、相対的に小さい量子化幅で量子化されたピクチャであることを示す。
そして、図4(B)に示すように、後段の再符号化を行う装置では、符号化装置が小さい量子化幅で量子化したピクチャを、参照ピクチャ(IピクチャまたはPピクチャ)にする。
なお、後段の装置が、符号化装置が小さい量子化幅で量子化したピクチャを特定する方法、すなわち符号化装置が参照ピクチャになると推定したピクチャを特定する方法として、例えば以下のような方法がある。
上記のように、符号化装置が画像の複雑度Xにもとづいて参照ピクチャになるか非参照ピクチャになるのかを判定した場合には、後段の装置は、符号化装置が判定に用いらアルゴリズムと同じアルゴリズムによって画像の複雑度Xにもとづいて参照ピクチャになるか非参照ピクチャになるのかを決定する。その場合には、符号化装置は、小さい量子化幅で量子化したピクチャを特定するための情報を後段の装置に送信しなくてもよい。
また、後段の装置は、各ピクチャに対する過去および未来の複数のピクチャを参照して各ピクチャの平均量子化ステップを検出し、各ピクチャを、平均量子化ステップが大きいグループと平均量子化ステップが小さいグループとにグループ分けしてもよい。その場合、平均量子化ステップが小さいグループに属するピクチャを参照ピクチャにし、平均量子化ステップが大きいグループに属するピクチャを非参照ピクチャにする。そのような制御する場合も、符号化装置は、小さい量子化幅で量子化したピクチャを特定するための情報を後段の装置に送信しなくてもよい。
また、符号化装置は、符号化データとともに、小さい量子化幅で量子化したピクチャを特定するための補助情報を送信してもよい。例えば、MPEG−2やMPEG−4 part.2では、user_data の領域に補助情報を設定する。MPEG−4 AVCでは、SEI(Supplemental Enhancement Information)メッセージに補助情報を設定する。また、システムレイヤ、例えばMPEG−2 TS(Transport Stream)やMPEG−2 PS(Program Stream)内の領域に、補助情報を設定することもできる。
なお、本実施形態では、符号化装置は、画像の複雑度に応じて、参照ピクチャになるか非参照ピクチャになるのかを判定したが、全てのピクチャを参照ピクチャとして扱うようにしてもよい。
実施形態2.
第1の実施形態では、リフレッシュ制御に関する構成は省略されていたが、符号化装置は、所定のリフレッシュ制御を実行してもよい。図5は、リフレッシュ制御を実行する第2の実施形態の符号化装置の構成例を示すブロック図である。
図5に例示された符号化装置は、リフレッシュ制御部22を備えている。リフレッシュ制御部22は、各フレームにおけるリフレッシュ領域(リフレッシュ単位領域)を設定する処理を行う。そして、フレーム内予測部17および動き検出部19にリフレッシュのためのリフレッシュ制御信号を与える。リフレッシュ制御信号はリフレッシュ領域を示す信号である。なお、リフレッシュ制御信号が、予測制限範囲を示す情報を含んでいてもよい。
適応予測選択部20は、リフレッシュ制御信号が入力されると、フレーム内予測部17の出力のみを選択する。すなわち、イントラ符号化によってリフレッシュを行う。
なお、予測制限範囲を越える参照を行わないようにすれば、リフレッシュのセグメントにおいて、インター符号化を用いてもよい。その場合、適応予測選択部20は、リフレッシュ制御信号が入力されると、フレーム間予測部18の出力を選択する。
また、本実施形態では、基本的に、漸次リフレッシュ(図13および図16(A)参照)を使用する。よって、フレーム内予測部17は、フレーム内の予測範囲を、予測制限範囲内に限定する。すなわち、フレーム内予測部17は、予測制限範囲を越える予測値を作成しないようにする。また、動き検出部19は、予測制限範囲を越える動きベクトルを生成しないようにする。その結果、適応予測選択部20は、予測制限範囲を越えるフレーム内予測部17による予測値および予測制限範囲を越えるフレーム間予測部18による予測値を除外できることになる。
なお、動き検出部19が予測制限範囲を越える動きベクトルを生成しないようにするのではなく、適応予測選択部20が、動き検出部19から予測制限範囲を越える動きベクトルが出力されたことを検知した場合には、フレーム内予測部17の出力を選択するようにしてもよい。
なお、リフレッシュ以外の制御は、第1の実施形態における制御と同じである。
実施形態3.
図6は、第3の実施形態の符号化装置の構成例を示すブロック図である。本実施形態では、リフレッシュとして、基本的には、図13や図16(A)に示されたような漸次リフレッシュを使用するが、再符号化ピクチャタイプ判定部10からの制御信号に応じて、リフレッシュの対象領域が制御される。
次に、図7のフローチャートを参照して符号化装置の動作を説明する。再符号化ピクチャタイプ判定部10は、第1の実施形態の場合と同様に、入力動画像データを構成する各ピクチャ(本実施形態では、フレーム)について、後段における再符号化で設定されるピクチャタイプを判定する(ステップS11)。そして、入力動画像データを構成する各ピクチャについて、ピクチャタイプを示す制御信号を量子化制御部12に出力する(ステップS2)。制御信号は、リフレッシュ制御部22および量子化制御部12に入力される。
リフレッシュ制御部22は、例えば、参照ピクチャ間距離にもとづいて、リフレッシュセグメントとなるセグメントの数(セグメントとしてスライスを採用した場合には、スライス数)を決定する(ステップS13)。参照ピクチャ間距離がM(M:自然数)であれば、リフレッシュセグメント数はMである。また、リフレッシュ制御部22は、ピクチャタイプを示す制御信号が参照ピクチャを示している場合に、そのピクチャにおいて、連続するM個のセグメントにおいて、イントラ符号化に限定する符号化が実行されるように制御する(ステップS14)。具体的には、適応予測選択部20に対して、フレーム内予測部17の出力のみを選択することを示すリフレッシュ制御信号を出力する。リフレッシュ制御部22は、ステップS14の処理で、参照ピクチャとされると判定した場合に、非参照ピクチャとされるピクチャに設定されるべきであったリフレッシュ領域の分も含めて参照ピクチャとされるピクチャにリフレッシュ領域を設定することになる。
適応予測選択部20は、リフレッシュ制御信号が入力されると、フレーム内予測部17の出力のみを選択するので、イントラ符号化によってリフレッシュが実行される。
なお、本実施形態でも、予測制限範囲を越える参照を行わないようにすれば、リフレッシュのセグメントにおいて、インター符号化を用いてもよい。その場合、適応予測選択部20は、リフレッシュ制御信号が入力されると、フレーム間予測部18の出力を選択する。
また、リフレッシュ制御部22は、動き検出部19に対して、予測制限範囲(図13参照)を越える動きベクトルの生成を禁止することを示す制御信号を出力したり、適応予測選択部20に対して、予測制限範囲を越える動きベクトルの入力を禁止することを示す制御信号を出力したりする。その結果、適応予測選択部20は、制御信号に従って、予測制限範囲を越えるフレーム間予測部18による予測値を除外することになる。
また、リフレッシュ制御部22は、フレーム内予測部17にも、制御信号を出力する。フレーム内予測部17は、制御信号に従って、予測制限範囲を越える予測値を作成しないようにする。
図8は、前段の符号化処理で本実施形態におけるリフレッシュが実行される場合の符号化データのストリーム(図8(A)参照)と、後段において再符号化される符号化データのストリーム(図8(B)参照)との関係の一例を示す説明図である。図8において、”B”はBピクチャを示し、”I”はIピクチャを示し、”P”はPピクチャを示す。また、図8(B)において、大きく描かれている”I”および”P”が示すIピクチャおよびPピクチャは、相対的に小さい量子化幅で量子化されたピクチャであることを示す。
また、図8(A)において、斜線部分は、後段の再符号化処理において参照ピクチャとされるピクチャでM個のセグメントに対してリフレッシュが実行されることを示す。また、横線は、リフレッシュの実行が省略されていることを示す。すなわち、後段の再符号化処理において非参照ピクチャとされるピクチャについてリフレッシュは実行されない。なお、図8に示す例では、M=3である。
図8(A)に示す例では、リフレッシュ領域は、1つのフレームにおいて、横方向(主走査方向)に延びる帯状の領域である。また、リフレッシュ領域は、時間経過に伴って、1つのフレームにおける下方向(副走査方向)に移動することになる。しかし、リフレッシュ領域の設定方法は、そのような方法に限られない。例えば、リフレッシュ領域が、時間経過に伴って、1つのフレームにおける上方向に移動するようにしてもよい。また、例えば、リフレッシュ領域は、副走査方向に延びる帯状の領域であってもよい。
リフレッシュ領域の設定方法を一般化すると、以下のようになる。
i枚目のピクチャをP(i)、一般的なリフレッシュ制御を用いた場合の、すなわち、再符号化時に参照ピクチャか否かに依らず各ピクチャに対して1個ずつセグメントを割り当てる方法でリフレッシュが実行される方法を用いた場合のP(i)のリフレッシュ領域をR(i)とする。再符号化時の参照ピクチャをP(i)とし、再符号化時の参照ピクチャ間距離をM(i)とした場合に、本実施形態における一般化されたR’(i)[i≦i≦(M−1)]は、(1)式のように表される。
Figure 0005640979
(1)式において、「U」は和集合を示し、「ψ」は空集合を示す。
本実施形態では、符号化装置は、後段の再符号化処理で参照ピクチャとされるピクチャについてリフレッシュを集中的に実行するので、参照ピクチャとされるピクチャの画質が相対的に向上することを期待できる。そして、後段の再符号化処理では、参照ピクチャの量子化幅が小さくされるので、符号化装置において画質を相対的に向上させたピクチャについて、後段の再符号化処理において、画質の低下を抑制することができる。すなわち、映像取得地点から中継設備や放送局を経て視聴者が有する受信設備に映像の符号化データが伝送される動画像データ伝送システムの全体において、参照ピクチャの画質の低下を抑制することができる。その結果、参照ピクチャを参照するピクチャの画質の低下も抑制することができる。
なお、第1の実施形態の場合と同様に、量子化制御部12は、制御信号が参照ピクチャを示している場合には、制御信号が参照ピクチャを示していない場合に比べて、量子化ステップのサイズを小さくするようにし、制御信号が参照ピクチャを示していない場合すなわち制御信号が非参照ピクチャを示している場合には、制御信号が参照ピクチャを示している場合に比べて、量子化ステップのサイズを大きくするようにしてもよい。
また、後段の再符号化を行う装置は、第1の実施形態の場合と同様の方法によって、符号化装置が参照ピクチャになると推定したピクチャを特定する。そして、特定したピクチャの量子化幅を小さくする。
また、図13や図16(A)に示されたような単純な漸次リフレッシュを使用した場合に、量子化幅が粗い非参照ピクチャにおけるリフレッシュ領域も粗く量子化されるので、各々のリフレッシュ領域の画質が不均一になって画質差が視認される可能性があるが、本実施形態における制御によれば、そのような可能性を小さくすることができる。
比較例として、H.264/MPEG−4 AVCにもとづく符号化方式を用い図13に示されたような漸次リフレッシュを実行する符号化装置と、MPEG−2にもとづく符号化方式を用い図12に示されたようなIピクチャによって画像(1画面)全体をリフレッシュする処理を行う後段の再符号化装置とを用いて、符号化効率を測定するとともに、画質を測定した。また、本実施形態の符号化装置と、MPEG−2にもとづく符号化方式を用い図12に示されたようなIピクチャによって画像(1画面)全体をリフレッシュする処理を行う後段の再符号化装置とを用いて、符号化効率を測定するとともに、画質を測定した。本実施形態の符号化装置を用いた場合には、比較例に対して、約2%符号化効率が改善された。また、比較例では、局所的な主観画質低下が見られたのに対して、本実施形態の符号化装置を用いた場合には、主観画質が改善されることが確認された。
なお、上記の各実施形態では、符号化装置が、映像取得地点から中継設備や放送局を経て視聴者が有する受信設備に映像の符号化データが伝送される動画像データ伝送システムに適用される場合を例にしたが、本発明による符号化装置の用途は、そのようなシステムに限定されない。例えば、双方向コミュニケーションにおいて使用される符号化装置に本発明を適用することができる。
図9は、本発明による符号化装置の主要部を示すブロック図である。図9に示すように、符号化装置は、画像データとインター予測部またはイントラ予測部が生成した予測値とから予測誤差信号を生成する予測誤差生成手段101(図6に示す例における減算器11および適応予測選択部20に相当)と、予測誤差生成手段101が生成した予測誤差信号を量子化する量子化手段102(図6に示す例における減算器11、適応予測選択部20、フレーム内予測部17、フレーム間予測部18、動き検出部19および周波数変換/量子化部13における周波数変換部に相当)と、ピクチャが後段の再符号化処理で参照ピクチャとされるか否か判定する再符号化時ピクチャタイプ判定手段103(図6に示す例における再符号化時ピクチャタイプ判定部10に相当)と、ピクチャにおける一部の領域をリフレッシュ単位領域とし、リフレッシュ単位領域をピクチャごとにずらすようなリフレッシュを行うリフレッシュ手段104(図6に示す例では、リフレッシュ制御部22、フレーム内予測部17、フレーム間予測部18および適応予測選択部20で実現される。)とを備えている。リフレッシュ手段104は、ピクチャが後段の再符号化処理で非参照ピクチャとされると再符号化時ピクチャタイプ判定手段103によって判定された場合には当該ピクチャにリフレッシュ単位領域を設定せず、参照ピクチャとされると判定された場合に、非参照ピクチャとされるピクチャに設定されるべきであったリフレッシュ単位領域の分も含めて当該参照ピクチャとされるピクチャにリフレッシュ単位領域を設定する。
リフレッシュ手段104は、例えば、参照ピクチャになりうるピクチャと次に参照ピクチャになりうるピクチャとの間の時間的な距離である参照ピクチャ間距離をMとした場合、ピクチャが後段の再符号化処理で参照ピクチャとされると再符号化時ピクチャタイプ判定手段によって判定されたときには、当該ピクチャにM個のリフレッシュ単位領域を設定する。
リフレッシュ手段104は、イントラ符号化によってリフレッシュを行うように構成されていてもよい。そのように構成されている場合には、画質の劣化が低減される。
例えば、リフレッシュ手段104は、複数のピクチャで構成される予測制限範囲内でリフレッシュ単位領域をずらし、予測誤差生成手段101は、予測誤差信号を生成する際に、予測制限範囲を越えるインター予測部またはイントラ予測部による予測値を除外する。
予測誤差生成手段101は、ピクチャを作成する際にインター予測部が生成した予測値を用いる場合には一方向予測のみを利用した予測値から予測誤差信号を生成するように構成されていてもよい。そのように構成されている場合には、ピクチャ毎の符号量の増減の程度が抑制されるので、遅延量を低減することができる。
予測誤差生成手段101は、ピクチャを作成する際にイントラ予測部が生成した予測値のみを用いて予測誤差信号を生成するように構成されていてもよい。そのように構成されている場合には、ピクチャ毎の符号量の増減の程度が抑制されるので、遅延量を低減することができる。
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2009年9月3日に出願された日本特許出願2009−203421を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 再符号化ピクチャタイプ判定部
11 減算器
12 量子化制御部
13 周波数変換/量子化部
14 逆量子化/逆周波数変換部
15 加算器
16 フレームメモリ
17 フレーム内予測部
18 フレーム関与側部
19 動き検出部
20 適応予測選択部
21 可変長符号化部
22 リフレッシュ制御部
31,41 カメラ
32 通信ネットワーク
33 地方局
34 伝送路
35 キー局
42 マイクロ波回線
43 FPU
44 伝送路
51,52,61,62 受信設備
101 予測誤差生成手段
102 量子化手段
103 再符号化時ピクチャタイプ判定手段
104 リフレッシュ手段

Claims (12)

  1. 入力された動画像における画像データをインター符号化またはイントラ符号化して、符号化されたピクチャを作成する動画像符号化装置であって、
    画像データとインター予測部またはイントラ予測部が生成した予測値とから予測誤差信号を生成する予測誤差生成手段と、
    前記予測誤差生成手段が生成した予測誤差信号を量子化する量子化手段と、
    ピクチャが後段の再符号化処理で参照ピクチャとされるか否か判定する再符号化時ピクチャタイプ判定手段と、
    ピクチャにおける一部の領域をリフレッシュ単位領域とし、リフレッシュ単位領域をピクチャごとにずらすようなリフレッシュを行うリフレッシュ手段とを備え、
    前記リフレッシュ手段は、ピクチャが後段の再符号化処理で非参照ピクチャとされると前記再符号化時ピクチャタイプ判定手段によって判定された場合には当該ピクチャにリフレッシュ単位領域を設定せず、参照ピクチャとされると判定された場合に、非参照ピクチャとされるピクチャに設定されるべきであったリフレッシュ単位領域の分も含めて当該参照ピクチャとされるピクチャにリフレッシュ単位領域を設定する
    ことを特徴とする動画像符号化装置。
  2. リフレッシュ手段は、参照ピクチャになりうるピクチャと次に参照ピクチャになりうるピクチャとの間の時間的な距離である参照ピクチャ間距離をMとした場合、ピクチャが後段の再符号化処理で参照ピクチャとされると前記再符号化時ピクチャタイプ判定手段によって判定されたときには、当該ピクチャにM個のリフレッシュ単位領域を設定する
    請求項1記載の動画像符号化装置。
  3. リフレッシュ手段は、イントラ符号化によってリフレッシュを行う
    請求項1または請求項2記載の動画像符号化装置。
  4. リフレッシュ手段は、複数のピクチャで構成される予測制限範囲内でリフレッシュ単位領域をずらし、
    予測誤差生成手段は、予測誤差信号を生成する際に、前記予測制限範囲を越えるインター予測部またはイントラ予測部による予測値を除外する
    請求項1から請求項3のうちのいずれか1項に記載の動画像符号化装置。
  5. 予測誤差生成手段は、ピクチャを作成する際にインター予測部が生成した予測値を用いる場合には一方向予測のみを利用した予測値から予測誤差信号を生成する
    請求項1から請求項4のうちのいずれか1項に記載の動画像符号化装置。
  6. 予測誤差生成手段は、ピクチャを作成する際にイントラ予測部が生成した予測値のみを用いて予測誤差信号を生成する
    請求項1から請求項4のうちのいずれか1項に記載の動画像符号化装置。
  7. 入力された動画像における画像データをインター符号化またはイントラ符号化して、符号化されたピクチャを作成する動画像符号化方法であって、
    画像データとインター予測処理またはイントラ予測処理で生成された予測値とから予測誤差信号を生成し、
    生成された予測誤差信号を量子化し、
    ピクチャが後段の再符号化処理で参照ピクチャとされるか否か判定し、
    ピクチャにおける一部の領域をリフレッシュ単位領域とし、リフレッシュ単位領域をピクチャごとにずらすようなリフレッシュを行い、
    ピクチャが後段の再符号化処理で非参照ピクチャとされると判定された場合には当該ピクチャにリフレッシュ単位領域を設定せず、参照ピクチャとされると判定された場合に、非参照ピクチャとされるピクチャに設定されるべきであったリフレッシュ単位領域の分も含めて当該参照ピクチャとされるピクチャにリフレッシュ単位領域を設定する
    ことを特徴とする動画像符号化方法。
  8. 参照ピクチャになりうるピクチャと次に参照ピクチャになりうるピクチャとの間の時間的な距離である参照ピクチャ間距離をMとした場合、ピクチャが後段の再符号化処理で参照ピクチャとされると判定されたときには、当該ピクチャにM個のリフレッシュ単位領域を設定する
    請求項7記載の動画像符号化方法。
  9. イントラ符号化によってリフレッシュを行う
    請求項7または請求項8記載の動画像符号化方法。
  10. 入力された動画像における画像データをインター符号化またはイントラ符号化して、符号化されたピクチャを作成するコンピュータに、
    画像データとインター予測処理またはイントラ予測処理で生成された予測値とから予測誤差信号を生成する処理と、
    生成された予測誤差信号を量子化する処理と、
    ピクチャが後段の再符号化処理で参照ピクチャとされるか否か判定する処理と、
    ピクチャにおける一部の領域をリフレッシュ単位領域とし、リフレッシュ単位領域をピクチャごとにずらすようなリフレッシュを行う処理と、
    ピクチャが後段の再符号化処理で非参照ピクチャとされると判定された場合には当該ピクチャにリフレッシュ単位領域を設定せず、参照ピクチャとされると判定された場合に、非参照ピクチャとされるピクチャに設定されるべきであったリフレッシュ単位領域の分も含めて当該参照ピクチャとされるピクチャにリフレッシュ単位領域を設定する処理と
    を実行させるための動画像符号化プログラム。
  11. コンピュータに、参照ピクチャになりうるピクチャと次に参照ピクチャになりうるピクチャとの間の時間的な距離である参照ピクチャ間距離をMとした場合、ピクチャが後段の再符号化処理で参照ピクチャとされるピクチャになると判定されたときには、当該ピクチャにM個のリフレッシュ単位領域を設定する処理を実行させるための請求項10記載の動画像符号化プログラム。
  12. コンピュータに、イントラ符号化によってリフレッシュを行う処理を実行させるための請求項10または請求項11記載の動画像符号化プログラム。
JP2011529781A 2009-09-03 2010-08-09 動画像符号化装置、動画像符号化方法および動画像符号化プログラム Expired - Fee Related JP5640979B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011529781A JP5640979B2 (ja) 2009-09-03 2010-08-09 動画像符号化装置、動画像符号化方法および動画像符号化プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009203421 2009-09-03
JP2009203421 2009-09-03
PCT/JP2010/005002 WO2011027507A1 (ja) 2009-09-03 2010-08-09 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
JP2011529781A JP5640979B2 (ja) 2009-09-03 2010-08-09 動画像符号化装置、動画像符号化方法および動画像符号化プログラム

Publications (2)

Publication Number Publication Date
JPWO2011027507A1 JPWO2011027507A1 (ja) 2013-01-31
JP5640979B2 true JP5640979B2 (ja) 2014-12-17

Family

ID=43649065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011529781A Expired - Fee Related JP5640979B2 (ja) 2009-09-03 2010-08-09 動画像符号化装置、動画像符号化方法および動画像符号化プログラム

Country Status (5)

Country Link
US (1) US9807422B2 (ja)
EP (1) EP2475174A4 (ja)
JP (1) JP5640979B2 (ja)
CN (1) CN102484718B (ja)
WO (1) WO2011027507A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9407924B2 (en) 2009-09-03 2016-08-02 Nec Corporation Video encoding device, video encoding method, and video encoding program
WO2012119855A1 (en) * 2011-03-09 2012-09-13 Siemens Aktiengesellschaft A method for coding a sequence of digitized images
US9369723B2 (en) * 2011-07-14 2016-06-14 Comcast Cable Communications, Llc Preserving image quality in temporally compressed video streams
AU2013282644B2 (en) 2012-06-25 2016-05-12 Nec Corporation Video encoding/decoding device, method, and program
US10841626B2 (en) * 2014-10-27 2020-11-17 Texas Instruments Incorporated Selective picture-based encryption of video streams
JP6357188B2 (ja) * 2016-04-12 2018-07-11 株式会社Nexpoint 監視カメラシステム及び監視カメラデータ保存方法
JP6943628B2 (ja) * 2017-05-24 2021-10-06 Nttエレクトロニクス株式会社 映像符号化装置および映像符号化方法
US10602139B2 (en) * 2017-12-27 2020-03-24 Omnivision Technologies, Inc. Embedded multimedia systems with adaptive rate control for power efficient video streaming
JP2020123449A (ja) * 2019-01-29 2020-08-13 パナソニックIpマネジメント株式会社 携帯電灯

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5805223A (en) * 1994-05-25 1998-09-08 Canon Kk Image encoding apparatus having an intrapicture encoding mode and interpicture encoding mode
CA2265089C (en) * 1998-03-10 2007-07-10 Sony Corporation Transcoding system using encoding history information
JPH11341435A (ja) * 1998-05-22 1999-12-10 Sony Corp 編集方法および編集装置
JP2002125232A (ja) 2000-10-12 2002-04-26 Matsushita Electric Ind Co Ltd 動画像データの符号化装置およびその方法
JP3923898B2 (ja) * 2002-01-18 2007-06-06 株式会社東芝 画像符号化方法及び装置
JP4324844B2 (ja) * 2003-04-25 2009-09-02 ソニー株式会社 画像復号化装置及び画像復号化方法
US20060015799A1 (en) * 2004-07-13 2006-01-19 Sung Chih-Ta S Proxy-based error tracking for real-time video transmission in mobile environments
JP4221667B2 (ja) * 2004-08-25 2009-02-12 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びに、プログラム
US9467659B2 (en) 2005-09-27 2016-10-11 Qualcomm Incorporated Method and apparatus for progressive channel switching
JP4649615B2 (ja) 2006-02-16 2011-03-16 国立大学法人三重大学 映像符号化、復号化装置および映像符号化、復号化方法、並びにそれらのプログラム
JP2008252755A (ja) 2007-03-30 2008-10-16 Hitachi Kokusai Electric Inc デジタル伝送システム
JP4821723B2 (ja) 2007-07-13 2011-11-24 富士通株式会社 動画像符号化装置及びプログラム
JP4871848B2 (ja) 2007-11-27 2012-02-08 富士通株式会社 動画像再符号化装置
JP5048551B2 (ja) 2008-02-29 2012-10-17 三洋化成工業株式会社 水性液用ゲル化剤、水性液ゲル及び水性液ゲルの製造方法
US9407924B2 (en) 2009-09-03 2016-08-02 Nec Corporation Video encoding device, video encoding method, and video encoding program

Also Published As

Publication number Publication date
US20130039411A1 (en) 2013-02-14
CN102484718B (zh) 2014-11-12
WO2011027507A1 (ja) 2011-03-10
US9807422B2 (en) 2017-10-31
EP2475174A4 (en) 2016-04-27
CN102484718A (zh) 2012-05-30
JPWO2011027507A1 (ja) 2013-01-31
EP2475174A1 (en) 2012-07-11

Similar Documents

Publication Publication Date Title
JP5640979B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
KR100942395B1 (ko) 다층 비디오 설계를 위한 레이트 제어
KR101177031B1 (ko) 인터-코딩에 사용된 기준 화상의 수를 최소화하기 위한 방법 및 장치
JP4643454B2 (ja) 動画像復号装置及び動画像復号方法
JP2004201298A (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
JP5365805B2 (ja) 動画像変換装置、動画像変換方法、および動画像変換プログラム
US8290064B2 (en) Intra-forecast mode selecting method, moving picture coding method, and device and program using the same
JP2004289796A (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
JP5708490B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
KR101096827B1 (ko) 각기 다수의 매크로블록을 포함하는 예측 및 비예측 화상을이용하여 화상 시퀀스를 인코딩하는 방법 및 장치
KR100929607B1 (ko) 엠펙-2 메인 프로파일에서 h.264/avc 베이스라인프로파일로의 트랜스코딩 방법
JP5136470B2 (ja) 動画像符号化装置及び動画像符号化方法
US8442113B2 (en) Effective rate control for video encoding and transcoding
KR100770873B1 (ko) 영상 부호화시 비트율 제어 방법 및 장치
JPH0775095A (ja) レート制御回路
JP4000581B2 (ja) 画像符号化装置および方法
JP6735370B2 (ja) 復号化方法
JP2012060423A (ja) 動画像符号化装置
Teixeira et al. Joint Coding of Multiple H. 264 Video Programs
JP2007318794A (ja) 圧縮動画像再符号化装置及び圧縮動画像再符号化方法
JP2016213698A (ja) 映像符号化装置及びプログラム
JP2012257323A (ja) 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
JP2001148855A (ja) 画像情報変換装置及び画像情報変換方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141013

R150 Certificate of patent or registration of utility model

Ref document number: 5640979

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees