JP2004363974A - 映像符号化伝送装置および映像符号量制御方法 - Google Patents
映像符号化伝送装置および映像符号量制御方法 Download PDFInfo
- Publication number
- JP2004363974A JP2004363974A JP2003160261A JP2003160261A JP2004363974A JP 2004363974 A JP2004363974 A JP 2004363974A JP 2003160261 A JP2003160261 A JP 2003160261A JP 2003160261 A JP2003160261 A JP 2003160261A JP 2004363974 A JP2004363974 A JP 2004363974A
- Authority
- JP
- Japan
- Prior art keywords
- area
- video
- region
- unit
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Closed-Circuit Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】広角領域を高解像度で撮影した映像を、符号化および伝送する映像符号化伝送装置において、広角映像全体を符号化伝送することなく、広角映像中の重要領域の一覧性を高めながら、効率的な映像伝送を行うことを目的とする。
【解決手段】広角映像から第一の領域と複数の第二の領域の切り出しを行う映像切り出し部103、第一の領域から非重要領域の抽出を行う主領域処理部104、第一の領域の符号化処理を行う主領域符号化部105、第二の領域から重要領域の抽出を行う補助領域処理部107、重要領域の符号化処理を行う補助領域符号化部108、非重要領域に重ね合わせる重要領域を決定し、第一の領域および重要領域に符号量の割り当てを行う符号量制御部106を備えることにより、補助領域中の重要領域を符号化した映像を、符号化した主領域中の非重要領域上に重ね合わせて伝送する。
【選択図】 図1
【解決手段】広角映像から第一の領域と複数の第二の領域の切り出しを行う映像切り出し部103、第一の領域から非重要領域の抽出を行う主領域処理部104、第一の領域の符号化処理を行う主領域符号化部105、第二の領域から重要領域の抽出を行う補助領域処理部107、重要領域の符号化処理を行う補助領域符号化部108、非重要領域に重ね合わせる重要領域を決定し、第一の領域および重要領域に符号量の割り当てを行う符号量制御部106を備えることにより、補助領域中の重要領域を符号化した映像を、符号化した主領域中の非重要領域上に重ね合わせて伝送する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、広角領域を高解像度で撮影した映像を、符号化および伝送する映像符号化伝送装置に関するものである。
【0002】
【従来の技術】
従来、広角カメラを利用した映像監視システムや遠隔モニタリングシステム等に用いられる映像処理装置では、ユーザがカメラから入力された広角映像領域から任意の映像領域を選択すると、映像処理装置が選択領域を受信端末に伝送し、受信端末は表示能力に合わせて画素密度変換処理などを施したのちに選択領域を表示する方法を使用している(特許文献1参照)。
【0003】
図15は、特許文献1の実施の形態を説明する図である。図15では、ユーザが、受信端末のユーザインタフェースにより、カメラから入力されたカメラ撮影領域1501から任意の選択領域1503を選択する。映像処理装置は、ユーザからの指示に合わせて、選択領域1503をカメラ撮影領域から切り出し受信端末に伝送する。受信端末は端末の表示領域に合わせて画素密度変換を行う。これにより、ユーザは、所望する映像領域を受信端末上に表示画面1502として表示できる。
【0004】
この構成により、ユーザがカメラ撮影領域中の任意の領域(選択領域1503)を変更することにより、受信端末により表示される方位およびズーム倍率を変更できることになる。
【0005】
また、特許文献2では、2画面表示機能を備えたテレビ電話装置に関し、親画面中の特定領域(人物の顔や文字領域など)を検出し、その結果に応じて子画面又は親画面の位置/サイズ/表示優先度を制御する方法について開示されている。
【0006】
図16は、特許文献2の実施の形態を説明する図である。図16には、特許文献2を適用前のテレビ電話の表示画面1601と、適用後のテレビ電話の表示画面1604を示している。適用前の表示画面1601では、親画面領域1602中の特定領域(この例では通話相手の顔領域)と、子画面領域1603(この例では自画像)の一部が重なり合っている。一方、適用後の表示画面1604では、親画面領域1602の移動やサイズ変更を行った親画面領域1605と、子画面領域1603は重なり合っていない。このように、親画面あるいは子画面の位置/サイズ/表示優先度を制御することで、特定の領域が重なり合うことを防ぐことが可能となる。
【0007】
また、特許文献3では、2画面表示機能を備えたテレビ電話装置に関し、子画面の表示位置/サイズを考慮した上で、親画面を符号化する方法について開示されている。
【0008】
この例では、子画面により隠されることになる親画面領域の符号量を完全に0にすることなく一定量の符号量を割り当てることで、子画面の位置や大きさの変更、あるいは子画面の消去などを行った際に、画像の無い部分を生じてしまうという問題に対する対処を行っている。
【0009】
具体的な動作としては、自テレビ電話装置は、相手側のテレビ電話装置より、子画面(相手の自画像)の位置やサイズに関する情報を取得し、自テレビ電話装置より送信する映像(自画像)から、相手側端末の子画面が重なり合う領域を決定する。自テレビ電話装置は、決定した領域に対する符合量を、他の同じ面積の領域よりも小さく割り当て符号化し自画像の送信を行う。これにより、子画面が重なる領域の符号量を少なくすることで一画面あたりの符号量を抑えつつ、子画面の表示位置や大きさの変更などによる画質の劣化を少なくできる。
【0010】
【特許文献1】
特開平8−237590号公報(第6図)
【特許文献2】
特開平10−200873号公報(第6図〜第9図)
【特許文献3】
特開2001−45476号公報(第1図)
【0011】
【発明が解決しようとする課題】
しかしながら、近年、CCD等の受光素子の高解像度化および撮影領域の広角化の進展により、広角カメラにより撮影された映像データは、通常の画角のカメラに比べて大きく、1画面あたり数メガバイト以上と非常に大きなものとなってきており、限られた伝送帯域を使用して撮影された映像を伝送するためには、従来の手法では不十分である。
【0012】
特許文献1で開示されている方法を用い、選択領域1503を広角カメラにより撮影されたカメラ撮影領域1501と同じにし、限られた伝送帯域に見合うように非常に高い圧縮率で選択領域1503の映像を圧縮して伝送することは可能である。しかしながら、この手法では、広角カメラの映像を高い圧縮率で圧縮する必要があり、映像受信端末により受信、表示された映像の品質は低いものとなってしまう。また、映像受信端末で受信、表示される映像の品質を高めるために、選択領域1503をカメラ撮影領域1501全体ではなく、ユーザがその一部を一定のサイズ以下(一定以上の画質を確保するため)で選択しながら、低い圧縮率で圧縮しながら伝送することも可能である。しかしながら、この場合には、選択領域1503以外のカメラ撮影領域1501の映像を、ユーザは映像受信端末で見ることができず、広角カメラで撮影した映像データが無駄になる。
【0013】
また、特許文献2では、テレビ電話端末において、通話相手から送信されてくる映像の顔や文字などの特定領域と、自画像が重ならないように、相手映像あるいは自画像の位置/サイズなどを変更するための方法を開示しているが、電話網という固定帯域の伝送網を対象とした方法であり、相手から送信されてくる映像は固定的な伝送帯域を占有できることを前提としている。したがって、伝送帯域が変動するような伝送網へそのまま適用することはできない。また、開示されている方法は相手画像と自画像という関係を対象とした方法であって、親画像と複数の子画像を同時に伝送するという場合に、そのまま適用することは困難である。
【0014】
また、特許文献3では、テレビ電話端末において、通話相手側の子画面表示位置を取得し、自画像中で相手側の子画面が重ね合わされると予想される位置の符号量を低く抑えることで一画面の符号量を抑える方法を開示しているが、特許文献2と同様に電話網という固定帯域の伝送網を対象とした方法であり、送信する映像は固定的な伝送帯域を占有できることを前提としている。したがって、伝送帯域が変動するような伝送網へそのまま適用することはできない。また、開示されている方法は、自画像と相手側の子画面の重ね合わせを考慮した方法であって、自端末で親画面と複数の子画面を同時に伝送するという場合に、そのまま適用することは困難である。
【0015】
本発明は、上記のような課題を解消するためになされたものであって、広角カメラ映像全体を符号化伝送することなく、広角映像中の重要領域の一覧性を高めながら、効率的な情報伝送を可能とする映像符号化伝送装置を提供することを目的とする。
【0016】
【課題を解決するための手段】
この課題を解決するために本発明は、広角映像から第一の領域と複数の第二の領域の切り出しを行う映像切り出し部、第一の領域から非重要領域の抽出を行う主領域処理部、第一の領域の符号化処理を行う主領域符号化部、第二の領域から重要領域の抽出を行う補助領域処理部、重要領域の符号化処理を行う補助領域符号化部、非重要領域に重ね合わせる重要領域を決定し、第一の領域および重要領域に符号量の割り当てを行う符号量制御部を備えたものである。
【0017】
これにより、高解像度な広角カメラによって撮影された映像を、伝送帯域の変動あるいは重要度に合わせて符号化伝送の基本部分となる主領域と主領域以外の領域である補助領域とに分割し、主領域中から非重要領域を選択して、その領域に割り当てる符号量を低減するとともに、補助領域中の重要領域を符号化した映像を、符号化した主領域中の非重要領域上に重ねあわせることによって、補助領域中の重要領域を符号化した映像を、符号化した主領域中の非重要領域上に重ね合わせることが可能となり、広角カメラ映像全体を符号化伝送することなく、広角映像中の重要領域の一覧性を高めながら、効率的に映像伝送できる、という効果が得られる。
【0018】
さらに本願発明は、映像切り出し部が、第一の特定領域を多く含むように第一の領域を決定することを特徴とする。これにより、第一の領域を主要部として効果的に選択することができる。
【0019】
さらに、第一の特定領域が、所定のサイズ以下でかつ動きの大きな映像領域を多く含む領域であることにより、活発に移動する被写体をより多く含む領域を主要部として効果的に選択でき、また、第一の特定領域が、所定のサイズ以下でかつ人物の顔を多く含む映像領域を多く含む領域により、例えば監視映像などで人物を特定したい映像を伝送したいときなど、より効果的に主要部を選択することができる。
【0020】
さらに、第一の領域より非重要領域を、動きが小さかったり、人物の顔などが含まれない領域から、第二の領域より重要領域を、動きが大きかったり、人物の顔などが含まれている領域から選ぶことにより、表示画面や伝送帯域に制限がある受信側に対して、広角映像の全体を高画質で伝送することなく、重要な情報を欠損させることなく、符号量を調節して伝送することができる。
【0021】
さらに、本願発明では、映像受信端末から送信される映像データを受信する伝送情報受信部をさらに具備することにより、ユーザの嗜好、および現状の伝送状況等に照らし合わせて、より動的に目標符号量を設定することができる。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態について、図1から図14を用いて説明する。
【0023】
(実施の形態1)
図1は本発明の第一の実施形態における映像符号化伝送装置の構成の一例を示す図である。図1において、101はCCD等の受光素子を備え広角を撮影できる広角カメラより広角映像を取得する映像入力部、102は映像入力部101により入力された映像を一時的に記憶するための映像記憶部、111は本発明の映像符号化伝送装置の動作を決めるためのパラメータを記憶する動作パラメータ記憶部、103は動作パラメータ記憶部111に記憶されているパラメータに基づき、映像記憶部102に記憶されている広角映像から符号化伝送の基本部分である主領域および主領域以外の領域である補助領域の切り出しを行う映像切り出し部、104は映像切り出し部103により切り出された主領域から非重要領域の抽出を行う主領域処理部、105は主領域処理部104より出力される主領域映像の符号化処理を行う主領域符号化部、107は映像切り出し部103により切り出された補助領域から重要領域の抽出を行う補助領域処理部、108は補助領域処理部107より出力される重要領域映像の符号化処理を行う補助領域符号化部、106は動作パラメータ記憶部111に記憶された動作パラメータ、主領域処理部104より取得する非重要領域に関する情報、補助領域処理部107より取得する重要領域に関する情報、主領域符号化部105より取得する符号量、および補助領域符号化部108より取得する符号量に基づき非重要領域や重要領域を決定して各領域に符号量の割り当てを行う符号量制御部106、109は主領域符号化部105および補助領域符号化部108から出力される符号化映像データを多重化する映像多重化部、110は映像多重化部109により主領域および補助領域の映像が多重化された映像データをネットワーク環境に合わせてパケット化して伝送を行う映像送信部である。
【0024】
図2は、本発明の第一の実施形態における映像符号化伝送装置の利用形態の一例を示す図である。201−1、201−2は本発明の映像符号化伝送装置、202は映像符号化伝送装置201−1、201−2より送信される符号化映像を受信し復号して画面に表示するための映像受信端末、203は映像符号化装置201−1、201−2より送信される符号化映像を蓄積する映像蓄積装置、204は映像符号化装置201−1、201−2、映像受信端末202、映像蓄積装置203を接続するネットワークである。ここでネットワーク204は、LANやWANなどのIPネットワークのみならず、ATM等の他の伝送方式のネットワークを使用しても良い。また、映像受信端末202は、本発明の映像符号化伝送装置により使用される符号化方式(例えばMPEG4)により符号化された映像データの復号部を持つ必要があるが、一般的に使用されているMPEG4デコーダを用いればよい。
【0025】
以上のように構成された映像符号化伝送装置について、以下その動作を説明する。
【0026】
最初に本発明の映像符号化伝送装置の動作概要を、図3および図4を用いて説明する。図3は本発明の第一の実施形態における映像符号化伝送装置が処理対象とする広角映像領域の一例を示す図である。本発明の映像符号化伝送装置では、図3に示すような広角映像領域(座標(0,0)、(x、0)、(0、y)、(x、y)で定義される)を入力として、その広角映像領域を、符号化伝送する基本部分である主領域301(座標(a、0)、(b、0)、(a、y)、(b、y)で定義される)とそれ以外の領域である補助領域302−1(座標(0,0)、(a、0)、(0、y)、(a、y)で定義される)および補助領域302−2((b、0)、(x、0)、(b、y)、(x、y)で定義される)とに分割する。この図では、主領域一つ、補助領域二つに分割しているが、この分割数は自由に変更可能である。二種類の領域に分割したのち、主領域301内で非重要な領域を検出し、低画質化領域とする。図3では、低画質化領域304−1(座標(ex1、ey1)、(fx1、fy1)で定義される)および低画質化領域304−2(座標(ex2、ey2)、(fx2、fy2)で定義される)として図示されている。補助領域302−1、302−2内では、重要な領域を検出し、子画面領域とする。図3では、子画面領域303−1(座標(cx1、cy1)、(dx1、dy1)で定義される)および子画面領域303−2(座標(cx2、cy2)、(dx2、dy2)で定義される)として図示されている。主領域内での低画質化領域および補助領域内での子画面領域を検出後、主領域上の低画質化領域を低画質に符号化した上に、補助領域中の子画面領域を符号化した映像を重ね合わせて伝送を行う。具体例を図4に示す。図4は本発明の第一の実施形態における映像符号化伝送装置の送信映像の一例を示す図であり、図3に示す広角映像領域から生成、符号化された映像である。主領域401(座標(a、0)、(b、0)、(a、y)、(b、y)で定義される)は主領域301と同一であり、子画面領域402−1(座標(ex1、ey1)、(fx1、fy1)で定義される)、402−2(座標(ex2、ey2)、(fx2、fy2)で定義される)は、それぞれ子画面領域303−1、303−2に対応する。
【0027】
次に本発明の映像符号化伝送装置の詳細な動作を、図5から図11を用いて説明する。
【0028】
まず、映像入力部101はCCD等の受光素子を備える広角カメラから広角映像を1フレーム分取得し、DRAMやフラッシュメモリなどのメモリ上にある映像記憶部102へ蓄積する。各機能ブロックは、1フレーム単位で処理を行う。また、動作パラメータ記憶部111は、本発明の映像符号化伝送装置に対して、映像の符号化伝送を開始する前に、初期情報としてユーザが直接、あるいは映像受信端末202や映像蓄積装置203が、本装置に与える「伝送映像目標符号量(本発明の装置が符号化する際の目標となる符号量)」、「初期ネットワーク伝送帯域」、「受信可能映像サイズ(映像受信端末202における表示能力)」、「フレームレート(広角カメラから映像を取得する毎秒あたりのフレーム数)」などの初期パラメータが格納している。これらの初期パラメータの映像受信端末202や映像蓄積装置203との受渡し方法については、広く用いられている方法(SIP+SDP、RTSP+SDPなど)により行うことが可能である。
【0029】
次に、映像記憶部102に広角映像が蓄積されると、映像切り出し部103が図5に示すフローチャートに従って動作する。図5は、本発明の第一の実施形態における映像符号化装置の映像切り出し部の動作を示すフローチャートである。
【0030】
映像切り出し部103の動作は、ステップ501〜ステップ504からなっている。
【0031】
ステップ501の動き検出ステップでは、映像記憶部102に蓄積されている広角映像から、過去の映像と比較して動きのあるブロックを検出する。動きの検出に関しては、世の中で広く使用されているMPEG2,MPEG4などの符号化方式で使用している動き検出方法を用いる。
【0032】
図6は本発明の第一の実施形態における映像符号化伝送装置のブロック単位の動き検出を説明する図である。図6を用いて、動き検出ステップ501について簡単に説明する。カメラで撮影された映像領域601を一定数の画素からなる動き検出ブロック602に分割し、動き検出ブロック単位で処理を行う。MPEG2、MPEG4ではこの動き検出ブロック602をマクロブロックと呼んでおり、例えば16×16の画素からなっている。各々の動き検出ブロック602について、過去の映像領域中の動き検出ブロックと比較し、類似する動き検出ブロックを検索する。類似する動き検出ブロックを発見すると、現在の動き検出ブロック602の位置へ移動させるために必要な動きベクトル603を求める。動きベクトル603は、例えばx方向に100画素、y方向に200画素という形式で表現するが、動き検出ブロック単位でも良いし、あるいは、40度方向(映像領域のx軸を基準(0度)として時計回りの角度として表現)に150画素という表現でも同様である。以降では、角度と画素数の組み合わせで動きベクトルを表現するものとして説明を行う。類似する動き検出ブロックが発見できない場合には、当該動き検出ブロック602の動きベクトル603は角度0度、画素数∞とする。
【0033】
ステップ502の選択領域の決定ステップでは、ステップ501で求めた動きベクトル情報603を利用して選択領域を選択する。動き検出ブロック602を連結したものが選択領域604−1、604−2である。選択領域604−1、604−2の選択は、次のように行う。まず、各動き検出ブロック602の動きベクトル603を調べ、ベクトルの差(角度と画素数)がある閾値(例えば10%)内のベクトルを求める。動きベクトルの差が閾値以下の動き検出ブロック中で、連結するブロックをそれぞれ集めて、選択領域604−1、604−2とする。選択領域604−1、604−2が矩形にならない場合には、近傍の動き検出ブロックを連結することで、矩形になるように変更する。選択領域は図10に示す選択領域管理テーブルにより管理を行う。図10は、本発明の第一の実施形態における映像符号化伝送装置の選択領域管理テーブルの一例を示す図である。選択領域管理テーブルは、選択領域を識別するための「領域ID」、選択領域の左上の動き検出ブロック602の「左上座標」、選択領域の右下の動き検出ブロック602の「右下座標」、選択領域内の動き検出ブロック602の動きベクトル603の「平均動き量」(単位は画素数)、選択領域内の動き検出ブロック602の動きベクトル603の「平均動き方向」(単位は度)からなっている。例えば、領域IDが1の選択領域は、左上座標(xa1、ya1)、右下座標(xb1、yb1)、平均動き量10画素、平均動き方向30度である。
【0034】
ステップ503の主領域および補助領域の決定ステップでは、選択領域管理テーブルの検索をし、平均動き量の大きな選択領域を可能な限り多く含み、かつ、動作パラメータ記憶部111に蓄積されている「受信可能映像サイズ」を超えないように主領域を決定する。決定した主領域が図3に示すようになったものとして、以降の説明を行う。広角映像領域から主領域301以外の領域を、補助領域302−1、302−2とする。
【0035】
ステップ504の主領域および補助領域の切り出しステップでは、ステップ503で決定した、主領域301、補助領域302−1、302−2を広角映像領域から切り出し、それぞれ主領域処理部104および補助領域処理部107へ送り出す。また、同時に選択領域管理テーブルも主領域処理部104および補助領域処理部107へ送り出す。
【0036】
次に、図8を用いて主領域処理部104の動作を説明する。図8は、本発明の第1の実施形態における映像符号化伝送装置の主領域処理部の動作を示すフローチャートである。
【0037】
主領域処理部104の動作は、ステップ801とステップ802からなっている。
【0038】
ステップ801の低画質化領域選択ステップでは、映像切り出し部103から受け取った選択領域管理テーブルを参照しながら、低画質化領域を選択する。低画質化領域とは、平均動き量の値がある閾値(例えば32画素)以下の領域である。
【0039】
ステップ802の低画質化領域管理テーブル作成ステップでは、ステップ801によって選択された低画質化領域の情報を一覧にした低画質化領域管理テーブルを作成する。低画質化領域管理テーブルの形式は、図10に示す選択領域管理テーブルと同じものである。より具体的には、低画質化領域管理テーブルは、選択領域管理テーブルの中からステップ801で選択された低画質化領域の中から、領域サイズ(領域に含まれる総画素数)の大きい順に領域を選択して、順次各項目をコピーすれば作成可能である。また、映像切り出し部103から受け取った主領域301の映像データを、主領域符号化部105へと送り出す。
【0040】
次に、図9を用いて補助領域処理部107の動作を説明する。図9は、本発明の第1の実施形態における映像符号化伝送装置の補助領域処理部の動作を示すフローチャートである。
【0041】
補助領域処理部107の動作は、ステップ901とステップ902からなっている。
【0042】
ステップ901の子画面領域選択ステップでは、映像切り出し部103から受け取った選択領域管理テーブルを参照しながら、子画面領域を選択する。子画面領域は、平均動き量の値が閾値(例えば320画素)以上の領域である。
【0043】
ステップ902の子画面領域管理テーブル作成ステップでは、ステップ901によって選択された子画面領域の情報を一覧にした子画面領域管理テーブルを作成する。子画面領域管理テーブルの形式は、図10に示す選択領域管理テーブルと同じものである。より具体的には、子画面領域管理テーブルは、選択領域管理テーブルの中からステップ901で選択された子画面領域の中から、領域サイズの大きい順に領域を選択して、順次各項目をコピーすれば作成可能である。また、映像切り出し部103から受け取った補助領域302−1、302−2の映像データを、補助領域符号化部107へと受け渡す。
【0044】
次に、図7を用いて符号量制御部106の動作を説明する。図7は、本発明の第1の実施形態における映像符号化伝送装置の符号量制御部の動作を示すフローチャートである。
【0045】
符号量制御部106の動作は、ステップ701〜ステップ710からなっている。
【0046】
ステップ701では、符号量補正値を0に初期化し、動作パラメータ記憶部111に格納されている「伝送映像目標符号量」を取得する。伝送映像目標符号量は、本装置が符号化伝送する映像データの目標符号量である。また、符号量補正値は、各フレームを符号化する際の目標符号量であるフレーム符合量を補正するための値である。
【0047】
ステップ702のフレーム符号量設定ステップでは、動作パラメータ記憶部111に格納されている「伝送映像目標符号量」と「フレームレート」および符号量補正値からフレーム符号量を求める。ここでは、各フレームに対して同一の符号量を割り当てる場合には、例えば以下の(式1)に示す式によりフレーム符号量を設定する。
【0048】
(式1):フレーム符号量=(「伝送映像目標符号量」÷「フレームレート」)−符号量補正値
なお、上記は、各フレーム同一の符号量割り当てを行ったが、フレーム毎に割当量を変更するようにしても良い。
【0049】
ステップ703の主領域情報取得ステップでは、主領域処理部104から低画質化領域管理テーブルを取得する。
【0050】
ステップ704の補助領域情報取得ステップでは、補助領域処理部107から子画面領域管理テーブルを取得する。
【0051】
ステップ705の低画質化領域および子画面領域の決定と符号量割り当てステップでは、ステップ703で取得した低画質化領域管理テーブルおよびステップ704取得した子画面領域管理テーブルおよび動作パラメータ記憶部111に格納されている「伝送映像目標符号量」から、低画質化領域と子画面領域を決定し、各領域への符号量割り当てを行う。割り当て結果として、図11に示す管理テーブルを作成する。
【0052】
図11は、本発明の第1の実施形態における映像符号化伝送装置の選択領域対応関係管理テーブルの一例を示す図である。選択領域対応関係管理テーブルは、低画質化領域を識別するための「低画質化領域ID」(低画質化領域管理テーブル中の「領域ID」と同一)、低画質化領域上に重ねあわされる子画面領域を識別するための「子画面領域ID」(子画面領域管理テーブル中の「領域ID」と同一)、低画質化領域の符号化する際の目標符合量となる「低画質化領域目標符号量」(単位はビット)、子画面領域を符号化する際の目標符合量となる「子画面領域目標符号量」(単位はビット)からなっている。例えば、図11の1行目は、低画質化領域ID1の領域の上に、子画面領域ID2の領域を重ね、それぞれの領域の符号量が1000、20000bitであることを示している。
【0053】
具体的には、次の手順で選択領域対応管理テーブルを作成する。まず、低画質化領域管理テーブルから、領域サイズが大きい順に低画質化領域を一定個数(例えば3領域)選択する。低画質化領域が主領域中で占める割合が、大きくなり過ぎないように(例えば、占める割合が50%以下)選択する。次に、子画面領域管理テーブルを参照して、領域サイズが大きい順に、先に選択した低画質化領域に重ねるように決める。ただし、重ね合わせる子画面領域の領域サイズが、隠される低画質化領域の領域サイズより大きくならないように決定する。
【0054】
最後に、低画質化領域と子画面領域の各組に対して、以下の方法で符号量の割り当てを行う。まず、(式2)で示す式により、低画質化領域の旧割り当て符号量を求める。
【0055】
(式2):低画質化領域への旧割り当て符号量=フレーム符号量×(低画質化領域の領域サイズ÷主領域の領域サイズ)
なお、上記は、各フレーム内で均一に符号量が割り当てられていることを前提としているが、フレーム内で均一でない場合に対応することも容易である。
【0056】
次に、旧割り当て符号量を一定の比率(例えば1対9)で、低画質化領域の目標符号量と子画面領域の目標符号量を割り当てる。
【0057】
また、低画質化領域以外の領域である通常領域の目標符号量の割り当てを、(式3)で示す式により行う。
【0058】
(式3):通常領域目標符号量=フレーム符号量−(低画質化領域目標符号量の和)
ステップ706の主領域符号化要求ステップでは、低画質化領域管理テーブルおよびステップ705で作成した選択領域対応関係管理テーブルおよび通常領域目標符号量を、主領域符号化部105へ通知するとともに符号化の要求を行う。
【0059】
ステップ707の補助領域符号化要求ステップでは、子画面領域管理テーブルおよびステップ5で作成した選択領域関係管理テーブルを、補助領域符号化部107へ通知するとともに符号化の要求を行う。
【0060】
ステップ708の主領域結果符号量取得ステップでは、主領域符号化部105から、主領域1フレーム分を符号化した結果の符合量である主領域結果符合量を取得する。
【0061】
ステップ709の補助領域結果符号量取得ステップでは、補助領域符号化部108から、重要領域1フレーム分を符号化した結果の符合量である補助領域結果符合量を取得する。
【0062】
ステップ710の符号量補正値決定ステップでは、ステップ702で設定したフレーム符号量、ステップ708、709で取得した主領域結果符号量、補助領域結果符号量から、符号量補正値を決定する。符合量補正値の決定は、例えば(式4)に示す式により行う。
【0063】
(式4):符号量補正値=フレーム符号量−(主領域結果符号量+補助領域結果符号量)
符号量を使用しすぎた場合には、符号量補正値が負の値になり、逆に、余った場合には、正の値になる。符号量補正値を次フレームのフレーム符号量に反映する(使いすぎた場合には次フレームで使用する符合量を減らし、余った場合には次フレームで使用する符号量を増やす)ことにより、「伝送映像目標符号量」に近づけるように補正される。ステップ702へと戻る。
【0064】
次に、主領域符号化部105は、主領域処理部104から受け取った主領域301のデータおよび符号量制御部106から受け取った低画質化領域管理テーブル、選択領域対応関係管理テーブルおよび通常領域(主領域中の低画質化領域以外の領域)目標符号量に基づき、主領域301の符号化を行う。符号化方式としては、MPEG4などの標準的なものを用いればよいが、これらに限らず各種方式を使用可能である。符号化の際には、低画質化領域への割り当て符号量および通常領域符号量を守るように符号化を行う。より具体的には、例えば、低画質化領域ID1、2、3で示される領域(主領域中のどこの領域であるかを示す領域情報は選択領域管理テーブルより得る)を、低画質化領域目標量1000、1500,2000bitでそれぞれ行いながら、通常領域目標符号量を守るように符号化する。その後、符号化した結果の符合量を、符合量制御部106へ通知する。
【0065】
一般的に符号化の際に、大きな量子化ステップ幅で量子化すると情報量を大きく圧縮可能であるが、量子化誤差は大きくなり画質が低下する。逆に、小さな量子化ステップ幅で量子化すると情報量の圧縮量は小さくなるが、量子化誤差は小さくなり画質が向上する。低画質化領域のみ符号量を削減するために、通常領域の量子化ステップ幅よりも当該領域の量子化ステップ幅を大きくすれば良い。
【0066】
次に、補助領域符号化部108は、補助領域処理部107から受け取った子画面領域303−1、303−2のデータおよび符号量制御部106から受け取った子画面領域管理テーブルおよび選択領域対応関係管理テーブルに基づき、子画面領域303−1、302−2の符号化を行う。より具体的には、例えば、子画面領域ID1、2、3で示される領域(補助領域中のどこの領域であるかを示す領域情報は選択領域管理テーブルより得る)を別々に、子画面領域目標符号量12000、20000,18000bitに近づくように符号化を行う。それ以外の領域については符号化を行わない。その後、符号化した結果の符合量を、符合量制御部106へ通知する。個々の子画面領域の符号化方式としては、主領域符号化部105と同様で、MPEG4などの標準的なものを用いればよいが、これらに限らず各種方式を使用可能である。
【0067】
次に、映像多重化部109は、主領域符号化部105から出力される主領域301を符号化した映像データを1オブジェクト、補助領域符号化部108から出力される子画面領域303−1、303−2を符号化した映像データをそれぞれ1オブジェクトとして、一つの映像データとなるように多重化し、映像送信部110に送り出す。多重化方式は、MPEG4のオブジェクト符号化方式を用いればよいが、オブジェクト単位で多重化できる他の方式を用いても良い。
【0068】
最後に、映像送信部110は、映像多重化部109から受け取った多重化映像データを、ネットワークに合わせてパケット化あるいはセル化などを行って、ネットワーク上に送出する。映像データの送出は、動作パラメータ記憶部111に格納されている「初期ネットワーク伝送帯域」を満たすような伝送レートで行う。
【0069】
さらに、上記の説明では、すべての領域に関し矩形であるものとして説明を行っているが、複数のベクトルを用いることにより、領域を矩形以外の他の形状で表現することも可能である。
【0070】
また、映像切り出し部103の動作フローチャートのステップ503で、平均動き量の大きな選択領域を可能な限り多く含むように主領域の選択を行っているが、選択領域を考慮せず固定的に主領域を決定することで、処理を低減しながら、本発明と同様の効果を得ることが可能である。
【0071】
また、映像切り出し部103の動作フローチャートのステップ502の、選択領域の選択の際に、一定サイズ(例えば4動き検出ブロック)以上の領域のみ選択領域管理テーブルへ登録する。これにより、記憶領域の削減、以降の処理で不必要な可能性の高い領域の排除しながら、本発明と同様の効果を得ることが可能である。
【0072】
また、映像切り出し部103、主領域処理部104、補助領域処理部107において、動きベクトルを利用して領域の重要度を判定しているが、例えば、顔画像認識技術と組み合わせて、人の顔が多く含まれる領域を重要領域と判断し、人の顔が含まれていない領域を非重要領域と判断することで、より効率的な映像伝送が可能となる。
【0073】
以上のように、本実施の形態では、高解像度な広角カメラによって撮影された広角映像から、動きの大きな領域を多く含むように主領域を切り出し、さらに、主領域中から動きの小さな領域を低画質化領域として、また補助領域中から動きの大きな領域を子画面領域として選択して、各々を別オブジェクトとして符号化し、子画面領域を低画質化領域上に重ね合わせる構成を備えることにより、広角カメラ映像の一部分(主領域)を見ながらも、それ以外の領域(補助領域)における大きな変化を見逃すことを減らすことが可能となり、その実用的効果は大きい。
【0074】
また、上記に加え、低画質化領域に割り当てる符号量を低減し、低減した符号量を子画面領域に割り当て符号化するような構成を備えることにより、限られた伝送帯域で広角カメラ映像の重要部分を伝送することが可能となり、その実用的効果は大きい。
【0075】
また、低画質化領域への符号量を0にすることなく符号化しているため、子画面領域の表示を行わない場合でも、黒く何も表示されないということはなく、主観的な画質を高めることが可能となり、その実用的効果は大きい。
【0076】
(実施の形態2)
図12は、本発明の第二の実施形態における映像符号化伝送装置の構成の一例を示す図である。図1に示す第一の実施形態における本装置の構成と同じ作用を持つブロックには同一の符号を付している。第一の実施形態との違いは、本装置の動作パラメータを格納している動作パラメータ記憶部1201、映像受信端末202や映像蓄積装置203から映像データの伝送状態を受信する伝送情報受信部1202、多重化されたデータをネットワークに送信する映像送信部1203、広角映像領域から主領域あるいは補助領域の切り出しを行う映像切り出し部1204、符号量の制御を行う符号量制御部1205である。
【0077】
各ブロックの動作について、第一の実施形態との相違点を説明する。
【0078】
新規の機能ブロックである伝送情報受信部1202は、映像受信端末202や映像蓄積装置203から逐次送られてくる「現状ネットワーク伝送帯域」などの伝送情報を受信する。ネットワーク伝送帯域の変動状況を、映像受信端末202や映像蓄積装置203から本装置に送る方法は、RTCPなどが利用できる。
【0079】
動作パラメータ記憶部1202は、第一の実施形態で示した「伝送映像目標符号量」、「初期ネットワーク伝送帯域」、「受信可能映像サイズ」、「フレームレート」などの初期パラメータを格納し、さらに、伝送情報受信部1202により受信した「現状ネットワーク伝送帯域」などの変動パラメータを格納する。
【0080】
映像送信部1203は、第一の実施形態と異なり、動作パラメータ記憶部1202に格納されている「現状ネットワーク伝送帯域」に合わせて、逐次伝送レートを変更する。
【0081】
映像切り出し部1204は、第一の実施形態の作用に加え、「現状ネットワーク伝送帯域」も考慮して、主領域のサイズを変更する。伝送帯域が小さくなった場合には、主領域の領域サイズが小さくなるように(例えば10%伝送帯域が減少したら、10%主領域の領域サイズを減らす)、逆に、伝送帯域が大きくなった場合には主領域の領域サイズを大きくなるようにする。
【0082】
符号量制御部1205は、第一の実施形態の作用に加え、「現状ネットワーク伝送帯域」も考慮して、低画質化領域の個数を変更する。伝送帯域が小さくなった場合には、低画質化領域の個数が少なくなるように(例えば10%伝送帯域が減少したら、1領域分減らす)、逆に、伝送帯域が大きくなった場合には低画質化領域の個数が多くなるようにする。
【0083】
さらに、映像受信端末202を使用しているユーザの主観的な好みを反映させるために、映像受信端末202から下記に示すパラメータを送信するようにしても良い。伝送情報受信部1202でそれらのパラメータを受信して、動作パラメータ1201に保存する。各機能ブロックは、保存されたパラメータを利用して、第一の実施形態あるいは第二の実施形態に示した動作を行う。
【0084】
映像受信端末202から送信するパラメータは例えば、
・ステップ502の動きベクトルの差の閾値
・ステップ801の平均動き量の閾値
・ステップ901の平均動き量の閾値
・ステップ705の低画質化領域の個数
・ステップ705の符号量の割り当て比率
である。
【0085】
以上のように、本実施の形態では、第一の実施形態の構成に加えて、映像受信端末からの伝送情報を受信し、ネットワークの伝送帯域変動に合わせて、主領域の領域サイズや低画質領域の選択方法を変更する構成を備えることにより、ネットワーク変動に応じた品質の広角カメラ映像をユーザに提示することが可能となり、その実用的効果は大きい。
【0086】
また、上記に加え、ユーザによって映像受信端末から本発明の動作を決定する平気動き量の閾値や動きベクトルの差の閾値などを変更可能とする構成を備えることにより、ユーザの主観的な好みの映像をユーザに提示することが可能となり、その実用的効果は大きい。
【0087】
(実施の形態3)
図13は、本発明の第三の実施形態における映像符号化伝送装置の選択領域対応関係管理テーブルの一例を示す図である。第一の実施形態の選択領域対応管理テーブルに、「子画面領域変形フラグ」を追加している。「子画面領域変形フラグ」は、低画質化領域の領域サイズと、重ね合わせた子画面領域の領域サイズが異なる場合に、子画面領域の領域サイズを変形して低画質化領域と同じ領域サイズにするかどうかの判定フラグである。ONの場合には変形を行って同一のサイズにし、OFFの場合には変形を行わない。このフラグの効果について、図14を用いて説明する。図14は、本発明の第3の実施形態における映像符号化伝送装置の送信映像の一例を示す図である。図14は、主領域1401上に子画面領域1402−1、1402−2が重ねあわされている様子を表している。子画面領域1402−1は、「子画面領域変形フラグ」がOFFになっており、低画質化領域1403−1と領域サイズが異なったままに表示されている。一方、子画面領域1402−2は、「子画面領域変形フラグ」がONになっており、低画質化領域1403−2と領域サイズが同一になっている。
【0088】
実際の変形処理は、符号量制御部106からの要求に合わせて補助領域処理部107により行ない、変形後の領域に対して補助領域符号化部108により符号化を行う。
【0089】
以上のように、本実施の形態では、第一の実施の形態の選択領域対応管理テーブルに、低画質化領域の領域サイズと、重ね合わせた子画面領域の領域サイズが異なる場合に、子画面領域の領域サイズを変形して低画質化領域と同じ領域サイズにするかどうかの判定フラグである「子画面領域変形フラグ」を備えることにより、低画質領域の表示領域を無駄にすることなく子画面領域を表示することが可能となり、その実用的効果は大きい。
【0090】
【発明の効果】
以上のように本発明によれば、高解像度な広角カメラによって撮影された映像を、ネットワークの伝送帯域の変動あるいは映像の動きの大きさに合わせて符号化伝送の基本部分となる主領域と主領域以外の領域である補助領域とに分割し、主領域中から非重要領域(低画質化領域)を選択して、その領域に割り当てる符号量を低減するとともに、補助領域中の重要領域(子画面領域)を符号化した映像を、符号化した主領域中の非重要領域上に重ねあわせる構成を備えたことにより、広角カメラ映像全体を符号化伝送することなく、広角映像中の重要領域の一覧性を高めながら、効率的な映像伝送が可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における映像符号化伝送装置の構成の一例を示す図
【図2】本発明の第1の実施形態における映像符号化伝送装置の利用形態の一例を示す図
【図3】本発明の第1の実施形態における映像符号化伝送装置が処理対象とする広角映像領域の一例を示す図
【図4】本発明の第1の実施形態における映像符号化伝送装置の送信映像の一例を示す図
【図5】本発明の第1の実施形態における映像符号化伝送装置の映像切り出し部の動作の一例を示すフローチャート
【図6】本発明の第1の実施形態における映像符号化伝送装置のブロック単位の動き検出を説明する図
【図7】本発明の第1の実施形態における映像符号化伝送装置の符号量制御部の動作の一例を示すフローチャート
【図8】本発明の第1の実施形態における映像符号化伝送装置の主領域処理部の動作の一例を示すフローチャート
【図9】本発明の第1の実施形態における映像符号化伝送装置の補助領域処理部の動作の一例を示すフローチャート
【図10】本発明の第1の実施形態における映像符号化伝送装置の選択領域管理テーブルの一例を示す図
【図11】本発明の第1の実施形態における映像符号化伝送装置の選択領域対応関係管理テーブルの一例を示す図
【図12】本発明の第2の実施形態における映像符号化伝送装置の構成の一例を示す図
【図13】本発明の第3の実施形態における映像符号化伝送装置の選択領域対応関係管理テーブルの一例を示す図
【図14】本発明の第3の実施形態における映像符号化伝送装置の送信映像の一例を示す図
【図15】従来の映像処理装置により伝送される映像を説明する図
【図16】テレビ電話装置で表示される画面を示す図
【符号の説明】
101 映像入力部
102 映像記憶部
103 映像切り出し部
104 主領域処理部
105 主領域符号化部
106 符号量制御部
107 補助領域処理部
108 補助領域符号化部
109 映像多重化部
110 映像送信部
111 動作パラメータ記憶部
【発明の属する技術分野】
本発明は、広角領域を高解像度で撮影した映像を、符号化および伝送する映像符号化伝送装置に関するものである。
【0002】
【従来の技術】
従来、広角カメラを利用した映像監視システムや遠隔モニタリングシステム等に用いられる映像処理装置では、ユーザがカメラから入力された広角映像領域から任意の映像領域を選択すると、映像処理装置が選択領域を受信端末に伝送し、受信端末は表示能力に合わせて画素密度変換処理などを施したのちに選択領域を表示する方法を使用している(特許文献1参照)。
【0003】
図15は、特許文献1の実施の形態を説明する図である。図15では、ユーザが、受信端末のユーザインタフェースにより、カメラから入力されたカメラ撮影領域1501から任意の選択領域1503を選択する。映像処理装置は、ユーザからの指示に合わせて、選択領域1503をカメラ撮影領域から切り出し受信端末に伝送する。受信端末は端末の表示領域に合わせて画素密度変換を行う。これにより、ユーザは、所望する映像領域を受信端末上に表示画面1502として表示できる。
【0004】
この構成により、ユーザがカメラ撮影領域中の任意の領域(選択領域1503)を変更することにより、受信端末により表示される方位およびズーム倍率を変更できることになる。
【0005】
また、特許文献2では、2画面表示機能を備えたテレビ電話装置に関し、親画面中の特定領域(人物の顔や文字領域など)を検出し、その結果に応じて子画面又は親画面の位置/サイズ/表示優先度を制御する方法について開示されている。
【0006】
図16は、特許文献2の実施の形態を説明する図である。図16には、特許文献2を適用前のテレビ電話の表示画面1601と、適用後のテレビ電話の表示画面1604を示している。適用前の表示画面1601では、親画面領域1602中の特定領域(この例では通話相手の顔領域)と、子画面領域1603(この例では自画像)の一部が重なり合っている。一方、適用後の表示画面1604では、親画面領域1602の移動やサイズ変更を行った親画面領域1605と、子画面領域1603は重なり合っていない。このように、親画面あるいは子画面の位置/サイズ/表示優先度を制御することで、特定の領域が重なり合うことを防ぐことが可能となる。
【0007】
また、特許文献3では、2画面表示機能を備えたテレビ電話装置に関し、子画面の表示位置/サイズを考慮した上で、親画面を符号化する方法について開示されている。
【0008】
この例では、子画面により隠されることになる親画面領域の符号量を完全に0にすることなく一定量の符号量を割り当てることで、子画面の位置や大きさの変更、あるいは子画面の消去などを行った際に、画像の無い部分を生じてしまうという問題に対する対処を行っている。
【0009】
具体的な動作としては、自テレビ電話装置は、相手側のテレビ電話装置より、子画面(相手の自画像)の位置やサイズに関する情報を取得し、自テレビ電話装置より送信する映像(自画像)から、相手側端末の子画面が重なり合う領域を決定する。自テレビ電話装置は、決定した領域に対する符合量を、他の同じ面積の領域よりも小さく割り当て符号化し自画像の送信を行う。これにより、子画面が重なる領域の符号量を少なくすることで一画面あたりの符号量を抑えつつ、子画面の表示位置や大きさの変更などによる画質の劣化を少なくできる。
【0010】
【特許文献1】
特開平8−237590号公報(第6図)
【特許文献2】
特開平10−200873号公報(第6図〜第9図)
【特許文献3】
特開2001−45476号公報(第1図)
【0011】
【発明が解決しようとする課題】
しかしながら、近年、CCD等の受光素子の高解像度化および撮影領域の広角化の進展により、広角カメラにより撮影された映像データは、通常の画角のカメラに比べて大きく、1画面あたり数メガバイト以上と非常に大きなものとなってきており、限られた伝送帯域を使用して撮影された映像を伝送するためには、従来の手法では不十分である。
【0012】
特許文献1で開示されている方法を用い、選択領域1503を広角カメラにより撮影されたカメラ撮影領域1501と同じにし、限られた伝送帯域に見合うように非常に高い圧縮率で選択領域1503の映像を圧縮して伝送することは可能である。しかしながら、この手法では、広角カメラの映像を高い圧縮率で圧縮する必要があり、映像受信端末により受信、表示された映像の品質は低いものとなってしまう。また、映像受信端末で受信、表示される映像の品質を高めるために、選択領域1503をカメラ撮影領域1501全体ではなく、ユーザがその一部を一定のサイズ以下(一定以上の画質を確保するため)で選択しながら、低い圧縮率で圧縮しながら伝送することも可能である。しかしながら、この場合には、選択領域1503以外のカメラ撮影領域1501の映像を、ユーザは映像受信端末で見ることができず、広角カメラで撮影した映像データが無駄になる。
【0013】
また、特許文献2では、テレビ電話端末において、通話相手から送信されてくる映像の顔や文字などの特定領域と、自画像が重ならないように、相手映像あるいは自画像の位置/サイズなどを変更するための方法を開示しているが、電話網という固定帯域の伝送網を対象とした方法であり、相手から送信されてくる映像は固定的な伝送帯域を占有できることを前提としている。したがって、伝送帯域が変動するような伝送網へそのまま適用することはできない。また、開示されている方法は相手画像と自画像という関係を対象とした方法であって、親画像と複数の子画像を同時に伝送するという場合に、そのまま適用することは困難である。
【0014】
また、特許文献3では、テレビ電話端末において、通話相手側の子画面表示位置を取得し、自画像中で相手側の子画面が重ね合わされると予想される位置の符号量を低く抑えることで一画面の符号量を抑える方法を開示しているが、特許文献2と同様に電話網という固定帯域の伝送網を対象とした方法であり、送信する映像は固定的な伝送帯域を占有できることを前提としている。したがって、伝送帯域が変動するような伝送網へそのまま適用することはできない。また、開示されている方法は、自画像と相手側の子画面の重ね合わせを考慮した方法であって、自端末で親画面と複数の子画面を同時に伝送するという場合に、そのまま適用することは困難である。
【0015】
本発明は、上記のような課題を解消するためになされたものであって、広角カメラ映像全体を符号化伝送することなく、広角映像中の重要領域の一覧性を高めながら、効率的な情報伝送を可能とする映像符号化伝送装置を提供することを目的とする。
【0016】
【課題を解決するための手段】
この課題を解決するために本発明は、広角映像から第一の領域と複数の第二の領域の切り出しを行う映像切り出し部、第一の領域から非重要領域の抽出を行う主領域処理部、第一の領域の符号化処理を行う主領域符号化部、第二の領域から重要領域の抽出を行う補助領域処理部、重要領域の符号化処理を行う補助領域符号化部、非重要領域に重ね合わせる重要領域を決定し、第一の領域および重要領域に符号量の割り当てを行う符号量制御部を備えたものである。
【0017】
これにより、高解像度な広角カメラによって撮影された映像を、伝送帯域の変動あるいは重要度に合わせて符号化伝送の基本部分となる主領域と主領域以外の領域である補助領域とに分割し、主領域中から非重要領域を選択して、その領域に割り当てる符号量を低減するとともに、補助領域中の重要領域を符号化した映像を、符号化した主領域中の非重要領域上に重ねあわせることによって、補助領域中の重要領域を符号化した映像を、符号化した主領域中の非重要領域上に重ね合わせることが可能となり、広角カメラ映像全体を符号化伝送することなく、広角映像中の重要領域の一覧性を高めながら、効率的に映像伝送できる、という効果が得られる。
【0018】
さらに本願発明は、映像切り出し部が、第一の特定領域を多く含むように第一の領域を決定することを特徴とする。これにより、第一の領域を主要部として効果的に選択することができる。
【0019】
さらに、第一の特定領域が、所定のサイズ以下でかつ動きの大きな映像領域を多く含む領域であることにより、活発に移動する被写体をより多く含む領域を主要部として効果的に選択でき、また、第一の特定領域が、所定のサイズ以下でかつ人物の顔を多く含む映像領域を多く含む領域により、例えば監視映像などで人物を特定したい映像を伝送したいときなど、より効果的に主要部を選択することができる。
【0020】
さらに、第一の領域より非重要領域を、動きが小さかったり、人物の顔などが含まれない領域から、第二の領域より重要領域を、動きが大きかったり、人物の顔などが含まれている領域から選ぶことにより、表示画面や伝送帯域に制限がある受信側に対して、広角映像の全体を高画質で伝送することなく、重要な情報を欠損させることなく、符号量を調節して伝送することができる。
【0021】
さらに、本願発明では、映像受信端末から送信される映像データを受信する伝送情報受信部をさらに具備することにより、ユーザの嗜好、および現状の伝送状況等に照らし合わせて、より動的に目標符号量を設定することができる。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態について、図1から図14を用いて説明する。
【0023】
(実施の形態1)
図1は本発明の第一の実施形態における映像符号化伝送装置の構成の一例を示す図である。図1において、101はCCD等の受光素子を備え広角を撮影できる広角カメラより広角映像を取得する映像入力部、102は映像入力部101により入力された映像を一時的に記憶するための映像記憶部、111は本発明の映像符号化伝送装置の動作を決めるためのパラメータを記憶する動作パラメータ記憶部、103は動作パラメータ記憶部111に記憶されているパラメータに基づき、映像記憶部102に記憶されている広角映像から符号化伝送の基本部分である主領域および主領域以外の領域である補助領域の切り出しを行う映像切り出し部、104は映像切り出し部103により切り出された主領域から非重要領域の抽出を行う主領域処理部、105は主領域処理部104より出力される主領域映像の符号化処理を行う主領域符号化部、107は映像切り出し部103により切り出された補助領域から重要領域の抽出を行う補助領域処理部、108は補助領域処理部107より出力される重要領域映像の符号化処理を行う補助領域符号化部、106は動作パラメータ記憶部111に記憶された動作パラメータ、主領域処理部104より取得する非重要領域に関する情報、補助領域処理部107より取得する重要領域に関する情報、主領域符号化部105より取得する符号量、および補助領域符号化部108より取得する符号量に基づき非重要領域や重要領域を決定して各領域に符号量の割り当てを行う符号量制御部106、109は主領域符号化部105および補助領域符号化部108から出力される符号化映像データを多重化する映像多重化部、110は映像多重化部109により主領域および補助領域の映像が多重化された映像データをネットワーク環境に合わせてパケット化して伝送を行う映像送信部である。
【0024】
図2は、本発明の第一の実施形態における映像符号化伝送装置の利用形態の一例を示す図である。201−1、201−2は本発明の映像符号化伝送装置、202は映像符号化伝送装置201−1、201−2より送信される符号化映像を受信し復号して画面に表示するための映像受信端末、203は映像符号化装置201−1、201−2より送信される符号化映像を蓄積する映像蓄積装置、204は映像符号化装置201−1、201−2、映像受信端末202、映像蓄積装置203を接続するネットワークである。ここでネットワーク204は、LANやWANなどのIPネットワークのみならず、ATM等の他の伝送方式のネットワークを使用しても良い。また、映像受信端末202は、本発明の映像符号化伝送装置により使用される符号化方式(例えばMPEG4)により符号化された映像データの復号部を持つ必要があるが、一般的に使用されているMPEG4デコーダを用いればよい。
【0025】
以上のように構成された映像符号化伝送装置について、以下その動作を説明する。
【0026】
最初に本発明の映像符号化伝送装置の動作概要を、図3および図4を用いて説明する。図3は本発明の第一の実施形態における映像符号化伝送装置が処理対象とする広角映像領域の一例を示す図である。本発明の映像符号化伝送装置では、図3に示すような広角映像領域(座標(0,0)、(x、0)、(0、y)、(x、y)で定義される)を入力として、その広角映像領域を、符号化伝送する基本部分である主領域301(座標(a、0)、(b、0)、(a、y)、(b、y)で定義される)とそれ以外の領域である補助領域302−1(座標(0,0)、(a、0)、(0、y)、(a、y)で定義される)および補助領域302−2((b、0)、(x、0)、(b、y)、(x、y)で定義される)とに分割する。この図では、主領域一つ、補助領域二つに分割しているが、この分割数は自由に変更可能である。二種類の領域に分割したのち、主領域301内で非重要な領域を検出し、低画質化領域とする。図3では、低画質化領域304−1(座標(ex1、ey1)、(fx1、fy1)で定義される)および低画質化領域304−2(座標(ex2、ey2)、(fx2、fy2)で定義される)として図示されている。補助領域302−1、302−2内では、重要な領域を検出し、子画面領域とする。図3では、子画面領域303−1(座標(cx1、cy1)、(dx1、dy1)で定義される)および子画面領域303−2(座標(cx2、cy2)、(dx2、dy2)で定義される)として図示されている。主領域内での低画質化領域および補助領域内での子画面領域を検出後、主領域上の低画質化領域を低画質に符号化した上に、補助領域中の子画面領域を符号化した映像を重ね合わせて伝送を行う。具体例を図4に示す。図4は本発明の第一の実施形態における映像符号化伝送装置の送信映像の一例を示す図であり、図3に示す広角映像領域から生成、符号化された映像である。主領域401(座標(a、0)、(b、0)、(a、y)、(b、y)で定義される)は主領域301と同一であり、子画面領域402−1(座標(ex1、ey1)、(fx1、fy1)で定義される)、402−2(座標(ex2、ey2)、(fx2、fy2)で定義される)は、それぞれ子画面領域303−1、303−2に対応する。
【0027】
次に本発明の映像符号化伝送装置の詳細な動作を、図5から図11を用いて説明する。
【0028】
まず、映像入力部101はCCD等の受光素子を備える広角カメラから広角映像を1フレーム分取得し、DRAMやフラッシュメモリなどのメモリ上にある映像記憶部102へ蓄積する。各機能ブロックは、1フレーム単位で処理を行う。また、動作パラメータ記憶部111は、本発明の映像符号化伝送装置に対して、映像の符号化伝送を開始する前に、初期情報としてユーザが直接、あるいは映像受信端末202や映像蓄積装置203が、本装置に与える「伝送映像目標符号量(本発明の装置が符号化する際の目標となる符号量)」、「初期ネットワーク伝送帯域」、「受信可能映像サイズ(映像受信端末202における表示能力)」、「フレームレート(広角カメラから映像を取得する毎秒あたりのフレーム数)」などの初期パラメータが格納している。これらの初期パラメータの映像受信端末202や映像蓄積装置203との受渡し方法については、広く用いられている方法(SIP+SDP、RTSP+SDPなど)により行うことが可能である。
【0029】
次に、映像記憶部102に広角映像が蓄積されると、映像切り出し部103が図5に示すフローチャートに従って動作する。図5は、本発明の第一の実施形態における映像符号化装置の映像切り出し部の動作を示すフローチャートである。
【0030】
映像切り出し部103の動作は、ステップ501〜ステップ504からなっている。
【0031】
ステップ501の動き検出ステップでは、映像記憶部102に蓄積されている広角映像から、過去の映像と比較して動きのあるブロックを検出する。動きの検出に関しては、世の中で広く使用されているMPEG2,MPEG4などの符号化方式で使用している動き検出方法を用いる。
【0032】
図6は本発明の第一の実施形態における映像符号化伝送装置のブロック単位の動き検出を説明する図である。図6を用いて、動き検出ステップ501について簡単に説明する。カメラで撮影された映像領域601を一定数の画素からなる動き検出ブロック602に分割し、動き検出ブロック単位で処理を行う。MPEG2、MPEG4ではこの動き検出ブロック602をマクロブロックと呼んでおり、例えば16×16の画素からなっている。各々の動き検出ブロック602について、過去の映像領域中の動き検出ブロックと比較し、類似する動き検出ブロックを検索する。類似する動き検出ブロックを発見すると、現在の動き検出ブロック602の位置へ移動させるために必要な動きベクトル603を求める。動きベクトル603は、例えばx方向に100画素、y方向に200画素という形式で表現するが、動き検出ブロック単位でも良いし、あるいは、40度方向(映像領域のx軸を基準(0度)として時計回りの角度として表現)に150画素という表現でも同様である。以降では、角度と画素数の組み合わせで動きベクトルを表現するものとして説明を行う。類似する動き検出ブロックが発見できない場合には、当該動き検出ブロック602の動きベクトル603は角度0度、画素数∞とする。
【0033】
ステップ502の選択領域の決定ステップでは、ステップ501で求めた動きベクトル情報603を利用して選択領域を選択する。動き検出ブロック602を連結したものが選択領域604−1、604−2である。選択領域604−1、604−2の選択は、次のように行う。まず、各動き検出ブロック602の動きベクトル603を調べ、ベクトルの差(角度と画素数)がある閾値(例えば10%)内のベクトルを求める。動きベクトルの差が閾値以下の動き検出ブロック中で、連結するブロックをそれぞれ集めて、選択領域604−1、604−2とする。選択領域604−1、604−2が矩形にならない場合には、近傍の動き検出ブロックを連結することで、矩形になるように変更する。選択領域は図10に示す選択領域管理テーブルにより管理を行う。図10は、本発明の第一の実施形態における映像符号化伝送装置の選択領域管理テーブルの一例を示す図である。選択領域管理テーブルは、選択領域を識別するための「領域ID」、選択領域の左上の動き検出ブロック602の「左上座標」、選択領域の右下の動き検出ブロック602の「右下座標」、選択領域内の動き検出ブロック602の動きベクトル603の「平均動き量」(単位は画素数)、選択領域内の動き検出ブロック602の動きベクトル603の「平均動き方向」(単位は度)からなっている。例えば、領域IDが1の選択領域は、左上座標(xa1、ya1)、右下座標(xb1、yb1)、平均動き量10画素、平均動き方向30度である。
【0034】
ステップ503の主領域および補助領域の決定ステップでは、選択領域管理テーブルの検索をし、平均動き量の大きな選択領域を可能な限り多く含み、かつ、動作パラメータ記憶部111に蓄積されている「受信可能映像サイズ」を超えないように主領域を決定する。決定した主領域が図3に示すようになったものとして、以降の説明を行う。広角映像領域から主領域301以外の領域を、補助領域302−1、302−2とする。
【0035】
ステップ504の主領域および補助領域の切り出しステップでは、ステップ503で決定した、主領域301、補助領域302−1、302−2を広角映像領域から切り出し、それぞれ主領域処理部104および補助領域処理部107へ送り出す。また、同時に選択領域管理テーブルも主領域処理部104および補助領域処理部107へ送り出す。
【0036】
次に、図8を用いて主領域処理部104の動作を説明する。図8は、本発明の第1の実施形態における映像符号化伝送装置の主領域処理部の動作を示すフローチャートである。
【0037】
主領域処理部104の動作は、ステップ801とステップ802からなっている。
【0038】
ステップ801の低画質化領域選択ステップでは、映像切り出し部103から受け取った選択領域管理テーブルを参照しながら、低画質化領域を選択する。低画質化領域とは、平均動き量の値がある閾値(例えば32画素)以下の領域である。
【0039】
ステップ802の低画質化領域管理テーブル作成ステップでは、ステップ801によって選択された低画質化領域の情報を一覧にした低画質化領域管理テーブルを作成する。低画質化領域管理テーブルの形式は、図10に示す選択領域管理テーブルと同じものである。より具体的には、低画質化領域管理テーブルは、選択領域管理テーブルの中からステップ801で選択された低画質化領域の中から、領域サイズ(領域に含まれる総画素数)の大きい順に領域を選択して、順次各項目をコピーすれば作成可能である。また、映像切り出し部103から受け取った主領域301の映像データを、主領域符号化部105へと送り出す。
【0040】
次に、図9を用いて補助領域処理部107の動作を説明する。図9は、本発明の第1の実施形態における映像符号化伝送装置の補助領域処理部の動作を示すフローチャートである。
【0041】
補助領域処理部107の動作は、ステップ901とステップ902からなっている。
【0042】
ステップ901の子画面領域選択ステップでは、映像切り出し部103から受け取った選択領域管理テーブルを参照しながら、子画面領域を選択する。子画面領域は、平均動き量の値が閾値(例えば320画素)以上の領域である。
【0043】
ステップ902の子画面領域管理テーブル作成ステップでは、ステップ901によって選択された子画面領域の情報を一覧にした子画面領域管理テーブルを作成する。子画面領域管理テーブルの形式は、図10に示す選択領域管理テーブルと同じものである。より具体的には、子画面領域管理テーブルは、選択領域管理テーブルの中からステップ901で選択された子画面領域の中から、領域サイズの大きい順に領域を選択して、順次各項目をコピーすれば作成可能である。また、映像切り出し部103から受け取った補助領域302−1、302−2の映像データを、補助領域符号化部107へと受け渡す。
【0044】
次に、図7を用いて符号量制御部106の動作を説明する。図7は、本発明の第1の実施形態における映像符号化伝送装置の符号量制御部の動作を示すフローチャートである。
【0045】
符号量制御部106の動作は、ステップ701〜ステップ710からなっている。
【0046】
ステップ701では、符号量補正値を0に初期化し、動作パラメータ記憶部111に格納されている「伝送映像目標符号量」を取得する。伝送映像目標符号量は、本装置が符号化伝送する映像データの目標符号量である。また、符号量補正値は、各フレームを符号化する際の目標符号量であるフレーム符合量を補正するための値である。
【0047】
ステップ702のフレーム符号量設定ステップでは、動作パラメータ記憶部111に格納されている「伝送映像目標符号量」と「フレームレート」および符号量補正値からフレーム符号量を求める。ここでは、各フレームに対して同一の符号量を割り当てる場合には、例えば以下の(式1)に示す式によりフレーム符号量を設定する。
【0048】
(式1):フレーム符号量=(「伝送映像目標符号量」÷「フレームレート」)−符号量補正値
なお、上記は、各フレーム同一の符号量割り当てを行ったが、フレーム毎に割当量を変更するようにしても良い。
【0049】
ステップ703の主領域情報取得ステップでは、主領域処理部104から低画質化領域管理テーブルを取得する。
【0050】
ステップ704の補助領域情報取得ステップでは、補助領域処理部107から子画面領域管理テーブルを取得する。
【0051】
ステップ705の低画質化領域および子画面領域の決定と符号量割り当てステップでは、ステップ703で取得した低画質化領域管理テーブルおよびステップ704取得した子画面領域管理テーブルおよび動作パラメータ記憶部111に格納されている「伝送映像目標符号量」から、低画質化領域と子画面領域を決定し、各領域への符号量割り当てを行う。割り当て結果として、図11に示す管理テーブルを作成する。
【0052】
図11は、本発明の第1の実施形態における映像符号化伝送装置の選択領域対応関係管理テーブルの一例を示す図である。選択領域対応関係管理テーブルは、低画質化領域を識別するための「低画質化領域ID」(低画質化領域管理テーブル中の「領域ID」と同一)、低画質化領域上に重ねあわされる子画面領域を識別するための「子画面領域ID」(子画面領域管理テーブル中の「領域ID」と同一)、低画質化領域の符号化する際の目標符合量となる「低画質化領域目標符号量」(単位はビット)、子画面領域を符号化する際の目標符合量となる「子画面領域目標符号量」(単位はビット)からなっている。例えば、図11の1行目は、低画質化領域ID1の領域の上に、子画面領域ID2の領域を重ね、それぞれの領域の符号量が1000、20000bitであることを示している。
【0053】
具体的には、次の手順で選択領域対応管理テーブルを作成する。まず、低画質化領域管理テーブルから、領域サイズが大きい順に低画質化領域を一定個数(例えば3領域)選択する。低画質化領域が主領域中で占める割合が、大きくなり過ぎないように(例えば、占める割合が50%以下)選択する。次に、子画面領域管理テーブルを参照して、領域サイズが大きい順に、先に選択した低画質化領域に重ねるように決める。ただし、重ね合わせる子画面領域の領域サイズが、隠される低画質化領域の領域サイズより大きくならないように決定する。
【0054】
最後に、低画質化領域と子画面領域の各組に対して、以下の方法で符号量の割り当てを行う。まず、(式2)で示す式により、低画質化領域の旧割り当て符号量を求める。
【0055】
(式2):低画質化領域への旧割り当て符号量=フレーム符号量×(低画質化領域の領域サイズ÷主領域の領域サイズ)
なお、上記は、各フレーム内で均一に符号量が割り当てられていることを前提としているが、フレーム内で均一でない場合に対応することも容易である。
【0056】
次に、旧割り当て符号量を一定の比率(例えば1対9)で、低画質化領域の目標符号量と子画面領域の目標符号量を割り当てる。
【0057】
また、低画質化領域以外の領域である通常領域の目標符号量の割り当てを、(式3)で示す式により行う。
【0058】
(式3):通常領域目標符号量=フレーム符号量−(低画質化領域目標符号量の和)
ステップ706の主領域符号化要求ステップでは、低画質化領域管理テーブルおよびステップ705で作成した選択領域対応関係管理テーブルおよび通常領域目標符号量を、主領域符号化部105へ通知するとともに符号化の要求を行う。
【0059】
ステップ707の補助領域符号化要求ステップでは、子画面領域管理テーブルおよびステップ5で作成した選択領域関係管理テーブルを、補助領域符号化部107へ通知するとともに符号化の要求を行う。
【0060】
ステップ708の主領域結果符号量取得ステップでは、主領域符号化部105から、主領域1フレーム分を符号化した結果の符合量である主領域結果符合量を取得する。
【0061】
ステップ709の補助領域結果符号量取得ステップでは、補助領域符号化部108から、重要領域1フレーム分を符号化した結果の符合量である補助領域結果符合量を取得する。
【0062】
ステップ710の符号量補正値決定ステップでは、ステップ702で設定したフレーム符号量、ステップ708、709で取得した主領域結果符号量、補助領域結果符号量から、符号量補正値を決定する。符合量補正値の決定は、例えば(式4)に示す式により行う。
【0063】
(式4):符号量補正値=フレーム符号量−(主領域結果符号量+補助領域結果符号量)
符号量を使用しすぎた場合には、符号量補正値が負の値になり、逆に、余った場合には、正の値になる。符号量補正値を次フレームのフレーム符号量に反映する(使いすぎた場合には次フレームで使用する符合量を減らし、余った場合には次フレームで使用する符号量を増やす)ことにより、「伝送映像目標符号量」に近づけるように補正される。ステップ702へと戻る。
【0064】
次に、主領域符号化部105は、主領域処理部104から受け取った主領域301のデータおよび符号量制御部106から受け取った低画質化領域管理テーブル、選択領域対応関係管理テーブルおよび通常領域(主領域中の低画質化領域以外の領域)目標符号量に基づき、主領域301の符号化を行う。符号化方式としては、MPEG4などの標準的なものを用いればよいが、これらに限らず各種方式を使用可能である。符号化の際には、低画質化領域への割り当て符号量および通常領域符号量を守るように符号化を行う。より具体的には、例えば、低画質化領域ID1、2、3で示される領域(主領域中のどこの領域であるかを示す領域情報は選択領域管理テーブルより得る)を、低画質化領域目標量1000、1500,2000bitでそれぞれ行いながら、通常領域目標符号量を守るように符号化する。その後、符号化した結果の符合量を、符合量制御部106へ通知する。
【0065】
一般的に符号化の際に、大きな量子化ステップ幅で量子化すると情報量を大きく圧縮可能であるが、量子化誤差は大きくなり画質が低下する。逆に、小さな量子化ステップ幅で量子化すると情報量の圧縮量は小さくなるが、量子化誤差は小さくなり画質が向上する。低画質化領域のみ符号量を削減するために、通常領域の量子化ステップ幅よりも当該領域の量子化ステップ幅を大きくすれば良い。
【0066】
次に、補助領域符号化部108は、補助領域処理部107から受け取った子画面領域303−1、303−2のデータおよび符号量制御部106から受け取った子画面領域管理テーブルおよび選択領域対応関係管理テーブルに基づき、子画面領域303−1、302−2の符号化を行う。より具体的には、例えば、子画面領域ID1、2、3で示される領域(補助領域中のどこの領域であるかを示す領域情報は選択領域管理テーブルより得る)を別々に、子画面領域目標符号量12000、20000,18000bitに近づくように符号化を行う。それ以外の領域については符号化を行わない。その後、符号化した結果の符合量を、符合量制御部106へ通知する。個々の子画面領域の符号化方式としては、主領域符号化部105と同様で、MPEG4などの標準的なものを用いればよいが、これらに限らず各種方式を使用可能である。
【0067】
次に、映像多重化部109は、主領域符号化部105から出力される主領域301を符号化した映像データを1オブジェクト、補助領域符号化部108から出力される子画面領域303−1、303−2を符号化した映像データをそれぞれ1オブジェクトとして、一つの映像データとなるように多重化し、映像送信部110に送り出す。多重化方式は、MPEG4のオブジェクト符号化方式を用いればよいが、オブジェクト単位で多重化できる他の方式を用いても良い。
【0068】
最後に、映像送信部110は、映像多重化部109から受け取った多重化映像データを、ネットワークに合わせてパケット化あるいはセル化などを行って、ネットワーク上に送出する。映像データの送出は、動作パラメータ記憶部111に格納されている「初期ネットワーク伝送帯域」を満たすような伝送レートで行う。
【0069】
さらに、上記の説明では、すべての領域に関し矩形であるものとして説明を行っているが、複数のベクトルを用いることにより、領域を矩形以外の他の形状で表現することも可能である。
【0070】
また、映像切り出し部103の動作フローチャートのステップ503で、平均動き量の大きな選択領域を可能な限り多く含むように主領域の選択を行っているが、選択領域を考慮せず固定的に主領域を決定することで、処理を低減しながら、本発明と同様の効果を得ることが可能である。
【0071】
また、映像切り出し部103の動作フローチャートのステップ502の、選択領域の選択の際に、一定サイズ(例えば4動き検出ブロック)以上の領域のみ選択領域管理テーブルへ登録する。これにより、記憶領域の削減、以降の処理で不必要な可能性の高い領域の排除しながら、本発明と同様の効果を得ることが可能である。
【0072】
また、映像切り出し部103、主領域処理部104、補助領域処理部107において、動きベクトルを利用して領域の重要度を判定しているが、例えば、顔画像認識技術と組み合わせて、人の顔が多く含まれる領域を重要領域と判断し、人の顔が含まれていない領域を非重要領域と判断することで、より効率的な映像伝送が可能となる。
【0073】
以上のように、本実施の形態では、高解像度な広角カメラによって撮影された広角映像から、動きの大きな領域を多く含むように主領域を切り出し、さらに、主領域中から動きの小さな領域を低画質化領域として、また補助領域中から動きの大きな領域を子画面領域として選択して、各々を別オブジェクトとして符号化し、子画面領域を低画質化領域上に重ね合わせる構成を備えることにより、広角カメラ映像の一部分(主領域)を見ながらも、それ以外の領域(補助領域)における大きな変化を見逃すことを減らすことが可能となり、その実用的効果は大きい。
【0074】
また、上記に加え、低画質化領域に割り当てる符号量を低減し、低減した符号量を子画面領域に割り当て符号化するような構成を備えることにより、限られた伝送帯域で広角カメラ映像の重要部分を伝送することが可能となり、その実用的効果は大きい。
【0075】
また、低画質化領域への符号量を0にすることなく符号化しているため、子画面領域の表示を行わない場合でも、黒く何も表示されないということはなく、主観的な画質を高めることが可能となり、その実用的効果は大きい。
【0076】
(実施の形態2)
図12は、本発明の第二の実施形態における映像符号化伝送装置の構成の一例を示す図である。図1に示す第一の実施形態における本装置の構成と同じ作用を持つブロックには同一の符号を付している。第一の実施形態との違いは、本装置の動作パラメータを格納している動作パラメータ記憶部1201、映像受信端末202や映像蓄積装置203から映像データの伝送状態を受信する伝送情報受信部1202、多重化されたデータをネットワークに送信する映像送信部1203、広角映像領域から主領域あるいは補助領域の切り出しを行う映像切り出し部1204、符号量の制御を行う符号量制御部1205である。
【0077】
各ブロックの動作について、第一の実施形態との相違点を説明する。
【0078】
新規の機能ブロックである伝送情報受信部1202は、映像受信端末202や映像蓄積装置203から逐次送られてくる「現状ネットワーク伝送帯域」などの伝送情報を受信する。ネットワーク伝送帯域の変動状況を、映像受信端末202や映像蓄積装置203から本装置に送る方法は、RTCPなどが利用できる。
【0079】
動作パラメータ記憶部1202は、第一の実施形態で示した「伝送映像目標符号量」、「初期ネットワーク伝送帯域」、「受信可能映像サイズ」、「フレームレート」などの初期パラメータを格納し、さらに、伝送情報受信部1202により受信した「現状ネットワーク伝送帯域」などの変動パラメータを格納する。
【0080】
映像送信部1203は、第一の実施形態と異なり、動作パラメータ記憶部1202に格納されている「現状ネットワーク伝送帯域」に合わせて、逐次伝送レートを変更する。
【0081】
映像切り出し部1204は、第一の実施形態の作用に加え、「現状ネットワーク伝送帯域」も考慮して、主領域のサイズを変更する。伝送帯域が小さくなった場合には、主領域の領域サイズが小さくなるように(例えば10%伝送帯域が減少したら、10%主領域の領域サイズを減らす)、逆に、伝送帯域が大きくなった場合には主領域の領域サイズを大きくなるようにする。
【0082】
符号量制御部1205は、第一の実施形態の作用に加え、「現状ネットワーク伝送帯域」も考慮して、低画質化領域の個数を変更する。伝送帯域が小さくなった場合には、低画質化領域の個数が少なくなるように(例えば10%伝送帯域が減少したら、1領域分減らす)、逆に、伝送帯域が大きくなった場合には低画質化領域の個数が多くなるようにする。
【0083】
さらに、映像受信端末202を使用しているユーザの主観的な好みを反映させるために、映像受信端末202から下記に示すパラメータを送信するようにしても良い。伝送情報受信部1202でそれらのパラメータを受信して、動作パラメータ1201に保存する。各機能ブロックは、保存されたパラメータを利用して、第一の実施形態あるいは第二の実施形態に示した動作を行う。
【0084】
映像受信端末202から送信するパラメータは例えば、
・ステップ502の動きベクトルの差の閾値
・ステップ801の平均動き量の閾値
・ステップ901の平均動き量の閾値
・ステップ705の低画質化領域の個数
・ステップ705の符号量の割り当て比率
である。
【0085】
以上のように、本実施の形態では、第一の実施形態の構成に加えて、映像受信端末からの伝送情報を受信し、ネットワークの伝送帯域変動に合わせて、主領域の領域サイズや低画質領域の選択方法を変更する構成を備えることにより、ネットワーク変動に応じた品質の広角カメラ映像をユーザに提示することが可能となり、その実用的効果は大きい。
【0086】
また、上記に加え、ユーザによって映像受信端末から本発明の動作を決定する平気動き量の閾値や動きベクトルの差の閾値などを変更可能とする構成を備えることにより、ユーザの主観的な好みの映像をユーザに提示することが可能となり、その実用的効果は大きい。
【0087】
(実施の形態3)
図13は、本発明の第三の実施形態における映像符号化伝送装置の選択領域対応関係管理テーブルの一例を示す図である。第一の実施形態の選択領域対応管理テーブルに、「子画面領域変形フラグ」を追加している。「子画面領域変形フラグ」は、低画質化領域の領域サイズと、重ね合わせた子画面領域の領域サイズが異なる場合に、子画面領域の領域サイズを変形して低画質化領域と同じ領域サイズにするかどうかの判定フラグである。ONの場合には変形を行って同一のサイズにし、OFFの場合には変形を行わない。このフラグの効果について、図14を用いて説明する。図14は、本発明の第3の実施形態における映像符号化伝送装置の送信映像の一例を示す図である。図14は、主領域1401上に子画面領域1402−1、1402−2が重ねあわされている様子を表している。子画面領域1402−1は、「子画面領域変形フラグ」がOFFになっており、低画質化領域1403−1と領域サイズが異なったままに表示されている。一方、子画面領域1402−2は、「子画面領域変形フラグ」がONになっており、低画質化領域1403−2と領域サイズが同一になっている。
【0088】
実際の変形処理は、符号量制御部106からの要求に合わせて補助領域処理部107により行ない、変形後の領域に対して補助領域符号化部108により符号化を行う。
【0089】
以上のように、本実施の形態では、第一の実施の形態の選択領域対応管理テーブルに、低画質化領域の領域サイズと、重ね合わせた子画面領域の領域サイズが異なる場合に、子画面領域の領域サイズを変形して低画質化領域と同じ領域サイズにするかどうかの判定フラグである「子画面領域変形フラグ」を備えることにより、低画質領域の表示領域を無駄にすることなく子画面領域を表示することが可能となり、その実用的効果は大きい。
【0090】
【発明の効果】
以上のように本発明によれば、高解像度な広角カメラによって撮影された映像を、ネットワークの伝送帯域の変動あるいは映像の動きの大きさに合わせて符号化伝送の基本部分となる主領域と主領域以外の領域である補助領域とに分割し、主領域中から非重要領域(低画質化領域)を選択して、その領域に割り当てる符号量を低減するとともに、補助領域中の重要領域(子画面領域)を符号化した映像を、符号化した主領域中の非重要領域上に重ねあわせる構成を備えたことにより、広角カメラ映像全体を符号化伝送することなく、広角映像中の重要領域の一覧性を高めながら、効率的な映像伝送が可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における映像符号化伝送装置の構成の一例を示す図
【図2】本発明の第1の実施形態における映像符号化伝送装置の利用形態の一例を示す図
【図3】本発明の第1の実施形態における映像符号化伝送装置が処理対象とする広角映像領域の一例を示す図
【図4】本発明の第1の実施形態における映像符号化伝送装置の送信映像の一例を示す図
【図5】本発明の第1の実施形態における映像符号化伝送装置の映像切り出し部の動作の一例を示すフローチャート
【図6】本発明の第1の実施形態における映像符号化伝送装置のブロック単位の動き検出を説明する図
【図7】本発明の第1の実施形態における映像符号化伝送装置の符号量制御部の動作の一例を示すフローチャート
【図8】本発明の第1の実施形態における映像符号化伝送装置の主領域処理部の動作の一例を示すフローチャート
【図9】本発明の第1の実施形態における映像符号化伝送装置の補助領域処理部の動作の一例を示すフローチャート
【図10】本発明の第1の実施形態における映像符号化伝送装置の選択領域管理テーブルの一例を示す図
【図11】本発明の第1の実施形態における映像符号化伝送装置の選択領域対応関係管理テーブルの一例を示す図
【図12】本発明の第2の実施形態における映像符号化伝送装置の構成の一例を示す図
【図13】本発明の第3の実施形態における映像符号化伝送装置の選択領域対応関係管理テーブルの一例を示す図
【図14】本発明の第3の実施形態における映像符号化伝送装置の送信映像の一例を示す図
【図15】従来の映像処理装置により伝送される映像を説明する図
【図16】テレビ電話装置で表示される画面を示す図
【符号の説明】
101 映像入力部
102 映像記憶部
103 映像切り出し部
104 主領域処理部
105 主領域符号化部
106 符号量制御部
107 補助領域処理部
108 補助領域符号化部
109 映像多重化部
110 映像送信部
111 動作パラメータ記憶部
Claims (15)
- 広角カメラ映像を入力映像として符号化して伝送する映像符号化伝送装置であって、
広角映像を取得する映像入力部と、
前記広角映像を一時的に記憶するための映像記憶部と、
前記映像記憶部に記憶されている前記広角映像から第一の領域と複数の第二の領域の切り出しを行う映像切り出し部と、
前記第一の領域から非重要領域の抽出を行う主領域処理部と、
前記第一の領域の符号化処理を行う主領域符号化部と、
前記第二の領域から重要領域の抽出を行う補助領域処理部と、
前記重要領域の符号化処理を行う補助領域符号化部と、
前記非重要領域に重ね合わせる前記重要領域を決定し、前記第一の領域および前記重要領域に符号量の割り当てを行う符号量制御部と、
前記主領域符号化部および前記補助領域符号化部により符号化された映像データを多重化する映像多重化部と、
前記映像多重化部により多重化された映像データをネットワークに伝送する映像送信部と、
を備えることを特徴とする映像符号化伝送装置。 - 前記映像切り出し部が、第一の特定領域を多く含むように第一の領域を決定することを特徴とする請求項1記載の映像符号化伝送装置。
- 前記第一の特定領域が、所定のサイズ以下でかつ動きの大きな映像領域を多く含む領域であることを特徴とする請求項2記載の映像符号化伝送装置。
- 前記第一の特定領域が、所定のサイズ以下でかつ人物の顔を多く含む映像領域を多く含む領域であることを特徴とする請求項2記載の映像符号化伝送装置。
- 前記主領域処理部が、前記第一の領域から第二の特定領域を選択して非重要領域とすることを特徴とする請求項1乃至4記載の映像符号化伝送装置。
- 前記第二の特定領域が、動きの小さな領域であることを特徴とする請求項5記載の映像符号化伝送装置。
- 前記第二の特定領域が、人物の顔が含まれていない領域であることを特徴とする請求項5記載の映像符号化伝送装置。
- 前記補助領域処理部が、前記第二の領域から第三の特定領域を選択して重要領域とすることを特徴とする請求項1乃至7記載の映像符号化伝送装置。
- 前記第三の特定領域が、動きの大きな領域であることを特徴とする請求項8記載の映像符号化伝送装置。
- 前記第三の特定領域が、人物の顔が含まれる領域であることを特徴とする請求項8記載の映像符号化伝送装置。
- 請求項1に記載の映像符号化伝送装置であって、
映像受信端末から送信される映像データを受信する伝送情報受信部と、
をさらに備えることを特徴とする映像符号化伝送装置。 - 前記映像切り出し部が、前記伝送情報受信部により受信した伝送情報を利用して、前期第一の特定領域を決定することを特徴とする請求項11記載の映像符号化伝送装置。
- 前記主領域処理部が、前記伝送情報受信部により受信した伝送情報を利用して、前期第二の特定領域を決定することを特徴とする請求項11または12記載の映像符号化伝送装置。
- 前記補助領域処理部が、前記伝送情報受信部により受信した伝送情報を利用して、前期第三の特定領域を決定することを特徴とする請求項11乃至14記載の映像符号化伝送装置。
- サーバが、映像を符号化して伝送する際の符号化量制御方法であって、
取得した映像を、第一の領域と少なくとも一つ以上の第二の領域とに分割し、
前記第一の領域内から非重要領域を、前記第二の領域から重要領域を検出し、
目標符号量に合わせて、前記第一の領域内で前記非重要領域の符号化量を下げ、前記重要領域を前記非重要領域に重畳するようにして、伝送する映像符号化量を調整する、
ことを特徴とする、符号化量調整方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003160261A JP2004363974A (ja) | 2003-06-05 | 2003-06-05 | 映像符号化伝送装置および映像符号量制御方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003160261A JP2004363974A (ja) | 2003-06-05 | 2003-06-05 | 映像符号化伝送装置および映像符号量制御方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004363974A true JP2004363974A (ja) | 2004-12-24 |
Family
ID=34053089
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003160261A Pending JP2004363974A (ja) | 2003-06-05 | 2003-06-05 | 映像符号化伝送装置および映像符号量制御方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2004363974A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008035745A1 (en) * | 2006-09-20 | 2008-03-27 | Panasonic Corporation | Monitor system, camera and video image coding method |
| JP2008141611A (ja) * | 2006-12-04 | 2008-06-19 | Yamaha Corp | 通信装置 |
| JP2009218851A (ja) * | 2008-03-11 | 2009-09-24 | Hitachi Ltd | 映像処理装置 |
| JP2018082333A (ja) * | 2016-11-17 | 2018-05-24 | Kddi株式会社 | 遠隔作業支援システムの作業者端末および支援者端末 |
-
2003
- 2003-06-05 JP JP2003160261A patent/JP2004363974A/ja active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008035745A1 (en) * | 2006-09-20 | 2008-03-27 | Panasonic Corporation | Monitor system, camera and video image coding method |
| US8115812B2 (en) | 2006-09-20 | 2012-02-14 | Panasonic Corporation | Monitoring system, camera, and video encoding method |
| JP2008141611A (ja) * | 2006-12-04 | 2008-06-19 | Yamaha Corp | 通信装置 |
| JP2009218851A (ja) * | 2008-03-11 | 2009-09-24 | Hitachi Ltd | 映像処理装置 |
| JP2018082333A (ja) * | 2016-11-17 | 2018-05-24 | Kddi株式会社 | 遠隔作業支援システムの作業者端末および支援者端末 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102715333B1 (ko) | 몰입형 미디어 콘텐츠 프레젠테이션 및 양방향 360° 비디오 통신 | |
| US11330262B2 (en) | Local image enhancing method and apparatus | |
| JP5268743B2 (ja) | 画像通信システム | |
| ES2347537T3 (es) | Codificacion de video en primer plano y de fondo; en el que la imagen se divide en porciones. | |
| US8872895B2 (en) | Real-time video coding using graphics rendering contexts | |
| US9756328B2 (en) | System, terminal, and method for dynamically adjusting video | |
| US6597736B1 (en) | Throughput enhanced video communication | |
| JP7630672B2 (ja) | 点群のジオメトリを符号化/復号する方法及び装置 | |
| JP6160357B2 (ja) | 画像処理装置、画像処理方法、および画像通信システム | |
| EP2785068B1 (en) | Video image data delivery device, method and system | |
| JP2017530613A (ja) | ビデオ合成 | |
| TW201026069A (en) | Encoding and decoding method for video screen layout, encoding device, decoding device, and data structure | |
| CN110832539A (zh) | 调整图传分辨率的方法、图像拍摄设备、机器可读存储介质 | |
| WO2018161867A1 (zh) | 码率分配方法、设备及存储介质 | |
| US11284094B2 (en) | Image capturing device, distribution system, distribution method, and recording medium | |
| JP6089846B2 (ja) | 映像配信システム及びデコーダ並びに映像配信方法 | |
| JP5473903B2 (ja) | 画像を処理する方法およびシステム | |
| RU2524677C2 (ru) | Устройство и способ обработки информации и система обработки информации | |
| JP2004363974A (ja) | 映像符号化伝送装置および映像符号量制御方法 | |
| US20130028325A1 (en) | Method and device for error concealment in motion estimation of video data | |
| JP4829867B2 (ja) | 画像符号化装置及び画像復号装置 | |
| JP4361430B2 (ja) | 双方向画像通信装置、その処理方法及びクライアント装置並びにプログラム | |
| JP2009212821A (ja) | コンテンツ配信装置、受信装置、コンテンツ配信方法及び受信方法 | |
| CN113141352A (zh) | 多媒体数据的传输方法、装置、计算机设备和存储介质 | |
| CN115699745B (zh) | 图像编解码方法和装置 |