[go: up one dir, main page]

JP6038360B2 - エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成 - Google Patents

エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成 Download PDF

Info

Publication number
JP6038360B2
JP6038360B2 JP2015563023A JP2015563023A JP6038360B2 JP 6038360 B2 JP6038360 B2 JP 6038360B2 JP 2015563023 A JP2015563023 A JP 2015563023A JP 2015563023 A JP2015563023 A JP 2015563023A JP 6038360 B2 JP6038360 B2 JP 6038360B2
Authority
JP
Japan
Prior art keywords
codeword
input
edr
image
slope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015563023A
Other languages
English (en)
Other versions
JP2016529741A (ja
Inventor
スゥ,グワン‐ミーン
アトキンス,ロビン
スコット ミラー,ジョン
スコット ミラー,ジョン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2016529741A publication Critical patent/JP2016529741A/ja
Application granted granted Critical
Publication of JP6038360B2 publication Critical patent/JP6038360B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本願は、2013年6月17日出願の米国特許仮出願第61/836,044号、2014年3月12日出願の米国特許仮出願第61/951,914号、および、2014年5月23日出願の米国特許仮出願第62/002,631号に基づく優先権を主張するものであり、これらの出願の開示内容の全てを本願に援用する。
本願は、2014年3月25日出願の国際出願第PCT/US2014/031716号にも関連し得るものであり、この出願の開示内容の全てを本願に援用する。
本発明は、広義には、ビデオ画像に関する。より具体的には、本発明のある実施形態は、階層符号化および復号化のための、ハイまたはエンハンスト(enhanced)ダイナミックレンジを有する画像の適応的再構成(adaptive reshaping)に関する。
本明細書において、用語「ダイナミックレンジ」(DR)は、画像においてある範囲の強度(例えば、輝度、ルマ)(例えば、最暗部(黒)から最明部(白)まで)を知覚する人間の心理視覚システム(HVS)の能力に関連し得る。この意味では、DRはシーン−リファード(scene−referred)の強度に関する。DRはまた、ディスプレイデバイスが特定の幅を有する強度範囲を妥当にまたは近似的に描画する能力にも関連し得る。この意味では、DRは、ディスプレイ−リファード(display−referred)の強度に関する。本明細書中の任意の箇所において、ある特定の意味が特に明示的に指定されている場合を除いて、この用語はどちらの意味としても(例えば、区別なく)使用できるものとする。
本明細書において、ハイダイナミックレンジ(HDR)という用語は、人間の視覚システム(HVS)において14〜15桁ほどにわたるDR幅に関する。例えば、しっかりと順応した、実質的に正常(例えば、統計的な意味、バイオメトリック的な意味、または、眼科的な意味の1つ以上において)な人間は、約15桁にわたる強度範囲を有する。順応した人間は、ほんの少量の光子のうす暗い光源を知覚し得る。また、同じ人間が、砂漠、海または雪上における真昼の太陽の、目が痛くなるほどの明るい強度を知覚し得る(また、怪我をしないような短時間であるとしても太陽を見ることもできる)。ただし、この範囲は、「順応した人間」、例えば、そのHVSをリセットして調節する時間を経た人間に当てはまるものである。
これに対して、人間が、広範囲の強度範囲を同時に知覚し得るDRは、HDRに対して幾分端折られ得る。本明細書において、エンハンストダイナミックレンジ(EDR)または視覚ダイナミックレンジ(VDR)という用語は、個別にまたは区別なく、HVSによって同時に知覚可能なDRに関連し得る。本明細書において、EDRは、5〜6桁にわたるDRに関連し得る。従って、真のシーンリファードのHDRに対して幾分狭いものの、EDRは、広いDR幅を示す。
実際には、画像は、1つ以上の色成分(例えば、輝度Yおよび色差CbおよびCr)を有し、各色成分はnビット/ピクセルの精度で表される(例えば、n=8)。輝度ダイナミックレンジとビット深度は同じものではないが、しばしば相互に関連性がある。n≦8の画像(例えば、カラー24ビットJPEG画像)は標準的なダイナミックレンジの画像とされ、n>8の画像はエンハンストダイナミックレンジの画像とされる。EDRおよびHDR画像は、”Industrial Light and Magic”が開発したOpenEXRファイルフォーマットなどの高精度の(例えば、16ビット)浮動小数点フォーマットを用いて、保存および配信され得る。
ビデオ信号は、ビット深度、色空間、色域および解像度などの複数のパラメータによって特徴付けられる。最新のテレビおよびビデオ再生デバイス(例えば、ブルーレイプレーヤー)は、標準解像度(例えば、720×480i)および高精細(HD)(例えば、1920×1080p)を含む様々な解像度をサポートしている。超高精細(UHD)は、少なくとも3,840×2,160の解像度(「4K UHD」)を有し、7680×4320(「8K UHD」)まで上げられるオプションを有する次世代解像度フォーマットである。超高精細は、UltraHD、UHDTVまたはスーパーハイビジョンとも呼ばれることがある。本明細書において、UHDは、HD解像度よりも高い任意の解像度を指す。
新しいHDRまたはUHD符号化およびディスプレイ技術だけでなく、旧式の8ビットの再生デバイスとの下位互換性をサポートするために、上流側デバイスから下流側デバイスへとUHDおよびHDR(またはEDR)ビデオデータを送信する際に、複数フォーマットが用いられ得る。あるEDRストリームに対して、あるデコーダは、1セットの8ビットレイヤを用いて、コンテンツのHD SDRまたはEDRバージョンを再構築し得る。新型のデコーダは、従来の8ビットよりも高いビット深度で符号化された第2のセットのレイヤを用いて、コンテンツのUHD EDRバージョンを再構築し、それをより高性能なディスプレイ上に描画し得る。本願発明者も理解しているように、EDRビデオの符号化および配信のためにより向上した技術が望まれる。
本節に記載されている手法は、探求し得る手法ではあるが、必ずしもこれまでに着想または探求されてきた手法ではない。従って、特に反対の記載がない限り、本節に記載された手法のいずれも、本節に記載されているという理由だけで従来技術としての適格性を有すると考えるべきではない。同様に、特に反対の記載がない限り、1以上の手法に関して特定される問題が、本節に基づいて、いずれかの先行技術において認識されたことがあると考えるべきではない。
図1Aは、本発明のある実施形態による、EDR階層符号化のフレームワーク例を示す図である。 図1Bは、本発明のある実施形態による、EDR階層復号化のフレームワーク例を示す図である。 図2は、本発明のある実施形態による、関数パラメータaを決定する、べき関数に基づくEDR信号再構成関数の一例を示す図である。 図3は、本発明のある実施形態による、EDR入力の順方向構成関数の最適な指数を決定する処理例を示す図である。 図4は、本発明のある実施形態による、EDR符号語の順方向マッピングを決定する処理例を示す図である。 図5は、入力EDR符号語(vc)を、本発明のある実施形態に従って算出される、ブロックベースのスケーリング係数(k(vc))に中間マッピングする一例を示す図である。 図6は、本発明のある実施形態による、入力EDR符号語を最終出力である再構成済みシンボルにマッピングする一例を示す図である。 図7は、本発明のある実施形態に従って算出される、逆方向マッピングの一例を示す図である。 図8Aおよび図8Bは、本発明のある実施形態による色度範囲スケーリングの一例を示す図である。 図9は、本発明のある実施形態による、符号化および復号化パイプラインの一例を示す図である。
エンハンストダイナミックレンジ(EDR)を有するビデオ画像の階層符号化のための、適応的再構成技術を本明細書に説明する。以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
同様の部材に同様の参照符号を付した添付図面の各図において、本発明のある実施形態を限定する事なく例示する。
概要
本明細書に記載の実施形態例は、効率的な階層符号化を行うための、ハイまたはエンハンストダイナミックレンジを有するビデオ画像の適応的再構成に関する。エンコーダは、レイヤ表現で符号化されるための入力エンハンストダイナミックレンジ(EDR)画像を受信する。入力画像は、ガンマ符号化されていてもよいし、利用可能なビデオエンコーダの1つ以上でサポートされていないビット深度フォーマットを用いて知覚的符号化されていてもよい。入力画像を1つ以上の量子化レイヤに再マッピングし、これにより、利用可能なビデオエンコーダを用いた圧縮に適した出力符号語を生成する。
ある実施形態において、再マッピングは、単一の関数パラメータを用いたべき関数に基づいている。入力EDR画像中の各ブロックについてブロックベースの複雑性尺度を算出し、その後、量子化画像における量子化に起因する歪みの量を評価することにより、最適な関数パラメータを求める技術を説明する。
別の実施形態においては、標準偏差のようなブロックベースの複雑性尺度と、ブロックベースの線形量子化モデル(各画像ブロックについて別々の最適な量子化器スケーラを求める)とを用いて、最適マッピングを生成する。この別々の最適スケーラを組み合わせることにより、各入力符号語について包絡線の傾きを求め、入力および出力符号語間の最適な順方向マッピング関数を包絡線の傾きに基づいて求める。逆方向マッピング関数を、ルックアップテーブルとしてデコーダに送信してもよいし、区分的多項式近似を用いて近似してもよい。
別の実施形態において、ある逆方向マッピングルックアップテーブルが与えられると、多項式近似技術を用いて逆方向マッピング関数が近似される。
デコーダにおいて、符号化ビットストリームレイヤを復号化することによって復号化ビデオレイヤを生成し、これら復号化ビデオレイヤを再結合して1つの復号化信号を生成する。そして、エンコーダの再構成(reshaping)またはマッピング関数を定義する受信パラメータが与えられると、復号化信号を逆方向マッピングして、これにより、エンコーダからデコーダに送信される元のEDR信号の推定結果を生成する。
別の実施形態においては、所望の白色点の座標が変換後の色度範囲の中心に概ねシフトされるように、入力ビデオ信号の色度色成分を変換してもよい。
ビデオ信号再構成および階層分解のためのフレームワーク例
階層符号化および復号化
HDTV、セットトップボックスまたはブルーレイプレーヤーのような既存のディスプレイおよび再生デバイスは、典型的に、最大1080pHD解像度(例えば、1920×1080 60フレーム/秒)までの信号をサポートしている。家庭用用途では、このような信号は、現在、典型的には色差成分が輝度成分よりも低い解像度を有するような輝度−色差色フォーマット(例えば、YCbCrまたはYUV4:2:0色フォーマット)で、各色成分について8ビット/ピクセルのビット深度を用いて典型的に圧縮される。8ビットの深度およびそれに対応する低ダイナミックレンジのために、これらの信号は典型的には、標準ダイナミックレンジ(SDR)を有する信号と呼ばれる。超高精細(UHD)などの新しいテレビ規格が開発される中、エンハンスト(enhanced)解像度および/またはエンハンストダイナミックレンジを用いて信号を符号化することが望まれ得る。
ビデオ画像は、典型的には、人間の視覚システムの特性を補うためにガンマ符号化される。例えば、ITU−R Rec 2020は、推奨されるUHDTV信号のガンマ符号化を定義している。EDR画像については、知覚量子化(PQ)は、従来のガンマ符号化よりも良い代替法であり得る。人間の視覚システムは、光レベルの増大に対して非常に非線形的に反応する。人間が刺激を見る能力は、その刺激の輝度、その刺激の大きさ、その刺激を構成する空間周波数、および、その刺激を見ている瞬間までに目が順応した輝度レベルに影響される。知覚的量子化器関数は、線形入力グレイレベルを、人間の視覚システムにおけるコントラスト感度閾値によりマッチした出力グレイレベルにマッピングする。PQマッピング関数の一例は、J.S.Millerらによる2012年12月06日出願の「Perceptual luminance nonlinearity−based image data exchange across different display capabilities」という表題のPCT出願シリアル番号第PCT/US2012/068212号(以下、「‘212出願」と呼ぶ)に記載されており、この出願の開示内容を全て本願に援用する。上記PCT出願において、ある固定刺激サイズに対して、それぞれの輝度レベル(即ち、刺激レベル)について、最高感度の適応レベルおよび最高感度の空間周波数(HVSモデルによる)に応じて、その輝度レベルにおける最小可視コントラストステップを選択する。物理的な陰極線管(CRT)装置の応答曲線を表しており、人間の視覚システムの応答の仕方に対して非常に大まかな類似性を偶然有し得る従来のガンマ曲線と比較して、‘212出願において決定されているPQ曲線は、比較的シンプルな関数モデルを用いながら人間の視覚システムの本当の視覚応答を模擬している。
本願にその開示内容が援用される2013年3月26日出願の「Encoding perceptually−quantized video content in multi−layer VDR coding」という表題の米国特許仮出願シリアル番号第61/805,388号(以下「‘388出願」と呼ぶ)(2014年3月25日にPCT/US2014/031716としても出願されている)において、発明者らは、2レイヤエンコーダを用いたPQ符号化EDR画像データの効率的な符号化および送信を行うための、画像再構成技術を記載している。本願は、シングルレイヤまたはマルチレイヤエンコーダの両方を用いた、EDRデータの符号化に適用可能な新規なマッピングまたは再構成技術を記載することによって‘388出願を発展させたものである。
図1Aは、本発明のある実施形態による、EDR階層符号化のフレームワーク例を示す。入力信号(102)は、ガンマまたはPQ符号化され得るEDRピクセル値を有する、ビデオフレームシーケンスを含む。システムは、少なくとも1つのベースレイヤ(BL)ビデオエンコーダ(120−0)を含み、合計L個の符号化レイヤに対して、1つ以上、最大L−1個のエンハンスメントレイヤ(EL)ビデオエンコーダ(120−1,120−L−1)を含み得る。例えば、L=2の場合、システムは、1つのデュアルレイヤエンコーダを含む。ビデオエンコーダ(120)は全て同じでもよく、または異なっていてもよく、MPEG−2、MPEG−4、part2、H.264(またはAVC)、H.265(またはHEVC)等のような既知の、または未来のビデオ圧縮用符号化フォーマットを実行する。さらに、あるレイヤのビデオエンコーダが、別のレイヤのビデオエンコーダとは異なるビット深度をサポートし得る。例えば、限定はしないが、実施形態は、以下の構成を有していてもよい。
・ 少なくとも10ビットのビット深度をサポートし、好ましくは12ビット以上をサポートする、シングルレイヤのHEVCエンコーダ。
・ デュアルレイヤエンコーダであって、両方のエンコーダが同じフォーマット(例えばH.264)を用いて符号化を行い、両方のエンコーダが同じまたは異なるビット深度(例えば8ビットおよび10ビット)をサポートするようなデュアルレイヤエンコーダ。
・ デュアルレイヤエンコーダであって、2つのエンコーダは異なる符号化フォーマットを用いて符号化を行い、それぞれが異なるビット深度(例えば8ビットおよび10ビット以上)をサポートし得るような、デュアルレイヤエンコーダ。
・ マルチレイヤエンコーダであって、少なくとも1つのエンコーダが8ビットMPEG−2エンコーダであり、少なくとも他方のエンコーダがHEVCまたはH.264エンコーダである、マルチレイヤエンコーダ。
ビデオエンコーダ(120)は、全て、単一のプロセッサまたは1つ以上のプロセッサによって実施され得る。
ある実施形態によれば、信号再構成モジュール(110)は、入力EDR信号(vと表記する)(102)を量子化して、最大サポートビット深度などのビデオエンコーダ(120)の特性により良く適合する、信号s(112)を得る。本明細書において、「再構成(reshaping)」、「量子化」および「(順方向)マッピング」の用語は、入力信号を第1のダイナミックレンジから(典型的には第1のダイナミックレンジよりも低い)第2のダイナミックレンジの出力信号へとマッピングする同様な機能を指し、互いに区別無く使用され得る。
lがl番目のレイヤビデオエンコーダ(120−l、l=0、1、2、...、L−1)が用いるビット深度を指すものとすると、各レイヤは、合計NT=N0+N1+...+NL-1個の符号語に対して、最大Nl=2Bl個の入力符号語をサポートできる。例えば、L=1(シングルレイヤ)およびB0=10の場合、210=1024個の量子化符号語が存在する。L=2(デュアルレイヤ)およびB0=B1=8の場合、28+28=512個の量子化符号語が存在する。L=2およびB0=10およびB1=8の場合、合計210+28=1280個の量子化符号語が存在する。よって、システムは、それぞれが独自のビット深度で動作する複数のビデオ符号化規格の、任意の組み合わせに対応し得る。
s=f(v)が信号再構成/量子化関数(110)を表すものとする。このような関数の例は詳しく後述する。再構成関数を特定するパラメータが、メタデータ信号(119)として含まれていてもよい。いくつかの実施形態において、メタデータ(119)はメタデータエンコーダ(125)によって符号化され、符号化メタデータ(127)は、適切な逆量子化および復号化のために、図1Bに示したようなデコーダに送信され得る。別の実施形態において、信号再構成(110)は、1群の信号再構成関数を含み、1つ以上のレイヤに対して、または1レイヤ内の1つ以上の色度成分に対して、別々の構成関数を用いてもよい。例えば、ある実施形態において、ベースレイヤ(l=0)の信号再構成関数は線形関数である一方で、第1のエンハンスメントレイヤ(l=1)の信号再構成関数は非線形関数または区分線形関数を含んでいてもよい。
レイヤ分解
ある実施形態において、量子化信号s(112)のピクセル値を、区分境界{pi、i=0、1、...、L}によって定義されるL個の区分に分割するものとする。ただし、p0は典型的にはsの最小値(例えば、p0=0)を表し、
Figure 0006038360
である。
例えば、L=1の場合、p0=0およびp1=N0である。このモジュールは、全符号語をベースレイヤに符号化する。
L=2の場合、p0=0、p1=N0、p2=N0+N1である。ある実施形態において、{p0、p1}間の符号語を有するピクセルはレイヤ0で符号化され、{p1、p2}間の符号語を有するピクセルはレイヤ1で符号化される。一般的に、L個のレイヤがあった場合、各レイヤlに対して、当該レイヤのslピクセルは、以下のように符号化される。
l=Clip3(s,pl,pl+1−1)−pl
l=0,1,2,…,L−1 (2)
ただし、d=Clip3(s,a,b)はクリッピング関数を表し、ここで、a≦s≦bであればd=sであり、s<aであればd=aであり、s>bであればd=bである。
レイヤ分解(115)後、ある実施形態においては、各レイヤsl(117−l、l=0、1、...、L−1)をビデオエンコーダ(120)でそれぞれ独立して符号化し、これにより、圧縮ビットストリーム(122)を生成してもよい。‘388出願において説明されているように、いくつかの実施形態において、図1Aに示すシステムを改変して、レイヤ間予測をも可能にしてもよい。そのような実施形態においては、予測器を用いて、l−1レイヤのピクセル値に基づいてl番目のレイヤのピクセル値を推定すればよく、その後、l番目のレイヤのピクセル値を直接符号化するのではなく、実値および予測値の間の残差を単に符号化して送信する。
いくつかの実施形態において、符号化ビットストリーム(122)、符号化メタデータ(127)および他のデータ(例えば、オーディオデータ)を多重化して単一のビットストリームにし、単一の多重化されたビットストリーム(図示せず)としてデコーダに送信してもよい。
図1Bは、本発明のある実施形態によるEDR階層復号化のフレームワーク例を示す。図1Bに示すように、オーディオ、ビデオおよび補助的なデータ(図示せず)を組み合わせ得る受信ビットストリームを多重分離した後、受信符号化ビットストリーム(122)をそれぞれビデオデコーダ(130)アレイに送る。デコーダ群(130)はエンコーダ群(120)に対応し、1つ以上の復号化ビデオ信号(132)を生成する。信号逆再構成(inverse reshaping)およびレイヤ結合器(140)ユニットを用いて、受信した階層信号を結合および逆再構成して信号(^付v)(142)(元のEDR信号(102)の推定結果を表す)を生成する。ある実施形態において、出力EDR信号(142)は以下のように生成され得る。
Figure 0006038360
ただし、f-1()は、信号再構成関数(110)の逆数(または逆数の近い近似値)を表し、(^付sl)は、元のsl信号(117)の非常に近い近似値を表す再構築されたレイヤ信号(132)を表す。図1Bに示すように、受信レイヤ間においてレイヤ間予測は無い。しかし、ビデオ符号化の分野において公知であるように、容易にこのシステムは拡張することができ、受信した残差信号およびレイヤ間予測を用いて(^付sl)信号を生成するデコーダとすることができる。
べき関数を用いたEDR信号再構成
‘388出願に記載のように、PQ符号化された信号について、ある実施形態においては、信号再構成関数(110)は以下のように表される。
Figure 0006038360
ただし、vLおよびvHは、入力EDR信号(102)について検討中のカラーチャンネルにおける最小値および最大値を表し、cLおよびcHは対応する最小および最大出力値を表す。例えば、ある実施形態においては、等式(1)に定義されるように、cL=0およびcH=pL−1である。αの値は一定であるが、フレーム毎に、シーン毎に、または、他の適切な基準に従って適応および変更してもよい。図2は、α<1についての等式(4)のべき再構築関数の一例を示す。ある実施形態においては、入力(112)がPQ符号化されている場合α>1であり、またそうではなく、入力(112)がガンマ符号化されている場合α<1である。
‘388出願には、あるブロック内のピクセルの標準偏差またはそのブロック内の最小と最大ピクセル値の差分に基づいて、ブロック複雑性尺度(metrics)(MEDR)を用いて、αの最適値を求める方法を記載した。これらの尺度に加えて、あるブロックの空間的または周波数特性のいずれかに基づいて他の複雑性尺度を適用することも可能である。例えば、MEDRは、ブロック内でのピクセルの分散、ブロックのDC値、または、そのピクセル値あるいはDCT係数の別の関数に対応していてもよい。
それぞれNブロックに区分された(例えば、各ブロックは8x8ピクセル)F枚のビデオフレームを含むビデオシーンについて考える。画像ブロックはオーバーラップしていてもよいが、好適な実施形態においてはオーバーラップしていない。図3は、一般化したブロック複雑性尺度MEDR(j,n)(例えば、限定はしないが、ブロック内のピクセル値の標準偏差)に基づいて最適なαを算出する処理を示す。
図3に示すように、そのシーン内の全フレームについてブロック毎にMEDR(j,n)を算出する工程(305)の後、工程(310)において、ある基準(例えば、MEDR(j,n)>T 但し、Tは予め定められた閾値(例えば0)である)を満たす全画像ブロックを含む1つの集合(set)Φjを構築する。
工程(315)、(320)および(325)は、所定の範囲(例えば、MIN_α≦αj≦MAX_α)内の様々なαj値について算出されるループ(327)を構成する。例えば、αjは始めに1に等しくしておき、その後、元のEDRビデオデータがどのように符号化されているかによって増減させてもよい。例えば、PQ符号化されたデータの場合には増加し、ガンマ符号化されたデータの場合には低減してもよい。工程(320)においては、与えられたαjおよび等式(4)を用いて、入力データEDRを量子化し、量子化された各ブロックについて新たな尺度MLD(j,n,αj)を算出してもよい。いくつかの実施形態において、複雑性尺度MLDは複雑性尺度MEDRと同一である。他の実施形態においては、これら2つの複雑性尺度は異なっていてもよい。入力EDRデータを量子化する程、量子化信号(112)の特性はより変化する。理想的には、量子化(110)がなるべく入力を歪ませない方がよい。工程(325)においては、量子化による歪みの尺度を適用して、選択αj値が最適かどうかを突き止めてもよい。例えば、ある実施形態において、
Figure 0006038360
の場合に、αjを最適として選択してもよい。ただし、Tσはまた別の所定の閾値(例えば、Tσ=0)
あるシーンの全ブロックを量子化した後、工程(330)において総合的に最適なアルファ値を選択する。例えば、ある実施形態において、α>1の場合、総合的に最適なαは、全最適αj値に対して最小であるαとして選択する。同様に、α<1の場合、総合的に最適なαは、全最適αj値に対して最大であるαとして選択する。
いくつかの実施形態において、ビデオエンコーダ(120)による損失の多い圧縮に起因する量子化の影響に対して調節するために、総合的に最適なアルファをさらに調節してもよい(例えば、α=α+Δα、但し、α>1の場合はΔは負の値であり、α<1の場合はΔは正の値である)。同パラメータ最適化処理は、複数の関数パラメータで特徴付けられる、他の線形または非線形量子化関数および再構築関数に、容易に拡張することができる。
表1は、図3に示す処理(所望のα<1である)に基づくある実施形態による、ガンマ符号化値を再構成するためのアルゴリズムの一例を疑似コードで示したものである。
表1:ガンマ符号化EDR信号について最適なαを算出する方法
Figure 0006038360
デコーダにおいて、逆構成処理(140)は以下のように表すことができる。
Figure 0006038360
いくつかの実施形態において、等式(4)のべき関数は、区分的線形多項式、区分的2次または3次多項式または区分的Bスプラインとして表すことができる。そのような実施の場合、量子化に関連するアーチファクトを避けるために、全区分にわたって、滑らかさおよび単調性に関する制約を与えるべきである。そして、これまでに、または、‘388出願において記載されたものと同様の検索方法を適用してもよい。
ブロック適応的な再構成関数
再び、それぞれNブロックに区分された(例えば、各ブロックは8x8ピクセル)F枚のビデオフレームを含むビデオシーンについて考える。画像ブロックはオーバーラップしていてもよいが、好適な実施形態においてはオーバーラップしていない。図4は、ある実施形態による、入力EDR符号語(102)を再構成済み出力値(112)にマッピングするためのデータフローの一例を示す。
先述のように、ブロックベースの複雑性尺度(MEDR)を定義できる。ある実施形態において、工程(405)において、限定はしないが、複雑性尺度がブロック内のピクセルの標準偏差(std)に基づいて算出されるものとして考える。なお、フレームj(j=1、2、...、F)におけるブロックnの標準偏差がゼロである(例えば、MEDR(j,n)=stdjn=0)かどうかを確認することは、このブロック内の最大値(例えば、B(j,n))とこのブロック内の最小値(例えば、A(j,n))との差異が0であるかどうかを確認することに等しい。
再構成関数(110)が区分的線形直線で構築されているとすると、入力viに対して、ローカル量子化器は以下のように表すことができる。
Figure 0006038360
Figure 0006038360
ただし、k(j,n)は、j番目のフレームのn番目のブロックにおける量子化器の傾きを調節するためのスケーリング係数である。
工程(410)において、Φが、ブロック尺度がある基準を満たす全ブロックの集合を表すものとする。例えば、Φが、量子化前に非ゼロの標準偏差を有する全ブロックの集合を表すものとする。すなわち、
Figure 0006038360
ある実施形態において、閾値Tth(ただし、限定はしないが、Tth≧1)が与えられ、ブロックの最小および最大ピクセル値が与えられると、工程(415)において、最適なk(j,n)は以下のように求められ得る。
Figure 0006038360
データ{A(j,n)、B(j,n)、k(j,n)}が与えられるとき、この3つの値は、区分[A(j,n)、B(j,n)]内で、量子化器は、少なくともk(j,n)の傾きを有するべきであることを示す。特定のEDR符号(例えば、vc)が複数[A(j,n)、B(j,n)]区分に属し得るとするならば、EDR符号語vcについて、各符号語について全ブロックを満足する最大の傾きを求める必要がある。
θ(vc)は、符号語vcをカバーする全ブロックにわたる全区分の集合を表すものとする。すなわち、
Figure 0006038360
すると、工程(420)において、符号語vcにおいて必要な傾きは、θ(vc)集合に属するブロック内の全ての最適な傾きの包絡線として求められ得る。すなわち、
Figure 0006038360
工程(425)において、これらの包絡線の傾き全ての合計を以下のように表記するものとすると、
Figure 0006038360
各vc符号語について、限定はしないが、工程(430)において、累積傾斜関数は以下のように定義されてもよい。
Figure 0006038360
全符号語が範囲[cL,cH]内にマッピングされることを担保するためには、vc符号語からsi値へのマッピングは、以下を用いて算出してもよい。
Figure 0006038360
等式(13)が与えられたとき、入力vc値と出力si値の間のマッピングは、順方向マッピングルックアップテーブル(例えば、LUTF(vc))を用いて算出してもよい。ある実施形態においては、このテーブルは、データと一緒に保存してもよいし、画像メタデータ(119)の一部としてデコーダに送信し、デコーダが逆方向マッピング処理を再構築し得るようにしてもよい。
Figure 0006038360
ある実施形態例において、表2は、疑似コードを用いて、図4に示すマッピング処理をまとめたものである。

表2
Figure 0006038360
いくつかの実施形態において、等式(12)では、代替的な関数を用いて累積傾斜関数k(vc)を算出してもよい。例えば、k(vc)値は、合算する前に、以下のようにフィルタリングまたは重み付けされてもよい。
Figure 0006038360
ただし、wiは、所定の重み、または、(2u+1)フィルタタップ(例えば、u=2であって、フィルタ係数はローパスフィルタのそれと対応する)を有するフィルタのフィルタ係数を表す。
図5は、[cL,cH]範囲を[0、255]とした場合の、フレーム群のテストシーケンスについての、vc符号語に対する包絡線傾きk(vc)値のプロットの一例を示す。
図5に示すデータに対して、図6は、vcに対する ̄付K(vc)マッピングの一例を示す。
逆再構成
デコーダにおいて、等式(13)の ̄付K(vc)値が与えられると、逆量子化器または再構成関数(140)は以下のようにして求められ得る。
各復号化符号語(^付sc)に対して、
Figure 0006038360
とすると、
Figure 0006038360
となる。
換言すれば、量子化領域(^付sc)における所与の符号語について、対応する推定EDR符号語(^付vc)は、まず、量子化値(^付sc)を有する全ピクセルをグループ分けし、対応するEDR符号語を見つけ、そして、集めた全EDR符号語の平均をとることによって構築される。等式(16)から、逆ルックアップテーブルLUTB(^付sc)を構築して、データと一緒に保存してもよいし、または例えばメタデータ(119)の一部としてこれをデコーダに送信してもよい。
Figure 0006038360
図6に示すデータに対して、図7は、
Figure 0006038360
マッピングまたは逆再構成(140)の一例を示す。
ある実施形態において、
Figure 0006038360
という関係によって定義されるマッピングは、メタデータ(119、127)を用いてデコーダに送信してもよい。このような手法は、ビットレートオーバーヘッドの観点から高コスト過ぎるかもしない。例えば、8ビットデータの場合、ルックアップテーブルは255個のエントリを含んでおり、これがシーンチェンジのたびに送信されてもよい。他の実施形態においては、逆方向マッピングを区分的多項式近似に置き換えてもよい。このような多項式は典型的には1次および2次多項式を含むが、高次多項式またはBスプラインを用いることも可能である。あるレイヤl(l=0、1、...、L−1)に対する1つのLUTを近似する多項式の数は、利用可能な帯域幅および処理の複雑度によって変わり得る。ある実施形態において、エンハンスメントレイヤが単一の区分を使用するのに対して、ベースレイヤは最大8区分を使用する。
表3は、ある実施形態において、2次多項式を用いてデコーダLUTテーブルを近似するアルゴリズムの一例を示す。
表3:2次多項式を用いたLUT近似
Figure 0006038360
Figure 0006038360
表3に示すように、ある実施形態において、近似処理の入力は、元のルックアップテーブル(例えば、等式(16)を用いて算出)と、LUT中の値および多項式近似により生成される値の間の許容可能な誤差範囲と、利用可能な符号語数と、その最初の符号語値(等式(1)参照)とを含む。出力は、各多項式のエンドポイント(ピボットポイントとも呼ぶ)と、多項式係数とを含み得る。
最初のピボットポイントからスタートして、アルゴリズムは、限定はしないが2次多項式を用いて、利用可能な符号語の最大範囲のフィッティングを試みる。平均二乗誤差多項式フィット等のような、任意の既知の多項式フィットアルゴリズムを用いてよい。
算出最大誤差が入力許容範囲を超える場合、最適な多項式のパラメータを保存して、新たな多項式の検索を開始し、これをLUTテーブル全体がマッピングされるまで行う。
いくつかの実施形態において、1つのLUTを近似するのに使用できる多項式数が固定値(例えば8)に制限される場合がある。その場合、より大きな誤差許容範囲をアルゴリズムに組み込んでよい。
表3の方法はまた、より高次の多項式、Bスプラインまたは近似関数の組み合わせなどの他の近似関数に対応するようにも容易に改変可能である。
知覚的に均質な色空間における符号化
ビデオ信号は典型的にはよく知られたRGB色空間に描画されるが、MPEG−2、H.264(AVC)、H.265(HEVC)等のようなほとんどのビデオ圧縮規格は、これと対立するYCbCrまたはYUVのような色空間で使用するように最適化されている。これらの色空間は、8〜10ビットの標準ダイナミックレンジ(SDR)ビデオを符号化および送信するのには十分であるが、ビット/ピクセル要件の観点からは、EDRビデオを符号化および送信する際に最も効率が良いとはいえない。例えば、Lu’v’およびLog(L)u’v’色空間がこれまでに提唱されている。
発明者らの理解によれば、知覚的に均質な色空間における信号の符号化は、ビデオコーデックによる処理の前のu’およびv’色度データを追加的に処理することによって利点を有し得る。例えば、ある実施形態において、エンコーダにおいて、このような処理は、信号再構築処理(110)の一部として入力信号(102)上で行われ得る。
白色点変換
ある実施形態において、線形XYZからルマu’v’色空間への変換は、以下の工程を含み得る。
a)白色点の座標(例えば、D65)を定義し、
b)Luma=f(Y)について解を求め、
c)X、YおよびZからu’およびv’について解を求める。
本明細書において、関数f(Y)は、L(またはL’)、Log(L)等のような明度に関連する関数を表している。好適な実施形態において、f(Y)は、‘212出願に記載したような知覚的量子化(PQ)マッピング関数を表していてもよい。
ある実施形態においては、白色点は、u’およびv’座標を用いてD65(6500K)と定義されてもよい。
Du=d65u=0.1978300066428;
Dv=d65v=0.4683199949388;
ある実施形態において、u’およびv’は以下のように求めることができる。
Figure 0006038360
逆演算処理は以下を含む。
a)白色点の座標(例えば、D65)を定義し、
b)Y=f-1(Luma)について解を求め、
c)u’およびv’からXおよびZについて解を求める。
例えば、‘212出願による知覚的量子化関数を用いる実施形態においては、対応する逆PQマッピングを適用してYピクセル値を生成することが可能である。
ある実施形態において、XおよびZは以下のように求めることができる。
Figure 0006038360
図8Aは、u’v’色度空間における白色点(805)(例えば、D65)の従来のマッピングを示している。図8Aに示すように、u’およびv’色度値の範囲は、概ね、u’については(0、0.623)であり、v’については(0、0.587)である。図8Aに示すように、D65白色点は、u’v’信号表記では中心ではない。これにより、色差成分をサブサンプリングおよびアップサンプリングして、元の4:4:4色フォーマットとビデオ符号化において典型的に用いられる4:2:0または4:2:2色フォーマットとの間の変換を行った後に、色ズレが生じ得る。このような色ズレを軽減するために、色度値に変換関数を適用することが推奨される。ある実施形態において、この変換関数によって、白色点を、概ね、変換後のu’v’の中心にずらすが、白色点は、クロマ誤差を引きつけたい任意の他の色値に置き換えられてもよい。例えば、変換後の値u’tおよびv’tが(0、1)の範囲内にある場合、以下のマッピングを適用してもよい。
Figure 0006038360
ただし、DuおよびDvは選択された白色点の元のu’およびv’座標を表し、(b1、b2)は変換後の色空間における白色点の所望位置の座標を決定し、ai(i=1、2)は、所望の変換点およびu’およびv’の最小および最大値に基づいて算出される定数である。ある実施形態において、変換パラメータ(例えば、a1およびa2)は、全体のビデオシーケンスについて固定であってもよい。別の実施形態においては、入力コンテンツの色度範囲が変化することを利用するために、シーン毎またはフレーム毎に変換パラメータを算出してもよい。
図8Bは、ある実施形態例による変換後の色度空間における白色点(805)のマッピングを示す。図8Bにおいて、元のu’およびv’色度値は、選択点(例えば、D65)が概ね変換後の色度空間の中心(0.5、0.5)になるように置き換えられる。例えば、変換後の値u’tおよびv’tが(0、1)内であれば、b1=b2=0.5について、ある実施形態において、以下のマッピングを適用してもよい。
Figure 0006038360
ただし、DuおよびDvは、選択された白色点のu’およびv’座標を表す。この変換の結果、色誤差は、色相ずれではなく、脱飽和に見えるであろう。u’およびv’色度値に非線形関数を適用して、これと同じ変換を実現することも可能であることは当業者であれば理解できるであろう。このような非線形関数は、符号化および量子化による色誤差の可視性をさらに低減するために、ほぼ中間色である色に対してより高い精度を割り当ててもよい。
クロマエントロピーの低減
u’およびv’ピクセル成分に光度の関数を掛ければ、クロマ的詳細の可視性をより改善できるかもしれない。例えば、ある実施形態において、変換された色度値は以下のように求めてもよい。
Figure 0006038360
ただし、g(Luma)はルマチャネルの関数を表している。ある実施形態において、g(Luma)=Lumaである。
デコーダにおいて、入力信号はLumau’tv’tと表記され得る。多くの用途において、この信号は、さらなる処理の前に、変換してXYZ、RGBまたは他の色空間に戻さなければならない。ある実施形態例において、Lumau’tv’tからXYZへの色変換処理は、以下の工程を含み得る。
a)Luma符号化を元に戻し、
Y=f-1(Luma)
b)u’tおよびv’tの値をスケーリングする範囲を元に戻して、u’およびv’に戻し、
c)等式(18)を用いてXおよびZを復元する。
いくつかの実施形態において、入力信号のLuma、u’tおよびv’t成分は、何らかの色変換を行う前に、(0、1)範囲に正規化してもよい。いくつかの実施形態において、ルックアップテーブル、乗算、加算を組み合わせることによって等式(17)〜(21)を実行してもよい。例えば、ある実施形態において、
Y=f-1(Luma)
B=3u’、
C=20v’、および
D=1/(4v’)
が、Luma、u’およびv’を入力とする3つのルックアップテーブルの出力を表しているとすると、等式(18)から、XおよびZの値は、以下のように4つの乗算と2つの加算を用いて算出され得る。
Z=(Y*D)*(12−B−C)
および
X=(Y*D)*(3*B)
例えば、ある実施形態において、10ビット符号化信号について、各LUTは、それぞれターゲットアプリケーションにとって十分な精度(例えば、32ビット)を持つ1024個のエントリを含んでいてもよい。
図9は、本発明のある実施形態による、符号化および復号化パイプラインの一例を示す。入力信号(902)は、RGB4:4:4または他の適切な色フォーマットであり得る。工程(910)において、例えば、輝度値に対し知覚的量子化(PQ)マッピング、および色度値に対し等式(17)を用いて、信号(902)を知覚的ルマ u’v’フォーマットに置き換えられる。工程(915)において、白色点が概ね変換された色度空間の中心に位置するように、例えば、等式(19)〜(21)に示す変換を適用して、元のu’v’色度値を変換された色度値u’tおよびv’tに置き換える。この色変換および変換後Lumau’tv’t4:4:4信号(例えば、917)は、ビデオエンコーダ(920)による符号化の前に、4:2:0または4:2:2フォーマットに色サブサンプリングされてもよい(図示せず)。ビデオエンコーダ(920)は、上述のように、信号再構成(110)およびレイヤ分解(115)処理を含んでいてもよい。受信器上では、ビデオデコーダ(930)が復号化信号(932)を生成する。ビデオデコーダ(930)は、信号逆再構成およびレイヤ結合器(140)を備えていてもよい。任意の色アップサンプリング(例えば、4:2:0から4:4:4)の後に、(915)の変換演算処理を逆転することによって、逆色度変換工程(935)がLumau’tv’t信号(932)を変換してLuma u’v’信号(937)に戻してもよい。最後に、Luma u’v’信号(937)を変換して、RGBまたは他の適切な色空間の出力信号(942)とし、これを表示またはさらに処理してもよい。
知覚的量子化されたIPT色空間における符号化
白色点変換は、IPT色空間またはIPT−PQ色空間(エンハンストまたはハイダイナミックレンジを有するビデオ信号の符号化に理想的に適していると思われる知覚的量子化された色空間)のような他の色空間にも適用してもよい。IPT−PQ色空間を最初に記載したのは、本願にその全文が援用される、R.Atkinsらによる2014年2月13日出願の「Display management for high dynamic range video」という表題のPCT出願PCT/US2014/016304である。
本願にその全文が援用される、F.EbnerおよびM.D.Fairchildによる「Development and testing of a color space (ipt) with improved hue uniformity」、Proc.6th Color Imaging Conference: Color Science, Systems, and Applications, IS&T, Scottsdale, Arizona、1998年11月、pp.8−13(「Ebner論文」と呼ぶ)に記載のIPT色空間は、人間の視覚システムにおける錐体間の色差のモデルである。その意味ではYCbCrまたはCIE−Lab色空間のようであるが、いくつかの科学的研究において、これらの空間よりも人間の視覚処理をより良く模擬することが分かっている。CIE−Labと同様に、IPTは、何らかの参照輝度に対する正規化された空間である。ある実施形態において、正規化は、ターゲットディスプレイの最大輝度に基づいていてもよい。
本明細書において、用語「PQ」は知覚的量子化を指す。人間の視覚システムは、光レベルの増大に対して非常に非線形的に反応する。人間が刺激を見る能力は、その刺激の輝度、その刺激の大きさ、その刺激を構成する空間周波数、および、その刺激を見ている瞬間までに目が適応した輝度レベルに影響される。好適な実施形態において、知覚的量子化器関数は、線形入力グレイレベルを、人間の視覚システムにおけるコントラスト感度閾値によりマッチした出力グレイレベルにマッピングする。PQマッピング関数の一例は、‘212出願に記載されており、この出願の全文を本願に援用する。ある固定刺激サイズに対して、それぞれの輝度レベル(即ち、刺激レベル)について、最高感度の適応レベルおよび最高感度の空間周波数(HVSモデルによる)に応じて、その輝度レベルにおける最小可視コントラストステップを選択する。物理的な陰極線管(CRT)装置の応答曲線を表しており、人間の視覚システムの応答の仕方に対して非常に大まかな意味での類似性を偶然有し得る従来のガンマ曲線と比較して、‘212出願において決定されているPQ曲線は、比較的シンプルな関数モデルを用いながら人間の視覚システムの本当の視覚応答を模擬している。
表1は、表示時点においてデジタルビデオ符号値を絶対線形輝度レベルに変換するための知覚的曲線EOTFの計算を示している。絶対線形輝度をデジタル符号値に変換するための逆OETFの計算も含まれている。

表1
例示的な等式定義:
D=知覚的曲線デジタル符号値、SDI−legal符号無し整数、10または12ビット
b=デジタル信号表記における成分毎のビット数、10または12
V=正規化された知覚的曲線信号値、0≦V≦1
Y=正規化された輝度値、0≦Y≦1
L=絶対輝度値、0≦L≦10,000cd/m2

例示的なEOTF復号化等式:
Figure 0006038360

例示的なOETF符号化等式:
Figure 0006038360

例示的な定数:
Figure 0006038360

備考:
1.演算子INTは、0〜0.4999...の範囲の小数部に対しては値0を返し、0.5〜0.9999...の範囲の小数部に対しては+1を返す(即ち、0.5より大きい小数部は切り上げ)。
2.定数は全て四捨五入の問題を回避するために、12ビット有理数のちょうどの倍数として定義する。
3.R、GまたはB信号成分は、上記のY信号成分と同じ方法で算出する。
IPT−PQ色空間への信号の変換は、以下の工程を含み得る。
a)入力色空間(例えば、RGBまたはYCbCr)からXYZに信号を変換する。
b)以下のように、信号をXYZからIPT−PQに変換する。
a.3x3XYZをLMS行列に適用して、信号をXYZからLMSに変換する。
b.LMS信号の各色成分を知覚的量子化されたLMS信号(L’M’S’またはLMS−PQ)に変換する(例えば、等式(t2)を適用して)。
c.3x3LMSをIPT行列に適用して、LMS−PQ信号をIPT−PQ色空間に変換する。
3x3XYZからLMS、および、L’M’S’(またはLMS−PQ)からIPTの変換行列の例は、Ebner論文に見出すことができる。IPT−PQ信号の色成分(例えば、P’およびT’)が範囲(−0.5、0.5)内にあるとすると、色成分の範囲が実質的に範囲(0、1)内となるように、バイアスa(例えば、a=0.5)を加えてもよい。例えば、
Figure 0006038360
逆色演算処理は、以下の工程を含み得る。
a)色成分に加えられた全てのバイアス値を引いておき、
b)3x3I’P’T’をLMS変換行列に適用して、IPT−PQからLMS−PQに変換し、
c)逆PQ関数を適用して、LMS−PQからLMSに変換し(例えば、等式(t1)を使用)、
d)3x3LMSをXYZ変換に適用して、LMSからXYZに変換し、
e)XYZから、選択した装置依存の色空間(例えば、RGBまたはYCbCr)に変換する。
実際には、符号化および/または復号化の際の色変換工程は、予め算出した1−Dルックアップテーブル(LUTs)を用いて行われてもよい。
クロマエントロピーの低減
上述のように、P’およびT’ピクセル成分に光度の関数(例えば、I’)を掛ければ、クロマ的詳細の可視性はさらに改善されるかもしれない。例えば、ある実施形態において、変換された色度値は以下のように求めることができる。
Figure 0006038360
ただし、g(I’)は、ルマチャネル(I’)の線形または非線形関数を表している。ある実施形態において、g(I’)=I’である。
コンピュータシステム実装例
本発明の実施形態は、コンピュータシステム、電子回路およびコンポーネントで構成されたシステム、マイクロコントローラ、フィールドプログラマブルゲートアレイ(FPGA)または他のコンフィギュラブルまたはプログラマブルロジックデバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)などの集積回路(IC)デバイス、および/または、このようなシステム、デバイスまたはコンポーネントを1つ以上含む装置、を用いて実施し得る。このコンピュータおよび/またはICは、本明細書に記載のようなエンハンストダイナミックレンジ(EDR)を有するビデオ画像の階層符号化のための適応的再構成技術に関する命令を行い、制御し、または実行し得る。このコンピュータおよび/またはICは、本明細書に記載の適応的再構成プロセスに関する様々なパラメータまたは値のいずれを演算してもよい。画像およびビデオ実施形態は、ハードウェア、ソフトウェア、ファームウェア、および、その様々な組み合わせで実施され得る。
本発明の特定の態様は、本発明の方法をプロセッサに行わせるためのソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどの中の1つ以上のプロセッサは、そのプロセッサがアクセス可能なプログラムメモリ内にあるソフトウェア命令を実行することによって、上記のようなエンハンストダイナミックレンジ(EDR)を有するビデオ画像の階層符号化のための適応的再構成技術に関する方法を実装し得る。本発明は、プログラム製品形態で提供されてもよい。このプログラム製品は、データプロセッサによって実行された時に本発明の方法をデータプロセッサに実行させるための命令を含む1セットの、コンピュータが可読な信号を格納する任意の媒体を含み得る。本発明によるプログラム製品は、様々な形態をとり得る。例えば、このプログラム製品は、フロッピーディスク、ハードディスクドライブを含む磁気データ記憶媒体、CD ROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMなどを含む電子データ記憶媒体、などの物理的媒体を含み得る。このプログラム製品上のコンピュータ可読信号は、任意に、圧縮または暗号化されていてもよい。
上記においてあるコンポーネント(例えば、ソフトウェアモジュール、プロセッサ、アセンブリ、デバイス、回路など)に言及している場合、そのコンポーネントへの言及(「手段」への言及を含む)は、そうでないと明記されている場合を除いて、当該コンポーネントの機能を果たす(例えば、機能的に均等である)あらゆるコンポーネント(上記した本発明の実施形態例に出てくる機能を果たす開示構造に対して構造的に均等ではないコンポーネントも含む)を、当該コンポーネントの均等物として、含むものと解釈されるべきである。
均等物、拡張物、代替物、その他
エンハンストダイナミックレンジ(EDR)を有するビデオ画像の階層符号化のための適応的再構成技術に関する実施形態例を上述した。この明細書中において、実装毎に異なり得る多数の詳細事項に言及しながら本発明の実施形態を説明した。従って、本発明が何たるか、また、本出願人が本発明であると意図するものを示す唯一且つ排他的な指標は、本願が特許になった際の請求の範囲(今後出されるあらゆる訂正を含む、特許となった特定請求項)である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項において明示されていない限定事項、要素、性質、特徴、利点または属性は、その請求項の範囲をいかなる意味においても限定すべきではない。従って、本明細書および図面は、限定的ではなく、例示的であるとみなされるものである。

Claims (15)

  1. 画像ブロックを含む入力エンハンストダイナミックレンジ(EDR)画像のシーケンスを符号化する方法であって、
    前記入力エンハンストダイナミックレンジ(EDR)画像のシーケンスを受信する工程と、
    前記入力EDR画像の前記シーケンス内の少なくとも1つの入力画像において前記画像ブロックのうち1つ以上についてブロック複雑性尺度を算出する工程であって、前記ブロック複雑性尺度はピクセル値の変化を表す、工程と、
    前記画像ブロックの第1の集合を構築する工程であって、前記第1の集合は算出したブロック複雑性尺度が所定の基準を満たす画像ブロックを含む、工程と、
    前記画像ブロックの前記第1の集合中の各ブロックに対して、線形量子化モデルの傾き生成関数によって最適な傾き(k(j,n))を決定する工程であって、前記最適な傾きは当該ブロックのための前記線形量子化モデルの最小の傾きを表す、工程と、
    前記入力EDR画像の前記シーケンスの各入力符号語(vcであって、前記少なくとも1つの入力画像に含まれ、かつ、符号化されていてもよい各ピクセル値を表す各入力符号語(v c に対し、
    画像ブロックの第2の集合を構築する工程であって、前記第2の集合は前記画像ブロックの前記第1の集合に属するブロックを含んでおり、かつ前記入力符号語が前記画像ブロックの最小および最大ピクセル値内にある、工程、
    前記入力符号語について包絡線の傾き(k(vc))を生成する工程であって、当該包絡線の傾きは、前記第2の集合中のブロック群の前記最適な傾きの中で最大の最適な傾きを用いて算出される、工程、および
    全符号語についての前記包絡線の傾きの総和(k)を算出する工程であって、前記全符号語は、前記入力EDR画像の前記シーケンス内の最小符号語から最大符号語までの入力符号語をカバーする、工程と、
    各入力符号語に対し、
    累積傾斜(K(vc))を生成する工程であって、前記累積傾斜は、当該入力符号語を含む当該入力符号語までの包絡線の傾きの総和を含む、工程、および
    前記入力符号語と出力符号語との間のマッピング関数を生成する工程であって、前記マッピング関数は、前記入力符号語の前記累積傾斜と前記全符号語の全包絡線の傾きの総和とから算出される工程と、を包含する方法。
  2. さらに、
    前記マッピング関数を前記入力EDR画像に適用して、これにより、再構成した画像を生成する工程と、
    前記再構成した画像を1つ以上のレイヤに分解する工程と、
    1つ以上のビデオエンコーダを用いて前記1つ以上のレイヤを符号化する工程とを包含する、請求項1に記載の方法。
  3. 再構成されたピクセルsとL個のレイヤとが与えられたとき、前記分解工程は前記sピクセルをslピクセル値にマッピングすることを含み、
    l=Clip3(s,pl,pl+1−1)−pl
    l=0、1、...、L−1は、前記L個のレイヤのうちの1つを表し、Clip3()は、plおよびpl+1−1の値の間において再構成したピクセルsをクリッピングするクリッピング関数であり、plは、レベルlにおいて前記再構成したシーケンスの最小ピクセル値を表す、請求項2に記載の方法。
  4. 0=0、かつ、
    Figure 0006038360
    であり、
    jは、レベルjにおいてビデオエンコーダのために利用可能な符号語の数を表している、請求項3に記載の方法。
  5. 前記線形量子化モデルは、
    Figure 0006038360
    によって表される関数を含み、
    ただし、vLおよびvHは前記入力EDR画像の前記シーケンス内の前記最小および最大符号を表し、cLおよびcHは最小および最大出力符号を表し、k(j,n)は前記入力EDR画像の前記シーケンス内のj番目のフレームのn番目のブロックにおける量子化傾きを表し、viは入力符号語を表し、siは対応する出力符号語を表す、請求項1に記載の方法。
  6. 前記最適な傾きk(j,n)は、
    Figure 0006038360
    を算出することによって生成され、ここで、Tthは所定の閾値であり、B(j,n)はフレームjのブロックn内の最大ピクセル値を表し、A(j,n)はフレームjのブロックn内の最小ピクセル値を表す、請求項5に記載の方法。
  7. ある画像ブロックの前記ブロック複雑性尺度を算出する工程は、前記画像ブロック内の最大および最小ピクセル値の差異を算出することを含み、前記第1の画像ブロックの集合はそのブロック複雑性尺度が0よりも大きい全ての画像ブロックを含む、請求項1に記載の方法。
  8. 前記vc符号語に対する包絡線の傾きk(vc)を生成する工程は、
    Figure 0006038360
    を算出することを含み、ここで、k(j,n)は前記入力EDR画像シーケンスのフレームjのブロックnに対する最適な傾きを表し、θ(vc)は前記第2の画像ブロックの集合を表す、請求項1に記載の方法。
  9. 前記符号語vcに対する累積傾斜K(vc)を算出する工程は、
    Figure 0006038360
    を算出することを含み、ここで、k(i)はi番目の入力符号語に対する前記包絡線の傾きを表す、請求項1に記載の方法。
  10. 前記入力符号語と前記出力符号語との間の前記マッピング関数 ̄付K(vc)を生成する工程は、
    Figure 0006038360
    を算出することを含み、ここで、K(vc)は符号語vcに対する累積傾斜を表し、kは全符号語の全包絡線の傾きの総和を表し、cLおよびcHは最小および最大出力符号を表す、請求項1に記載の方法。
  11. EDR符号化システムにおいて、受信したマッピング済み出力符号語と推定EDR符号語との間の逆方向マッピングを生成する方法であって、前記受信したマッピング済み出力符号語は請求項1に記載の方法によって生成され、
    ある受信したマッピング済み出力符号語について、順方向マッピング関数を用いて、前記受信したマッピング済み出力符号語にマッピングされ得る全入力符号語を特定する工程と、
    前記受信したマッピング済み出力符号語にマッピングされた、特定された前記全入力符号語の平均に基づいて算出された前記推定EDR符号語に前記受信したマッピング済み出力符号語をマッピングすることによって、逆方向マッピングを生成する工程と、を包含する方法。
  12. 前記1つ以上のビデオエンコーダは、第1および第2のビデオエンコーダを含み、
    前記第1のビデオエンコーダは第1のビット深度を用いて第1のレイヤを符号化し、前記第2のビデオエンコーダは第2のビット深度を用いて第2のレイヤを符号化し、前記第2のビット深度は前記第1のビット深度とは異なる、請求項に記載の方法。
  13. 前記1つ以上のビデオエンコーダは、第1および第2のビデオエンコーダを含み、
    前記第1のビデオエンコーダは第1の符号化フォーマットを用いて第1のレイヤを符号化し、前記第2のビデオエンコーダは第2の符号化フォーマットを用いて第2のレイヤを符号化し、前記第2の符号化フォーマットは前記第1の符号化フォーマットとは異なる、請求項に記載の方法。
  14. プロセッサを備え、請求項1から13に記載の方法のいずれかを実行するように構成された装置。
  15. 請求項1から13のいずれかに記載の方法を実行するためのコンピュータが実行可能な命令を格納した非一時的コンピュータ可読記憶媒体。
JP2015563023A 2013-06-17 2014-06-16 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成 Active JP6038360B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361836044P 2013-06-17 2013-06-17
US61/836,044 2013-06-17
US201461951914P 2014-03-12 2014-03-12
US61/951,914 2014-03-12
US201462002631P 2014-05-23 2014-05-23
US62/002,631 2014-05-23
PCT/US2014/042583 WO2014204865A1 (en) 2013-06-17 2014-06-16 Adaptive reshaping for layered coding of enhanced dynamic range signals

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2016169138A Division JP6181259B2 (ja) 2013-06-17 2016-08-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP2016213145A Division JP6312775B2 (ja) 2013-06-17 2016-10-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成

Publications (2)

Publication Number Publication Date
JP2016529741A JP2016529741A (ja) 2016-09-23
JP6038360B2 true JP6038360B2 (ja) 2016-12-07

Family

ID=51134441

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015563023A Active JP6038360B2 (ja) 2013-06-17 2014-06-16 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP2016169138A Active JP6181259B2 (ja) 2013-06-17 2016-08-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP2016213145A Active JP6312775B2 (ja) 2013-06-17 2016-10-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2016169138A Active JP6181259B2 (ja) 2013-06-17 2016-08-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP2016213145A Active JP6312775B2 (ja) 2013-06-17 2016-10-31 エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成

Country Status (5)

Country Link
US (2) US9584811B2 (ja)
EP (1) EP3011741B1 (ja)
JP (3) JP6038360B2 (ja)
CN (2) CN106488246B (ja)
WO (1) WO2014204865A1 (ja)

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4087247A1 (en) 2014-02-26 2022-11-09 Dolby Laboratories Licensing Corp. Luminance based coding tools for video compression
EP3157242B1 (en) * 2014-06-10 2019-07-03 Panasonic Intellectual Property Management Co., Ltd. Display system, display method, and display device
MX358934B (es) * 2014-06-26 2018-09-10 Panasonic Ip Man Co Ltd Dispositivo de salida de datos, metodo de salida de datos y metodo de generacion de datos.
MX360781B (es) * 2014-09-22 2018-11-16 Panasonic Ip Man Co Ltd Método de reproducción y aparato de reproducción.
WO2016049327A1 (en) 2014-09-26 2016-03-31 Dolby Laboratories Licensing Corporation Encoding and decoding perceptually-quantized video content
EP3035688B1 (en) 2014-12-18 2019-07-31 Dolby Laboratories Licensing Corporation Encoding and decoding of 3d hdr images using a tapestry representation
JP7106273B2 (ja) 2015-01-27 2022-07-26 インターデジタル マディソン パテント ホールディングス, エスアーエス 画像及びビデオを電気光変換及び光電気変換するための方法、システム、及び機器
EP3051489A1 (en) * 2015-01-30 2016-08-03 Thomson Licensing A method and apparatus of encoding and decoding a color picture
WO2016120354A1 (en) * 2015-01-30 2016-08-04 Thomson Licensing Method and device for matching colors between color pictures of different dynamic range
CA2975172C (en) * 2015-01-30 2023-04-04 Thomson Licensing A method and apparatus of encoding and decoding a color picture
CA2976183C (en) * 2015-02-17 2023-06-20 Sony Corporation Transmission apparatus, transmission method, reception apparatus, and reception method
EP3266208B1 (en) * 2015-03-02 2019-05-08 Dolby Laboratories Licensing Corporation Content-adaptive perceptual quantization for high dynamic range images
WO2016145243A1 (en) * 2015-03-10 2016-09-15 Apple Inc. Adaptive chroma downsampling and color space conversion techniques
BR112017018552B1 (pt) * 2015-03-20 2019-10-22 Dolby Laboratories Licensing Corp aproximação para remodelagem de sinal
EP3275190B1 (en) 2015-03-25 2024-04-17 Dolby Laboratories Licensing Corporation Chroma subsampling and gamut reshaping
CN109068139B (zh) * 2015-04-06 2022-02-22 杜比实验室特许公司 用于环内再成形的方法、设备和计算机可读存储介质
US20160309154A1 (en) * 2015-04-17 2016-10-20 Qualcomm Incorporated Dynamic range adjustment for high dynamic range and wide color gamut video coding
WO2016172091A1 (en) * 2015-04-22 2016-10-27 Dolby Laboratories Licensing Corporation Signal reshaping and coding in the ipt-pq color space
US10257526B2 (en) * 2015-05-01 2019-04-09 Disney Enterprises, Inc. Perceptual color transformations for wide color gamut video coding
US20180167615A1 (en) * 2015-06-07 2018-06-14 Sharp Kabushiki Kaisha Systems and methods for optimizing video coding based on a luminance transfer function or video color component values
US10397585B2 (en) * 2015-06-08 2019-08-27 Qualcomm Incorporated Processing high dynamic range and wide color gamut video data for video coding
JP6532962B2 (ja) 2015-06-09 2019-06-19 華為技術有限公司Huawei Technologies Co.,Ltd. 画像符号化方法、画像復号方法、符号化デバイス、および復号デバイス
EP3113496A1 (en) 2015-06-30 2017-01-04 Thomson Licensing Method and device for encoding both a hdr picture and a sdr picture obtained from said hdr picture using color mapping functions
EP3113495A1 (en) * 2015-06-30 2017-01-04 Thomson Licensing Methods and devices for encoding and decoding a hdr color picture
US10701359B2 (en) 2015-06-30 2020-06-30 Dolby Laboratories Licensing Corporation Real-time content-adaptive perceptual quantizer for high dynamic range images
CN107852511B (zh) * 2015-07-16 2020-09-22 杜比实验室特许公司 用于hdr和宽色域信号的信号整形和编码
US10575005B2 (en) 2015-07-22 2020-02-25 Dolby Laboratories Licensing Corporation Video coding and delivery with both spatial and dynamic range scalability
WO2017019818A1 (en) * 2015-07-28 2017-02-02 Vid Scale, Inc. High dynamic range video coding architectures with multiple operating modes
JP6320440B2 (ja) * 2015-08-04 2018-05-09 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ信号のための信号再構成
JP6633739B2 (ja) * 2015-08-20 2020-01-22 エルジー エレクトロニクス インコーポレイティド 放送信号送信装置、放送信号受信装置、放送信号送信方法、及び放送信号受信方法
US10652588B2 (en) 2015-09-21 2020-05-12 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
US10778983B2 (en) 2015-09-23 2020-09-15 Dolby Laboratories Licensing Corporation Preserving texture/noise consistency in video codecs
JP6608067B2 (ja) * 2015-09-23 2019-11-20 アリス エンタープライジズ エルエルシー 映像復号化器における高ダイナミックレンジ適応演算
EP3338452B1 (en) * 2015-09-23 2020-08-26 ARRIS Enterprises LLC Signalling of reshaping functions for coding high dynamic range and wide color gamut sequences
EP3369241B1 (en) 2015-10-28 2020-12-09 InterDigital VC Holdings, Inc. Method and device for selecting a process to be applied on video data from a set of candidate processes driven by a common set of information data
US10311558B2 (en) * 2015-11-16 2019-06-04 Dolby Laboratories Licensing Corporation Efficient image processing on content-adaptive PQ signal domain
CN108370405B (zh) * 2015-12-23 2019-11-26 华为技术有限公司 一种图像信号转换处理方法、装置及终端设备
CN106937121B (zh) * 2015-12-31 2021-12-10 中兴通讯股份有限公司 图像解码和编码方法、解码和编码装置、解码器及编码器
US10165275B2 (en) * 2016-01-26 2018-12-25 Dolby Laboratories Licensing Corporation Content-adaptive reshaping for high dynamic range images
US10032262B2 (en) * 2016-02-02 2018-07-24 Dolby Laboratories Licensing Corporation Block-based content-adaptive reshaping for high dynamic range images
US10223774B2 (en) 2016-02-02 2019-03-05 Dolby Laboratories Licensing Corporation Single-pass and multi-pass-based polynomial approximations for reshaping functions
EP3433833B1 (en) 2016-03-23 2021-07-07 Dolby Laboratories Licensing Corporation Encoding and decoding reversible production-quality single-layer video signals
US10397586B2 (en) 2016-03-30 2019-08-27 Dolby Laboratories Licensing Corporation Chroma reshaping
EP3226563B1 (en) * 2016-03-30 2021-06-23 Dolby Laboratories Licensing Corp. Chroma reshaping
US10542296B2 (en) 2016-05-10 2020-01-21 Dolby Laboratories Licensing Corporation Chroma reshaping of HDR video signals
EP3456047B1 (en) * 2016-05-10 2020-02-26 Dolby Laboratories Licensing Corporation Chroma reshaping of hdr video signals
WO2017201139A1 (en) * 2016-05-19 2017-11-23 Dolby Laboratories Licensing Corporation Chroma reshaping for high dynamic range images
US10602110B2 (en) * 2016-08-26 2020-03-24 Dolby Laboratories Licensing Corporation Chroma reshaping based on just noticeable differences
WO2018039665A1 (en) * 2016-08-26 2018-03-01 Dolby Laboratories Licensing Corporation Chroma reshaping based on just noticeable differences
JP6771656B2 (ja) * 2016-08-30 2020-10-21 ドルビー ラボラトリーズ ライセンシング コーポレイション シングルレイヤー後方互換性コーデックのリアルタイム再構成
US10507005B2 (en) * 2016-09-22 2019-12-17 General Electric Company Spectral calibration of spectral computed tomography (CT)
KR102636100B1 (ko) * 2016-12-16 2024-02-13 삼성전자주식회사 데드존에 기초하여 양자화를 수행하는 인코더 및 이를 포함하는 비디오 처리 시스템
JP6929373B2 (ja) 2017-03-03 2021-09-01 ドルビー ラボラトリーズ ライセンシング コーポレイション 不均等な色空間における彩度調整
US11288781B2 (en) 2017-06-16 2022-03-29 Dolby Laboratories Licensing Corporation Efficient end-to-end single layer inverse display management coding
CN117793380B (zh) * 2017-06-29 2025-05-02 杜比实验室特许公司 整合的图像整形和视频编码
US10798321B2 (en) 2017-08-15 2020-10-06 Dolby Laboratories Licensing Corporation Bit-depth efficient image processing
US10609372B2 (en) 2017-09-29 2020-03-31 Dolby Laboratories Licensing Corporation Up-conversion to content adaptive perceptual quantization video signals
US10778979B2 (en) * 2018-01-11 2020-09-15 Qualcomm Incorporated Signaling mechanisms for equal ranges and other DRA parameters for video coding
US10880531B2 (en) * 2018-01-31 2020-12-29 Nvidia Corporation Transfer of video signals using variable segmented lookup tables
MX2020008499A (es) 2018-02-14 2020-09-25 Dolby Laboratories Licensing Corp Reconfiguracion de imagenes en codificacion de video usando la optimizacion de tasa-distorsion.
US11310537B2 (en) 2018-02-28 2022-04-19 Dolby Laboratories Licensing Corporation Linear encoder for image/video processing
US10757428B2 (en) 2018-10-10 2020-08-25 Apple Inc. Luma and chroma reshaping of HDR video encoding
US10484784B1 (en) 2018-10-19 2019-11-19 xMEMS Labs, Inc. Sound producing apparatus
EP3713237A1 (en) * 2019-03-20 2020-09-23 InterDigital VC Holdings, Inc. A method and apparatus for depth encoding and decoding
US12047612B2 (en) * 2019-06-21 2024-07-23 Interdigital Ce Patent Holdings, Sas Luma mapping with chroma scaling (LMCS) lut extension and clipping
US11405582B2 (en) * 2019-06-28 2022-08-02 Meta Platforms, Inc. Preprocessing of high-dynamic-range video using a hybrid lookup table scheme
CN114747224B (zh) * 2019-11-27 2023-12-01 杜比实验室特许公司 一种用于生成整形函数的方法、装置以及存储介质
PH12022552811A1 (en) 2020-04-21 2024-02-12 Dolby Laboratories Licensing Corp Reshaping functions for hdr imaging with continuity and reversibility constraints
MX2022013191A (es) * 2020-04-22 2023-01-05 Dolby Laboratories Licensing Corp Optimización iterativa de funciones de remodelación en códec de imágenes hdr de una sola capa.
US11516429B2 (en) * 2020-04-22 2022-11-29 Grass Valley Limited System and method for image format conversion using 3D lookup table approximation
EP4193592A1 (en) 2020-08-06 2023-06-14 Dolby Laboratories Licensing Corporation Adaptive streaming with false contouring alleviation
US11544826B2 (en) * 2021-04-30 2023-01-03 Realnetworks, Inc. Intelligent metadata service for video enhancement
US11962788B2 (en) * 2021-08-03 2024-04-16 Vertiv It Systems, Inc. DVCX and DVCY extensions to DVC video compression
JP2025509720A (ja) * 2022-03-18 2025-04-11 ドルビー ラボラトリーズ ライセンシング コーポレイション モバイル捕捉および編集アプリケーションにおける画像の最適化
CN115390780B (zh) * 2022-10-28 2023-02-10 广州市保伦电子有限公司 一种拼接屏配对方法及装置
US20240403999A1 (en) * 2023-05-30 2024-12-05 Apple Inc. Mixed reality recording of foveated display content systems and methods

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5313298A (en) 1992-03-05 1994-05-17 Rubin, Bednarek And Associates, Inc. Video companding method and system
US6560285B1 (en) 1998-03-30 2003-05-06 Sarnoff Corporation Region-based information compaction as for digital images
JP2002109523A (ja) 2000-09-28 2002-04-12 Minolta Co Ltd 撮像装置、光学フィルタ群および画像データ変換装置
US7023580B2 (en) 2001-04-20 2006-04-04 Agilent Technologies, Inc. System and method for digital image tone mapping using an adaptive sigmoidal function based on perceptual preference guidelines
US20030111533A1 (en) 2001-12-19 2003-06-19 Koninklijke Philips Electronics N.V. RGB led based white light control system with quasi-uniform color metric
TW548509B (en) 2002-11-12 2003-08-21 Novatek Microelectronics Corp Estimation method for white-point offset of the white balance point
JP2005037996A (ja) * 2003-07-15 2005-02-10 Matsushita Electric Ind Co Ltd 画像処理装置および方法
JP2005167962A (ja) * 2003-11-11 2005-06-23 Secom Co Ltd 符号化信号分離装置、符号化信号合成装置および符号化信号分離合成システム
JP2006071332A (ja) 2004-08-31 2006-03-16 Fuji Photo Film Co Ltd 演色性評価方法及びその装置並びにこの演色性評価方法で評価して製造した発光装置
US8537893B2 (en) * 2006-01-23 2013-09-17 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. High dynamic range codecs
US8493514B2 (en) 2007-07-16 2013-07-23 Lg Electronics Inc. Apparatus for controlling color temperature
US8019150B2 (en) 2007-10-11 2011-09-13 Kwe International, Inc. Color quantization based on desired upper bound for relative quantization step
CN101282437A (zh) * 2008-04-19 2008-10-08 青岛海信电器股份有限公司 一种解码装置
US8446961B2 (en) * 2008-07-10 2013-05-21 Intel Corporation Color gamut scalability techniques
CN101355634B (zh) * 2008-08-26 2013-06-05 北京中星微电子有限公司 一种调整图像色度的方法和系统
WO2010104624A2 (en) 2009-03-10 2010-09-16 Dolby Laboratories Licensing Corporation Extended dynamic range and extended dimensionality image signal conversion
WO2010105036A1 (en) * 2009-03-13 2010-09-16 Dolby Laboratories Licensing Corporation Layered compression of high dynamic range, visual dynamic range, and wide color gamut video
US8390642B2 (en) * 2009-04-30 2013-03-05 Hewlett-Packard Development Company, L.P. System and method for color space setting adjustment
JP5330562B2 (ja) 2010-04-27 2013-10-30 東京エレクトロン株式会社 成膜装置
TWI559779B (zh) 2010-08-25 2016-11-21 杜比實驗室特許公司 擴展影像動態範圍
JP2012108707A (ja) 2010-11-17 2012-06-07 Toyota Motor Corp 制御装置
KR20120091578A (ko) 2011-02-09 2012-08-20 삼성전자주식회사 영상의 밝기 변환 방법 및 장치
US9451274B2 (en) 2011-04-28 2016-09-20 Koninklijke Philips N.V. Apparatuses and methods for HDR image encoding and decoding
JP2013046095A (ja) 2011-08-22 2013-03-04 Canon Inc 通信装置
WO2013039730A2 (en) * 2011-09-15 2013-03-21 Dolby Laboratories Licensing Corporation Method and system for backward compatible, extended dynamic range encoding of video
CN107103588B (zh) * 2011-09-27 2025-08-22 皇家飞利浦有限公司 用于图像的动态范围变换的装置和方法
TWI575933B (zh) 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術
WO2013086169A1 (en) 2011-12-06 2013-06-13 Dolby Laboratories Licensing Corporation Device and method of improving the perceptual luminance nonlinearity - based image data exchange across different display capabilities
JP5511882B2 (ja) 2012-04-19 2014-06-04 ギガフォトン株式会社 極端紫外光源装置
ES2708954T3 (es) 2013-02-21 2019-04-12 Dolby Laboratories Licensing Corp Gestión de visualización para video de alto rango dinámico
BR112015024172B1 (pt) 2013-03-26 2023-01-31 Dolby Laboratories Licensing Corporation Método, sistema e meio de armazenamento legível por computador

Also Published As

Publication number Publication date
US20160134872A1 (en) 2016-05-12
WO2014204865A1 (en) 2014-12-24
US9716887B2 (en) 2017-07-25
JP2016529741A (ja) 2016-09-23
EP3011741B1 (en) 2018-03-07
CN105324997B (zh) 2018-06-29
EP3011741A1 (en) 2016-04-27
US20170085881A1 (en) 2017-03-23
US9584811B2 (en) 2017-02-28
JP6181259B2 (ja) 2017-08-16
CN105324997A (zh) 2016-02-10
JP2017079471A (ja) 2017-04-27
CN106488246A (zh) 2017-03-08
JP2017022737A (ja) 2017-01-26
CN106488246B (zh) 2019-06-11
JP6312775B2 (ja) 2018-04-18
HK1217393A1 (zh) 2017-01-06

Similar Documents

Publication Publication Date Title
JP6312775B2 (ja) エンハンストダイナミックレンジ信号の階層符号化のための適応的再構成
JP7541055B2 (ja) 高ダイナミックレンジおよび広色域シーケンスを符号化するシステム
JP6302600B2 (ja) 知覚的量子化されたビデオコンテンツの符号化および復号化
US10575005B2 (en) Video coding and delivery with both spatial and dynamic range scalability
CN109068139B (zh) 用于环内再成形的方法、设备和计算机可读存储介质
JP6608067B2 (ja) 映像復号化器における高ダイナミックレンジ適応演算
EP3069513B1 (en) Pre-dithering in high dynamic range video coding
CN108476325B (zh) 用于高动态范围颜色转换校正的介质、方法和设备
CN103535038A (zh) 用于分层vdr编码的有效架构
US10742986B2 (en) High dynamic range color conversion correction
CN108370446B (zh) 具有减小的内插误差的低复杂度查找表构造
US10715772B2 (en) High dynamic range color conversion correction
HK1217393B (zh) 用於增强动态范围信号的分层编码的自适应整形
WO2019071045A1 (en) HIGH DYNAMIC RANGE COLORING CORRECTION
HK1236298A1 (en) Encoding and decoding perceptually-quantized video content

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160115

A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20160217

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160307

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20160307

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161101

R150 Certificate of patent or registration of utility model

Ref document number: 6038360

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250