[go: up one dir, main page]

JP7543577B2 - チェーンドリシェーピング関数の最適化 - Google Patents

チェーンドリシェーピング関数の最適化 Download PDF

Info

Publication number
JP7543577B2
JP7543577B2 JP2023575544A JP2023575544A JP7543577B2 JP 7543577 B2 JP7543577 B2 JP 7543577B2 JP 2023575544 A JP2023575544 A JP 2023575544A JP 2023575544 A JP2023575544 A JP 2023575544A JP 7543577 B2 JP7543577 B2 JP 7543577B2
Authority
JP
Japan
Prior art keywords
reshaping
image
color
chained
functions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023575544A
Other languages
English (en)
Other versions
JP2024522166A (ja
Inventor
スゥ,グワン-ミーン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2024522166A publication Critical patent/JP2024522166A/ja
Application granted granted Critical
Publication of JP7543577B2 publication Critical patent/JP7543577B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本開示は、概して画像処理動作に関連する。より具体的には、本発明の実施形態は、ビデオコーデックに関する。
本願明細書で使用されるとき、用語「ダイナミックレンジ(dynamic range (DR))」は、例えば最も暗い黒色(darks)から最も明るい白色(ハイライト)までの画像内の強度(例えば、輝度、ルマ)範囲を知覚する人間の視覚システム(human visual system (HVS))の能力に関連し得る。このシーンでは、DRは「シーン参照」強度に関連する。DRは、特定幅の強度範囲を適切に又は近似的にレンダリングするディスプレイ装置の能力にも関連してよい。このシーンでは、DRは「ディスプレイ参照」強度に関連する。本願明細書の説明の任意の点において、特定のシーンが特定の重要度を有すると明示的に指定されない限り、用語はいずれかのシーンで、例えば同義的に使用されてよいことが推定されるべきである。
本願明細書で使用されるとき、用語「高ダイナミックレンジ(high dynamic range (HDR))」は、人間の視覚システム(HVS)の大きさの14~15倍又はそれより大きな程度に渡るDR幅に関連する。実際に、人間が強度範囲の中の広範な幅を同時に知覚し得るDRは、HDRに関連して、何らかの方法で省略され得る。本願明細書で使用されるとき、用語「拡張ダイナミックレンジ(enhanced dynamic range (EDR))」又は「視覚ダイナミックレンジ(visual dynamic range (VDR))」は、個々に又は同義的に、目の動きを含む人間の視覚システム(HVS)によりシーン又は画像内で知覚可能なDRに関連し、何からの光適応がシーン又は画像に渡り変化することを可能にする。本願明細書で使用されるとき、EDRは、5~6桁の大きさに広がるDRに関連してよい。HDRと呼ばれる実際のシーンに比べておそらくやや狭いが、それにも関わらず、EDRは広いDR幅を表し、更にHDRと呼ばれ得る。
実際には、画像は色空間の1つ以上の色成分)チャネル(例えば、ルマY及びクロマCb及びCr)を含み、各色成分はピクセル当たりnビット(例えば、n=8)の精度により表さNチャネルれる。非線形輝度コーディング(例えば、ガンマエンコーディング)を使用して、n≦8である画像(例えば、カラー24ビットJPEG画像)は、標準ダイナミックレンジの画像であると考えられる。一方で、n>8である画像は、拡張ダイナミックレンジの画像であると考えられてよい。
所定のディスプレイに対する参照電気光学伝達関数(electro-optical transfer function (EOTF))は、入力ビデオ信号の色値(例えば、画像を表すコードワードのうちのあるコードワードで表される輝度、等)とディスプレイによって生成される出力スクリーン色値(例えば、画像をレンダリングするために使用されるディスプレイドライブ値のうちのあるディスプレイドライブ値で表されるスクリーン輝度、等)との関係を特徴づける。例えば、ITU Rec. ITU-RBT1886「Reference electro-optical transfer function for flat panel displays used in HDTV studio production」(March 2011)は、参照によりその全体がここに組み込まれ、平面パネルディスプレイの参照EOTFを定義する。ビデオストリームが与えられると、そのEOTFに関する情報は、(画像)メタデータとしてビットストリームに埋め込まれてよい。用語「メタデータ」は、本願明細書では、符号化ビットストリームの部分として送信される任意の補助情報に関連し、復号画像をレンダリングするためにデコーダを支援する。このようなメタデータは、限定ではないが、本願明細書に記載されるような、色空間又は全色域(gamut)情報、参照ディスプレイパラメータ、及び補助信号パラメータ、を含んでよい。
用語「PQ」は、本願明細書で使用されるとき、知覚輝度振幅量子化を表す。人間の視覚システム(human visual system (HVS))は、非常に非線形な方法で、増大する光レベルに反応する。刺激を見る人間の能力は、該刺激の輝度、該刺激のサイズ、該刺激を構成する空間周波数、及び特定の瞬間に適応される目が該刺激を見ている輝度レベル、により影響を受ける。幾つかの実施形態では、知覚量子化関数は、線形入力グレイレベルを、人間の視覚システムにおいてコントラスト感度閾値により良好に一致する出力グレイレベルにマッピングする。例示的なPQマッピング関数は、参照によりその全体がここに組み込まれるSMPTE ST2084:2014「High Dynamic Range EOTF of Mastering Reference Displays」(以後「SMPTE」)に記載されており、固定刺激サイズが与えられると、輝度レベル(例えば、刺激レベル、等)毎に、該輝度レベルにおける最小可視コントラストステップが、該輝度レベルが最も敏感な適応レベル及び最も敏感な空間周波数に従い(HVSモデルに従い)選択される。
200~1000cd/m又はニト(nit)の輝度をサポートするディスプレイは、低いダイナミックレンジ(lower dynamic range (LDR))を代表し、EDR(又はHDR)に対して、標準ダイナミックレンジ(standard dynamic range (SDR))とも呼ばれる。EDRコンテンツは、より高いダイナミックレンジ(例えば、1000ニト~5000ニト、又はそれ以上)をサポートするEDRディスプレイ上で表示されてよい。このようなディスプレイは、高輝度能力(例えば0~10000ニト)をサポートする代替のEOTFを使用して定義されてよい。EOTFの例(例えば、HDR、Hybrid Log Gamma、又はHLG、等)は、SMPTE2084、及びRec. ITU-R BT.2100, “Image parameter values for high dynamic range television for use in production and international programme exchange,”(06/2017)で定義される。Rec.2020又はBT.2020色空間に関連する、参照により全体がここに組み込まれるITU Rec. ITU-R BT.2020-2, “Parameter values for ultra-high definition television systems for production and international programme exchange,” (October 2015)も参照のこと。ここで発明者によって認識されているように、多種多様なディスプレイ装置でレンダリングされる高品質のビデオコンテンツデータをコーディングするための改善された技術が望まれている。
本章に記載されるアプローチは、追求可能なアプローチであるが、必ずしも以前に考案又は追求されたアプローチではない。従って、特に示されない限り、本章に記載したアプローチのうちのいずれも、単に本章に含まれることにより従来技術と見なされるべきではない。同様に、1つ以上のアプローチに関して特定される課題は、特に示されない限り、本章に基づき任意の従来技術の中で認識されたものと想定されるべきではない。
WO2018/005705A1は、高ダイナミックレンジのビデオ信号を再構成する方法を開示している。デコーダは、入力ビットストリーム内のパラメータを受信して、予測関数を生成する。予測関数を使用して、各ノードが入力ノード値と出力ノード値によって特徴付けられる、第1予測ルックアップテーブルのためのノードの第1セットを生成する。次に、ノードの第1セットのうちの1つ以上の出力ノード値を変更して、第2予測ルックアップテーブルのためのノードの第2セットを生成し、第2ルックアップテーブルを使用して出力予測値を生成する。現在のノードと現在のノードの周囲のノードとの間の修正勾配の計算に基づいて、ノードの第1セットの中の現在のノードの出力ノード値を修正するための低複雑性の方法が提示されている。
WO2017/015564A1は、高ダイナミックレンジ(high dynamic range (HDR))及び/又は広色域(wide color gamut (WCG))データの少なくとも部分的な再生を可能にするために、符号化前にHDR及び/又はWCG画像データを表すデータに適応的な前処理を適用し、復号後にデータに補完的な後処理を適用するデジタルビデオデータの符号化方法を開示する。例示的な方法は、量子化前に1つ以上の色空間変換及び知覚伝達関数をデータに適用する。例示的な方法は、HDR及び/又はWCGデータを復元するために、復号後に逆知覚伝達関数及び逆色空間変換を適用する。伝達関数は、異なる伝達関数が、異なるフレームグループ、フレーム、又は単一フレーム内の処理ウィンドウを含むビデオデータセットに適用できるように適応的である。データセットに関する情報及び適用された伝達関数に関する情報は、メタデータとしてエンコーダからデコーダに渡される。
WO2012/125802A1は、ターゲットディスプレイに表示するために画像データを変換する方法を開示している。シグモイド伝達関数は、最小階調コントラストを制御する自由パラメータを提供する。伝達関数は、変化する周囲照明条件に適応するために動的に調整することができる。変換は、画像データに具現化された創造的意図を実質的に保持する方法で、ターゲットディスプレイに表示するために画像データを自動的に適応させるように選択することができる。画像データは、ビデオデータであってもよい。
Minoo, K. at al.: "Description of the reshaper parameters derivation process in ETM reference software", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 23rd Meeting: San Diego, USA, 19-26 February 2016, document JCTVC-W0031, date saved: 11 January 2016, XP030117798は、HEVC処理パイプラインで入力HDR信号を分析し、SDR互換性のあるリシェープドビデオ信号を生成し、リシェープドビデオ信号からHDR信号を再構成するためのリシェーピングパラメータを生成するリシェーピング処理を開示している。
Francois, E. et al: "HDR CE2-related: some experiments on ETM with dual grading input", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11, 23rd Meeting: San Diego, USA, 19-26 February 2016, document JCTVC-W0089, date saved: 15 February 2016, XP030117867は、デュアルグレーディングHDR分布シナリオを開示している。SDRとHDRの両方のバージョンがHDR分布システムの入力として与えられ、そこからSDR互換バージョンが生成される。
本発明は、独立請求項に定められる。従属請求項は、本発明の幾つかの実施形態の任意の特徴に関するものである。
本発明の実施形態は、限定ではなく、例を用いて説明され、添付の図中の同様の参照符号は同様の要素を表す。
チェーンドリシェーピング最適化を実行するための例示的な画像処理パイプラインを示す。
チェーンドリシェーピング関数の例示的なパイプラインを示す。 チェーンドリシェーピング関数の例示的なパイプラインを示す。 チェーンドリシェーピング関数の例示的なパイプラインを示す。 チェーンドリシェーピング関数の例示的なパイプラインを示す。
リシェープドビデオ信号の例示的な歪みを示す。 リシェープドビデオ信号の例示的な歪みを示す。 リシェープドビデオ信号の例示的な歪みを示す。 リシェープドビデオ信号の例示的な歪みを示す。 リシェープドビデオ信号の例示的な歪みを示す。 リシェープドビデオ信号の例示的な歪みを示す。
例示的な処理フローを示す。 例示的な処理フローを示す。
本願明細書に記載されるコンピュータ又はコンピューティング装置が実装され得る例示的なハードウェアプラットフォームの簡略ブロック図を示す。
以下の詳細な説明を通じて、説明を目的として、本開示の完全な理解を提供するために、多数の特定の詳細が説明される。しかしながら、本発明がこれらの特定の詳細のうちの一部を有しないで実行されてよいことが明らかである。他の例では、よく知られた構造及び装置は、本開示を妨げ、曖昧にし、又は不明瞭にすることを避けるために、徹底的に詳細に記載されない。
<要約>
本願明細書は、チェーンドリシェーピング最適化(chained reshaping optimization (CRO))のための技術を記載する。リシェーピング関数のチェーンは、パイプラインに連結することができる。リシェーピング関数のチェーン内の各リシェーピング関数は、基準色等級(reference color grade)(又は参照ビデオ信号)を有し、基準色等級と同じ又は基準色等級に近いターゲット(又はリシェープド)色等級を近似して生成する。リシェーピング関数のチェーンは、複数のターゲット(又はリシェープド)色等級を生成するために使用できる。本明細書で使用されるとき、同じビデオコンテンツの異なる色等級は、ダイナミックレンジ、色空間又は色域、空間解像度、画像リフレッシュレート、クロマサンプリング形式、画像コンテナ、などの一部又は全部の異なる組み合わせであってもよい。特定の色等級は、ダイナミックレンジ、色空間又は色域、空間解像度、画像リフレッシュレート、クロマサンプリング形式、画像コンテナ、などの一部又は全部の特定の組み合わせで、ビデオ信号で伝送されるようなビデオデータを表してもよい。
制約付き又は制約なしの最適化ソリューション/アルゴリズムを実装又は実行して、リシェーピング関数のチェーンを構成する最適化されたリシェーピング関数を見つけることができる。最適化ソリューション/アルゴリズムは、制約付き又は制約なし問題の式における反復ソリューション/アルゴリズムとして実装することができる。
説明のみを目的として、HDR10下位互換ビデオコーディング、SDR下位互換ビデオコーディング、HLG下位互換ビデオコーディングなどに関連する例示的な(例えば、ビットストリーム、ビデオコーディング、Dolby、サードパーティ独自、標準ベース、等)プロファイルに対応する又はそれを実装するビデオコーデックによって生成される色等級は、これらの技術の一部又はすべてを説明するための非限定的な実装例として、本明細書の一部の議論で使用される。種々の実施形態において、これら及び他のプロファイルは、入力ビデオ信号として、参照ビデオ信号又は色等級のいずれか、一部又は全部として、ターゲット又はリシェープドビデオ信号又は色等級のいずれか、一部又は全部として、使用することができることに留意されたい。
例示的な(例えば、ビットストリーム、ビデオコーディング、Dolby、サードパーティ独自、標準ベース、等)プロファイルは、本明細書に記載されているようにビデオコーデックによってサポートされ又は実装され得るが、SMPTE ST2094、“Dynamic Metadata for Color Volume Transform (DMCVT),” (2016)に見出すことができ、その全内容は本明細書に完全に記載されているかのように参照により本明細書に組み込まれる。本明細書に記載されているようなプロファイルは、限定されるものではないが、以下のいずれかを含むことができる:10ビットHEVC(Main10)プロファイルのような10ビットコーデックによってサポートされるプロファイル、8ビットAVC(Main)プロファイルのような8ビットコーデックによってサポートされるプロファイル、知覚量子化を実装するビデオコードによってサポートされるプロファイル、Profile8.2 for Rec.709 SDRビデオ、Profile32.2 for SDR Mobileビデオ、などのSDRビデオコーディングを実装するビデオコーデックによってサポートされるプロファイル、モバイルビデオやDVB放送ビデオなどのようなHybrid Log Gamma又はHLGビデオコーディングを実装したビデオコーデックでサポートされるプロファイル。これらの(例えば、ビットストリーム、ビデオコーディング、Dolby、サードパーティ独自、標準ベース、等)プロファイルは、様々なユーザ装置、様々なビデオコーデック、様々なダイナミックレンジ、様々な色空間、画像のコードワードが表現される様々なドメインなどをサポートするために使用できる。
本明細書に記載されているようなチェーンリシェーピング関数最適化技術は、様々な色等級間の静的マッピング及び動的マッピングを提供するために使用できる。静的マッピングは事前に生成され、実行時に適用するために(例えば、入力画像の実際のコードワード分布又は他の特性、等に少なくとも部分的に基づいて)選択され、一方、動的マッピングは生成され、実行時にオンザフライで適用される。制限ではなく例として、これらの技術の一部又はすべてを実装又は適用して、例えば、リシェーピング関数のチェーン内で(例えば、順序付けされた、チェーンにされた、シーケンシャルな、指示された、等)リシェーピング関数を連結し、連結したリシェーピング関数をビデオ信号から復号された(例えば、ターゲット、リシェープド、等)色等級に適用することにより、パイプライン内のチェーンドリシェーピング関数によってサポートされる異なるターゲット(又はリシェープド)色等級間の静的マッピングを提供することができる。例えば、異なるプロファイル(例えば、Dolby Laboratories, Inc., Californiaなどから市販されているDolby VisionビデオコーディングソリューションによってサポートされているDolby Vision Profiles)に対応する色等級は、静的マッピングを介して変換できる。
第1例では、HLG下位互換コーデックによってサポートされる第1(例えば、ビットストリーム、ビデオコーディング、Dolby、サードパーティ独自、標準ベースなど)プロファイル(例えば、Dolby Vision Profile 8.4など)は、ここでは、静的マッピングを介して、広く展開されているユーザ装置内のSDR下位互換コーデックによってサポートされる(例えば、ビットストリーム、ビデオコーディング、Dolby、サードパーティ独自、標準ベースなど)プロファイル(例えば、Dolby Vision Profile 8.2/9.2/32.2など)に変換できる。より具体的には、入力としてのビデオ信号のHLG(Hybrid Log Gamma)基本層内の(例えば、第1プロファイル、Dolby Vision Profile 8.4など)ビデオ信号又は(入力)画像が与えられると、第1リシェーピング関数が構築されるか、又はHLG入力画像をSDR画像に変換するために使用できる。次に、SDR画像をPQ画像にさらに変換するために、第2の異なるリシェーピング関数が構築されるか、又は使用することができる。例えば、このPQ画像は、第1プロファイル又はBT.2100色空間における入力画像を直接リシェーピングすることによる出力1000ニトPQ画像と同一又は同等であってよい。
第2例では、HDR10下位互換コーデックによってサポートされる第2(例えば、ビットストリーム、ビデオコーディング、Dolby、サードパーティ独自、標準ベースなど)プロファイル(例えば、Dolby Vision Profile 8.1など)は、ここでは、静的マッピングを介して、HLG下位互換コーデックによってサポートされる(例えば、ビットストリーム、ビデオコーディング、Dolby、サードパーティ独自、標準ベースなど)プロファイル(例えば、Dolby Vision Profile 8.4など)に変換できる。より具体的には、入力としてのビデオ信号の1000ニトのPQ基本層内の(例えば、第2プロファイル、Dolby Vision Profile 8.1など)ビデオ信号又は(入力)画像が与えられると、第1リシェーピング関数が構築されるか、又は入力1000ニトのPQ画像を1000ニトのHLG(基本層)画像に変換するために使用できる。次に、1000ニトHLG(基本層)画像を4000ニトPQ画像にさらに変換するために、第2の異なるリシェーピング関数が構築されるか、又は使用することができる。例えば、この4000ニトPQ画像は、第2プロファイルにおける入力画像を直接リシェーピングすることによる出力4000ニトPQ画像と同一又は同等であってよい。
様々な実施形態において、これら及び他のリシェーピング関数のチェーン(リシェーピング関数のより長いチェーンを含むがこれに限定されない)は、複数のターゲット(又はリシェープド)色等級を生成するために最適化されて構築されるか又は使用され得ることに留意されたい。
幾つかの運用シナリオでは、反復(最適化)アルゴリズムを使用して、順方向及び逆方向(リシェーピング)パスの可逆性をサポートすることができる。例えば、逆方向リシェーピングから生成される出力色等級(又は出力ビデオ信号)は、順方向リシェーピングの入力色等級(又は入力ビデオ信号)に近くなるように最適化できる。したがって、出力ビデオ信号は、最終的に(元の)入力ビデオ信号(又は元の入力ドメイン)に戻すことができる。
幾つかの動作シナリオでは、リシェーピング関数のチェーンから(例えば、最後に、等)生成された出力色等級(又は出力又はリシェープドビデオ信号)は、同じドメインにない場合があり、又はリシェーピング関数のチェーンに入力された入力色等級(又は入力ビデオ信号)と同じではないか又は近似していない場合がある。これらの技術は、(例えば、最終、最適化、反復的に最適化された、等)出力色等級の調整をサポートする。さらに、必要に応じて又は代替的に、これらの技術は、中間色等級(例えば、SDR色等級など)と(元の)基準色等級(例えば、基準SDR色等級など)との間の偏差又は差を最小化することによって、リシェーピング関数のチェーンの一部又は全部により生成される各中間(ターゲット)色等級における比較的高いレベルの忠実度を確保するために実施することができる。さらに、必要に応じて又は代替的に、これらの技術の一部又は全部は、単層下位互換性(single-layer backward compatible (SLBC))コーデックをサポートするものを含むがそれに限定されない広範なビデオ配信及び表示アプリケーションで実施することができる。
本明細書に記載される実施例は、チェーンドリシェーピング最適化に関連したビデオ画像の符号化に関する。チェーンドリシェーピング関数のパイプラインへの入力ビデオ信号の入力画像が受信され、チェーンドリシェーピング関数のパイプラインは、リシェーピング関数のチェーンを含む。入力ビデオ信号の入力画像から、2つ以上の基準色等級に対して2つ以上の基準画像が生成され、2つ以上の基準画像の各基準画像は、2つ以上の基準色等級の各々の基準色等級に対応する。入力画像及び2つ以上の参照画像は、チェーンドリシェーピング関数のパイプラインにおける2つ以上のチェーンドリシェーピング関数のための演算パラメータの2つ以上のセットを決定するために使用され、演算パラメータの各セットは、2つ以上のチェーンドリシェーピング関数における各々のチェーンドリシェーピング関数を指定し、2つ以上のチェーンドリシェーピング関数における各々のチェーンドリシェーピング関数は、2つ以上のリシェーピング色等級における2つ以上のリシェープド画像における各々のリシェープド画像を生成するために使用される。2つ以上のリシェーピング色等級における2つ以上のリシェープド画像のうち、選択されたリシェーピング色等級における選択されたリシェープド画像は、画像メタデータと共にビデオ信号に符号化され、画像メタデータは、2つ以上のチェーンドリシェーピング関数のうちの1つ以上のチェーンドリシェーピング関数のための演算パラメータの1つ以上のセットを含み、ビデオ信号の受信装置は、画像メタデータ及び選択されたリシェープド画像を使用して、選択されたリシェーピング色等級以外のリシェーピング色等級の再構成画像を生成するようにされる。
本明細書に記載される実施例は、チェーンドリシェーピング最適化に関連したビデオ画像の復号に関する。リシェーピング色等級におけるリシェープド画像は、画像メタデータと共に、ビデオ信号から復号され、画像メタデータは、チェーンドリシェーピング関数のパイプライン内の1つ以上のチェーンドリシェーピング関数を各々指定する演算パラメータの1つ以上のセットを含む。1つ以上のチェーンドリシェーピング関数のうちの少なくとも1つは、第2リシェーピング色等級における第2リシェープド画像を生成するために、ビデオ信号から復号されたリシェープド画像に適用される。第2リシェープド画像から生成された表示画像を表示装置上でレンダリングする。
<例示的な画像処理パイプライン>
図1は、ビデオキャプチャからビデオコンテンツ表示までの種々の段階を示すビデオ配信パイプライン(100)の例示的な処理を示す。ビデオフレーム(102)のシーケンスは、画像生成ブロック(105)を用いてキャプチャ又は生成される。ビデオフレーム(102)は、デジタル方式、で(例えば、デジタルカメラ等により)キャプチャされ、又はコンピュータにより(例えば、コンピュータアニメーション等を、用いて)生成されてよく、ビデオデータ(107)を提供する。追加で、任意で又は代替として、ビデオフレーム(102)は、フィルムカメラによりフィルム上にキャプチャされてよい。フィルムは、デジタルフォーマットに変換されて、ビデオデータ(107)を提供する。プロダクション段階(110)において、ビデオデータ(107)は、ビデオプロダクションストリーム(112)を提供するために編集される。
プロダクションストリーム(112)のビデオデータは、次に、ポストプロダクション編集(115)のためにプロセッサに提供される。ポストプロダクション編集(115)は、ビデオ制作者の創造的意図に従い画像品質を向上するため又は特定の外観を達成するために、画像の特定領域の色又は明るさの調整又は変更を含んでよい(例えば、自動的に、手動で、部分的に自動で部分的に手動で、等)。これは、時に、「色タイミング」又は「色グレーディング」と呼ばれる。他の編集(例えば、、シーン選択、順序付け、手動及び/又は自動シーンカット情報生成、画像クロッピング、コンピュータの生成した視覚特殊効果の追加、等)が、コンテンツマッピング及び/又はカラーグレーディングを介して、チェーンドリシェーピング関数のパイプラインなどへの元の入力ビデオ信号を生成するために、ポストプロダクション編集(115)において実行されてよい。
元の入力ビデオ信号は、アップストリーミング装置(例えば、エンコーダ、トランスコーダ、プロダクションスタジオシステム、コンテンツ集約及び/又は配信サーバ、ストリーミングサーバなど)、又はポストプロダクションブロック(115)及び/又はその中のコーディングブロック(120)によって使用されて、画像の1つ、2つ又はそれ以上の基準色等級を生成するとともに、(例えば、予測誤差の最小化、制約なし若しくは制約あり最適化問題に対する閉じた形式の解などによって)1つ、2つ又はそれ以上の基準色等級と各々同じ又は厳密に近似する1つ、2つ又はそれ以上のリシェープド色等級を生成するために使用されるチェーンドリシェーピング関数を生成する。
基準色等級及び/又はリシェープド色等級は、同じシーン又は意味的内容を描写する対応する参照画像の異なるセット又はシーケンスを含むことができるが、以下:異なるダイナミックレンジレベル、異なる色空間、異なるEOTF、異なる色空間タイプ、など、のうちの1つ又は複数において異なる場合がある。例えば、これらの基準色等級及び/又はリシェープド色等級は、異なるビデオコーデック及び/又は異なる画像処理能力及び/又はiOS装置、Android装置、タブレットコンピュータ、ラップトップコンピュータ、デスクトップコンピュータ、異なる表示能力のテレビなどの異なるユーザ装置用に最適化されたユーザ知覚可能な視覚品質を有する画像を含むことができる。幾つかの動作シナリオでは、基準色等級を厳密に近似するリシェープド色等級は、一部又は全部のチェーンドリシェーピング関数の一部又は全部の演算パラメータとビデオ信号に符号化された色等級とを含むビデオ信号の受信装置によって、より効率的に(例えば、より少ない計算コストで、より少ない時間で、など)送信、復号又は再構成されてよい。例示的なリシェーピング動作は、G-Mによる米国特許10,080,026「Signal reshaping approximation」に記載されている。その全体の内容は、ここに完全に記載されているかのように参照によりここに組み込まれている。
幾つかの動作シナリオでは、コーディングブロック(120)は、ポストプロダクションブロック(115)から生成された元の入力ビデオ信号(例えば、入力色等級、HLGRec.2020ビデオ信号など)を受信する。コンテンツマッピング及び/又はカラーグレーディング/タイミングツールを使用して、元の入力ビデオ信号から1、2、又はそれ以上の基準色等級を生成することができる。入力ビデオ信号及び基準色等級の各々は、同じ視覚シーン又は意味コンテンツのセットを表す。基準色等級は、手動、自動、又は手動と自動の組み合わせの画像処理演算によって実行されるコンテンツマッピング及び/又はカラーグレーディングを介して、元の入力ビデオ信号から導出することができる。
図示の目的のためだけに、元の入力ビデオ信号は、例えば、ポストプロダクションブロック(115)からコーディングブロック(120)によって受信され、HDR画像117の入力色等級を表す。リシェープド色等級によって近似される基準色等級における参照画像は、元の入力ビデオ信号内のHDR画像(117)から(例えば、Dolby Laboratories, Inc., San Francisco, Californiaなどから市販されているDolby Visionコーディングツールなどのビデオ符号化ツールの適切なプロファイルを使用して)コンテンツマッピングされてよい。幾つかの実施形態では、製作後編集115の間に、HDR画像117は、高ダイナミックレンジをサポートするHDR参照ディスプレイ125で、HDR画像117に対してポストプロダクション編集を実行しているカラリストにより閲覧される。
コーディングブロック(120)は、入力ビデオ信号内の画像を中間及び/又は最終的なリシェープド色等級のリシェープド画像にマッピングするために使用されるパイプラインで、チェーンドリシェーピング関数のための演算パラメータの複数のセットを生成するために、本明細書に記載されているように、一部又は全部のチェーンド最適化演算を実装することができる。幾つかの動作シナリオでは、中間及び最終的なリシェープド色等級から選択された(例えば、単一の、等)選択されたリシェープド色等級(例えば、SDR色等級、モバイル装置用のSDR色等級、SDRテレビ用のSDR色等級など)は、コーディングブロック(120)により、符号化ビットストリーム(122)へと圧縮/符号化され得る。チェーンドリシェーピング関数(例えば、逆方向リシェーピング関数、逆リシェーピング関数など)のための演算パラメータの複数のセットの一部又は全部は、画像メタデータの一部として同じ符号化ビットストリームに含まれるか、符号化され得る。
コーディングブロック120は、符号化ビットストリーム122を生成するために、ATSC、DVB、DVD、Blu-Ray(登録商標)、及び他の配信フォーマットにより定義されるような、オーディオ及びビデオエンコーダを含んでよい。
一部の運用シナリオでは、符号化ビットストリーム122は、広範な種類のSDR表示装置(例えば、SDRディスプレイ、等)との後方互換性のあるビデオ信号(例えば、8ビットSDRビデオ信号、10ビットSDRビデオ信号、等)を表してよい。非限定的な例では、再成形SDR画像と共に符号化されたビデオ信号は、単一レイヤの下位互換性のあるビデオ信号であってよい。ここで、「単一レイヤの下位互換性のあるビデオ信号」は、単一の信号レイヤのSDRディスプレイのために特に最適化された又はカラーグレーディングされたSDR画像を運ぶビデオ信号を表してよい。単一レイヤのビデオコーディング操作の例は、G-Mによる米国特許出願公開第2019/0110054号「Encoding and decoding reversible production-quality single-layer video signals」に記載されている。その全体の内容は、ここに完全に記載されているかのように参照によりここに組み込まれている。
チェーンドリシェーピング関数のための演算パラメータの複数のセットは、1つの色等級の復号画像から他の色等級の再構成画像を生成するために、ビデオ信号又は符号化ビットストリームの受信装置によって、復号され、予測動作に使用され得る。(上流)コーディングブロック(120)によって生成されるように、チェーンドリシェーピング関数のための演算パラメータの複数のセットを有する予測演算(例えば、逆方向リシェーピング演算、逆トーンマッピング演算など)を用いて、再構成画像に対して、1つ以上の異なるビデオ品質レベルを生成することができる。これらの異なるビデオ品質レベルは、エンコーダ側の中間及び/又は最終的なリシェープド色等級のような、1つ以上の異なる色等級に各々対応することができる。
幾つかの動作シナリオでは、復号画像は、参照SDR色等級を近似するために、カラーグレーディングされたHDR画像(117)からアップストリームビデオエンコーダ(例えば、コーディングブロック(120)等を用いる)によって順方向にリシェーピングされたSDR画像を表す。再構成画像は、符号化ビットストリーム(122)内で送信される画像メタデータ内の演算パラメータの複数のセットで指定されたリシェーピング関数を使用して復号画像から生成され、基準SDR色等級以外の他の中間及び/又は最終基準色等級を近似する画像を表す。
追加で、任意で、又は代替として、符号化ビットストリーム(122)は、下流のデコーダが復号画像又は逆方向リシェープド画像に対して表示管理操作を実行するために使用できる表示管理(display management (DM))メタデータを含むがこれに限定されない追加の画像メタデータにより符号化され、ターゲットディスプレイ上でのレンダリングに最適化された表示画像を生成する。これらの画像は、中間及び/又は最終基準色投球が比較的高い視覚品質を提供する参照ディスプレイと同じ表示機能を有していてもいなくてもよい。
符号化ビットストリーム122は、次に、モバイル装置、ハンドセット、タブレットコンピュータ、復号及び再生装置、メディアソース装置、メディアストリーミングクライアント装置、テレビジョンセット(例えば、スマートTV、等)、セットトップボックス、映画劇場、等のような受信機へと下流へ配信される。受信機(又は下流装置)では、符号化ビットストリーム(122)を復号ブロック(130)によって復号して復号画像182を生成する。これは、コーディングブロック(120)によってビットストリームに符号化された画像(例えば、順方向リシェープドSDR画像など)と同じであってもよく、コーディングブロック(120)によって実行される圧縮と復号ブロック(130)によって実行される伸長で発生する量子化誤差の影響を受ける。
受信機が復号画像(182)のレンダリングをサポートするターゲットディスプレイ140で動作する(又は接続されているか、動作可能にリンクされている)運用シナリオでは、復号ブロック(130)は、コーディングビットストリーム(122)(例えば、その単一レイヤなど)から画像(182)を復号し、復号画像(182)(例えば、順方向リシェーピングSDR画像など)をターゲットディスプレイ(140)でのレンダリングに直接又は間接的に使用できる。
幾つかの運用シナリオでは、ターゲットディスプレイ(140)はSDR参照ディスプレイ(125)と同様の特性を持ち、復号画像(182)は、ターゲットディスプレイ(140)で直接監視可能な順方向リシェープドSDR画像である。
幾つかの実施例では、受信機は、復号画像(182)が最適化された参照ディスプレイとは異なる表示機能を持つターゲットディスプレイで動作する(又は、ターゲットディスプレイに接続又は動作可能にリンクされる)。画像メタデータ(又はコンポーザメタデータ)内の、チェーンドリシェーピング関数の演算パラメータの複数のセットの一部又はすべてを使用して、ターゲットディスプレイに最適化された復号画像(182)から画像を構成又は再構成できる。
例えば、受信機は、復号画像(182)よりも高ダイナミックレンジ(例えば、100ニト、200ニト、300ニト、500ニト、1,000ニト、4,000ニト、1万ニト、又はそれ以上など)をサポートするHDRターゲットディスプレイ140-1で動作する場合がある。受信機は、符号化ビットストリーム122(例えば、その中のメタデータコンテナなど)から画像メタデータを抽出し、画像メタデータ(又はコンポーザメタデータ)内の演算パラメータの複数のセットを使用して、順方向リシェープドSDR画像などの復号画像(182)から画像132-1を構成又は再構成できる。
幾つかの運用シナリオでは、再構成画像(132-1)は、受信機と連動して動作するターゲットディスプレイと同じか又は互換性のあるディスプレイ上で閲覧するために最適化された再構成された(例えば、HDR、EDR、1000ニトの表示装置に最適化された画像、4000ニトの表示装置に最適化された画像、等)の画像を表す。受信機は、ターゲットディスプレイ上でレンダリングするために再構成画像(132-1)を直接使用する場合がある。
幾つかの運用シナリオでは、再構成画像(132-1)は、受信機と連動して動作するターゲットディスプレイ(140-1)と同じではない(例えば、参照、等の)ディスプレイ上で閲覧するのに最適化された再構成画像を表す。表示管理ブロック(例えば、135-1など)は、受信機、ターゲットディスプレイ(140-1)、又は別の装置内にあってもよく、ターゲットディスプレイ(140-1)の特性に適合したディスプレイマップド信号(137-1)を生成することによって、再構成画像(132-1)をターゲットディスプレイ(140-1)の特性にさらに調整する。表示画像又は調整された再構成画像は、ターゲットディスプレイ(140-1)上でレンダリングされてよい。
<チェーンドリシェーピング関数のパイプライン>
図2Aは、チェーンドリシェーピング関数の例示的なパイプラインを示す。これらのチェーンドリシェーピング関数は、本明細書に記載されるような最適化方法又は手順を使用して生成又は構築することができる。
チェーンドリシェーピング関数のパイプラインへの(元の)入力ビデオ信号(又はその中の入力画像)を、s<0>と表す。入力信号(又はその中の入力画像)のi番目のピクセルは,s<0>,iとして示され、入力色空間(又は入力ドメイン)の3つのチャネル、各々、(sy <0>,i, sC0 <0>,i, sC1 <0>,i)として示される。
チェーンドリシェーピング関数のパイプラインは、一緒に連結されたK個のリシェーピング関数を含み、Kは1より大きい整数である。チェーンドリシェーピング関数のパイプラインの中のk番目のリシェーピング関数は、Rk()と表され、r<k+1>として表される対応する参照ビデオ信号(又はその中の対応する参照画像)を持つことができ、又は割り当てることができる。ここで、k=0、...、K-1である。
k番目のリシェーピング関数Rk()の参照信号(又はその中の参照画像)r<k+1>のi番目のピクセルを、(ry <k+1>,i,rC0 <k+1>,i,rC1 <k+1>,i)と表す。k番目のリシェーピング関数Rk()への入力ビデオ信号(又はその中の入力画像)及びk番目のリシェーピング関数Rk()からの出力又はリシェープドビデオ信号(又はその中の出力又はリシェープド画像)を、各々、s<k>及びs<k+1>と表し、ここで、k=0、...、K-1である。k番目のリシェーピング関数Rk()は、次のように、入力信号(又はその中の入力画像)s<k>を出力信号(又はその中の出力画像)s<k+1>に順方向にリシェーピングするために適用できる。
Figure 0007543577000001
多くの運用シナリオでは、チェーンドリシェーピング関数のパイプラインからの最終出力又はリシェープドビデオ信号(又はその中の最終出力画像)は、次のように、最初又は元の入力ビデオ信号(又はその中の最初又は元の入力画像)と等しない。
Figure 0007543577000002
k番目のリシェーピング関数の場合、その出力信号s<k+1>は、次のように、参照信号r<k+1>にできるだけ近い(例えば、エラー閾値/測定値などに応じて、最小化/最適化手順に従う)必要がある。
Figure 0007543577000003
その結果、チェーンドリシェーピング関数のパイプライン全体における最適化リシェーピング関数の構成/生成は、次のように、個々のリシェーピング関数の個々の最適化問題の線形結合(に対する解)として定式化できる。
Figure 0007543577000004
ここで、ukは、チェーンドリシェーピング関数のパイプライン内の対応する各リシェーピング関数に割り当てられた重み付け係数を表す。
エンドツーエンドの最適化は、解決が比較的困難であり又は計算集約的である可能性があるが、順次最適化などのより優れた効率的な方法を使用して、この問題に取り組むことができる。
図2Bは、先に述べたように、Dolby Vision Profile8.4からDolby Vision Profile8.2への変換を実装するために使用できる、チェーンドリシェーピング関数の(具体的な)パイプラインの例を示している。
図2Bに示されるように、チェーンドリシェーピング関数のパイプラインへの第1又は元のビデオ信号s<0>は、入力HLG(例えば、R.2020など)信号である。チェーンドリシェーピング関数のパイプライン内の第1リシェーピング関数Rは、参照信号r<1>を持っているか又は割り当てられており、参照信号r<1>は、HLG-SDR API(Application Programming Interface)又は市販のツールキットを使用して入力HLG信号から導出又は変換することができる。
出力又はリシェープドビデオ信号s<1>は、チェーンドリシェーピング関数のパイプライン内の第1リシェーピング関数Rを第1又は元の入力ビデオ信号s<0>に適用することによって生成することができ、言い換えると、第1リシェーピング関数Rに基づいて第1又は元の入力ビデオ信号s<0>をリシェーピングすることによって生成することができる。図2Bに示すように、出力又はリシェープドビデオ信号s<1>は、リシェープドSDR信号であってもよい。リシェープドSDR信号は、参照信号r<1>と同じであってもよく又は厳密に近似していてもよい。
リシェープドSDR信号(s<1>)は、第2リシェーピング関数Rへの入力ビデオ信号として使用することができる。第2参照信号r<2>は、基準PQ信号であってもよい。基準PQ信号は、HLG後方互換コーデックのようなビデオコーデックを使用して、又はBT.2100規格のような関連するビデオコーディング規格又はその中で定義されるプロファイルを実装する他のビデオコーデックを使用して、第1又は元の入力ビデオ信号(又は入力HLGビデオ信号)から導出又は変換することができる。
出力又はリシェープドビデオ信号s<2>は、チェーンドリシェーピング関数のパイプライン内の第2リシェーピング関数Rをリシェープドビデオ信号s<1>に適用することによって、言い換えると、第1リシェーピング関数Rに基づいてリシェープドビデオ信号s<1>をリシェーピングすることによって生成することができる。出力又はリシェープドビデオ信号(s<2>)は、PQ信号であってもよい。PQ信号は、第2参照信号r<2>又は参照PQ信号と同じであってもよく又は厳密に近似していてもよい。
図示のように、第1リシェーピング関数:
Figure 0007543577000005
から出力されたリシェープドSDRビデオ信号は、ビデオ信号内の基本層画像データとして符号化/表現されてもよい。第2リシェーピング関数:
Figure 0007543577000006
を指定するようなリシェーピング関数パラメータは、ビデオ信号に含まれる画像メタデータの一部として含まれ、ビデオ信号の受信装置によって使用されて、ビデオ信号の基本層画像データで表現されたSDRビデオ信号を、再構成PQ画像を有する再構成又はリシェープドPQビデオ信号に再構成又はリシェーピングすることができる。
<順次/チェーンド最適化>
様々な予測子を使用して、例えば、順次最適化プロセスを使用して、ここで説明するようなチェーンドリシェーピング関数を構成又は生成できる。これらの予測子は、テンソル積Bスプライン(Tensor Product B-Spline (TPB))予測子や非TPB予測子などの高度な予測子であってよい。
幾つかの運用シナリオでは、チェーンドリシェーピング関数のパイプライン全体でリシェーピング関数を構築するための最適化問題は、2つの最適化問題に分解できる。1つはルマチャネルに使用されるリシェーピング関数/マッピング(ルマリシェーピング関数と呼ばれることがある)を構成するための最適化問題であり、もう1つはクロマチャネルのリシェーピング関数/マッピング(クロマリシェーピング関数と呼ばれることがある)を構成するための最適化問題である。例えば、リシェーピング関数のパイプライン内のリシェーピング関数は、(ルマチャネル内の入力コードワード又は入力ルマコードワードをルマチャネル内の出力コードワード又は出力ルマコードワードにリシェーピングする)ルマリシェーピング関数/マッピングと、(ルマ及びクロマチャネル内の入力コードワード又は入力ルマ及びクロマコードワードをクロマチャネル内の出力コードワード又は出力クロマコードワードにリシェーピングする)クロマリシェーピング関数/マッピングを含むことができる。
幾つかの運用シナリオでは、ルマチャネルの最適化問題を解決する際に、CDFマッチング技術を使用して、クロマ及び/又はルマリシェーピング関数/マッピング(例えば、マルチピース多項式、1次元ルックアップテーブル又は1D LUT、3次元ルックアップテーブル又は3D LUTの一部など)を構成又は生成することができる。追加で、任意で、又は代替として、クロマ及び/又はルマリシェーピング関数/マッピングは、マルチカラーチャネル多重回帰(multiple color channel multiple regression (MMR))予測ベース技術などのクロスカラーチャネル予測因子を使用して構成又は生成することができる。追加で、任意で、又は代替として、クロマ及び/又はルマリシェーピング関数/マッピングは、基底関数としてBスプライン(B-Spline)関数を使用するテンソル積Bスプライン(tensor product B-spline (TPB))予測ベース技術などのクロスカラーチャネル予測因子を使用して構成又は生成することができる。
例示的な累積密度関数(cumulative density function (CDF))マッチング演算は、参照により本願明細書に全体が記載されたように本願明細書に組み込まれる2017年9月11日出願のPCT出願番号PCT/US2017/50980;2016年10月5日出願の米国仮特許出願番号第62/404,307号(米国特許出願公開番号第2018/0098094号として2018年4月5日に公開された)に記載されている。MMRに基づく演算の例は、米国特許8,811,490に記載されており、その全内容は、参照によりここに完全に記載されているものとして組み込まれる。TPBに基づく演算の例は、米国仮出願番号第62/908,770号(代理人整理番号第60175-0417号)、2019年10月1日出願、名称「TENSOR-PRODUCT B-SPLINE PREDICTOR」に記載されており、該出願は参照により、その全体が本明細書に完全に記載されているものとして援用される。
第1例では、チェーンドリシェーピング関数のパイプラインにおけるk番目のリシェーピング関数のためのMMRベースのクロママッピング関数/マッピング(又はMMR予測子)は、以下のように構築又は生成することができる。
入力ビデオ信号(又はその中の入力画像)のi番目のピクセルのためのMMR展開形式を、以下のように示す:
Figure 0007543577000007
すべてのP個のピクセルのMMR展開形式は、次のように入力ベクトルに収集できる:
Figure 0007543577000008
観測(又は基準/ターゲット)のクロマ信号又はベクトルは、次のように基準/ターゲットビデオ信号(又はその中の基準/ターゲット画像)のクロマコードワードに基づいて形成できる。ここで、chは、c0若しくはCbチャネルであるか、又はc1若しくはCrチャネルであるか、のいずれかである。
Figure 0007543577000009
MMR係数は、mch <k>として表され、次のようなマトリクス形式を使用して、出力又はリシェープドビデオ信号(又はその中の出力又はリシェープド画像)の出力又はリシェープドクロマコードワードを予測するために使用できる。
Figure 0007543577000010
MMR係数mch <k>は、次のように定式化された最適化問題を解くことによって最適化できる。
Figure 0007543577000011
例えば、最適化されたMMR係数は、次のように式(9)の最適化問題の最小二乗解によって見付けられ又は生成される。
Figure 0007543577000012
幾つかの運用シナリオでは、チェーンドリシェーピング関数のパイプライン内の各リシェーピング関数、例えばルマ及びクロマリシェーピング関数/そのマッピングは、k=0から開始してK-1まで、順次生成又は構築できる。例えば、チェーンドリシェーピング関数のパイプライン内の各リシェーピング関数内のクロマリシェーピング関数/マッピングは、以下の表1に示すような例示的な最適化手順を使用して、k=0から開始してK-1まで、順次生成又は構築できる。
[表1]
Figure 0007543577000013
第2例では、チェーンドリシェーピング関数のパイプラインにおけるk番目のリシェーピング関数のためのTPBベースのクロママッピング関数/マッピング(又はTPB予測子)は、以下のように構築又は生成することができる。
chカラーチャネルの場合、次の行列を構築できる。
Figure 0007543577000014
TPBベースのクロマリシェーピング関数/マッピングのために最適化されたTPB演算パラメータは、mch,opt <k>と表され、例えば、上記の式(8)と同様の式を使用して定式化された(グローバルな)TPB最適化問題の最小二乗解によって、次のように構築、生成又は取得することができる。
Figure 0007543577000015
<チェーンドリシェーピング関数の最適化>
チェーンドリシェーピング関数のパイプラインにおけるリシェーピング関数の性能(例えば、再構成ビデオ信号の精度の向上、予測誤差の最小化、多様なビデオコーデックのサポートなど)を向上するために、様々な最適化アルゴリズム/方法を使用できる。様々な運用シナリオでは、これらの最適化アルゴリズム/方法で制約が使用される場合と使用されない場合がある。
幾つかの運用シナリオでは、制約なしの信号調整のための逆方向誤差減算(BESA (Backward Error Subtraction for signal Adjustment))アルゴリズム/方法と呼ばれることがある反復アルゴリズム/方法を使用して、チェーンドリシェーピング関数のパイプラインでリシェーピング関数の性能を向上させることができる。BESAアルゴリズム/方法の例は、米国仮特許出願番号第63/013,063号、「Reshaping functions for HDR imaging with continuity and reversibility constraints」、G-M. Su, 2020年4月21日出願、米国仮特許出願番号第63/013,807号、「Iterative optimization of reshaping functions in single-layer HDR image codec」、G-M. Su、H. Kadu、2020年4月22日出願、に記載されており、それらの内容は、ここに完全に記載されているかのように、参照によりここに完全に組み込まれている。
反復アルゴリズム/方法は、T回の反復で実行できる。ここで、Tは、(例えば、事前に設定された、構成された、動的に決定された、予算計上されたなど)1より大きい整数を表す。T反復の各反復(例えば、反復tであり、t=0、...、T-1である)では、まず最適化を順方向に実行して、チェーンドリシェーピング関数のパイプラインでリシェーピング関数を定義又は指定するリシェーピング関数係数を取得又は生成でき、その後、参照信号の変更を逆方向に実行できる。反復アルゴリズム/方法の目標は、エンドツーエンド誤差(例えば、予測された最終的なリシェープドビデオ信号と最終的な基準ビデオ信号との間の差、等)を最小化できるように、各反復tで参照信号r(t) <k>を変更することである。
非限定的な実装例では、反復アルゴリズム/方法は、2つのforループで実装又は実行できる。2つのforループのうちの外側のforループでは、t=0、...、T-1のようにT回の反復に達するまで、反復回数(t)が1つずつ増加又はインクリメントされる。2つのforループのうちの内側のforループでは、第1リシェーピング関数Rから最後のリシェーピング関数RK-1まで、順方向最適化を実行できる。
2つのforループのうちの内側のforループの各反復の最後に、最後から2番目の参照信号から第1参照信号r(t) <1>まで、逆方向参照信号修正を実行できる。幾つかの動作シナリオでは、最後の参照信号r(t) <K>は、固定されており、前述の逆方向参照信号修正は適用されない。これは、チェーンドリシェーピング関数のパイプラインからの出力(又は最後の参照信号)の忠実度を維持し、各反復で最終エラー又は最終コスト関数(値)を変更することによって発生する振動(したがって、収束しないか又は比較的遅く収束すること)を回避するためである。
より具体的には、順方向最適化において、(例えば、各々、等)反復tにおいて、各リシェーピング関数(例えば、k番目のリシェーピング関数、等)は、
(1)k=0の場合に最初又は元の入力映像信号(又はその中の最初又は元の入力画像)であり、k≠0の場合に(直前の)先行するリシェーピング関数(例えば、(k-1)番目のリシェーピング関数、など)から出力される更新された入力ビデオ信号(又はその中の更新された入力画像)であるs(t) <K>、及び(2)(直前の)先行する反復の最後に実行される逆方向参照信号修正からの更新された参照ビデオ信号(又はその中の更新された参照画像)であるr(t) <K+1>に基づき、最適化リシェーピング関数係数{m(t),ch,opt <K>}、及び予測信号s(t) <K+1>を取得するために最適化を実行することにより生成又は構成できる。これらの演算は、k=0からK-1までのチェーンドリシェーピング関数のパイプライン内のすべてのリシェーピング関数に対して順次実行することができる。
各反復(t)の最後に、各カラーチャネルの予測誤差を次のように計算することによって、各kに対して逆方向参照信号修正を実行することができる。
Figure 0007543577000016
次に、予測誤差を使用して、対応する参照ビデオ信号(又はその中の参照画像)を次のように修正する。
Figure 0007543577000017
これらの演算は、k=K-1から1までのすべての参照ビデオ信号(最後の参照ビデオ信号を除く)に対して順番に実行できる。
幾つかの運用シナリオでは、関数f()を使用して、参照ビデオ信号(又はその中の参照画像)を変更する方法を決定できる。この関数は、比較的大きなエラーを参照ビデオ信号に逆伝播させるために使用できる。各ピクセル(又はi番目のピクセル)に対して、関数f()は次のように指定又は定義できる。
Figure 0007543577000018
ここで、εは、誤差が参照ビデオ信号又は(又はその中の参照画像を変更する必要があるほど十分に大きいかどうかを決定するための最小誤差閾値である。αchは、収束速度係数(又はスケーリング係数)を表す。λは、修正の上限を表す。
幾つかの運用シナリオでは、次のように、関数f()で適応スケーリング係数を使用できる。ここで、反復インデックスtが増加すると、以下のようにスケーリング係数が減少する。
Figure 0007543577000019
ここで、βは0.99、0.98、又は別の数値などの割引係数(discount factor)である。
反復最適化手順の例を次の表2に示す。
[表2]
Figure 0007543577000020
<最適化された反復回数の選択>
図3Aは、図2Bに示すように、チェーンドリシェーピング関数のパイプラインでリシェーピング関数を構築するために使用される反復最適化アルゴリズム/方法の各反復における、第1リシェーピング関数Rから出力される第1リシェープドSDRビデオ信号(又はその中のリシェープドSDR画像)の歪みの例を示す。図3Bは、反復最適化アルゴリズム/方法の各反復における、第2リシェーピング関数Rから出力されるリシェープドHDRビデオ信号(又はその中のリシェープドHDR画像)の歪みの例を示す。
図3Bに示すように、第2リシェーピング関数から出力されるリシェープドHDRビデオ信号の歪みは、反復回数が増加すると、一定レベル以下で飽和するまで徐々に減少する。対照的に図3Aに示すように、第1リシェーピング関数から出力されるリシェープドSDRビデオ信号の歪みは、反復回数が増加するき、一定レベル又はそれ以下で飽和することなく増加し続ける。
中間のリシェープドビデオ信号の忠実度を向上させるために、反復回数が最終ラウンド(又はT回の反復)に達する前にリシェーピング係数を取得するか、又はチェーンドリシェーピング関数のパイプライン内の特定のリシェーピング関数を定義するために使用することができる。言い換えると、最終ラウンド(又はT回の反復)まで、表2に示す反復最適化アルゴリズム/方法を完了する代わりに、反復toptでのリシェーピング係数を取得することができる。ここで、topt<Tである。
第1例では、客観的な方法を使用して、最適な反復回数toptを選択又は取り出すことができる。図3A及び図3Bに示すような反復に渡る歪みを示す収束曲線を使用して、第1リシェーピング関数Rから出力される第1リシェープドビデオ信号の歪みと、第2リシェーピング関数Rから出力される第2リシェープドビデオ信号の歪みとの間に最良のトレードオフを有する特定の反復インデックス(又は最適な反復回数topt)を識別、選択又は取り出すことができる。例えば、図3Bに示されるようなR歪みは、R1収束曲線上のニーポイントである反復#8のような特定の反復回数で飽和し始める。このニーポイントは、R収束曲線が絶対値で最大の1次微分変化を有する(又は絶対値又は大きさで最大の2次微分を有する)場所で識別又は見つけることができる。図3Aに示されるように、図3Aに示されるようなR歪みはまた、R収束曲線上の特定の反復回数(又はこの例では反復8)で比較的小さな歪みを有する。
第2例では、主観的な方法を使用して、最適な反復回数toptを選択又は取り出すことができる。例えば、各反復で生成又は取得されたリシェーピング係数の各セットをテスト画像のバッチに適用して、異なるリシェープドビデオ信号間の最適なトレードオフを主観的に決定するのを助けるために、ユーザ(又は人間)によってレビューできるリシェープド画像を生成することができる。これらの操作の一部は手動で実行されてもよく、これらの操作の他の一部は自動的に実行されてもよい。
<逆勾配ベースアルゴリズム>
逆方向参照信号修正の一部として、幾つかの動作シナリオでは、例えば、入力ビデオ信号(又はその中の入力画像)の(例えば、比較的小さい、等)入力差をリシェーピング関数に与え、リシェーピング関数によって出力されるリシェープドビデオ信号(又はその中の出力画像)の中で生じる出力差を測定することによって、チェーンドリシェーピング関数のパイプライン内の(例えば、各々の、等)リシェーピング関数に対して逆勾配を計算することができる。入力差と出力差の間の比率は、リシェーピング関数の逆勾配として定義又は使用することができる。
例えば、各ピクセルについて、次のように、各チャネルの入力画像のピクセル値(s(t)y <k>,i, s(t)C0 <k>,i, s(t)C1 <k>,i)に入力差Δを追加できる。
Figure 0007543577000021
ここで、左辺(left hand side (LHS))はデルタの加算されたピクセル値である。
リシェーピング関数が、入力画像のピクセルに適用されて、リシェーピング関数から出力されるリシェープドビデオ信号の出力差を生成することができる。
デルタの加算されたピクセル値(s'(t)y <k>,i, s'(t)C0 <k>,i, s'(t)C1 <k>,i)に対する入力画像のi番目のピクセルに対するMMR展開形式は、次のように与えることができる。
Figure 0007543577000022
すべてのピクセルのMMR展開形式は、次のように行列形式に収集できる:
Figure 0007543577000023
リシェーピングビデオ信号(又はその中のリシェープド画像)の出力差は、次のように表現又は計算できる。
Figure 0007543577000024
各ピクセルの逆勾配は、次のように計算できる。
Figure 0007543577000025
逆勾配g(t),ch <k+1>,iは、次のように、リシェープドビデオ信号(又はその中のリシェープド画像)とその参照ビデオ信号(又はその中の参照画像)との間の計算誤差e(t),ch <k+1>と共に使用されて、逆方向参照信号修正の一部として、次の反復のために更新された参照ビデオ信号を生成できる。
Figure 0007543577000026
表2に示すものと同様の符号化手順/方法/フローを使用して、上記の式で更新された異なる参照ビデオ信号があるにもかかわらず、チェーンドリシェーピング関数のパイプラインの中のリシェーピング関数を生成又は構築できる。
<制約付き最適化>
図3Aに示されているように、中間リシェープドビデオ信号における制約なし最適化、又は制約又は制限なしで中間リシェープドビデオ信号を最適化すると、歪みの発散が生じる可能性がある。制約は、本明細書に記載されているように、リシェーピング関数最適化処理において実施され、リシェーピング関数最適化処理によって構築されたチェーンドリシェーピング関数のパイプラインから生成される中間リシェープドビデオ信号の忠実度を向上又は保証することができる。
幾つかの動作シナリオにおいて、本明細書に記載されているようなリシェーピング関数最適化は、ハード制約で実施又は実行することができる。このような最適化は、ハード制約最適化と呼ばれることがある。
例えば、チェーンドリシェーピング関数のパイプラインで生成される中間リシェープドビデオ信号の誤差補正のレベルは、中間リシェープドビデオが近似又はターゲットとなる参照ビデオ信号への修正に制限/境界を設定することによって、次のように制約又は制御できる。
Figure 0007543577000027
ここで、rch,L <k>及びrch,H <k>は、各々許容値変更の下限と上限を表す。許容値変更の下限と上限は、参照ビデオ信号(又はその中の参照画像)内の実際のコードワード分布又は範囲に基づいて設定できる。乗算/除算スケーリング又は比率係数及び/又は加算/減算デルタを使用して、参照ビデオ信号(又はその中の参照画像)内の実際のコードワード分布又は範囲から決定されるグループコードワード値(例えば、最大、死作用、平均、中央、加重平均など)に関連して、これらの上限と下限を設定できる。これらの係数及び/又はデルタの値は、比例、固定などであることができる。例えば、上限は、(a)色空間又はその中の色チャネル内の最大の有効なコードワード値以下、及び(b)参照画像で決定された最大のコードワードから5%未満の差(又は固定値)、に設定できる。同様に、上限は、(a)色空間又はその中の色チャネル内の最小の有効なコードワード値以上、及び(b)参照画像で決定された最小のコードワードから5%未満の差(又は固定値)、に設定できる。
表2に示すものと同様の符号化手順/方法/フローを使用して、上記の式(22)において、(中間リシェープドビデオ信号で近似又はターゲットにするため)参照ビデオ信号に対する限定された修正を伴うが、チェーンドリシェーピング関数のパイプラインの中のリシェーピング関数を生成又は構築できる。
飽和色の変化は中間色の変化よりも顕著であることが分かっている。したがって、中間リシェープドビデオ信号における飽和色に対する変化は、回避、制限、制限又は他の方法で減弱することができる。
これらの飽和色に影響を与える信号修正は、比較的小さい又は狭い範囲又は程度で行うことができ、一方、中間色のような不飽和色に影響を与える信号修正は、比較的大きい又は広い範囲又は程度で行うことができる。
幾つかの動作シナリオにおいて、本明細書に記載されているようなリシェーピング関数最適化は、飽和制約加重アルゴリズム又は方法を使用して実施又は実行することができる。
例えば、各ピクセルの重み付け係数は、リシェーピング関数最適化処理(全体)に対して設定することができる。最終基準ビデオ信号r<K>(又はその中の最終基準画像)の各ピクセルの彩度(値)は、次のように計算され、リシェーピング関数最適化処理(全体)において変更されないように保持することができる。
Figure 0007543577000028
上式(23)に示されているピクセルの彩度(値)は、次のように非線形減少関数又は関数形式を介して、ピクセル(又は中間リシェープドビデオ信号の対応するピクセル)の重み付け係数に変換されるか、又はそれを構成するために使用することができる。
Figure 0007543577000029
は、重み付け係数関数パラメータを表す。σの値の例は、0.01、0.011などである。
画素の重み付け係数は、中間リシェープドビデオ信号が近似する基準ビデオ信号を修正する際に使用できる。これらの重み付け係数を使用すると、画素の彩度が低いほど、画素の画素値に対する修正量が多くなる。換言すれば、彩度の高い画素は、比較的少ない修正量を有することができ、それによって、中間リシェープドビデオ信号における飽和色画素と中間色画素の両方の比較的高い忠実度を確保するのに役立つ。
参照信号修正関数は、次のように重み付け係数で定義することができる。
Figure 0007543577000030
表2に示すものと同様の符号化手順/方法/フローを使用して、上記の式(25)において、(中間リシェープドビデオ信号で近似又はターゲットにするため)参照ビデオ信号に対する飽和加重修正を伴うが、チェーンドリシェーピング関数のパイプラインの中のリシェーピング関数を生成又は構築できる。
図3Cは、図2Bに示すように、チェーンドリシェーピング関数のパイプラインでリシェーピング関数を構築するために使用される反復飽和加重最適化アルゴリズム/方法の各反復における、第1リシェーピング関数Rから出力される第1リシェープドSDRビデオ信号(又はその中のリシェープドSDR画像)の歪みの例を示す。図3Dは、反復飽和加重最適化アルゴリズム/方法の各反復における、第2リシェーピング関数Rから出力されるリシェープドHDRビデオ信号(又はその中のリシェープドHDR画像)の歪みの例を示す。
図3Dに示すように、第2リシェーピング関数から出力されるリシェープドHDRビデオ信号の歪みは、反復回数が増加すると、一定レベル以下で飽和するまで徐々に減少する。図3Cに示すように、第1リシェーピング関数から出力されるリシェープドSDRビデオ信号の歪みは、反復回数が増加するとき増加し続け、反復#15付近でピークに達し、その後飽和点付近まで減少し始める。したがって、HDR及びSDRリシェーピング関数の両方のリシェープドHDR及びSDRビデオ信号の歪みは収束する。さらに、図3C及び図3Bに示すような制約付き(例えば、飽和加重制約など)最適化における歪みは、図3A及び図3Bに示すような制約なし最適化における歪みと比較して、大きく又は顕著な増加はない。
<事前知識を組み込んだ最適化>
幾つかの動作シナリオでは、本明細書に記載されているようなリシェーピング関数最適化は、チェーンドリシェーピング関数のパイプラインから生成される、異なる色等級(又はリシェープドビデオ信号)に関する事前知識を組み込むことができる。したがって、事前知識を組み込んだ(又は制約に基づく)アルゴリズム/方法は、チェーンドリシェーピング関数のパイプラインでリシェーピング関数を生成又は構築する目的で、そのような事前知識を組み込むように実装することができる。
例えば、入力コンテンツを符号化又は表現する際に実際に使用されるコードワード値のうち、入力コンテンツを符号化又は表現するために使用される入力色空間又はドメイン内のコードワード値の全データ範囲の適切なサブセットを表すデータ範囲は、事前情報又は知識として利用可能である。データ範囲に関するこの事前知識は、本明細書に記載されるように、リシェーピング関数最適化における制約として実装され、入力コンテンツの色空間又はドメインから別の色空間又はドメイン内の中間又は最終コンテンツへの変換を容易にするために使用される。
限定ではないが例示として、1つ以上の(追加の)リシェーピング関数を、データ範囲に関する事前知識に基づく変換/制約を考慮するために、チェーンドリシェーピング関数のパイプラインに実装することができる。これらの(追加の)リシェーピング関数は、リシェーピング関数パラメータを最適化せずに固定されることも、又はすべてのリシェーピング関数パラメータの中の最適化すべきリシェーピング関数パラメータの比較的少数(例えば、1、2など)のサブセットのみを使用して構成することもできる。同様に、出力データ範囲も同様に事前知識として知られており、固定リシェーピング関数を使用してチェーンドリシェーピング関数のパイプラインの最終段階又はその近くで制約/変換を実装するために使用することも、構成可能なリシェーピングパラメータのサブセットのみを有するリシェーピング関数を使用することもできる。
図2Cは、チェーンドリシェーピング関数の例示的な事前知識を組み込まれたパイプラインを示す。これらのチェーンドリシェーピング関数のサブセットは、本明細書に記載されるような制約又は変換を有する最適化方法又は手順を使用して生成又は構築することができる。
図2Cに示すように、(元の)入力ビデオ信号(又はその中の入力画像)s<0>は、入力色空間(又は入力ドメイン)で表現/符号化され、チェーンドリシェーピング関数のパイプラインへの入力として提供される。チェーンドリシェーピング関数のパイプラインは、一緒に連結されたK個のリシェーピング関数を含み、Kは1より大きい整数である。これらのK個のリシェーピング関数は、チェーンドリシェーピング関数のパイプラインの両端にある2つの固定リシェーピング関数R()とRK-1()を含む。各固定リシェーピング関数R()とRK-1()は、最適化されるリシェーピング関数パラメータを持たないか、又は最適化される比較的少数のリシェーピング関数パラメータのサブセットを持つことができる。これらのKリシェーピング関数はまた、R()とR()のようなチェーンドリシェーピング関数のサブセットを含み、ここに記載されているように、リシェーピング関数最適化によって最適化されるか構築される。
図2Dは、前述のように、HLG下位互換コーデックからSDR下位互換コーデックへの変換を実装するために使用され得る、チェーンドリシェーピング関数の(特定の)事前知識組み込みパイプラインの例を示す。
図2Dに示されるように、適用可能なユースケースで携帯電話カメラによってキャプチャされた入力ビデオ信号(又はその中の画像)のような、入力コンテンツの中で表されるデータ範囲又は最大色に関する事前知識は、リシェーピング関数最適化に組み込まれ得る。事前知識に基づいて、既存の携帯電話カメラでキャプチャされた入力コンテンツ内の画像のデータ範囲又は最大色は、P3色空間又はドメインであることが分かっている場合があり、同時に、画像を含む入力ビデオ信号は、キャプチャ/格納された画像で実際に使用されるP3色空間又はドメインよりもはるかに大きなデータ範囲又は最大色を持つHLG R.2020画像データコンテナ(又はHLG R.2020色空間又はドメイン)に格納されることが分かっている場合がある。SMPTE EG432-1:2010、「Digital Source Processing-Color Processing for D-Cinema」(2010年11月10日)及びSMPTE RP431-2:2011、「D-Cinema Quality-Reference Projector and Environment」(2011年4月6日)は、その全体が参照により本明細書に組み込まれ、P3色空間の例を説明している。
最適化されたリシェーピング関数パラメータ値は、チェーンドリシェーピング関数のパイプライン内のリシェーピング関数を定義又は指定し、入力コンテンツ内の制約又は事前知識を使用して生成又は構築され、チェーンドリシェーピング関数のパイプライン全体におけるリシェーピング関数の性能(例えば、リシェープド信号の忠実度の向上、予測誤差の低減等)を向上させることができる。
例えば、図2Dに示すように、入力コンテンツ内のデータ範囲又は最大色の制約は、HLG R.2020色空間(又はドメイン)内の入力コンテンツ(名目上)のP3色空間(又はドメイン)への変換を実装する第1リシェーピング関数Rなどの固定リシェーピング関数を介して実施することができる。
SDR参照ビデオ信号(又はSDR画像)は、HLG-to-SDR API又はツールキットを使用して、入力HLG R.2020信号から導出又は変換できる。
チェーンドリシェーピング関数のパイプライン内の第2リシェーピング関数Rは、2つの入力、つまり、(1)SDR参照ビデオ信号(又はその中のSDR画像)及び(2)リシェープドHLG P3ビデオ信号(又はその中のリシェープドHLG P3画像)、を受け取り、第2リシェーピング関数Rによって表される予測モデルを介して、リシェープドHLG P3ビデオ信号(又はその中のリシェープドHLG P3画像)を、図2DのSDRとして表されるリシェープドSDRビデオ信号(又はその中のリシェープドSDR画像)にリシェーピングすることによって、SDR参照ビデオ信号(又はそのSDR画像)を近似しようとする。
R.2020色空間(又はドメイン)内の中間PQ信号は、HLG後方互換コーデックのようなビデオコーデックを使用して、又はBT.2100規格のような関連するビデオコーディング規格又はその中で定義されるプロファイルを実装する他のビデオコーデックを使用して、入力HLG R.2020ビデオ信号から導出又は変換することができる。
その後、R.2020色空間(又はドメイン)における中間PQ信号は、HLG R.2020色空間(又はドメイン)における入力コンテンツ(名目上)のP3色空間(又はドメイン)への変換を実装する第1リシェーピング関数Rのような固定リシェーピング関数によって、P3色空間(又はドメイン)で表される参照PQビデオ信号にリシェーピングすることができる。
チェーンドリシェーピング関数のパイプライン中の第3リシェーピング関数Rは、2つの入力、つまり、(1)P3色空間(又はドメイン)で表される参照PQビデオ信号と、(2)第2リシェーピング関数Rから出力されるリシェープドSDRビデオ信号(又はその中のリシェープドSDR画像)、を受け取り、第3リシェーピング関数Rで表される予測モデルを介してリシェープドSDRビデオ信号(又はその中のリシェープドSDR画像)を再構成又はリシェープドPQビデオ信号(図2DにおいてPQとして表される)又はP3色空間若しくはドメイン(その中の再構成又はリシェープドPQ画像)にリシェーピングすることによって、参照PQビデオ信号(又はその中の参照PQ画像)を近似しようとする。
図示のように、第2リシェーピング関数Rから出力されたリシェープドSDRビデオ信号は、ビデオ信号内の基本層画像データとして符号化/表現されてもよい。第3リシェーピング関数Rを指定するようなリシェーピング関数パラメータは、ビデオ信号に含まれる画像メタデータの一部として含まれ、ビデオ信号の受信装置によって使用されて、ビデオ信号の基本層画像データで表現されたSDRビデオ信号を、再構成PQ画像を有する再構成又はリシェープドPQビデオ信号に再構成又はリシェーピングすることができる。
幾つかの動作シナリオでは、予想される最終出力ビデオ信号は、再構成又はリシェープドPQ R.2020ビデオ信号であってもよい。第3リシェーピング関数Rから生成された再構成PQビデオ信号は、固定リシェーピング関数又はP3色空間若しくはドメインからR.2020色空間若しくはドメインへの変換によってさらに変換することができる。追加で、任意で、又は代替として、3色空間又はドメインからR.2020色空間又はドメインへの固定リシェーピング関数又は変換を、P3色空間又はドメインからLMS色空間又はドメインのような別の色空間又はドメインへの全体的な変換(例えば、LMS変換又は変換など)の一部として結合又はカプセル化することができる。P3色空間又はドメインからR.2020色空間又はドメインへの固定リシェーピング関数又は変換の、全体的な変換への結合又はカプセル化は、例えば、画像メタデータ又はそこに含まれる表示管理(display management (DM))メタデータを介して、上流の符号化装置から下流の受信側復号装置に信号を送ることができる。
最適化されるべき第1(非固定)リシェーピング関数のインデックスをksとして表し、ここでks>0であり、及び最適化されるべき最後の(非固定)リシェーピング関数のインデックスをkeとして表し、ここでke<K-1である。上述した制約の有無にかかわらず、事前知識を組み込んだリシェーピング関数最適化手順の例を以下の表3に示す。
[表3]
Figure 0007543577000031
図3Eは、リシェープドSDRビデオ信号を生成する図2Dの第2リシェーピング関数Rの歪み(又は収束曲線)の例を示す。図3Fは、リシェープドPQ(又はHDR)ビデオ信号を生成する図2Dの第3リシェーピング関数Rの歪み(又は収束曲線)の例を示す。
<例示的な処理フロー>
図4Aは、実施形態による例示的な処理フローを示す。幾つかの実施形態では、1つ以上のコンピューティング装置又はコンポーネント(例えば、符号化装置/モジュール、トランスコーディング装置/モジュール、復号装置/モジュール、逆トーンマッピング装置/モジュール、トーンマッピング装置/モジュール、メディア装置/モジュール、逆マッピング生成及び適用システム等)は、この処理フローを実行してよい。ブロック402において、画像処理システムは、チェーンドリシェーピング関数のパイプラインへの入力ビデオ信号の入力画像を受信する。チェーンドリシェーピング関数のパイプラインは、リシェーピング関数のチェーンを含む。
ブロック404において、画像処理システムは、入力ビデオ信号から、2つ以上の基準色等級のための2つ以上の参照画像を生成する。2つ以上の参照画像の各参照画像は、2つ以上の基準色等級の各々の基準色等級に対応する。
ブロック406において、画像処理システムは、入力画像及び2つ以上の参照画像を使用して、チェーンドリシェーピング関数のパイプラインにおける2つ以上のチェーンドリシェーピング関数のための演算パラメータの2つ以上のセットを決定する。演算パラメータの各セットは、2つ以上のチェーンドリシェーピング関数における各々のチェーンドリシェーピング関数を指定する。2つ以上のチェーンドリシェーピング関数における各々のチェーンドリシェーピング関数は、2つ以上のリシェーピング色等級における2つ以上のリシェープド画像における各々のリシェープド画像を生成するために使用される。
ブロック408において、画像処理システムは、2つ以上のリシェーピング色等級における2つ以上のリシェープド画像のうち、選択されたリシェーピング色等級における選択されたリシェープド画像を、画像メタデータと共にビデオ信号に符号化する。画像メタデータは、2つ以上のチェーンドリシェーピング関数のうちの1つ以上のチェーンドリシェーピング関数に対する演算パラメータの1つ以上のセットを含む。ビデオ信号の受信装置は、画像メタデータと選択されたリシェープド画像とを用いて、選択されたリシェーピング色等級以外のリシェーピング色等級の再構成画像を生成するようにされる。
実施形態では、ビデオ信号は単一レイヤの後方互換性信号を表す。
実施形態では、入力ビデオ信号は第1ビデオコーディングプロファイルに対応し、2つ以上のリシェープド色等級は、1つ以上の第2ビデオコーディングプロファイルに対応し、各第2ビデオコーディングプロファイルは第1ビデオコーディングプロファイルとは異なる。
実施形態では、2つ以上の第2ビデオコーディングプロファイルは、以下:iOS装置、Android装置、タブレットコンピュータ、ラップトップコンピュータ、デスクトップコンピュータ、異なる表示機能を有するユーザ装置、のうちの1つ以上によってサポートされる少なくとも1つのビデオコーディングプロファイルを含む、等である。
実施形態では、入力画像、2つ以上の参照画像、及び2つ以上のリシェープド画像は、以下:8ビット画像、10ビット画像、12ビット画像、ハイブリッドログガンマ(HLG)画像、知覚量子化(PQ)画像、高ダイナミックレンジ(HDR)画像、標準ダイナミックレンジ(SDR)画像、拡張ダイナミックレンジ(EDR)画像、Rec.2020色空間で表される画像、Rec.2100色空間で表される画像、又はP3色空間で表される画像、のうちの少なくとも1つを含む、等である。
実施形態では、各々のチェーンドリシェーピング関数を指定する演算パラメータのセットは、各々のチェーンドリシェーピング関数により生成されたリシェープド画像と2つ以上の参照画像における対応する参照画像との間の予測誤差を最小化することによって決定される。
実施形態では、2つ以上のチェーンドリシェーピング関数を指定する演算パラメータの2つ以上のセットは、2つ以上のチェーンドリシェーピング関数により生成された2つ以上のリシェープド画像の各々と2つ以上の参照画像における対応する参照画像との間の予測誤差を最小化することによって、反復の合計回数によって決定され、
合計回数は、固定反復回数、予測誤差により表される歪みにおけるニーポイントに対応する反復回数、又は少なくとも一部がユーザ入力に基づいて選択される反復回数、のうちの1つから選択される。
実施形態では、反復の合計回数は、予測誤差における予測誤差のサブセットが生成される第1反復を含み、第1予測誤差における予測誤差のサブセットは、第1反復後の第2反復に使用される2つ以上の参照画像を修正するために使用される。
実施形態では、2つ以上の参照画像中のコードワードが、予測誤差のサブセットから計算される逆勾配、コードワードに対する修正を制限するために使用されるハード制約、コードワードの中で比較的飽和したコードワードに対する修正を制限するために使用されるソフト制約、等のうちの1つにより修正される。
実施形態では、チェーンドリシェーピング関数のパイプラインが、入力ビデオ信号、及び2つ以上の基準色等級、のうちの少なくとも1つに関する事前知識に少なくとも部分的に基づいて決定される固定リシェーピング関数を含む。
実施形態では、チェーンドリシェーピング関数のパイプラインによって生成される2つ以上のリシェーピング色等級が、2つ以上の基準色等級における最終基準色等級を近似する最終リシェーピング色等級を含み、最終基準色等級は、ビット深度、ダイナミックレンジ、色空間、空間解像度、ドメイン、又はビデオコーディングプロファイル、等のうちの少なくとも1つにおいて、入力ビデオ信号と異なる。
図4Bは、実施形態による例示的な処理フローを示す。幾つかの実施形態では、1つ以上のコンピューティング装置又はコンポーネント(例えば、符号化装置/モジュール、トランスコーディング装置/モジュール、復号装置/モジュール、逆トーンマッピング装置/モジュール、トーンマッピング装置/モジュール、メディア装置/モジュール、逆マッピング生成及び適用システム等)は、この処理フローを実行してよい。ブロック452では、画像処理システムは、画像メタデータとともに、リシェーピング色等級におけるリシェープド画像をビデオ信号から復号する。画像メタデータは、チェーンドリシェーピング関数のパイプライン内の1つ以上のチェーンドリシェーピング関数を各々指定する演算パラメータの1つ以上のセットを含む。
ブロック454で、画像処理システムは、1つ以上のチェーンドリシェーピング関数のうちの少なくとも1つを、第2リシェーピング色等級における第2リシェープド画像を生成するために、ビデオ信号から復号されたリシェープド画像に適用する。
ブロック456において、画像処理システムは、表示装置上で、第2リシェープド画像から生成された表示画像をレンダリングする。
実施形態では、演算パラメータの1つ以上のセットが、複数の多項式、1次元ルックアップテーブル(1DLUT)、3次元ルックアップテーブル(3DLUT)、クロスカラーチャネル予測子、マルチカラーチャネル重回帰(MMR)予測子、基底関数としてBスプライン関数を有する予測子、又はテンソル積Bスプライン(TPB)予測子、等のうちの1つ以上を指定する。
一実施形態では、ディスプレイ装置、モバイル装置、セットトップボックス、マルチメディア装置、等のようなコンピューティング装置は、前述の方法のうちのいずれかを実行するよう構成される。一実施形態では、機器は、プロセッサを含み、前述の方法のうちのいずれかを実行するよう構成される。一実施形態では、非一時的コンピュータ可読記憶媒体は、1つ以上のプロセッサにより実行されると、前述の方法のうちのいずれかの実行を生じるソフトウェア命令を格納している。
一実施形態では、コンピューティング装置は、1つ以上のプロセッサと1つ以上の記憶媒体とを含み、該記憶媒体は、1つ以上のプロセッサにより実行されると、前述の方法のうちの何れかの実行を生じる命令のセットを格納している。
別個の実施形態が本願明細書に記載されたが、本願明細書で議論した実施形態及び/又は部分的実施形態の任意の組み合わせは、更なる実施形態を形成するために結合されてよい。
<例示的なコンピュータシステムの実装>
本発明の実施形態は、コンピュータシステム、電子回路及びコンポーネント内に構成されるシステム、マイクロコントローラのような集積回路(IC)装置、FPGA(field programmable gate array)、又は別の構成可能な又はプログラム可能な論理装置(PLD)、個別時間又はデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)、及び/又はこのようなシステム、装置、又はコンポーネントのうちの1つ以上を含む機器により実装されてよい。コンピュータ及び/又はICは、本願明細書に記載したような拡張ダイナミックレンジを有する画像の適応型知覚量子化に関連する命令を実行し、制御し、又は実行してよい。コンピュータ及び/又はICは、本願明細書に記載した適応型知覚量子化処理に関連する種々のパラメータ又は値のうちのいずれかを計算してよい。画像及びビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェア、及びそれらの種々の組み合わせで実施されてよい。
本発明の特定の実装は、プロセッサに本発明の方法を実行させるソフトウェア命令を実行するコンピュータプロセッサを含む。例えば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダ、等の中の1つ以上のプロセッサは、プロセッサのアクセス可能なプログラムメモリ内のソフトウェア命令を実行することにより、上述のHDR画像の適応型知覚量子化に関連する方法を実施してよい。本発明bの実施形態は、プログラムプロダクトの形式で提供されてもよい。プログラムプロダクトは、データプロセッサにより実行されるとデータプロセッサに本発明の実施形態の方法を実行させる命令を含むコンピュータ可読信号のセットを運ぶ任意の非一時的媒体を含んでよい。本発明の実施形態によるプログラムプロダクトは、種々の形式のうちの任意のものであってよい。プログラムプロダクトは、例えば、フロッピーディスクを含む磁気データ記憶媒体、ハードディスクドライブ、CDROM、DVDを含む光学データ記憶媒体、ROM、フラッシュRAMを含む電子データ記憶媒体、等のような物理媒体を含んでよい。プログラムプロダクト上のコンピュータ可読信号は、光学的に圧縮又は暗号化されてよい。
コンポーネント(例えば、ソフトウェアモジュール、プロセッサ、部品、装置、回路、等)が以上で言及されたが、特に断りのない限り、それらのコンポーネントの言及(「手段」の言及を含む)は、それらのコンポーネントの均等物、記載したコンポーネントの機能を実行する(例えば、機能的に均等な)任意のコンポーネント、本発明の図示の例示的な実施形態における機能を実行する開示の構造と構造的に等しくないコンポーネントを含むと解釈されるべきである。
一実施形態によると、本願明細書に記載の木j通は、1つ以上の専用コンピューティング装置により実装される。専用コンピューティング装置は、技術を実行するためにハード結線されてよく、又は技術を実行するために永久的にプログラムされた1つ以上の特定用途向け集積回路(ASIC)又はフィールドプログラマブルゲートアレイ(FPGA)のようなデジタル電子装置を含んでよく、又はファームウェア、メモリ、他の記憶装置又はそれらの組み合わせの中のプログラム命令に従い技術を実行するためにプログラムされた1つ以上の汎用ハードウェアプロセッサを含んでよい。このような専用コンピューティング装置は、技術を達成するために、カスタムハードワイヤドロジック、ASIC、又はFPGAをカスタムプログラミングと結合してもよい。専用コンピューティング装置は、デスクトップコンピュータシステム、ポータブルコンピュータシステム、ハンドヘルド装置、ネットワーク装置、又は技術を実装するためにハードワイヤ-ド及び/又はプログラムロジックを組み込む任意の他の装置であってよい。
例えば、図5は、本発明の一実施形態が実装され得るコンピュータシステム500を示すブロック図である。コンピュータシステム500は、情報を通信するためのバス502又は他の通信メカニズム、及び情報を処理するためにバス502に結合されたハードウェアプロセッサ504を含む。ハードウェアプロセッサ504は、例えば、汎用マイクロプロセッサであってよい。
コンピュータシステム500は、バス502に結合され、プロセッサ504により実行されるべき情報及び命令を格納するRAM(random access memory)又は他の動的記憶装置のようなメインメモリ506も含む。メインメモリ506は、プロセッサ504により実行されるべき命令の実行中に、時間変数又は他の中間情報を格納するためにも使用されてよい。このような命令は、プロセッサ504によりアクセス可能な非一時的記憶媒体に格納されるとき、コンピュータシステム500を、命令で指定された動作を実行するようカスタマイズされた専用マシンにする。
コンピュータシステム500は、バス502に結合され、プロセッサ504のための静的情報及び命令を格納する、読み出し専用メモリ(ROM)508又は他の静的記憶装置を更に含む。情報及び命令を格納するために、磁気ディスク又は光ディスクのような記憶装置510が設けられ、バス502に結合される。
コンピュータシステム500は、バス502を介して、コンピュータユーザに情報を表示する液晶ディスプレイのようなディスプレイ512に結合されてよい。英数字及び他のキーを含む入力装置514は、プロセッサ504に情報及びコマンド選択を通信するために、バス502に結合される。別の種類のユーザ入力装置は、プロセッサ504に方向情報及びコマンド選択を通信するための、及びディスプレイ512上のカーソルの動きを制御するための、マウス、トラックボール、又はカーソル方向キーのようなカーソル制御516である。この入力装置は、標準的に、第1軸(例えばx)及び第2軸(例えばy)の2軸の2つの自由度を有し、装置が平面内で位置を指定することを可能にする。
コンピュータシステム500は、コンピュータシステムと結合してコンピュータシステム500を専用マシンにする又はプログラムする、カスタマイズされたハードワイヤドロジック、1つ以上のASIC又はFPGA、ファームウェア及び/又はプログラムロジックを用いて、本願明細書に記載の技術を実装してよい。一実施形態によると、本願明細書に記載の技術は、プロセッサ504がメインメモリ506に含まれる1つ以上の命令の1つ以上のシーケンスを実行することに応答して、コンピュータシステム500により実行される。このような命令は、記憶装置510のような別の記憶媒体からメインメモリ506に読み込まれてよい。メインメモリ506に含まれる命令のシーケンスの実行は、プロセッサ504に本願明細書に記載の処理ステップを実行させる。代替の実施形態では、ハード結線回路が、ソフトウェア命令の代わりに又はそれと組合せて使用されてよい。
用語「記憶媒体」は、本願明細書で使用されるとき、機械を特定の方式で動作させるデータ及び/又は命令を格納する任意の非一時的媒体を表す。そのような記憶媒体は、不揮発性媒体及び/又は揮発性媒体を含んでよい。不揮発性媒体は、例えば、記憶装置510のような光学又は磁気ディスクを含む。揮発性媒体は、メインメモリ506のような動的メモリを含む。記憶媒体の一般的形式は、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、固体ドライブ、磁気テープ、又は任意の他の磁気データ記憶媒体、CD-ROM、任意の他の光学データ記憶媒体、ホールのパターンを有する任意の物理媒体、RAM、PROM、EPROM、FLASH-EPROM、NVRAM、任意の他のメモリチップ又はカートリッジを含む。
記憶媒体は、伝送媒体と異なるが、それと関連して使用されてよい。伝送媒体は、記憶媒体の間で情報を転送する際に関連する。例えば、伝送媒体は、バス502を含むワイヤを含む、同軸ケーブル、銅線、光ファイバを含む。伝送媒体は、無線波及び赤外線データ通信の間に生成されるような、音響又は光波の形式も取りうる。
種々の形式の媒体は、実行のためにプロセッサ504に1つ以上の命令の1つ以上のシーケンスを運ぶ際に関連してよい。例えば、命令は、最初に、リモートコンピュータの磁気ディスク又は固体ドライブにより運ばれてよい。リモートコンピュータは、その動的メモリに命令をロードし、該命令をモデムを用いて電話線を介して送信できる。コンピュータシステム500のローカルにあるモデムは、電話線でデータを受信し、赤外線送信機を用いてデータを赤外線信号に変換できる。赤外線検出器は、赤外線信号の中で運ばれたデータを受信し、適切な回路が該データをバス502に配置できる。バス502は、データをメインメモリ506に運び、そこからプロセッサ504が命令を読み出し実行する。メインメモリ506により受信された命令は、任意で、プロセッサ504による実行の前又は後に記憶装置510に格納されてよい。
コンピュータシステム500は、バス502に結合された通信インタフェース518も含む。通信インタフェース518は、ローカルネットワーク522に接続されるネットワークリンク520との2方向データ通信結合を提供する。例えば、通信インタフェース518は、ISDN(integrated services digital network)カード、ケーブルモデム、衛星モデム、又は対応する種類の電話線にデータ通信接続を提供するモデムであってよい。別の例として、通信インタフェース518は、互換LANにデータ通信接続を提供するLAN(local area network)カードであってよい。無線リンクも実装されてよい。任意のこのような実装では、通信インタフェース518は、種々の種類の情報を表すデジタルデータストリームを運ぶ電気、電磁気、又は光信号を送受信する。
ネットワークリンク520は、標準的に、1つ以上のネットワークを通じて他のデータ装置にデータ通信を提供する。例えば、ネットワークリンク520は、ローカルネットワーク522を通じてホストコンピュータ524に又はISP(Internet Service Provider)526により運用されるデータ機器に接続を提供してよい。ISP526は、また、現在一般に「インターネット」528と呼ばれるワールドワイドパケットデータ通信ネットワークを通じて、データ通信サービスを提供する。ローカルネットワーク522及びインターネット528は、デジタルデータストリームを運ぶ電気、電磁気、又は光信号の両方を使用する。コンピュータシステム500へ及びそれからのデジタルデータを運ぶ種々のネットワークを通じる信号及びネットワークリンク520上の信号及び通信インタフェース518を通じる信号は、伝送媒体の例示的な形式である。
コンピュータシステム500は、ネットワーク、ネットワークリンク520、及び通信インタフェース518を通じて、プログラムコードを含むメッセージを送信しデータを受信できる。インターネットでは、例えば、サーバ530は、インターネット528、ISP526、ローカルネットワーク522、及び通信インタフェース518を通じて、適切なプログラムのための要求されたコードを送信してよい。
受信したコードは、プロセッサ504により受信されるとプロセッサ504により実行され、及び/又は後の実行のために記憶装置510若しくは他の不揮発性記憶装置に格納される。
<均等物、拡張機能、代替案、等(Equivalents, Extensions, Alternatives and Miscellaneous)>
以上の明細書において、本発明の実施形態は、実装毎に変化し得る多数の特定の詳細を参照して説明された。従って、本発明の実施形態の請求の範囲の単独及び排他的な指示、及び出願人が本発明の権利化される実施形態であることを意図するものは、本願により、いかなる後の補正を含む、特定の形式で発行される請求の範囲に記載される。このような請求の範囲に含まれる用語について本願明細書に明示的に記載された任意の定義は、請求の範囲において使用されるこのような用語の意味を支配するべきである。従って、請求の範囲に明示的に記載されないいかなる限定、要素、特徴、利点、又は属性は、いかなる方法でも、請求の範囲の範囲を限定すべきではない。明細書及び図面は、従って、限定的意味では無く、説明であると考えられるべきである。

Claims (15)

  1. 方法であって、
    チェーンドリシェーピング関数のパイプラインへの入力として、入力ビデオ信号の入力画像を受信するステップであって、前記チェーンドリシェーピング関数のパイプラインはリシェーピング関数のチェーンを含む、ステップと、
    前記入力ビデオ信号の入力画像から、2つ以上の基準色等級のための2つ以上の参照画像を生成するステップであって、前記2つ以上の参照画像の中の各々の参照画像は、前記2つ以上の基準色等級の中の各々の基準色等級に対応し、前記2つ以上の基準色等級は相互に及び前記入力画像の色等級と異なる、ステップと、
    前記入力画像及び前記2つ以上の参照画像を使用して、チェーンドリシェーピング関数の前記パイプラインにおける前記2つ以上のチェーンドリシェーピング関数のための演算パラメータの2つ以上のセットを決定し、演算パラメータの各セットは前記2つ以上のチェーンドリシェーピング関数の中の各々のチェーンドリシェーピング関数を指定して、前記2つ以上のチェーンドリシェーピング関数の中の各々のチェーンドリシェーピング関数が、2つ以上のリシェーピング色等級における2つ以上のリシェープド画像において各々のリシェープド画像を生成するようにし、前記2つ以上のリシェーピング色等級の各々が、前記2つ以上の基準色等級のうちの対応する1つと同じであるか又はそれを近似する、ステップと、
    前記2つ以上のリシェーピング色等級における前記2つ以上のリシェープド画像のうち、第1リシェーピング色等級における選択されたリシェープド画像を、画像メタデータと共にビデオ信号に符号化するステップであって、前記第1リシェーピング色等級は、前記第1リシェーピング色等級における前記選択されたリシェープド画像を生成する第1チェーンドリシェーピング関数に対応し、前記画像メタデータは、前記2つ以上のチェーンドリシェーピング関数のうちの第2又はそれ以降のチェーンドリシェーピング関数のための演算パラメータの1つ以上のセットを含み、前記第2又はそれ以降のチェーンドリシェーピング関数は、前記リシェーピング関数のチェーンの中の第1リシェーピング関数に続き、前記第2又はそれ以降のチェーンドリシェーピング関数は、第2リシェーピング色等級の再構成画像を生成し、前記ビデオ信号の受信装置は、前記画像メタデータと前記選択されたリシェープド画像を使用して前記第2リシェーピング色等級の再構成画像を生成するようにされる、ステップと、
    を含む方法。
  2. 前記ビデオ信号は、単一レイヤの後方互換性のある信号を表す、請求項1に記載の方法。
  3. 前記入力ビデオ信号は、第1ビデオコーディングプロファイルに対応し、
    前記2つ以上のリシェーピング色等級は、1つ以上の第2ビデオコーディングプロファイルに対応し、各第2ビデオコーディングプロファイルは前記第1ビデオコーディングプロファイルとは異なる、請求項に記載の方法。
  4. 前記2つ以上の第2ビデオコーディングプロファイルは、以下:iOS装置、Android装置、タブレットコンピュータ、ラップトップコンピュータ、デスクトップコンピュータ、又は異なる表示機能を有するユーザ装置、のうちの1つ以上によってサポートされる少なくとも1つのビデオコーディングプロファイルを含む、請求項3に記載の方法。
  5. 前記入力画像、前記2つ以上の参照画像、及び前記2つ以上のリシェープド画像は、以下:8ビット画像、10ビット画像、12ビット画像、ハイブリッドログガンマ(HLG)画像、知覚量子化(PQ)画像、高ダイナミックレンジ(HDR)画像、標準ダイナミックレンジ(SDR)画像、拡張ダイナミックレンジ(EDR)画像、Rec.2020色空間で表される画像、Rec.2100色空間で表される画像、又はP3色空間で表される画像、のうちの少なくとも1つを含む、請求項に記載の方法。
  6. 各々の前記チェーンドリシェーピング関数を指定する演算パラメータの前記セットは、各々の前記チェーンドリシェーピング関数により生成されたリシェープド画像と前記2つ以上の参照画像における対応する参照画像との間の予測誤差を最小化することによって決定される、請求項に記載の方法。
  7. 前記2つ以上のチェーンドリシェーピング関数をそれぞれ指定する演算パラメータの前記2つ以上のセットは、前記2つ以上のチェーンドリシェーピング関数によりそれぞれ生成された前記2つ以上のリシェープド画像の各々と前記2つ以上の参照画像における対応する参照画像との間の予測誤差を最小化することによって、反復の合計回数によって決定され、
    前記合計回数は、固定反復回数、前記予測誤差により表される歪みにおけるニーポイントに対応する反復回数、又は少なくとも一部がユーザ入力に基づいて選択される反復回数、のうちの1つから選択される、請求項に記載の方法。
  8. 前記反復の合計回数は、前記予測誤差における予測誤差のサブセットが生成される第1反復を含み、
    前記予測誤差における予測誤差の前記サブセットは、前記第1反復の後の第2反復に使用される前記2つ以上の参照画像を修正するために使用される、請求項7に記載の方法。
  9. 前記2つ以上の参照画像中のコードワードが、予測誤差の前記サブセットから計算される逆勾配、前記コードワードに対する修正を制限するために使用されるハード制約、又は前記コードワードの中で比較的飽和したコードワードに対する修正を制限するために使用されるソフト制約、のうちの1つにより修正される、請求項8に記載の方法。
  10. 前記チェーンドリシェーピング関数の前記パイプラインが、前記入力ビデオ信号、及び前記2つ以上の基準色等級、のうちの少なくとも1つに関する事前知識に少なくとも部分的に基づいて決定される固定リシェーピング関数を含む、請求項に記載の方法。
  11. チェーンドリシェーピング関数の前記パイプラインによって生成される前記2つ以上のリシェーピング色等級が、前記2つ以上の基準色等級における最終基準色等級を近似する最終リシェーピング色等級を含み、
    前記最終基準色等級は、ビット深度、ダイナミックレンジ、色空間、空間解像度、ドメイン、又はビデオコーディングプロファイル、のうちの少なくとも1つにおいて、前記入力ビデオ信号と異なる、請求項に記載の方法。
  12. 方法であって、
    ビデオ信号から、画像メタデータと共に、第1リシェーピング色等級におけるリシェープド画像を復号するステップであって、前記画像メタデータは、演算パラメータの2つ以上のセットを含み、演算パラメータの各セットは、2つ以上のチェーンドリシェーピング関数における各々のチェーンドリシェーピング関数を指定して、前記2つ以上のチェーンドリシェーピング関数における各々のチェーンドリシェーピング関数が、2つ以上の第2リシェーピング色等級における2つ以上のリシェープド画像における各々のリシェープド画像を生成するようにし、前記2つ以上の第2リシェーピング色等級が互いに及び前記第1リシェーピング色等級と異なる、ステップと、
    前記2つ以上の第2リシェーピング色等級における第2リシェーピング色等級を決定するステップであって、前記第2リシェーピング色等級は、前記リシェープド画像を前記第2リシェーピング色等級で表示装置上でレンダリングするために、前記表示装置の能力に適合する、ステップと、
    前記第2リシェーピング色等級における第2リシェープド画像を生成するために、前記ビデオ信号から復号された前記リシェープド画像に前記2つ以上のチェーンドリシェーピング関数のうちの少なくとも1つを適用するステップと、
    前記表示装置上で、前記第2リシェープド画像から生成された表示画像をレンダリングするステップと、
    を含む方法。
  13. 演算パラメータの1つ以上の前記セットが、複数の多項式、1次元ルックアップテーブル(1DLUT)、3次元ルックアップテーブル(3DLUT)、クロスカラーチャネル予測子、マルチカラーチャネル重回帰(MMR)予測子、基底関数としてBスプライン関数を有する予測子、又はテンソル積Bスプライン(TPB)予測子、のうちの1つ以上を指定する、請求項12に記載の方法。
  14. プロセッサを含み、請求項1~13に記載の方法のうちのいずれか1つを実行するよう構成される機器。
  15. 請求項1~13のいずれかに記載の方法に従い1つ以上のプロセッサにより方法を実行するためのコンピュータ実行可能命令を格納している非一時的コンピュータ可読記憶媒体。
JP2023575544A 2021-06-08 2022-06-01 チェーンドリシェーピング関数の最適化 Active JP7543577B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163208190P 2021-06-08 2021-06-08
US63/208,190 2021-06-08
EP21178180 2021-06-08
EP21178180.2 2021-06-08
PCT/US2022/031767 WO2022260902A1 (en) 2021-06-08 2022-06-01 Chained reshaping function optimization

Publications (2)

Publication Number Publication Date
JP2024522166A JP2024522166A (ja) 2024-06-11
JP7543577B2 true JP7543577B2 (ja) 2024-09-02

Family

ID=82115636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023575544A Active JP7543577B2 (ja) 2021-06-08 2022-06-01 チェーンドリシェーピング関数の最適化

Country Status (7)

Country Link
US (1) US12143593B2 (ja)
EP (1) EP4352964B1 (ja)
JP (1) JP7543577B2 (ja)
ES (1) ES3014895T3 (ja)
HU (1) HUE070652T2 (ja)
PL (1) PL4352964T3 (ja)
WO (1) WO2022260902A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024098411A (ja) * 2023-01-10 2024-07-23 キヤノン株式会社 画像処理装置および画像処理方法
CN121058251A (zh) * 2023-02-10 2025-12-02 杜比实验室特许公司 使用张量积b样条表示进行的图像压缩

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017011636A1 (en) 2015-07-16 2017-01-19 Dolby Laboratories Licensing Corporation Signal reshaping and coding for hdr and wide color gamut signals
WO2017024042A2 (en) 2015-08-04 2017-02-09 Dolby Laboratories Licensing Corporation Signal reshaping for high dynamic range signals
WO2017053432A1 (en) 2015-09-21 2017-03-30 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
US20170221189A1 (en) 2016-02-02 2017-08-03 Dolby Laboratories Licensing Corporation Block-based content-adaptive reshaping for high dynamic range images
WO2021108719A1 (en) 2019-11-27 2021-06-03 Dolby Laboratories Licensing Corporation Rate-control-aware reshaping in hdr imaging

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI538474B (zh) 2011-03-15 2016-06-11 杜比實驗室特許公司 影像資料轉換的方法與設備
PL2782348T3 (pl) 2011-04-14 2018-04-30 Dolby Laboratories Licensing Corp Zmienna objaśniająca regresji wielorakiej kanału wielu barw
BR112017018552B1 (pt) 2015-03-20 2019-10-22 Dolby Laboratories Licensing Corp aproximação para remodelagem de sinal
JP2018525905A (ja) * 2015-07-22 2018-09-06 アリス エンタープライジズ エルエルシーArris Enterprises Llc 高ダイナミックレンジおよび広色域シーケンスを符号化するシステム
US11277610B2 (en) * 2015-09-23 2022-03-15 Arris Enterprises Llc Single layer high dynamic range coding with standard dynamic range backward compatibility
US10200701B2 (en) * 2015-10-14 2019-02-05 Qualcomm Incorporated HDR and WCG coding architecture with SDR backwards compatibility in a single bitstream for video coding
CN108885783B (zh) 2016-03-23 2022-02-15 杜比实验室特许公司 编码和解码可逆制作质量单层视频信号
GB201611253D0 (en) 2016-06-29 2016-08-10 Dolby Laboratories Licensing Corp Efficient Histogram-based luma look matching
US10264287B2 (en) 2016-10-05 2019-04-16 Dolby Laboratories Licensing Corporation Inverse luma/chroma mappings with histogram transfer and approximation
TWI812874B (zh) 2019-10-01 2023-08-21 美商杜拜研究特許公司 張量乘積之b平滑曲線預測子
ES2975636T3 (es) 2020-04-22 2024-07-10 Dolby Laboratories Licensing Corp Optimización iterativa de funciones de reformación en códec monocapa de imagen HDR

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017011636A1 (en) 2015-07-16 2017-01-19 Dolby Laboratories Licensing Corporation Signal reshaping and coding for hdr and wide color gamut signals
US20180167637A1 (en) 2015-07-16 2018-06-14 Dolby Laboratories Licensing Corporation Signal reshaping and coding for hdr and wide color gamut signals
WO2017024042A2 (en) 2015-08-04 2017-02-09 Dolby Laboratories Licensing Corporation Signal reshaping for high dynamic range signals
WO2017053432A1 (en) 2015-09-21 2017-03-30 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
US20180278967A1 (en) 2015-09-21 2018-09-27 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
US20170221189A1 (en) 2016-02-02 2017-08-03 Dolby Laboratories Licensing Corporation Block-based content-adaptive reshaping for high dynamic range images
WO2021108719A1 (en) 2019-11-27 2021-06-03 Dolby Laboratories Licensing Corporation Rate-control-aware reshaping in hdr imaging

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
K. Minoo, et al.,Description of the reshaper parameters derivation process in ETM reference software,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11,JCTVC-W0031,23rd Meeting: San Diego, USA,2016年01月,pp.1-17

Also Published As

Publication number Publication date
ES3014895T3 (en) 2025-04-28
US20240267530A1 (en) 2024-08-08
EP4352964C0 (en) 2025-02-19
JP2024522166A (ja) 2024-06-11
US12143593B2 (en) 2024-11-12
EP4352964A1 (en) 2024-04-17
PL4352964T3 (pl) 2025-04-22
WO2022260902A1 (en) 2022-12-15
EP4352964B1 (en) 2025-02-19
HUE070652T2 (hu) 2025-06-28

Similar Documents

Publication Publication Date Title
US10264287B2 (en) Inverse luma/chroma mappings with histogram transfer and approximation
CN109416832B (zh) 高效的基于直方图的亮度外观匹配
US11388408B2 (en) Interpolation of reshaping functions
CN115152212B (zh) 图像处理中的联合前向和后向神经网络优化
JP2022550206A (ja) テンソル積bスプライン予測子
JP7439251B2 (ja) ビデオコーデックにおける品質と計算の複雑さとの間の調整可能なトレードオフ
US12244872B2 (en) Wrapped reshaping for codeword augmentation with neighborhood consistency
EP3306563B1 (en) Inverse luma/chroma mappings with histogram transfer and approximation
US12382106B2 (en) Reshaping functions for HDR imaging with continuity and reversibility constraints
JP7543577B2 (ja) チェーンドリシェーピング関数の最適化
JP7434554B2 (ja) カスケード予測
JP7540085B2 (ja) 色変換データ生成方法
CN117426091B (zh) 用于生成或渲染图像的方法以及计算装置
HK1248904B (en) Inverse luma/chroma mappings with histogram transfer and approximation
HK1248904A1 (en) Inverse luma/chroma mappings with histogram transfer and approximation
HK1257716A1 (zh) 编码和解码可逆制作质量单层视频信号
HK1257716B (en) Encoding and decoding reversible production-quality single-layer video signals

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231207

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20231207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240821

R150 Certificate of patent or registration of utility model

Ref document number: 7543577

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150