JP7726209B2 - 情報処理装置および方法 - Google Patents
情報処理装置および方法Info
- Publication number
- JP7726209B2 JP7726209B2 JP2022530134A JP2022530134A JP7726209B2 JP 7726209 B2 JP7726209 B2 JP 7726209B2 JP 2022530134 A JP2022530134 A JP 2022530134A JP 2022530134 A JP2022530134 A JP 2022530134A JP 7726209 B2 JP7726209 B2 JP 7726209B2
- Authority
- JP
- Japan
- Prior art keywords
- bitstream
- information
- spatial scalability
- layer
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/001—Model-based coding, e.g. wire frame
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
- H04N19/23—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/33—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Generation (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Description
1.V3Cビットストリームのスペーシャルスケーラビリティ
2.第1の実施の形態(ビットストリームとスペーシャルスケーラビリティ情報を格納するファイル)
3.第2の実施の形態(スペーシャルスケーラビリティ情報を格納する制御ファイル)
4.付記
<技術内容・技術用語をサポートする文献等>
本技術で開示される範囲は、実施の形態に記載されている内容だけではなく、出願当時において公知となっている以下の非特許文献等に記載されている内容や以下の非特許文献において参照されている他の文献の内容等も含まれる。
非特許文献2:(上述)
非特許文献3:(上述)
非特許文献4:(上述)
非特許文献5:(上述)
非特許文献6:https://www.matroska.org/index.html
従来、点の位置情報や属性情報等により3次元構造を表すポイントクラウド(Point cloud)等の3Dデータが存在した。
V-PCC(Video based Point Cloud Compression)では、このようなポイントクラウドのジオメトリやアトリビュートが、小領域毎に2次元平面に投影される。本開示において、この小領域を部分領域という場合がある。このジオメトリやアトリビュートが2次元平面に投影された画像を投影画像とも称する。また、この小領域(部分領域)毎の投影画像をパッチ(patch)と称する。例えば、図1のAのオブジェクト1(3Dデータ)が、図1のBに示されるようなパッチ2(2Dデータ)に分解される。ジオメトリのパッチの場合、各画素値は、ポイントの位置情報を示す。ただし、その場合、ポイントの位置情報は、その投影面に対して垂直方向(奥行方向)の位置情報(デプス値(Depth))として表現される。
エンコーダは、上述したようなジオメトリビデオフレーム、アトリビュートビデオフレーム、オキュパンシーマップ、およびアトラス情報の符号化データを多重化し、1つのビットストリームを生成する。このビットストリームをV3Cビットストリーム(V3C Bitstream)とも称する。
図3のAは、アトラスサブビットストリームの主な構成例を示す図である。図3のAに示されるようにアトラスサブビットストリーム31は、アトラスNALユニット(atlas NAL unit)32の連続で構成される。図3のAに示される各四角がアトラスNALユニット32を示している。
非特許文献4には、V3CビットストリームをISOBMFF(International Organization for Standardization Base Media File Format)に格納する方法として、マルチトラックストラクチャ(multi-track structure)とシングルトラックストラクチャ(single track structure)の2種類が規定されている。
ところで非特許文献4には、ポイントクラウドのオブジェクトの一部分を取得したり、復号したりするためのパーシャルアクセス(partial access)情報が規定されている。例えば、このパーシャルアクセス情報を利用することにより、ストリーミング配信時にポイントクラウドのオブジェクトの表示部分の情報のみを取得するといった制御が可能になる。このような制御により、帯域幅を有効活用して高精細化する、といった効果を得ることができる。
例えば、図6のオブジェクト61のビットストリームが3つの3Dスペーシャルリージョン(3Dスペーシャルリージョン61A、3Dスペーシャルリージョン61B、3Dスペーシャルリージョン61C)に分割されてISOBMFFに格納されるとする。また、マルチトラックストラクチャが適用され、3Dスペーシャルリージョン情報が静的である(時間方向に変化しない)とする。
V-PCC符号化においては、例えば、上述のように、volumetric annotation SEI message familyを利用することにより、特定の3D空間位置の一部のポイントクラウド(partial point cloud)のみを復号し、レンダリングすることができるリージョンベースドスケーラビリティ(region-based scalability)を実現することができる。
LoDパッチモードでは、クライアントが高LoD(密)のポイントクラウドを構成する低LoD(疎)のポイントクラウドを単独で復号し、低LoDのポイントクラウドを構築することができるようにポイントクラウドが符号化される。
以上のように、MPEG-I Part 5 Visual Volumetric Video-based Coding(V3C) and Video-based Point Cloud Compression(V-PCC)では、LoDパッチモードで符号化することで、クライアントは高LoD(密)のポイントクラウドを構成する低LoD(疎)のポイントクラウドを単独で復号し、低LoDのポイントクラウドを構築することができる。
<ビットストリームとスペーシャルスケーラビリティ情報を格納するファイル>
そこで、スペーシャルスケーラビリティに関する情報を、V3Cビットストリームを格納するファイル(例えばISOBMFF)に、V3Cビットストリームとは別の情報として格納する(システムレイヤに格納する)ようにする。
図13のAは、VPCCスペーシャルリージョンボックス(VPCCSpatialRegionsBox)のシンタックスの例を示す図である。図13のAの例の場合、VPCCスペーシャルリージョンボックスにおいて、リージョン(region)毎に、スペーシャルスケーラビリティインフォストラクト(SpatialScalabilityInfoStruct())が格納される。
なお、図14のAに示される例のように、VPCCスペーシャルリージョンボックス(VPCCSpatialRegionsBox)において、リージョン(region)毎に、レイヤ数分のforループを用いて、スペーシャルスケーラビリティインフォストラクト(SpatialScalabilityInfoStruct())およびトラックグループ識別情報(track_group_id)を格納してもよい。
以上においてはファイルフォーマットとしてISOBMFFを適用する例について説明したが、V3Cビットストリームを格納するファイルは任意であり、ISOBMFF以外であってもよい。例えば、V3Cビットストリームが、マトリョーシカメディアコンテナ(Matroska Media Container)に格納されるようにしてもよい。マトリョーシカメディアコンテナの主な構成例を図15に示す。
図16は、本技術を適用した情報処理装置の一態様であるファイル生成装置の構成の一例を示すブロック図である。図16に示されるファイル生成装置300は、V-PCCを適用して、ポイントクラウドデータをビデオフレームとして2次元画像用の符号化方法により符号化する装置である。また、ファイル生成装置300は、ISOBMFFを生成し、その符号化により生成したV3Cビットストリームを格納する。
このファイル生成装置300により実行されるファイル生成処理の流れの例を、図17のフローチャートを参照して説明する。
本実施の形態において上述した本技術は、ファイル生成装置に限らず、クライアント装置にも適用することができる。図18は、本技術を適用した情報処理装置の一態様であるクライアント装置の構成の一例を示すブロック図である。図18に示されるクライアント装置400は、V-PCCを適用し、ポイントクラウドデータをビデオフレームとして2次元画像用の符号化方法により符号化されたV3Cビットストリーム(ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシービデオサブビットストリーム、およびアトラスサブビットストリーム、または、それらをまとめたもの)をファイルから取得し、2次元画像用の復号方法により復号し、ポイントクラウドを生成(再構築)する装置である。例えば、クライアント装置400は、ファイル生成装置300が生成したファイルからV3Cビットストリームを抽出し、復号してポイントクラウドを生成することができる。
このクライアント装置400により実行されるクライアント処理の流れの例を、図19のフローチャートを参照して説明する。
<スペーシャルスケーラビリティ情報を格納する制御ファイル>
本技術は、例えば、MPEG-DASH(Moving Picture Experts Group phase - Dynamic Adaptive Streaming over HTTP)に適用することもできる。例えば、MPEG-DASHにおいて、ビットストリームの配信に関する制御情報を格納する制御ファイルであるMPD(Media Presentation Description)を拡張し、サブビットストリームのスペーシャルスケーラビリティに関するスペーシャルスケーラビリティ情報を格納してもよい。
図21は、V3C3Dリージョンディスクリプタのシンタックスの例を示す図である。図21に示されるように、このV3C3Dリージョンディスクリプタのvpsr.spatialRegion.spatialScalabilityInfoに、スペーシャルスケーラビリティ情報として、レイヤ識別情報(layerId)が格納されてもよい。レイヤ識別情報は、ISOBMFFの場合と同様に、そのvpsr.spatialRegion.spatialScalabilityInfoが対応するアダプテーションセットに制御情報が格納されるサブビットストリームが対応するレイヤを示す識別情報である。例えば、layerId = 0は、ベースレイヤを示し、layerId = 1乃至255は、エンハンスメントレイヤを示す。
なお、図22に示される例のように、vpsr.spatialRegion.spatialScalabilityInfo@idをシグナルせず、代わりにレイヤ数分のvpsr.spatialRegion.spatialScalabilityInfoおよびasIdsをシグナルしてもよい。このとき特定のvpsr.spatialRegion下の複数spatialScalabilityInfoがスペーシャルスケーラビリティ(spatial scalability)を提供する。
図23は、このような本技術を適用した場合の、MPDの記述例を示す図である。図23の上から5行目に示されるサプリメントプロパティの記述例を図24に示す。
図25は、この場合のファイル生成装置300の主な構成例を示すブロック図である。つまり、図25に示されるファイル生成装置300は、本技術を適用した情報処理装置の一態様であるファイル生成装置の構成の一例を示す。図25に示されるファイル生成装置300は、V-PCCを適用して、ポイントクラウドデータをビデオフレームとして2次元画像用の符号化方法により符号化する装置である。また、この場合のファイル生成装置300は、その符号化により生成したV3Cビットストリームの配信を制御する制御情報を格納するMPDを生成する。
この場合のファイル生成装置300により実行されるファイル生成処理の流れの例を、図26のフローチャートを参照して説明する。
本実施の形態において上述した本技術は、ファイル生成装置に限らず、クライアント装置にも適用することができる。図27は、この場合のクライアント装置400の主な構成例を示すブロック図である。つまり、図27に示されるクライアント装置400は、本技術を適用した情報処理装置の一態様であるクライアント装置の構成の一例を示す。図27に示されるクライアント装置400は、V-PCCを適用し、ポイントクラウドデータをビデオフレームとして2次元画像用の符号化方法により符号化されたV3Cビットストリーム(ジオメトリビデオサブビットストリーム、アトリビュートビデオサブビットストリーム、オキュパンシービデオサブビットストリーム、およびアトラスサブビットストリーム、または、それらをまとめたもの)を、MPDに基づいて取得し、2次元画像用の復号方法により復号し、ポイントクラウドを生成(再構築)する装置である。例えば、クライアント装置400は、ファイル生成装置300が生成したMPDに基づいてV3Cビットストリームを取得し、復号してポイントクラウドを生成することができる。
このクライアント装置400により実行されるクライアント処理の流れの例を、図28のフローチャートを参照して説明する。
<コンピュータ>
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。
以上においては、ポイントクラウドデータの符号化・復号に本技術を適用する場合について説明したが、本技術は、これらの例に限らず、任意の規格の3Dデータの符号化・復号に対して適用することができる。つまり、上述した本技術と矛盾しない限り、符号化・復号方式等の各種処理、並びに、3Dデータやメタデータ等の各種データの仕様は任意である。また、本技術と矛盾しない限り、上述した一部の処理や仕様を省略してもよい。
本技術を適用したシステム、装置、処理部等は、例えば、交通、医療、防犯、農業、畜産業、鉱業、美容、工場、家電、気象、自然監視等、任意の分野に利用することができる。また、その用途も任意である。
なお、本明細書において「フラグ」とは、複数の状態を識別するための情報であり、真(1)または偽(0)の2状態を識別する際に用いる情報だけでなく、3以上の状態を識別することが可能な情報も含まれる。したがって、この「フラグ」が取り得る値は、例えば1/0の2値であってもよいし、3値以上であってもよい。すなわち、この「フラグ」を構成するbit数は任意であり、1bitでも複数bitでもよい。また、識別情報(フラグも含む)は、その識別情報をビットストリームに含める形だけでなく、ある基準となる情報に対する識別情報の差分情報をビットストリームに含める形も想定されるため、本明細書においては、「フラグ」や「識別情報」は、その情報だけではなく、基準となる情報に対する差分情報も包含する。
(1) 3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドであって、スペーシャルスケーラビリティに対応する前記ポイントクラウドが2次元化された2Dデータを符号化して、前記スペーシャルスケーラビリティの単数または複数のレイヤに対応する前記ポイントクラウドが符号化されたサブビットストリームを含むビットストリームを生成する符号化部と、
前記サブビットストリームの前記スペーシャルスケーラビリティに関するスペーシャルスケーラビリティ情報を生成するスペーシャルスケーラビリティ情報生成部と、
前記符号化部により生成された前記ビットストリームと、前記スペーシャルスケーラビリティ情報生成部により生成された前記スペーシャルスケーラビリティ情報とを格納するファイルを生成するファイル生成部と
を備える情報処理装置。
(2) 前記スペーシャルスケーラビリティ情報は、前記ファイルのトラックグループに格納される前記サブビットストリームが対応する前記レイヤを示すレイヤ識別情報を含む
(1)に記載の情報処理装置。
(3) 前記スペーシャルスケーラビリティ情報は、前記スペーシャルスケーラビリティの最上位レイヤから前記レイヤ識別情報により示される前記レイヤまでの各レイヤに対応する前記ポイントクラウドを再構築することにより得られる前記ポイントクラウドの解像度に関する情報をさらに含む
(2)に記載の情報処理装置。
(4) 前記スペーシャルスケーラビリティ情報は、前記スペーシャルスケーラビリティを識別するスペーシャルスケーラビリティ識別情報をさらに含む
(3)に記載の情報処理装置。
(5) 3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドであって、スペーシャルスケーラビリティに対応する前記ポイントクラウドが2次元化された2Dデータを符号化して、前記スペーシャルスケーラビリティの単数または複数のレイヤに対応する前記ポイントクラウドが符号化されたサブビットストリームを含むビットストリームを生成し、
前記サブビットストリームの前記スペーシャルスケーラビリティに関するスペーシャルスケーラビリティ情報を生成し、
生成された前記ビットストリームと前記スペーシャルスケーラビリティ情報とを格納するファイルを生成する
情報処理方法。
前記ファイルに格納される前記ビットストリームから、前記選択部により選択された前記レイヤに対応するサブビットストリームを抽出する抽出部と、
前記抽出部により抽出された前記サブビットストリームを復号する復号部と
を備える情報処理装置。
(7) 前記選択部は、前記スペーシャルスケーラビリティ情報に含まれる、前記ファイルのトラックグループに格納される前記サブビットストリームが対応する前記レイヤを示すレイヤ識別情報に基づいて、復号する前記スペーシャルスケーラビリティの前記レイヤを選択する
(6)に記載の情報処理装置。
(8) 前記選択部は、さらに、前記スペーシャルスケーラビリティ情報に含まれる、前記スペーシャルスケーラビリティの最上位レイヤから前記レイヤ識別情報により示される前記レイヤまでの各レイヤに対応する前記ポイントクラウドを再構築することにより得られる前記ポイントクラウドの解像度に関する情報に基づいて、復号する前記スペーシャルスケーラビリティの前記レイヤを選択する
(7)に記載の情報処理装置。
(9) 前記選択部は、さらに、前記スペーシャルスケーラビリティ情報に含まれる、前記スペーシャルスケーラビリティを識別するスペーシャルスケーラビリティ識別情報に基づいて、復号する前記スペーシャルスケーラビリティの前記レイヤを選択する
(8)に記載の情報処理装置。
(10) ファイルに格納される、3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドであって、スペーシャルスケーラビリティに対応する前記ポイントクラウドが2次元化された2Dデータが符号化されたビットストリームの前記スペーシャルスケーラビリティに関するスペーシャルスケーラビリティ情報に基づいて、復号する前記スペーシャルスケーラビリティのレイヤを選択し、
前記ファイルに格納される前記ビットストリームから、選択された前記レイヤに対応するサブビットストリームを抽出し、
抽出された前記サブビットストリームを復号する
情報処理方法。
前記サブビットストリームの前記スペーシャルスケーラビリティに関するスペーシャルスケーラビリティ情報を生成するスペーシャルスケーラビリティ情報生成部と、
前記スペーシャルスケーラビリティ情報生成部により生成された前記スペーシャルスケーラビリティ情報と、前記符号化部により生成された前記ビットストリームの配信に関する制御情報とを格納する制御ファイルを生成する制御ファイル生成部と
を備える情報処理装置。
(12) 前記スペーシャルスケーラビリティ情報は、前記制御ファイルのアダプテーションセットに前記制御情報が格納される前記サブビットストリームが対応する前記レイヤを示すレイヤ識別情報を含む
(11)に記載の情報処理装置。
(13) 前記スペーシャルスケーラビリティ情報は、前記スペーシャルスケーラビリティの最上位レイヤから前記レイヤ識別情報により示される前記レイヤまでの各レイヤに対応する前記ポイントクラウドを再構築することにより得られる前記ポイントクラウドの解像度に関する情報をさらに含む
(12)に記載の情報処理装置。
(14) 前記スペーシャルスケーラビリティ情報は、前記スペーシャルスケーラビリティを識別するスペーシャルスケーラビリティ識別情報をさらに含む
(13)に記載の情報処理装置。
(15) 3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドであって、スペーシャルスケーラビリティに対応する前記ポイントクラウドが2次元化された2Dデータを符号化して、前記スペーシャルスケーラビリティの単数または複数のレイヤに対応する前記ポイントクラウドが符号化されたサブビットストリームを含むビットストリームを生成し、
前記サブビットストリームの前記スペーシャルスケーラビリティに関するスペーシャルスケーラビリティ情報を生成し、
生成された前記スペーシャルスケーラビリティ情報と、生成された前記ビットストリームの配信に関する制御情報とを格納する制御ファイルを生成する
情報処理方法。
前記選択部により選択された前記レイヤに対応するサブビットストリームを取得する取得部と、
前記取得部により取得された前記サブビットストリームを復号する復号部と
を備える情報処理装置。
(17) 前記選択部は、前記スペーシャルスケーラビリティ情報に含まれる、前記制御ファイルのアダプテーションセットに前記制御情報が格納される前記サブビットストリームが対応する前記レイヤを示すレイヤ識別情報に基づいて、復号する前記スペーシャルスケーラビリティの前記レイヤを選択する
(16)に記載の情報処理装置。
(18) 前記選択部は、さらに、前記スペーシャルスケーラビリティ情報に含まれる、前記スペーシャルスケーラビリティの最上位レイヤから前記レイヤ識別情報により示される前記レイヤまでの各レイヤに対応する前記ポイントクラウドを再構築することにより得られる前記ポイントクラウドの解像度に関する情報に基づいて、復号する前記スペーシャルスケーラビリティの前記レイヤを選択する
(17)に記載の情報処理装置。
(19) 前記選択部は、さらに、前記スペーシャルスケーラビリティ情報に含まれる、前記スペーシャルスケーラビリティを識別するスペーシャルスケーラビリティ識別情報に基づいて、復号する前記スペーシャルスケーラビリティの前記レイヤを選択する
(18)に記載の情報処理装置。
(20) 3次元形状のオブジェクトをポイントの集合として表現するポイントクラウドであって、スペーシャルスケーラビリティに対応する前記ポイントクラウドが2次元化された2Dデータが符号化されたビットストリームの配信に関する制御情報が格納された制御ファイルに格納される、前記ビットストリームの前記スペーシャルスケーラビリティに関するスペーシャルスケーラビリティ情報に基づいて、復号する前記スペーシャルスケーラビリティのレイヤを選択し、
選択された前記レイヤに対応するサブビットストリームを取得し、
取得された前記サブビットストリームを復号する
情報処理方法。
Claims (12)
- 再構築された3Dデータの解像度を制御するスペーシャルスケーラビリティに対応し、前記解像度に基づく階層構造を有する前記3Dデータを前記階層構造のレイヤ毎にサブビットストリームとして符号化し、前記サブビットストリームを含むビットストリームを生成する符号化部と、
前記サブビットストリームの前記スペーシャルスケーラビリティに関する情報であって、前記サブビットストリームに対応する前記レイヤの識別情報と、前記階層構造の最上位レイヤから前記サブビットストリームのレイヤまでを再構築することにより得られる前記3Dデータの前記解像度に関する情報とを含むスペーシャルスケーラビリティ情報を生成するスペーシャルスケーラビリティ情報生成部と、
前記符号化部により生成された前記ビットストリームを格納するファイルを生成し、前記スペーシャルスケーラビリティ情報生成部により生成された前記スペーシャルスケーラビリティ情報を前記ファイルのシステムレイヤに格納するファイル生成部と
を備える情報処理装置。 - 前記スペーシャルスケーラビリティ情報は、前記スペーシャルスケーラビリティを識別するスペーシャルスケーラビリティ識別情報をさらに含む
請求項1に記載の情報処理装置。 - 再構築された3Dデータの解像度を制御するスペーシャルスケーラビリティに対応し、前記解像度に基づく階層構造を有する前記3Dデータを前記階層構造のレイヤ毎にサブビットストリームとして符号化し、前記サブビットストリームを含むビットストリームを生成し、
前記サブビットストリームの前記スペーシャルスケーラビリティに関する情報であって、前記サブビットストリームに対応する前記レイヤの識別情報と、前記階層構造の最上位レイヤから前記サブビットストリームのレイヤまでを再構築することにより得られる前記3Dデータの前記解像度に関する情報とを含むスペーシャルスケーラビリティ情報を生成し、
生成された前記ビットストリームを格納するファイルを生成し、生成された前記スペーシャルスケーラビリティ情報を前記ファイルのシステムレイヤに格納する
情報処理方法。 - ファイルのシステムレイヤに格納される、再構築された3Dデータの解像度を制御するスペーシャルスケーラビリティに関する情報であって、前記3Dデータの前記解像度に基づく階層構造のレイヤ毎に符号化されたサブビットストリームに対応する前記レイヤの識別情報と、前記階層構造の最上位レイヤから前記サブビットストリームのレイヤまでを再構築することにより得られる前記3Dデータの前記解像度に関する情報とを含むスペーシャルスケーラビリティ情報に基づいて、復号する前記レイヤを選択する選択部と、
前記ファイルに格納される前記3Dデータのビットストリームから、前記選択部により選択された前記レイヤに対応する前記サブビットストリームを抽出する抽出部と、
前記抽出部により抽出された前記サブビットストリームを復号する復号部と
を備える情報処理装置。 - 前記選択部は、さらに、前記スペーシャルスケーラビリティ情報に含まれる、前記スペーシャルスケーラビリティを識別するスペーシャルスケーラビリティ識別情報に基づいて、復号する前記レイヤを選択する
請求項4に記載の情報処理装置。 - ファイルのシステムレイヤに格納される、再構築された3Dデータの解像度を制御するスペーシャルスケーラビリティに関する情報であって、前記3Dデータの前記解像度に基づく階層構造のレイヤ毎に符号化されたサブビットストリームに対応する前記レイヤの識別情報と、前記階層構造の最上位レイヤから前記サブビットストリームのレイヤまでを再構築することにより得られる前記3Dデータの前記解像度に関する情報とを含むスペーシャルスケーラビリティ情報に基づいて、復号する前記レイヤを選択し、
前記ファイルに格納される前記3Dデータのビットストリームから、選択された前記レイヤに対応するサブビットストリームを抽出し、
抽出された前記サブビットストリームを復号する
情報処理方法。 - 再構築された3Dデータの解像度を制御するスペーシャルスケーラビリティに対応し、前記解像度に基づく階層構造を有する前記3Dデータを前記階層構造のレイヤ毎にサブビットストリームとして符号化し、前記サブビットストリームを含むビットストリームを生成する符号化部と、
前記サブビットストリームの前記スペーシャルスケーラビリティに関する情報であって、前記サブビットストリームに対応する前記レイヤの識別情報と、前記階層構造の最上位レイヤから前記サブビットストリームのレイヤまでを再構築することにより得られる前記3Dデータの前記解像度に関する情報とを含むスペーシャルスケーラビリティ情報を生成するスペーシャルスケーラビリティ情報生成部と、
前記スペーシャルスケーラビリティ情報生成部により生成された前記スペーシャルスケーラビリティ情報と、前記符号化部により生成された前記ビットストリームの配信に関する制御情報とを格納する制御ファイルを生成する制御ファイル生成部と
を備える情報処理装置。 - 前記スペーシャルスケーラビリティ情報は、前記スペーシャルスケーラビリティを識別するスペーシャルスケーラビリティ識別情報をさらに含む
請求項7に記載の情報処理装置。 - 再構築された3Dデータの解像度を制御するスペーシャルスケーラビリティに対応し、
前記解像度に基づく階層構造を有する前記3Dデータを前記階層構造のレイヤ毎にサブビットストリームとして符号化し、前記サブビットストリームを含むビットストリームを生成し、
前記サブビットストリームの前記スペーシャルスケーラビリティに関する情報であって、前記サブビットストリームに対応する前記レイヤの識別情報と、前記階層構造の最上位レイヤから前記サブビットストリームのレイヤまでを再構築することにより得られる前記3Dデータの前記解像度に関する情報とを含むスペーシャルスケーラビリティ情報を生成し、
生成された前記スペーシャルスケーラビリティ情報と、生成された前記ビットストリームの配信に関する制御情報とを格納する制御ファイルを生成する
情報処理方法。 - 再構築された3Dデータの解像度を制御するスペーシャルスケーラビリティに対応し、前記解像度に基づく階層構造を有する前記3Dデータが符号化されたビットストリームの配信に関する制御情報が格納された制御ファイルに格納される、前記ビットストリームの前記スペーシャルスケーラビリティに関する情報であって、前記階層構造のレイヤ毎に符号化されたサブビットストリームに対応する前記レイヤの識別情報と、前記階層構造の最上位レイヤから前記サブビットストリームのレイヤまでを再構築することにより得られる前記3Dデータの前記解像度に関する情報とを含むスペーシャルスケーラビリティ情報に基づいて、復号する前記レイヤを選択する選択部と、
前記選択部により選択された前記レイヤに対応するサブビットストリームを取得する取得部と、
前記取得部により取得された前記サブビットストリームを復号する復号部と
を備える情報処理装置。 - 前記選択部は、さらに、前記スペーシャルスケーラビリティ情報に含まれる、前記スペーシャルスケーラビリティを識別するスペーシャルスケーラビリティ識別情報に基づいて、復号する前記レイヤを選択する
請求項10に記載の情報処理装置。 - 再構築された3Dデータの解像度を制御するスペーシャルスケーラビリティに対応し、前記解像度に基づく階層構造を有する前記3Dデータが符号化されたビットストリームの配信に関する制御情報が格納された制御ファイルに格納される、前記ビットストリームの前記スペーシャルスケーラビリティに関する情報であって、前記階層構造のレイヤ毎に符号化されたサブビットストリームに対応する前記レイヤの識別情報と、前記階層構造の最上位レイヤから前記サブビットストリームのレイヤまでを再構築することにより得られる前記3Dデータの前記解像度に関する情報とを含むスペーシャルスケーラビリティ情報に基づいて、復号する前記レイヤを選択し、
選択された前記レイヤに対応するサブビットストリームを取得し、
取得された前記サブビットストリームを復号する
情報処理方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202063038389P | 2020-06-12 | 2020-06-12 | |
| US63/038,389 | 2020-06-12 | ||
| PCT/JP2021/020355 WO2021251173A1 (ja) | 2020-06-12 | 2021-05-28 | 情報処理装置および方法 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2021251173A1 JPWO2021251173A1 (ja) | 2021-12-16 |
| JPWO2021251173A5 JPWO2021251173A5 (ja) | 2024-12-09 |
| JP7726209B2 true JP7726209B2 (ja) | 2025-08-20 |
Family
ID=78845585
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022530134A Active JP7726209B2 (ja) | 2020-06-12 | 2021-05-28 | 情報処理装置および方法 |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US20230224482A1 (ja) |
| EP (1) | EP4167573A4 (ja) |
| JP (1) | JP7726209B2 (ja) |
| KR (1) | KR20230022165A (ja) |
| CN (1) | CN115699751A (ja) |
| BR (1) | BR112022024817A2 (ja) |
| MX (1) | MX2022015369A (ja) |
| WO (1) | WO2021251173A1 (ja) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7467647B2 (ja) * | 2020-06-24 | 2024-04-15 | 中興通訊股▲ふん▼有限公司 | ボリュメトリックメディア処理方法および装置 |
| CN116636225A (zh) | 2020-12-28 | 2023-08-22 | 索尼集团公司 | 信息处理装置和方法 |
| KR20220095819A (ko) * | 2020-12-30 | 2022-07-07 | 현대자동차주식회사 | 라이다 센서를 이용한 객체 추적 방법 및 장치, 및 이 방법을 실행하기 위한 프로그램을 기록한 기록 매체 |
| CN117176715A (zh) * | 2021-03-31 | 2023-12-05 | 腾讯科技(深圳)有限公司 | 点云编解码方法、装置、计算机可读介质及电子设备 |
| KR102527798B1 (ko) * | 2021-12-23 | 2023-05-02 | 경희대학교 산학협력단 | 3차원 컨텐츠 전송 장치 및 방법 |
| WO2024262058A1 (ja) * | 2023-06-21 | 2024-12-26 | ソニーグループ株式会社 | 情報処理装置および方法 |
| US20250285381A1 (en) * | 2024-03-07 | 2025-09-11 | GM Global Technology Operations LLC | Human-centric vehicular metaverse platform for road-side ar/vr content delivery |
| JP2025158437A (ja) * | 2024-04-04 | 2025-10-17 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180268570A1 (en) | 2017-03-16 | 2018-09-20 | Samsung Electronics Co., Ltd. | Point cloud and mesh compression using image/video codecs |
| US20190087978A1 (en) | 2017-09-18 | 2019-03-21 | Apple Inc. | Point cloud compression using non-cubic projections and masks |
| WO2020008758A1 (ja) | 2018-07-06 | 2020-01-09 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9167246B2 (en) * | 2008-03-06 | 2015-10-20 | Arris Technology, Inc. | Method and apparatus for decoding an enhanced video stream |
| US9936196B2 (en) * | 2012-10-30 | 2018-04-03 | Qualcomm Incorporated | Target output layers in video coding |
| AU2014252043B2 (en) * | 2013-04-07 | 2016-11-24 | Dolby International Ab | Signaling change in output layer sets |
| US10567804B2 (en) * | 2014-01-08 | 2020-02-18 | Qualcomm Incorporated | Carriage of HEVC extension bitstreams and buffer model with MPEG-2 systems |
| US20170019673A1 (en) * | 2014-03-14 | 2017-01-19 | Sharp Kabushiki Kaisha | Image decoding device, image decoding method, recoding medium, image coding device, and image coding method |
| US9712837B2 (en) * | 2014-03-17 | 2017-07-18 | Qualcomm Incorporated | Level definitions for multi-layer video codecs |
| US10148969B2 (en) * | 2015-02-11 | 2018-12-04 | Qualcomm Incorporated | Of sample entry and operation point signalling in a layered video file format |
| KR102603459B1 (ko) * | 2015-09-07 | 2023-11-17 | 엘지전자 주식회사 | 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법 |
| AU2020234972B2 (en) * | 2019-03-11 | 2025-10-23 | Interdigital Vc Holdings, Inc. | Sub-picture bitstream extraction and reposition |
| EP4022928A4 (en) * | 2019-09-24 | 2022-11-16 | Huawei Technologies Co., Ltd. | DPB PARAMETER REPORTING FOR MULTILAYER VIDEO BITSTREAMS |
| KR20230002615A (ko) * | 2020-04-14 | 2023-01-05 | 인터디지탈 패튼 홀딩스, 인크 | 비디오 기반 포인트 클라우드 스트림들을 위한 isobmff 컨테이너들에서의 부분 액세스 지원 |
| CN115699761A (zh) * | 2020-04-19 | 2023-02-03 | 抖音视界有限公司 | 变换跳过残差编解码 |
| CA3184462A1 (en) * | 2020-05-22 | 2021-11-25 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Subpicture-related video coding concepts |
| IL319989A (en) * | 2020-05-22 | 2025-06-01 | Fraunhofer Ges Forschung | Processing of output layer sets of coded video |
| US11589052B2 (en) * | 2020-06-10 | 2023-02-21 | Tencent America LLC | Techniques for bitstream extraction for subpicture in coded video stream |
| JP7518216B2 (ja) * | 2020-06-20 | 2024-07-17 | 北京字節跳動網絡技術有限公司 | 異なるコーディングブロックサイズを有するインターレイヤ予測 |
| JP7632805B2 (ja) * | 2020-09-29 | 2025-02-19 | 北京字節跳動網絡技術有限公司 | 補助情報のシグナリング |
| WO2022225233A1 (ko) * | 2021-04-22 | 2022-10-27 | 엘지전자 주식회사 | 포인트 클라우드 데이터 송신 장치, 포인트 클라우드 데이터 송신 방법, 포인트 클라우드 데이터 수신 장치 및 포인트 클라우드 데이터 수신 방법 |
-
2021
- 2021-05-28 MX MX2022015369A patent/MX2022015369A/es unknown
- 2021-05-28 WO PCT/JP2021/020355 patent/WO2021251173A1/ja not_active Ceased
- 2021-05-28 CN CN202180040527.5A patent/CN115699751A/zh active Pending
- 2021-05-28 BR BR112022024817A patent/BR112022024817A2/pt not_active Application Discontinuation
- 2021-05-28 EP EP21822918.5A patent/EP4167573A4/en active Pending
- 2021-05-28 US US18/000,396 patent/US20230224482A1/en active Pending
- 2021-05-28 JP JP2022530134A patent/JP7726209B2/ja active Active
- 2021-05-28 KR KR1020227041049A patent/KR20230022165A/ko not_active Withdrawn
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180268570A1 (en) | 2017-03-16 | 2018-09-20 | Samsung Electronics Co., Ltd. | Point cloud and mesh compression using image/video codecs |
| US20190087978A1 (en) | 2017-09-18 | 2019-03-21 | Apple Inc. | Point cloud compression using non-cubic projections and masks |
| WO2020008758A1 (ja) | 2018-07-06 | 2020-01-09 | ソニー株式会社 | 情報処理装置および情報処理方法、並びにプログラム |
Non-Patent Citations (2)
| Title |
|---|
| Jiheon Im et al.,A method of level of details control table for 3D point density scalability in video based point cloud compression,Applications of Digital Image Processing XLII,SPIE,2019年09月,Proc. SPIE Vol.11137,pp.1-6 |
| Vida Fakour Sevom, et al.,Geometry-Guided 3D Data Interpolation for Projection-Based Dynamic Point Cloud Coding,2018 7th European Workshop on Visual Information Processing (EUVIP),IEEE,2018年11月26日,pp.1-6 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20230224482A1 (en) | 2023-07-13 |
| EP4167573A4 (en) | 2023-12-13 |
| MX2022015369A (es) | 2023-01-16 |
| WO2021251173A1 (ja) | 2021-12-16 |
| JPWO2021251173A1 (ja) | 2021-12-16 |
| KR20230022165A (ko) | 2023-02-14 |
| EP4167573A1 (en) | 2023-04-19 |
| CN115699751A (zh) | 2023-02-03 |
| BR112022024817A2 (pt) | 2022-12-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7726209B2 (ja) | 情報処理装置および方法 | |
| US11245926B2 (en) | Methods and apparatus for track derivation for immersive media data tracks | |
| KR102559862B1 (ko) | 미디어 콘텐츠 전송을 위한 방법, 디바이스, 및 컴퓨터 프로그램 | |
| US11457231B2 (en) | Methods and apparatus for signaling spatial relationships for point cloud multimedia data tracks | |
| EP3751857A1 (en) | A method, an apparatus and a computer program product for volumetric video encoding and decoding | |
| US11699248B2 (en) | Image processing apparatus and method | |
| US11218715B2 (en) | Methods and apparatus for spatial grouping and coordinate signaling for immersive media data tracks | |
| JP7487742B2 (ja) | 画像処理装置および方法 | |
| CN114342402A (zh) | 信息处理装置、信息处理方法、再现处理装置和再现处理方法 | |
| GB2509953A (en) | Displaying a Region of Interest in a Video Stream by Providing Links Between Encapsulated Video Streams | |
| JP7331852B2 (ja) | 画像処理装置および方法 | |
| CN113302944B (zh) | 信息处理装置和信息处理方法 | |
| JP7768130B2 (ja) | 情報処理装置および方法 | |
| US11974026B2 (en) | Apparatus, a method and a computer program for volumetric video | |
| JP7746995B2 (ja) | 情報処理装置および方法 | |
| CN116636225A (zh) | 信息处理装置和方法 | |
| WO2024071283A1 (ja) | 情報処理装置および方法 | |
| JP7687375B2 (ja) | 情報処理装置および方法 | |
| WO2023054156A1 (ja) | 情報処理装置および方法 | |
| WO2019138928A1 (ja) | 情報処理装置および方法 | |
| CN117529924A (zh) | 信息处理装置和方法 | |
| US20230370636A1 (en) | Image processing device and method | |
| WO2024143466A1 (ja) | 情報処理装置および方法 | |
| WO2022075074A1 (ja) | 画像処理装置および方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240411 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241129 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250121 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250314 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250422 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250612 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250708 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250721 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7726209 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |