[go: up one dir, main page]

CN115136601A - 几何分割模式 - Google Patents

几何分割模式 Download PDF

Info

Publication number
CN115136601A
CN115136601A CN202180013097.8A CN202180013097A CN115136601A CN 115136601 A CN115136601 A CN 115136601A CN 202180013097 A CN202180013097 A CN 202180013097A CN 115136601 A CN115136601 A CN 115136601A
Authority
CN
China
Prior art keywords
mode
video
video block
partitioning
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180013097.8A
Other languages
English (en)
Inventor
邓智玭
张莉
张凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
ByteDance Inc
Original Assignee
Douyin Vision Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd, ByteDance Inc filed Critical Douyin Vision Co Ltd
Publication of CN115136601A publication Critical patent/CN115136601A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了几何分割模式。在代表性方面,一种视频处理的方法包括对于视频的当前视频块和该视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码,其中,几何分割模式包括整个分割模式集合;基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式,其中,分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;以及基于一个或多个分割模式来执行转换。

Description

几何分割模式
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请适时要求于2020年2月7日提交的国际专利申请No.PCT/CN2020/074499的优先权和权益。国际专利申请No.PCT/CN2020/074499的全部公开通过参考而并入作为本申请的公开的一部分。
技术领域
本文档涉及视频编解码技术、系统和设备。
背景技术
数字视频占据了互联网和其他数字通信网络上的最大带宽使用。随着能够接收和显示视频的连接用户设备的数量增加,预计数字视频使用的带宽需求将继续增长。
发明内容
本发明涉及视频编解码技术。具体地,本发明关于视频编解码中的帧间预测和相关技术。本发明可以被应用于现有的视频编解码标准,如HEVC,也可以被应用于待定的标准(多功能视频编解码)。本发明也可以适用于未来的视频编解码标准或视频编解码器。
在一个代表性方面,所公开的技术可以用于提供一种用于视频处理的方法。该方法包括执行视频的当前块和该视频的比特流表示之间的转换,其中,当前块的编解码模式将当前块分割为包括至少一个非矩形或非正方形子区域的两个或更多个子区域,其中,比特流表示包括与编解码模式相关联的信令,并且其中,信令对应于具有视频的当前块的第一值集合和后续块的第二值集合的参数集合。
在另一个代表性方面,所公开的技术可以用于提供一种用于视频处理的方法。该方法包括执行视频的当前块和该视频的比特流表示之间的转换,其中,当前块的编解码模式将当前块分割为包括至少一个非矩形或非正方形子区域的两个或更多个子区域,其中,编解码模式能够使用多个参数集来配置,并且其中,比特流表示包括用于多个参数集的子集的信令,并且其中,参数集包括与至少一个非矩形或非正方形子区域相关联的角度、位移和距离。
在又一个代表性方面,所公开的技术可以用于提供一种用于视频处理的方法。该方法包括:对于视频的当前块和该视频的比特流表示之间的转换,做出关于第一编解码模式和不同于第一编解码模式的第二编解码模式的启用的确定,其中,第一编解码模式将当前块分割为包括至少一个非矩形或非正方形子区域的两个或更多个子区域;以及基于该确定来执行转换。
在又一个代表性方面,所公开的技术可以用于提供一种用于视频处理的方法。该方法包括:对于视频的当前视频块和该视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码,其中,几何分割模式包括整个分割模式集合;基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式,其中,分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;以及基于一个或多个分割模式来执行转换。
在又一个代表性方面,所公开的技术可以用于提供一种用于视频处理的方法。该方法包括:对于视频的当前视频块和该当前视频块的比特流之间的转换,确定视频块以几何分割模式进行编解码,其中,几何分割模式包括整个分割模式集合,并且每个分割模式与包括角度、距离和/或位移中的至少一个的参数集合相关联;从整个分割模式或参数集合推导分割模式或参数的子集;以及基于分割模式或参数的子集来执行转换。
在又一个代表性方面,所公开的技术可以用于提供一种用于视频处理的方法。该方法包括:对于视频的视频块和该视频块的比特流之间的转换,确定几何分割模式和不同于几何分割模式的第二编解码模式对视频块的启用;以及基于该确定来执行转换。
在又一个代表性方面,所公开的技术可以用于提供一种用于视频处理的方法。该方法包括:对于视频的视频块和该视频块的比特流之间的转换,基于当前视频块是否以当前视频块的几何分割模式和/或颜色格式进行编解码,来确定与视频块相关联的去方块过程;以及基于去方块过程来执行转换。
在又一个代表性方面,公开了一种用于存储视频的比特流的方法。该方法包括:对于视频的当前视频块和该视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码,其中,几何分割模式包括整个分割模式集合;基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式,其中,分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;以一个或多个分割模式从视频块生成比特流;以及将比特流存储在非暂时性计算机可读记录介质中。
在又一示例方面,公开了一种包括被配置为实施上述方法的处理器的视频编码器装置。
在又一示例方面,公开了一种包括被配置为实施上述方法的处理器的视频解码器装置。
在又一示例方面,公开了一种计算机可读介质。该计算机可读介质上存储有代码。该代码在由处理器执行时使得处理器实施上述方法。
本文档中描述了这些和其他方面。
附图说明
图1示出了三角形预测模式(TPM)的示例。
图2示出了几何编解码模式(GEO)划分边界描述的示例。
图3A示出了GEO中支持的边缘的示例。
图3B示出了给定像素位置和两个边缘之间的几何关系。
图4示出了GEO的不同角度以及它们对应的宽高比的示例。
图5示出了64个GEO模式的角度分布的示例。
图6示出了以逆时针方向的angleIdx 0到31的GEO/TPM划分边界的示例。
图7示出了以顺时针方向的angleIdx 0到31的GEO/TPM划分边界的另一示例。
图8示出了视频处理的示例方法的流程图。
图9是视频处理装置的示例的框图。
图10是示出示例视频编解码系统的框图。
图11是示出示例编码器的框图。
图12是示出示例解码器的框图。
图13是其中可以实施所公开的技术的示例视频处理系统的框图。
图14示出了视频处理的示例方法的流程图。
图15示出了视频处理的示例方法的流程图。
图16示出了视频处理的示例方法的流程图。
图17示出了视频处理的示例方法的流程图。
图18示出了视频处理的示例方法的流程图。
具体实施方式
由于对更高分辨率视频的需求不断增加,视频编解码方法和技术在现代技术中无处不在。视频编解码器通常包括压缩或解压缩数字视频的电子电路或软件,并且不断得到改进以提供更高的编解码效率。视频编解码器将未压缩视频转换为压缩格式,反之亦然。视频质量、用于表示视频的数据量(由比特率确定)、编码和解码算法的复杂性、对数据丢失和错误的敏感性、编辑的容易程度、随机访问和端到端延迟(时延)之间存在复杂的关系。压缩格式通常符合标准视频压缩规范,例如,高效视频编解码(HEVC)标准(也称为H.265或MPEG-H Part 2)、待定的多功能视频编解码标准或者其他当前和/或未来的视频编解码标准。
所公开的技术的实施例可以被应用于现有的视频编解码标准(例如,HEVC、H.265)和未来的标准,以提高运行时性能。它具体涉及视频编解码中的merge模式。在本文档中使用章节标题来提高描述的可读性,并且不以任何方式将讨论或实施例(和/或实施方式)仅限于相应的章节。
1.背景
视频编解码标准主要是通过开发公知的ITU-T和ISO/IEC标准而发展起来的。ITU-T开发了H.261和H.263,ISO/IEC开发了MPEG-1和MPEG-4Visual,并且两个组织联合开发了H.262/MPEG-2视频、H.264/MPEG-4高级视频编解码(AVC)和H.265/HEVC标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中采用了时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索团队(JVET)。此后,JVET采纳了许多新方法并将其引入到名为联合探索模型(JointExploration Model,JEM)的参考软件中。JVET会议每季度同时举行一次,新编解码标准的目标是与HEVC相比降低50%的比特率。新视频编解码标准在2018年4月的JVET会议上被正式命名为多功能视频编解码(VVC),第一版VVC测试模型(VTM)也在当时发布。由于对VVC标准化的持续努力,新的编解码技术在每次JVET会议上都被采用到VVC标准中。VVC的工作草案和测试模型VTM在每次会议后都会更新。VVC项目现在的目标是在2020年7月的会议上技术上完成(FDIS)。
1.1.用于帧间预测的几何分割(GEO)
以下描述摘自JVET-P0884、JVET-P0107、JVET-P0304、JVET-P0264、JVET-Q0079、JVETQ0059、JEVT-Q0077和JVET-Q0309。
几何merge模式(GEO)是在第15届哥德堡JVET会议上提出的,是现有三角形预测模式(TPM)的扩展。在第16届日内瓦JVET会议上,JVET-P0884中的一个更简单设计的GEO模式被选为CE锚用于进一步研究。在第17届布鲁塞尔JVET会议上,GEO被采用到VTM8中,以替换VTM7中的TPM模式,并且GEO模式在VVC WD8中被重命名为GPM模式。
图1图示了VTM-6.0中的TPM以及为GEO帧间块提出的附加形状。
几何merge模式的划分边界由角度
Figure BDA0003783992400000051
和距离偏移ρi描述,如图2所示。角度
Figure BDA0003783992400000052
表示0到360度之间的量化角度,并且距离偏移ρi表示最大距离ρmax的量化偏移。此外,排除了与二叉树划分和TPM划分重叠的划分方向。
在JVET-P0884中,GEO被应用于不小于8×8的块尺寸,并且对于每个块尺寸,有82种不同的分割方式,由相对于CU的中心的24个角度和4个边缘区分。图3A示出了从穿过CU中心的Edge0开始,4个边缘沿着CU内的法矢量方向均匀分布。GEO中的每个分割模式(即,一对角度度索引和边缘索引)被分配有像素自适应权重表,以混合两个分割部分上的样点,其中样点的权重值范围从0到8,并且由从像素的中心位置到边缘的L2距离确定。基本上,当分配权重值时,遵循单元增益约束,也就是说,当小的权重值被分配给GEO分区时,一个大的互补权重值被分配给另一个分区,总计为8。
每个像素的权重值的计算是双重的:(a)计算从像素位置到给定边缘的位移,以及(c)通过预定义的查找表将计算的位移映射到权重值。计算从像素位置(x,y)到给定边缘Edgei的位移的方式实际上与计算从(x,y)到Edge0的位移并将该位移减去Edge0和Edgei之间的距离ρ相同。图3B示出了(x,y)和边缘之间的几何关系。具体地,从(x,y)到Edgei的位移可以用公式表示如下:
Figure BDA0003783992400000061
ρ的值是法矢量的最大长度(由ρmax表示)和边缘索引i的函数,即:
Figure BDA0003783992400000062
其中N是GEO支持的边缘的数量,并且“1”是为了防止最后一个边缘EdgeN-1过于靠近一些角度索引的CU角。将等式(8)代入(6),我们可以计算从每个像素(x,y)到给定Edgei的位移。简而言之,我们将
Figure BDA0003783992400000063
表示为wIdx(x,y)。每个CU需要计算一次ρ,并且每个样点需要计算一次wIdx(x,y),其中涉及乘法。
1.1.1.JVET-P0884
在第16届日内瓦JVET会议CE4-1.14的基础上,JVET-P0884加入了提出的JVET-P0107基于斜率的版本2、JVET-P0304和JVET-P0264测试1的简化。
a)在联合贡献中,geo角度是与JVET-P0107和JVET-P0264中相同的定义斜率(2的纠缠幂)。本提案中使用的斜率为(1,1/2,1/4,4,2)。在这种情况下,如果即时计算混合掩模,乘法将被移位运算替换。
b)rho计算由偏移X和偏移Y替换,如JVET-P304中所述。在这种情况下,在不即时计算混合掩码的情况下,仅需要存储24个混合掩模。
1.1.2.JVET-P0107
基于该基于斜率的GEO版本2,表1中图示了Dis[.]查找表
表1.基于斜率的GEO的2比特Dis[.]查找表
Figure BDA0003783992400000064
Figure BDA0003783992400000071
利用基于斜率的GEO版本2,GEO混合掩模推导的计算复杂度被认为是乘法(多达2比特移位)和加法。与TPM相比,没有不同的分区。此外,移除了distFromLine的取整运算,以便更容易地存储混合掩模。该错误修复保证了样点权重以移位的方式在每行或每列中重复。
1.1.3.JVET-P0264
在JVET-P0264中,GEO中的角度被替换为具有2的幂为正切的角度。因为所提出的角度的正切为2的幂,所以大多数乘法可以由移位来替换。此外,这些角度的权重值可以通过逐行或逐列重复相移来实施。利用所提出的角度,每个块尺寸和每个分割模式需要一行或一列来存储。
1.1.4.JVET-P0304
在JVET-P0304中,提出了从两个预定义掩模集合推导用于所有块和分割模式的运动场存储的权重和掩模掩码,一个集合用于混合权重推导,另一个集合用于运动场存储的掩模。每个集合中总共有16个掩模。使用GEO中的相同等式计算每个角度的每个掩模,块宽度和块高度设置为256,位移设置为0。对于具有角度
Figure BDA0003783992400000072
和距离ρ的尺寸为W×H的块,亮度样点的混合权重直接从预定义的掩模裁剪,偏移被计算如下:
-变量offsetX和offsetY被计算如下:
Figure BDA0003783992400000073
Figure BDA0003783992400000074
-
Figure BDA0003783992400000075
其中g_sampleWeightL[]是混合权重的预定义掩模。
1.1.5.JVET-Q0079
在JVET-P会议上,在JVET-P0884/JVET-P0885中提出了简化的GEO模式,并建议作为CE4核心实验的公共基础。在此公共基础中,GEO模式被应用于宽度和高度都大于或等于8的merge块。当使用GEO模式对块进行编解码时,信令通知索引以指示使用82个分割模式中的哪一个来将块划分为两个分区。每个分区利用其自身的运动矢量进行帧间预测。在预测每个分区之后,使用利用权重的混合处理来调整沿着分割边缘的样点值。这是整个块的预测信号,并且变换和量化过程将被应用于整个块,如同在其他预测模式中一样。
在混合过程中使用的亮度样点的权重被计算如下:
weightIdx=(((x+offsetX)<<1)+1)*Dis[displacementX]+(((y+offsetY)<<1)+1))*Dis[displacementY]-rho.
weightIdxAbs=Clip3(0,26,abs(weightIdx)).
sampleWeight=weightIdx<=0?GeoFilter[weightIdxAbs]:8-GeoFilter[weightIdxAbs]
Dis[.]是具有24个条目的查找表,并且可能的输出值为{0,1,2,4}。GeoFilter[.]是具有27个条目的查找表。变量rho、offsetX和offsetY是基于以下预被先计算的:
rho=(Dis[displacementX]<<8)+(Dis[displacementY]<<8)
Figure BDA0003783992400000081
Figure BDA0003783992400000082
Figure BDA0003783992400000083
和ρ表示使用信令通知的索引从查找表推导的角度和距离。
色度样点的权重是从亮度权重子采样的。使用相同的权重推导方法独立地推导运动存储掩模。关于该公共基础的更多详细说明,可以在JVET-P0884/JVET-P0885中找到。
1.1.6.JVET-Q0059
在JVET-Q会议中,采用了64个模式的几何帧间预测(即,JVET-Q0059)。
因为在自然视频序列中,运动对象大多是垂直布局的,所以不太经常使用接近水平的划分模式。在提出的64个模式的GEO中,我们移除了角度{5,7,17,19}。图5示出了64个模式的GEO的角度分布。
此外,在82个模式的GEO中,水平角度{0,12}和垂直角度{6,18}的距离索引为2的距离与三叉树划分边界重叠。在提出的64个模式的GEO中也移除了它们。
所提出的方法的总模式能够被计算为10*4+10*3–2–4=64个模式
此外,由于通过使用截断二进制来信令通知geo划分模式,因此64个模式将以6比特TB最有效地信令通知。
1.1.7.JVET-Q0077和JVET-Q0309
对大于64x64的块禁用GEO,并且对64x8和8x64的块禁用GEO。
1.1.8.GEO/GPM角度索引和角度尺寸
在最新的VVC工作草案8中,GEO模式被重命名为几何分割模式(GPM)。GEO/GPM角度索引用于表示将GEO/GPM块划分为两个子区域的划分边界,如图6所示。如JVET-P0264所介绍的,根据块的宽高比,GEO/GPM角度的正切是2的幂。在JVET-Q2001-vB中,GEO/GPM角度的尺寸范围从0°到352.87°,相关联的GEO/GPM角度索引范围从0到31,如图6所示。垂直方向(例如,与等于0的angleIdx的划分边界重叠)和指定的GEO划分边界之间的角度被定义为GEO/GPM模式的GEO/GPM角度的尺寸。GEO/GPM角度的尺寸(角度尺寸)和GEO/GPM角度索引(angleIdx)之间的对应关系可以在表2中找到。
表2:角度索引和角度尺寸之间的关系的示例(逆时针)
Figure BDA0003783992400000091
1.2.JVET-Q2001-vB中的GEO/GPM的规范
以下规范摘自JVET-Q2001-vB中所提供的工作草案。
7.3.10.5编解码单元语法
Figure BDA0003783992400000101
Figure BDA0003783992400000111
Figure BDA0003783992400000121
Figure BDA0003783992400000131
7.3.10.7 Merge数据语法
Figure BDA0003783992400000141
sps_gpm_enabled_flag指定基于几何分割的运动补偿是否能够被用于帧间预测。sps_gpm_enabled_flag等于0指定语法应当被约束,使得在CLVS中不使用基于几何分割的运动补偿,并且merge_gpm_partition_idx、merge_gpm_idx0和merge_gpm_idx1不存在于CLVS的编解码单元语法中。sps_gpm_enabled_flag等于1指定能够在CLVS中使用基于几何分割的运动补偿。当不存在时,sps_gpm_enabled_flag的值被推断为等于0。
max_num_merge_cand_minus_max_num_gpm_cand指定从MaxNumMergeCand中减去的SPS中支持的几何分割merge模式候选的最大数量。
如果sps_gpm_enabled_flag等于1且MaxNumMergeCand大于或等于3,则几何分割merge模式候选的最大数量MaxNumGeoMergeCand被推导如下:
if(sps_gpm_enabled_flag&&MaxNumMergeCand>=3)
MaxNumGpmMergeCand=MaxNumMergeCand-max_num_merge_cand_minus_max_num_gpm_cand
else if(sps_gpm_enabled_flag&&MaxNumMergeCand==2)
MaxNumMergeCand=2
else MaxNumGeoMergeCand=0
MaxNumGeoMergeCand的值应当在2到MaxNumMergeCand的范围内,包括端值。
变量MergeGpmFlag[x0][y0],指定当解码B条带时,是否使用基于几何分割的运动补偿来生成当前编解码单元的预测样点,其被推导如下:
-如果所有以下条件都为真,MergeGpmFlag[x0][y0]被设置为等于1:
-sps_gpm_enabled_flag等于1。
-slice_type等于B。
-general_merge_flag[x0][y0]等于1。
-cbWidth大于或等于8。
-cbHeight大于或等于8。
-cbWidth小于8*cbHeight。
-cbHeight小于8*cbWidth。
-regular_merge_flag[x0][y0]等于0。
-merge_subblock_flag[x0][y0]等于0。
-ciip_flag[x0][y0]等于0。
-否则,MergeGpmFlag[x0][y0]被设置为等于0。
merge_gpm_partition_idx[x0][y0]指定几何分割merge模式的分割形状。数组索引x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当merge_gpm_partition_idx[x0][y0]不存在时,其被推断为等于0。
merge_gpm_idx0[x0][y0]指定基于几何分割的运动补偿候选列表的第一Merge候选索引,其中x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当merge_gpm_idx0[x0][y0]不存在时,其被推断为等于0。
merge_gpm_idx1[x0][y0]指定基于几何分割的运动补偿候选列表的第二Merge候选索引,其中x0、y0指定所考虑的编解码块的左上亮度样点相对于图片的左上亮度样点的位置(x0,y0)。
当merge_gpm_idx1[x0][y0]不存在时,其被推断为等于0。
8.5.7几何分割模式帧间块的解码过程
8.5.7.1概述
当对MergeGpmFlag[xCb][yCb]等于1的编解码单元进行解码时,调用该过程。
该过程的输入为:
-亮度位置(xCb,yCb),指定当前编解码块相对于当前图片的左上亮度样点的左上样点,
-变量cbWidth,指定亮度样点中的当前编解码块的宽度,
-变量cbHeight,指定亮度样点中的当前编解码块的高度,
-1/16分数样点精度的亮度运动矢量mvA和mvB,
-色度运动矢量mvCA和mvCB,
-参考索引refIdxA和refIdxB,
-预测列表标志predListFlagA和predListFlagB。
该过程的输出为:
-亮度预测样点的(cbWidth)x(cbHeight)的数组predSamplesL
-当ChromaArrayType不等于0时,分量Cb的色度预测样点的(cbWidth/SubWidthC)x(cbHeight/SubHeightC)的数组predSamplesCb
-当ChromaArrayType不等于0时,分量Cr的色度预测样点的(cbWidth/SubWidthC)x(cbHeight/SubHeightC)的数组predSamplesCr
设predSamplesLAL和predSamplesLBL为预测亮度样点值的(cbWidth)x(cbHeight)的数组,并且当ChromaArrayType不等于0时,设predSamplesLACb、predSamplesLBCb、predSamplesLACr和predSamplesLBCr为预测色度样点值的(cbWidth/SubWidthC)x(cbHeight/SubHeightC)的数组。
predSamplesL、predSamplesCb和predSamplesCr通过以下有序步骤来推导:
1.对于N是A和B中的每一个,以下适用:
-由亮度样点的有序二维数组refPicLNL和色度样点的两个有序二维数组refPicLNCb和refPicLNCr组成的参考图片通过调用条款8.5.6.2中指定的过程来推导,其中以设置为等于predListFlagN的X和设置为等于refIdxN的refIdxX作为输入。
-数组predSamplesLNL通过调用条款8.5.6.3中指定的分数样点插值过程来推导,其中以亮度位置(xCb,yCb)、设置为等于cbWidth的亮度编解码块宽度sbWidth、设置为等于cbHeight的亮度编解码块高度sbHeight、设置为等于(0,0)的运动矢量偏移mvOffset、设置为等于mvN的运动矢量mvLX、设置为等于refPicLNL的参考数组refPicLXL、设置为等于FALSE的变量bdofFlag、设置为等于0的变量cIdx、RprConstraintsActive[X][refIdxLX]以及RefPicScale[predListFlagN][refIdxN]作为输入。
-当ChromaArrayType不等于0时,数组predSamplesLNCb通过调用条款8.5.6.3中指定的分数样点插值过程来推导,其中以亮度位置(xCb,yCb)、设置为等于cbWidth/SubWidthC的编解码块宽度sbWidth、设置为等于cbHeight/SubHeightC的编解码块高度sbHeight、设置为等于(0,0)的运动矢量偏移mvOffset、设置为等于mvCN的运动矢量mvLX、设置为等于refPicLNCb的参考数组refPicLXCb、设置为等于FALSE的变量bdofFlag、设置为等于1的变量cIdx、RprConstraintsActive[X][refIdxLX]以及RefPicScale[predListFlagN][refIdxN]作为输入。
-当ChromaArrayType不等于0时,数组predSamplesLNCr通过调用条款8.5.6.3中指定的分数样点插值过程来推导,其中以亮度位置(xCb,yCb)、设置为等于cbWidth/SubWidthC的编解码块宽度sbWidth、设置为等于cbHeight/SubHeightC的编解码块高度sbHeight、设置为等于(0,0)的运动矢量偏移mvOffset、设置为等于mvCN的运动矢量mvLX、设置为等于refPicLNCr的参考数组refPicLXCr、设置为等于FALSE的变量bdofFlag、设置为等于2的变量cIdx、RprConstraintsActive[X][refIdxLX]以及RefPicScale[predListFlagN][refIdxN]作为输入。
2.几何分割模式的分割角度变量angleIdx和距离变量distanceIdx根据merge_gpm_partition_idx[xCb][yCb]的值来设置,如表36所指定的。
3.当前亮度编解码块内部的预测样点predSamplesL[xL][yL](其中,xL=0..cbWidth-1,并且yL=0..cbHeight-1)通过调用条款8.5.7.2中指定的几何分割模式的加权样点预测过程来推导,其中以设置为等于cbWidth的编解码块宽度nCbW、设置为等于cbHeight的编解码块高度nCbH、样点数组predSamplesLAL和predSamplesLBL、以及变量angleIdx、distanceIdx和等于0的cIdx作为输入。
4.当ChromaArrayType不等于0时,当前色度分量Cb编解码块内部的预测样点predSamplesCb[xC][yC](其中,xC=0..cbWidth/SubWidthC-1,并且yC=0..cbHeight/SubHeightC-1)通过调用条款8.5.7.2中指定的几何分割模式的加权样点预测过程来推导,其中以设置为等于cbWidth/SubWidthC的编解码块宽度nCbW、设置为等于cbHeight/SubHeightC的编解码块高度nCbH、样点数组predSamplesLACb和predSamplesLBCb、以及变量angleIdx、distanceIdx和等于1的cIdx作为输入。
5.当ChromaArrayType不等于0时,当前色度分量Cr编解码块内的预测样点predSamplesCr[xC][yC](其中xC=0..cbWidth/SubWidthC-1并且yC=0..cbHeight/SubHeightC-1)通过调用条款8.5.7.2中指定的几何分割模式的加权样点预测过程来推导,其中以设置为等于cbWidth/SubWidthC的编解码块宽度nCbW、设置为等于cbHeight/SubHeightC的编解码块高度nCbH、样点数组predSamplesLACr和predSamplesLBCr、以及变量angleIdx、distanceIdx和等于2的cIdx作为输入。
6.调用条款8.5.7.3中指定的merge几何分割模式的运动矢量存储过程,其中以亮度编解码块位置(xCb,yCb)、亮度编解码块宽度cbWidth、亮度编解码块高度cbHeight、分割角度angleIdx和距离distanceIdx、亮度运动矢量mvA和mvB、参考索引refIdxA和refIdxB、以及预测列表标志predListFlagA和predListFlagB作为输入。
表36–基于merge_gpm_partition_idx的angleIdx和distanceIdx的规范
merge_gpm_partition_idx 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
angleIdx 0 0 2 2 2 2 3 3 3 3 4 4 4 4 5 5
distanceIdx 1 3 0 1 2 3 0 1 2 3 0 1 2 3 0 1
merge_gpm_partition_idx 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
angleIdx 5 5 8 8 11 11 11 11 12 12 12 12 13 13 13 13
distanceIdx 2 3 1 3 0 1 2 3 0 1 2 3 0 1 2 3
merge_gpm_partition_idx 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
angleIdx 14 14 14 14 16 16 18 18 18 19 19 19 20 20 20 21
distanceIdx 0 1 2 3 1 3 1 2 3 1 2 3 1 2 3 1
merge_gpm_partition_idx 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63
angleIdx 21 21 24 24 27 27 27 28 28 28 29 29 29 30 30 30
distanceIdx 2 3 1 3 1 2 3 1 2 3 1 2 3 1 2 3
8.5.7.2几何分割模式的加权样点预测过程
该过程的输入为:
-两个变量nCbW和nCbH,指定当前编解码块的宽度和高度,
-两个(nCbW)x(nCbH)的数组predSamplesLA和predSamplesLB,
-变量angleIdx,指定几何分割的角度索引,
-变量distanceIdx,指定几何分割的距离索引,
-变量cIdx,指定颜色分量索引。
该过程的输出为预测样点值的(nCbW)x(nCbH)的数组pbSamples。
变量nW、nH、shift1、offset1、hwRatio、displacementX、displacementY、partFlip和shiftHor被推导如下:
nW=(cIdx==0)?nCbW:nCbW*SubWidthC (1030)
nH=(cIdx==0)?nCbH:nCbH*SubHeightC (1031)
shift1=Max(5,17-BitDepth) (1032)
offset1=1<<(shift1-1) (1033)
hwRatio=nH/nW (1034)
displacementX=angleIdx (1035)
displacementY=(angleIdx+8)%32 (1036)
partFlip=(angleIdx>=13&&angleIdx<=27)?0:1 (1037)
shiftHor=(angleIdx%16==8||(angleIdx%16!=0&&hwRatio>0))?0:1 (1038)
变量offsetX和offsetY被推导如下:
-如果shiftHor等于0,则以下适用:
offsetX=(-nW)>>1 (1039)
offsetY=((-nH)>>1)+(angleIdx<16?(distanceIdx*nH)>>3:-((distanceIdx*nH)>>3)) (1040)
-否则(shiftHor等于1),以下适用:
offsetX=((-nW)>>1)+(angleIdx<16?(distanceIdx*nW)>>3:-((distanceIdx*nW)>>3)) (1041)
offsetY=(-nH)>>1 (1042)
预测样点pbSamples[x][y](其中,x=0..nCbW-1,并且y=0..nCbH-1)被推导如下:
-变量xL和yL被推导如下:
xL=(cIdx==0)?x:x*SubWidthC (1043)
yL=(cIdx==0)?y:y*SubHeightC (1044)
-指定预测样点的权重的变量wValue基于表37中指定的数组disLut被推导如下:
weightIdx=(((xL+offsetX)<<1)+1)*disLut[displacementX]+(((yL+offsetY)<<1)+1))*disLut[displacementY] (1045)
weightIdxL=partFlip?32+weightIdx:32-weightIdx (1046)
wValue=Clip3(0,8,(weightIdxL+4)>>3) (1047)
-预测样点值被推导如下:
pbSamples[x][y]=Clip3(0,(1<<BitDepth)-1,(predSamplesLA[x][y]*wValue+(1048)
predSamplesLB[x][y]*(8-wValue)+offset1)>>shift1)
表37-几何分割距离数组disLut的规范
idx 0 2 3 4 5 6 8 10 11 12 13 14
disLut[idx] 8 8 8 4 4 2 0 -2 -4 -4 -8 -8
idx 16 18 19 20 21 22 24 26 27 28 29 30
disLut[idx] -8 -8 -8 -4 -4 -2 0 2 4 4 8 8
8.5.7.3几何分割模式的运动矢量存储过程
当对MergeGpmFlag[xCb][yCb]等于1的编解码单元进行解码时,调用该过程。
该过程的输入为:
-亮度位置(xCb,yCb),指定当前编解码块相对于当前图片的左上亮度样点的左上样点,
-变量cbWidth,指定亮度样点中的当前编解码块的宽度,
-变量cbHeight,指定亮度样点中的当前编解码块的高度,
-变量angleIdx,指定几何分割的角度索引,
-变量distanceIdx,指定几何分割的距离索引,
-1/16分数样点精度的亮度运动矢量mvA和mvB,
-参考索引refIdxA和refIdxB,
-预测列表标志predListFlagA和predListFlagB。
分别指定当前编解码块在水平和垂直方向上的4×4块的数量的变量numSbX和numSbY分别被设置为等于cbWidth>>2以及cbHeight>>2。
变量hwRatio、displacementX、displacementY、partIdx和shiftHor被推导如下:
hwRatio=cbHeight/cbWidth (1049)
displacementX=angleIdx (1050)
displacementY=(angleIdx+8)%32 (1051)
partIdx=(angleIdx>=13&&angleIdx<=27)?0:1 (1052)
shiftHor=(angleIdx%16==8||(angleIdx%16!=0&&hwRatio>0)?0:1(1053)
变量offsetX和offsetY被推导如下:
-如果shiftHor等于0,则以下适用:
offsetX=(-cbWidth)>>1 (1054)
offsetY=((-cbHeight)>>1)+(angleIdx<16?(distanceIdx*cbHeight)>>3:-((distanceIdx*cbHeight)>>3)) (1055)
-否则(shiftHor等于1),以下适用:
offsetX=((-cbWidth)>>1)+(angleIdx<16?(distanceIdx*cbWidth)>>3:-((distanceIdx*cbWidth)>>3)) (1056)
offsetY=(-cbHeight)>>1 (1057)
对于子块索引(xSbIdx,ySbIdx)(其中,xSbIdx=0..numSbX-1并且ySbIdx=0..numSbY-1)处的每个4×4子块,以下适用:
-变量motionIdx基于表37中指定的数组disLut被计算如下:
motionIdx=(((4*xSbIdx+offsetX)<<1)+5)*disLut[displacementX]+(((4*ySbIdx+offsetY<<1)+5))*disLut[displacementY] (1058)
-变量sType被推导如下:
sType=abs(motionIdx)<32?2:(motionIdx<=0?(1-partIdx):partIdx) (1059)
-取决于sType的值,进行以下赋值:
-如果sType等于0,则以下适用:
predFlagL0=(predListFlagA==0)?1:0 (1060)
predFlagL1=(predListFlagA==0)?0:1 (1061)
refIdxL0=(predListFlagA==0)?refIdxA:-1 (1062)
refIdxL1=(predListFlagA==0)?-1:refIdxA (1063)
mvL0[0]=(predListFlagA==0)?mvA[0]:0 (1064)
mvL0[1]=(predListFlagA==0)?mvA[1]:0 (1065)
mvL1[0]=(predListFlagA==0)?0:mvA[0] (1066)
mvL1[1]=(predListFlagA==0)?0:mvA[1] (1067)
-否则,如果sType等于1或者(sType等于2且predListFlagA+predListFlagB不等于1),则以下适用:
predFlagL0=(predListFlagB==0)?1:0 (1068)
predFlagL1=(predListFlagB==0)?0:1 (1069)
refIdxL0=(predListFlagB==0)?refIdxB:-1 (1070)
refIdxL1=(predListFlagB==0)?-1:refIdxB (1071)
mvL0[0]=(predListFlagB==0)?mvB[0]:0 (1072)
mvL0[1]=(predListFlagB==0)?mvB[1]:0 (1073)
mvL1[0]=(predListFlagB==0)?0:mvB[0] (1074)
mvL1[1]=(predListFlagB==0)?0:mvB[1] (1075)
-否则(sType等于2且predListFlagA+predListFlagB等于1),以下适用:
predFlagL0=1 (1076)
predFlagL1=1 (1077)
refIdxL0=(predListFlagA==0)?refIdxA:refIdxB (1078)
refIdxL1=(predListFlagA==0)?refIdxB:refIdxA (1079)
mvL0[0]=(predListFlagA==0)?mvA[0]:mvB[0] (1080)
mvL0[1]=(predListFlagA==0)?mvA[1]:mvB[1] (1081)
mvL1[0]=(predListFlagA==0)?mvB[0]:mvA[0] (1082)
mvL1[1]=(predListFlagA==0)?mvB[1]:mvA[1] (1083)
-对于x=0..3并且y=0..3,进行以下赋值:
MvL0[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=mvL0 (1084)
MvL1[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=mvL1 (1085)
MvDmvrL0[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=mvL0 (1086)
MvDmvrL1[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=mvL1 (1087)
RefIdxL0[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=refIdxL0 (1088)
RedIdxL1[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=refIdxL1 (1089)
PredFlagL0[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=predFlagL0 (1090)
PredFlagL1[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=predFlagL1 (1091)
BcwIdx[(xSbIdx<<2)+x][(ySbIdx<<2)+y]=0 (1092)
2.现有解决方案的缺点
在GEO的当前设计中有几个潜在的问题,如下所述。
(1)当前GEO模式被分布为对称GEO角度和对称GEO距离/位移,这对于自然视频编解码可能是无效的。
(2)当前GEO模式能够用加权预测来呈现,这可能导致视觉伪影。
3.所公开的技术的实施例
下面的详细发明应该被认为是解释一般概念的示例。这些发明不应该以狭隘的方式来解释。此外,这些发明能够以任何方式组合。
术语“GEO”可以表示将一个块划分为两个或更多个子区域的编解码方法,其中,至少一个子区域是非矩形的,或者它不能通过将一个块划分为多个矩形子区域的任何现有分割结构(例如,QT/BT/TT)生成。在一个示例中,对于GEO编解码块,基于子区域如何被划分来为编解码块推导一个或多个加权掩模,并且编解码块的最终预测信号通过与子区域相关联的两个或更多个辅助预测信号的加权和来生成。术语“GEO”可以指示几何merge模式(GEO)、和/或几何分割模式(GPM)、和/或楔形预测模式、和/或三角形预测模式(TPM)。
术语“块”可以表示编解码块(CB)、CU、PU、TU、PB、TB。
1.信令通知的GEO模式索引的解释可以从一个视频单元到另一个视频单元自适应地改变。也就是说,对于相同的信令通知值,它可以被解释为不同的角度和/或不同的距离。
a)在一个示例中,信令通知的GEO模式索引和其对应的GEO角度/距离之间的映射可以取决于块维度(例如,块宽度与高度之比)。
b)此外,可替代地,用于GEO模式索引编解码的二值化可以是非固定长度编解码,其中,对于两个不同模式,要被编解码的二进制位/比特的数量可以不同。
c)在一个示例中,可以在不同视频单元中使用不相等数量的GEO模式/角度/位移/距离。
i.在一个示例中,在视频单元中使用多少GEO模式/角度/位移/距离可以取决于块维度(例如,宽度、高度、宽高比等)。
ii.在一个示例中,可以在块A中使用比在块B中使用的更多的GEO角度,其中,A和B可以具有不同的维度(例如,A可以指示高度大于宽度的块,B可以指示高度小于或等于宽度的块)。
iii.在一个示例中,视频单元的允许GEO角度可以是不对称的。
iv.在一个示例中,视频单元的允许GEO角度可以不是旋转对称的。
v.在一个示例中,视频单元的允许GEO角度可以不是双边对称的。
vi.在一个示例中,视频单元的允许GEO角度可以不是四分对称的。
d)在一个示例中,视频单元可以是块、VPDU、片/条带/图片/子图片/图块/视频。
2.如何在比特流中表示GEO模式可以取决于模式的优先级,例如,优先级通过相关联的GEO角度和/或距离来确定。
a)在一个示例中,面向更小的GEO角度尺寸(即,如2.1.8节的表2所描述的小于X度的GEO角度尺寸,诸如X=90或45)的GEO模式比面向更大的GEO角度尺寸(即,大于X度的GEO角度尺寸)的GEO模式具有更高的优先级。
b)在一个示例中,与更小的GEO角度索引(即,小于Y(诸如Y=4或8或16)的GEO角度索引)相关联的GEO模式比与更大的GEO角度索引(即,大于Y的GEO角度索引)相关联的GEO模式具有更高的优先级。
c)在一个示例中,在信令通知时,以上权利要求中具有更高优先级的GEO模式可以比具有更低优先级的GEO模式需要更少的二进制位或比特。
3.GEO模式可以被分类为两个或更多个类别。可以在与GEO模式有关的其他信息之前信令通知GEO属于哪个类别的指示。
a)例如,可以首先针对GEO编解码块信令通知以顺时针方向还是以逆时针方向信令通知角度索引。
i.顺时针GEO角度索引信令的定义:
1.例如,以逆时针信令通知的GEO角度索引可以意味着更小的GEO角度索引表示更小的GEO角度尺寸。
a)在一个示例中,如图6和表2所示,其中,GEO角度索引以逆时针被信令通知,假设angleIdx=0意味着GEO角度尺寸等于0度,则angleIdx=8意味着GEO角度尺寸等于90度;angleIdx=16意味着GEO角度尺寸等于180度,而angleIdx=24意味着GEO角度尺寸等于270度。
ii.顺时针GEO角度索引信令的定义:
1.例如,以顺时针信令通知的GEO角度索引可以意味着更小的GEO角度索引表示更大的GEO角度尺寸。
a)在一个示例中,与图6和表2相反,其中,GEO角度索引以逆时针被信令通知,图7和表3中图示了顺时针GEO角度信令,假设angleIdx=0意味着GEO角度尺寸等于0度(相当于360度),则angleIdx=8可以意味着GEO角度尺寸等于270度;angleIdx=16可以意味着GEO角度尺寸等于180度,而angleIdx=24可以意味着GEO角度尺寸等于90度。
iii.在一个示例中,它可以在视频单元级别(诸如SPS/VPS/PPS/图片标头/子图片/条带/条带标头/片/图块/CTU/VPDU/CU/块级别)被信令通知。
1.在一个示例中,可以信令通知高级别标志(高于块级别),以指示与信令通知的GEO模式相关联的角度是顺时针方向还是逆时针方向。
2.在一个示例中,可以信令通知块级别标志,以指示与信令通知的GEO模式相关联的角度是顺时针方向还是逆时针方向。
表3:角度索引和角度尺寸之间的关系的示例(顺时针)
Figure BDA0003783992400000261
Figure BDA0003783992400000271
4.GEO模式/角度/位移/距离的子集可以从整个GEO模式/角度/位移/距离集合被推导。
a)在一个示例中,仅GEO模式的子集被用于块。
b)在一个示例中,仅与GEO角度/位移/距离的子集相关联的GEO模式被用于块。
c)此外,可替代地,可以在比特流中进一步信令通知所选择的模式/角度/位移/距离是否在子集内的指示。
d)在一个示例中,GEO模式/角度/位移/距离的子集还是GEO模式/角度/位移/距离的全集被用于视频单元可以取决于当前视频单元或(多个)先前解码的视频单元的解码信息(例如,语法元素和/或块维度)。
e)在一个示例中,什么GEO模式在子集中可以取决于对应的GEO角度。
i.在一个示例中,子集可以仅包含与等于0的距离/位移相关联的GEO模式。
ii.在一个示例中,子集可以仅包含与指定的GEO角度相关联的GEO模式(例如,与GEO角度的预定义子集相关联的GEO模式,其可以与对应于这些预定义GEO角度的所有位移组合)。
f)在一个示例中,什么GEO模式在子集中可以取决于是否检查LDB(即,低延迟B帧)编解码。
i.在一个示例中,GEO模式的不同子集可以被用于LDB(即,低延迟B帧)和RA(即,随机访问)编解码。
g)在一个示例中,什么GEO模式在子集中可以取决于当前图片的参考图片列表中的参考图片。例如,参考图片列表中的参考图片的状态可以被标识为两种情况:情况1:所有参考图片在显示顺序中在当前图片之前;情况2:至少一个参考图片在显示顺序中在当前图片之后。
i.在一个示例中,不同的子集可以被用于情况1和情况2。
h)在一个示例中,什么GEO模式在子集中可以取决于如何推导运动候选。
i.在一个示例中,可以使用GEO模式的不同子集,取决于运动候选是从时域运动候选(例如,TMVP)、空域运动候选、基于历史的运动矢量预测(HMVP)还是哪些空域运动候选(例如,左,或上,或右上)被推导。
i)在一个示例中,GEO的子集可以仅包含以与TPM模式相同的方式划分块的GEO模式。
i.在一个示例中,GEO的子集可以仅包含通过连接块的左上角和右下角的线或者通过连接块的右上角和左下角的线来划分块的GEO模式。
j)在一个示例中,GEO的子集可以仅包含对应于具有一个或多个距离/位移索引的对角角度的GEO模式。
i.在一个示例中,对角角度可以指示对应于划分边界的GEO模式,该划分边界通过连接块的左上角和右下角的线或者通过连接块的右上角和左下角的线来划分块。
ii.在一个示例中,GEO的子集可以仅包含与等于0的距离/位移相关联的GEO模式。
1.在一个示例中,GEO的子集可以仅包含对应于与等于0的距离/位移相关联的任何角度的GEO模式。
2.在一个示例中,GEO的子集可以仅包含对应于与等于0的距离/位移相关联的对角角度(即,块的从左上到右下和/或从右上到左下的划分边界)的GEO模式。
iii.在一个示例中,GEO的子集可以仅包含对应于与对应于这些GEO角度的所有距离/位移索引相关联的对角角度(即,块的从左上到右下和/或从右上到左下的划分边界)的GEO模式。
1.例如,对于宽高比(即,2与log2(宽度)-log2(高度)的幂之比)等于X的块,GEO的子集可以仅包含与等于arctan(X)和/或π-arctan(X)、和/或π+arctan(X)和/或2π-arctan(X)的GEO角度尺寸、以及对应于这些GEO角度的所有距离索引(例如,如JVET-Q2001-vB所定义的从0到3的distanceIdx)相对应的GEO模式。
k)例如,对于宽高比等于1的块,GEO的子集可以仅包含与等于45°和/或135°和/或225°和/或315°的GEO角度尺寸(例如,如JVET-Q2001-vB所定义的角度索引=4和/或12和/或20和/或28)、以及对应于这些GEO角度的所有距离索引(例如,如JVET-Q2001-vB所定义的从0到3的距离索引)相对应的GEO模式。在一个示例中,水平和/或垂直角度可以被包括在GEO角度的子集中。
i.例如,水平角度可以意味着如2.1.8节的表2所描述的对应于90°和/或270°的角度索引(即,JVET-Q2001-vB的表36中等于8和/或24的GEO角度索引)。
ii.例如,垂直角度可以意味着如2.1.8节的表2所描述的对应于0°和/或180°的角度索引(即,JVET-Q2001-vB的表36中等于0和/或6的GEO角度索引)。
iii.在一个示例中,与和等于0的距离/位移组合的水平和/或垂直角度相关联的GEO模式可以被包括在允许的GEO角度的子集中。
1.可替代地,与和等于0的距离/位移组合的水平和/或垂直角度相关联的GEO模式可以不包括在允许的GEO角度的子集中。
iv.在一个示例中,与和所有距离/位移索引组合的水平和/或垂直角度相关联的GEO模式可以被包括在允许的GEO角度的子集中。
1.可替代地,与和所有距离/位移索引组合的水平和/或垂直角度相关联的GEO模式可以不包括在允许的GEO角度的子集中。
l)它可以被信令通知(诸如SPS/VPS/PPS/图片标头/子图片/条带/条带标头/片/图块/CTU/VPDU/CU/块级别)以指示是否使用GEO模式/角度/位移/距离的子集。
i.它可以进一步被信令通知(诸如SPS/VPS/PPS/图片标头/子图片/条带/条带标头/片/图块/CTU/VPDU/CU/块级别)以指示使用GEO模式/角度/位移/距离的哪个子集。
5.GEO模式可以不与X共存(诸如X是不同于GEO的另一个编解码工具)。
a)在一个示例中,X可以指示加权预测。
i.在一个示例中,当(例如,在条带级别)加权预测被启用时,GEO可以在视频单元级别(诸如条带/PPS/SPS/片/子图片/CU/PU/TU级别)被禁用。
ii.在一个示例中,GEO是否与加权预测一起使用可以取决于加权因子。
1.在一个示例中,如果加权预测的加权因子大于T(例如,T是常数值),则GEO可以被禁用。
b)在一个示例中,X可以指示BCW。
c)在一个示例中,X可以指示PROF
d)在一个示例中,X可以指示BDOF。
e)在一个示例中,X可以指示DMVR。
f)在一个示例中,X可以指示SBT。
g)在一个示例中,当GEO被启用时,编解码工具X可以被禁用。
i.在一个示例中,如果GEO被启用,则可以不信令通知编解码工具X的指示。
h)在另一个示例中,当编解码工具X被启用时,GEO可以被禁用。
i.在一个示例中,如果编解码工具X被启用,则可以不信令通知GEO的指示。
i)在另一个示例中,当(例如,在条带级别)加权预测被启用时,编解码工具X可以被禁用。
j)可替代地,去方块过程(诸如去方块强度、去方块边缘检测、去方块边缘的类型等)可以取决于GEO是否与编解码工具X共存。
6.去方块过程(诸如去方块强度、去方块边缘检测、去方块边缘的类型等)可以取决于是否应用GEO。对于用GEO编解码的编解码单元,为第一分量(诸如亮度分量)生成的加权值可以用于为第二分量(诸如Cb或Cr分量)推导加权值。
a)该推导可以取决于颜色格式(诸如4:2:0或4:2:2或4:4:4)。
b)第二分量的加权值可以通过对第一分量的加权值应用上采样或下采样来推导。
7.为分量(诸如Cb或Cr分量)生成的加权值可以取决于颜色格式(诸如4:2:0或4:2:2或4:4:4)。
a)例如,当颜色格式为4:2:2时,可以调整与GEO模式相关联的GEO角度/位移/距离,以为分量(诸如Cb或Cr分量)生成加权值。
以上描述的示例可以被并入以下描述的方法(例如,方法800)的上下文,该方法可以在视频解码器或视频编码器处实施。
图8示出了用于视频处理的示例方法800的流程图。该方法包括,在操作810,对于视频的当前块和该视频的比特流表示之间的转换,做出关于第一编解码模式和不同于第一编解码模式的第二编解码模式的启用的确定,其中,第一编解码模式将当前块分割为包括至少一个非矩形或非正方形子区域的两个或更多个子区域。
该方法包括,在操作820,基于该确定来执行转换。
在一些实施例中,可以实施以下技术解决方案:
A1.一种用于视频处理的方法,包括:执行视频的当前块和该视频的比特流表示之间的转换,其中,当前块的编解码模式将当前块分割为包括至少一个非矩形或非正方形子区域的两个或更多个子区域,其中,比特流表示包括与编解码模式相关联的信令,并且其中,信令对应于具有视频的当前块的第一值集合和后续块的第二值集合的参数集合。
A2.根据解决方案A1所述的方法,其中,信令包括索引,并且其中,索引的二值化包括使用第一数量的二进制位用于索引的第一值并使用第二数量的二进制位用于索引的第二值的可变长度编解码。
A3.根据解决方案A1所述的方法,其中,信令包括索引,并且其中,索引基于当前块的高度或宽度。
A4.根据解决方案A1所述的方法,其中,参数集合包括至少一个非矩形或非正方形子区域的多个角度和多个距离。
A5.根据解决方案A4所述的方法,其中,多个角度是不对称的。
A6.根据解决方案A4所述的方法,其中,多个角度不是旋转对称的。
A7.根据解决方案A4所述的方法,其中,多个角度不是双边对称的。
A8.根据解决方案A1所述的方法,其中,比特流表示中信令的位置基于编解码模式的优先级。
A9.根据解决方案A1所述的方法,其中,信令包括编解码模式的类别和与编解码模式有关的其他信息的指示。
A10.根据解决方案A9所述的方法,其中,其他信息包括角度,并且其中,该指示包括角度的顺时针方向或逆时针方向的指示。
A11.一种用于视频处理的方法,包括:执行视频的当前块和该视频的比特流表示之间的转换,其中,当前块的编解码模式将当前块分割为包括至少一个非矩形或非正方形子区域的两个或更多个子区域,其中,编解码模式可以使用多个参数集来配置,并且其中,比特流表示包括用于多个参数集的子集的信令,并且其中,参数集包括与至少一个非矩形或非正方形子区域相关联的角度、位移和距离。
A12.根据解决方案A11所述的方法,其中,编解码模式仅使用多个参数集的子集。
A13.根据解决方案A11所述的方法,其中,对多个参数集的子集中的参数集的选择基于比特流表示中的语法元素或者当前块的一个或多个维度。
A14.根据解决方案A11所述的方法,其中,对多个参数集的子集中的参数集的选择基于低延迟B(LDB)帧编解码工具的启用。
A15.根据解决方案A11所述的方法,其中,对多个参数集的子集中的参数集的选择基于运动矢量候选的推导。
A16.根据解决方案A15所述的方法,其中,运动矢量候选是从时域运动矢量预测(TMVP)候选、空域运动候选或基于历史的运动矢量预测(HMVP)候选推导的。
A17.根据解决方案A11所述的方法,其中,在确定当前块的高度与当前块的宽度之比为1时,多个参数集的子集包括对应于45°、135°、225°和/或315°的角度的编解码模式。
A18.根据解决方案A11所述的方法,其中,多个参数集的子集包括对应于通过(a)连接当前块的左上角和右下角的线或(b)连接当前块的右上角和左下角的线来划分的当前块的编解码模式。
A19.一种用于视频处理的方法,包括:对于视频的当前块和该视频的比特流表示之间的转换,做出关于第一编解码模式和不同于第一编解码模式的第二编解码模式的启用的确定,其中,第一编解码模式将当前块分割为包括至少一个非矩形或非正方形子区域的两个或更多个子区域;以及基于该确定来执行转换。
A20.根据解决方案A19所述的方法,其中,第二编解码模式包括加权预测,并且其中,第一编解码模式在视频单元级别被禁用,并且第二编解码模式在条带级别被启用。
A21.根据解决方案A20所述的方法,其中,视频单元级别是条带级别、图片参数集(PPS)级别、序列参数集(SPS)级别、片级别、子图片级别、编解码单元(CU)级别、预测单元(PU)级别或变换单元(TU)级别。
A22.根据解决方案A19所述的方法,其中,第二编解码模式是利用编解码单元(CU)权重的双向预测(BCW)、利用光流的预测细化(PROF)模式、双向光流(BDOF)模式、解码器侧运动矢量细化(DMVR)模式或子块变换(SBT)模式。
A23.根据解决方案A19所述的方法,其中,第二编解码模式包括去方块过程,并且其中,启用第二编解码模式基于第一编解码模式的启用。
A24.根据解决方案A19所述的方法,其中,第二编解码模式包括加权预测,并且其中,分量的加权预测的加权值基于当前块的颜色格式。
A25.根据解决方案A24所述的方法,其中,分量是Cb分量或Cr分量,并且其中颜色格式为4:2:0、4:2:2或4:4:4:4。
A26.根据解决方案A1至A25中任一项所述的方法,其中,转换从比特流表示生成当前块。
A27.根据解决方案A1至A25中任一项所述的方法,其中,转换从当前块生成比特流表示。
A28.一种视频系统中的装置,包括处理器和其上具有指令的非暂时性存储器,其中,在由处理器执行时,该指令使得处理器实施根据解决方案A1至A27中任一项所述的方法。
A29.一种存储在非暂时性计算机可读介质上的计算机程序产品,该计算机程序产品包括用于执行根据解决方案A1至A27中任一项所述的方法的程序代码。
图9是视频处理装置900的框图。装置900可以用于实施本文描述的一种或多种方法。装置900可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置900可以包括一个或多个处理器902、一个或多个存储器904和视频处理硬件906。处理器902可以被配置为实施本文档中描述的一种或多种方法。存储器904可以用于存储用于实施本文所描述的方法和技术的数据和代码。视频处理硬件906可以用于在硬件电路系统中实施本文档中描述的一些技术。
图10是示出可以利用本公开的技术的示例视频编解码系统300的框图。
如图10所示,视频编解码系统300可以包括源设备310和目的设备320。源设备310生成编码的视频数据,其中该源设备310可以被称为视频编码设备。目的设备320可以解码由源设备310生成的编码视频数据,其中该目的设备320可以被称为视频解码设备。
源设备310可以包括视频源312、视频编码器314和输入/输出(I/O)接口316。
视频源312可以包括诸如视频捕捉设备、从视频内容提供器接收视频数据的接口和/或用于生成视频数据的计算机图形系统的源,或这些源的组合。视频数据可以包括一个或多个图片。视频编码器314对来自视频源312的视频数据进行编码,以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关数据。编解码图片是图片的编解码表示。相关数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口316可以包括调制器/解调器(调制解调器)和/或发射器。编码的视频数据可以经由I/O接口316通过网络330a直接发送到目的设备320。编码的视频数据也可以存储在存储介质/服务器330b上,以供目的设备320访问。
目的设备320可以包括I/O接口326、视频解码器324和显示设备322。
I/O接口326可以包括接收器和/或调制解调器。I/O接口326可以从源设备310或存储介质/服务器330b获取编码的视频数据。视频解码器324可以对编码的视频数据进行解码。显示设备322可以向用户显示解码的视频数据。显示设备322可以与目的设备320集成,或者可以在目的设备320的外部,目的设备320被配置为与外部显示设备接口。
视频编码器314和视频解码器324可以根据视频压缩标准进行操作,诸如高效视频编解码(HEVC)标准、通用视频编解码(VVM)标准和其他当前和/或进一步的标准。
图11是示出视频编码器400的示例的框图,该视频编码器400可以是图10所示的系统300中的视频编码器314。
视频编码器400可以被配置为执行本公开的任何或所有技术。在图11的示例中,视频编码器400包括多个功能组件。本公开中描述的技术可以在视频编码器400的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器400的功能组件可以包括分割单元401、预测单元402(其可以包括模式选择单元403、运动估计单元404、运动补偿单元405和帧内预测单元406)、残差生成单元407、变换单元408、量化单元409、逆量化单元410、逆变换单元411、重建单元412、缓冲器413和熵编码单元414。
在其他示例中,视频编码器400可以包括更多、更少或不同的功能组件。在示例中,预测单元402可以包括帧内块复制(IBC)单元。IBC单元可以执行IBC模式下的预测,其中至少一个参考图片是当前视频块所在的图片。
此外,诸如运动估计单元404和运动补偿单元405的一些组件可以高度集成,但是处于解释的目的,在图11的示例中分开表示。
分割单元401可以将图片分割为一个或多个视频块。视频编码器400和视频解码器500可以支持各种视频块尺寸。
模式选择单元403可以基于误差结果选择编解码模式(例如,帧内或帧间)之一,并且将作为结果的帧内编解码块或帧间编解码块提供给残差生成单元407以生成残差块数据,以及提供给重建单元412以重建编码块以用作参考图片。在一些示例中,模式选择单元403可以选择帧内和帧间预测模式的组合(CIIP),其中预测基于帧间预测信号和帧内预测信号。在帧间预测的情况下,模式选择单元403还可以选择块的运动矢量的分辨率(例如,子像素或整数像素精度)。
为了对当前视频块执行帧间预测,运动估计单元404可以通过将来自缓冲区413的一个或多个参考帧与当前视频块进行比较,来生成当前视频块的运动信息。运动补偿单元405可以基于运动信息和来自缓冲区413的除了与当前视频块相关联的图片之外的图片的解码样点,来确定当前视频块的预测视频块。
运动估计单元404和运动补偿单元405可以对当前视频块执行不同的操作,例如,取决于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元404可以对当前视频块执行单向预测,并且运动估计单元404可以为当前视频块的参考视频块搜索列表0或列表1的参考图片。运动估计单元404然后可以生成指示列表0或列表1中的参考图片的参考索引,该参考索引包含参考视频块和指示当前视频块和参考视频块之间的空域位移的运动矢量。运动估计单元404可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元405可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元404可以对当前视频块执行双向预测,运动估计单元404可以在列表0中的参考图片中搜索当前视频块的参考视频块,并且还可以在列表1中搜索当前视频块的另一个参考视频块。运动估计单元404然后可以生成参考索引,该参考索引指示包含参考视频块的列表0和列表1中的参考图片以及指示参考视频块和当前视频块之间的空域位移的运动矢量。运动估计单元404可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元405可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元404可以输出完整的运动信息集,以用于解码器的解码处理。
在一些示例中,运动估计单元404可以不输出当前视频的完整的运动信息集。而是运动估计单元404可以参考另一个视频块的运动信息信令通知当前视频块的运动信息。例如,运动估计单元404可以确定当前视频块的运动信息与邻近视频块的运动信息足够相似。
在一个示例中,运动估计单元404可以在与当前视频块相关联的语法结构中指示值,该值向视频解码器500指示当前视频块具有与另一个视频块相同的运动信息。
在另一个示例中,运动估计单元404可以在与当前视频块相关联的语法结构中标识另一视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量和所指示的视频块的运动矢量之间的差。视频解码器500可以使用所指示的视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所述,视频编码器400可以预测性地信令通知运动矢量。可以由视频编码器400实施的预测信令通知技术的两个示例包括高级运动矢量预测(AMVP)和merge模式信令通知。
帧内预测单元406可以对当前视频块执行帧内预测。当帧内预测单元406对当前视频块执行帧内预测时,帧内预测单元406可以基于同一图片中的其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元407可以通过从当前视频块中减去(例如,由减号指示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括与当前视频块中样点的不同样点分量相对应的残差视频块。
在其他示例中,例如在跳过模式下,对于当前视频块可能没有残差数据,并且残差生成单元407可能不执行减去操作。
变换处理单元408可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来为当前视频块生成一个或多个变换系数视频块。
在变换处理单元408生成与当前视频块相关联的变换系数视频块之后,量化单元409可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元410和逆变换单元411可以分别对变换系数视频块应用逆量化和逆变换,以从变换系数视频块重建残差视频块。重建单元412可以将重建后的残差视频块添加到来自预测单元402生成的一个或多个预测视频块的对应样点,以产生与当前块相关联的重建视频块,用于存储在缓冲区413中。
在重建单元412重建视频块之后,可以执行环路滤波操作,以减少视频块中的视频块效应。
熵编码单元414可以从视频编码器400的其他功能组件接收数据。当熵编码单元414接收到数据时,熵编码单元414可以执行一个或多个熵编码操作,以生成熵编码数据,并输出包括该熵编码数据的比特流。
图12是示出视频解码器500的示例的框图,视频解码器500可以是图10所示的系统300中的视频解码器314。
视频解码器500可以被配置为执行本公开的任何或所有技术。在图12的示例中,视频解码器500包括多个功能组件。本公开中描述的技术可以在视频解码器500的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图12的示例中,视频解码器500包括熵解码单元501、运动补偿单元502、帧内预测单元503、逆量化单元504、逆变换单元505、重建单元506和缓冲区507。在一些示例中,视频解码器500可以执行通常与针对视频编码器400(图11)描述的编码过程相反的解码过程。
熵解码单元501可以检索编码比特流。编码比特流可以包括熵编解码的视频数据(例如,视频数据的编码块)。熵解码单元501可以解码熵编解码的视频数据,并且根据熵解码的视频数据,运动补偿单元502可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元502可以例如通过执行AMVP和merge模式来确定这样的信息。
运动补偿单元502可以产生运动补偿块,可以基于插值滤波器执行插值。要以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。
运动补偿单元502可以使用如视频编码器400在视频块的编码期间使用的插值滤波器来计算参考块的子整数像素的插值。运动补偿单元502可以根据所接收的语法信息确定视频编码器400使用的插值滤波器,并使用该插值滤波器来产生预测块。
运动补偿单元502可以使用一些语法信息来确定用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸、描述编码视频序列的图片的每个宏块如何被分割的分割信息、指示每个分割如何被编码的模式、每个帧间编码块的一个或多个参考帧(和参考帧列表)以及用于对编码视频序列进行解码的其他信息。
帧内预测单元503可以使用例如在比特流中接收的帧内预测模式来从空域上相邻的块形成预测块。逆量化单元503对在比特流中提供并由熵解码单元501解码的量化后的视频块系数进行逆量化,即,解量化。逆变换单元503应用逆变换。
重建单元506可以将残差块与由运动补偿单元502或帧内预测单元503生成的对应预测块相加,以形成解码块。如果需要,还可以应用去方块滤波器来滤波解码块,以便移除块效应。解码的视频块然后被存储在缓冲区507中,为随后的运动补偿/帧内预测提供参考块,并且还产生解码的视频以在显示设备上呈现。
图13是示出可以在其中实施本文公开的各种技术的示例视频处理系统1300的框图。各种实施方式可以包括系统1300的一些或所有组件。系统1300可以包括用于接收视频内容的输入1302。视频内容可以以例如8或10比特多分量像素值的原始或未压缩格式而接收,或者可以是压缩或编码格式。输入1302可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统1300可以包括可以实施本文档中描述的各种编解码或编码方法的编解码组件1304。编解码组件1304可以将来自输入1302的视频的平均比特率减小到编解码组件1304的输出,以产生视频的编解码表示。编解码技术因此有时被称为视频压缩或视频转码技术。编解码组件1304的输出可以被存储,或者经由如由组件1306表示的通信连接而发送。在输入1302处接收的视频的存储或通信传送的比特流(或编解码)表示可以由组件1308用于生成像素值或传送到显示接口1310的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是将理解,编解码工具或操作在编码器处被使用,并且反转编解码结果的对应的解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)、或高清晰度多媒体接口(HDMI)、或显示端口等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备。
图14示出了用于视频处理的示例方法的流程图。该方法包括:对于视频的当前视频块和该视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码(1402),其中,几何分割模式包括整个分割模式集合;基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式(1404),其中,分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;以及基于一个或多个分割模式来执行转换(1406)。
在一些示例中,整个分割模式集合中的每个分割模式将当前视频块分割为两个或更多个分区,并且对应于至少一个分割模式的两个或更多个分区是非正方形和非矩形的。
在一些示例中,每个分割模式索引与包括角度、距离和/或位移中的至少一个的参数集合相关联。
在一些示例中,分割模式索引和分割模式的对应关系取决于视频块的维度,其中,视频块的维度包括视频块的高度、宽度以及宽度和高度之比中的至少一个。
在一些示例中,分割模式索引的二值化包括可变长度编解码,所述可变长度编解码为第一分割模式使用第一数量的二进制位,并且为第二分割模式使用第二数量的二进制位。
在一些示例中,不同数量的分割模式或不同数量的参数用于不同的视频块中。
在一些示例中,在视频块中使用的分割模式的数量或参数的数量取决于视频块的维度。
在一些示例中,在当前视频块中使用的角度的数量多于在第二视频块中使用的角度的数量,其中,当前视频块是高度大于宽度的视频块,并且第二视频块是高度小于宽度的视频块。
在一些示例中,角度是不对称的。
在一些示例中,角度不是旋转对称的。
在一些示例中,角度不是双边对称的。
在一些示例中,角度不是四分对称的。
在一些示例中,视频块包括编解码块、编解码单元、虚拟流水线数据单元(VPDU)、片、条带、图片、子图片、图块或视频中的至少一个。
在一些示例中,比特流中分割模式的表示取决于分割模式的优先级。
在一些示例中,优先级由与分割模式相关联的角度和/或距离确定。
在一些示例中,面向小于预定值的角度的分割模式比面向大于预定值的角度的分割模式具有更高的优先级。
在一些示例中,预定值为45或90。
在一些示例中,与小于预定值的角度索引相关联的分割模式比与大于预定值的角度索引相关联的分割模式具有更高的优先级。
在一些示例中,预定值为4或8或16。
在一些示例中,在信令通知时,具有更高优先级的分割模式比具有更低优先级的分割模式需要更少的二进制位或比特。
在一些示例中,分割模式被分类为两个或更多个类别,并且分割模式属于哪个类别的指示在与分割模式有关的其他信息之前被信令通知。
在一些示例中,首先针对视频块信令通知以顺时针方向还是逆时针方向信令通知角度索引。
在一些示例中,当以逆时针方向信令通知角度索引时,以逆时针信令通知的角度索引意味着更小的角度索引,更小的角度索引表示更小的角度尺寸。
在一些示例中,如果angleIdx=0意味着角度尺寸等于0度,则angleIdx=8意味着角度尺寸等于90度;angleIdx=16意味着角度尺寸等于180度,而angleIdx=24意味着角度尺寸等于270度。
在一些示例中,当以顺时针方向信令通知角度索引时,以顺时针信令通知的角度索引意味着更大的角度索引,更大的角度索引表示更大的角度尺寸。
在一些示例中,如果angleIdx=0意味着角度尺寸等于0度,则angleIdx=8意味着角度尺寸等于270度;angleIdx=16意味着角度尺寸等于180度,而angleIdx=24意味着角度尺寸等于90度。
在一些示例中,该指示在视频块级别被信令通知。
在一些示例中,该指示在SPS、VPS、PPS、图片标头、子图片、条带、条带标头、片、图块、CTU、VPDU、CU和块级别中的至少一个处被信令通知。
在一些示例中,高于块级别的高级别标志被信令通知,以指示与信令通知的分割模式相关联的角度是顺时针方向还是逆时针方向。
在一些示例中,块级别标志被信令通知,以指示与信令通知的分割模式相关联的角度是顺时针方向还是逆时针方向。
图15示出了用于视频处理的示例方法的流程图。该方法包括:对于视频的当前视频块和该当前视频块的比特流之间的转换,确定视频块以几何分割模式进行编解码(1502),其中,几何分割模式包括整个分割模式集合,并且每个分割模式与包括角度、距离和/或位移中的至少一个的参数集合相关联;从整个分割模式或参数集合推导分割模式或参数的子集(1504);以及基于分割模式或参数的子集来执行转换(1506)。
在一些示例中,整个分割模式集合中的每个分割模式将当前视频块分割为两个或更多个分区,该两个或更多个分区中的至少一个是非正方形和非矩形的。
在一些示例中,仅分割模式的子集用于视频块。
在一些示例中,仅与参数的子集相关联的分割模式用于视频块。
在一些示例中,所选择的分割模式或参数是否在子集内的指示还被包括在比特流中。
在一些示例中,分割模式或参数的子集还是整个分割模式或参数集合用于视频块取决于当前视频块或者一个或多个先前解码的视频块的解码信息。
在一些示例中,解码信息包括语法元素和/或视频块的块维度。
在一些示例中,对分割模式的子集中的分割模式的选择取决于对应的角度。
在一些示例中,分割模式的子集仅包含与等于0的距离或位移相关联的分割模式。
在一些示例中,分割模式的子集仅包含与指定角度相关联的分割模式。
在一些示例中,与指定角度相关联的分割模式包括与角度的预定义子集相关联的分割模式,该角度的预定义子集与对应于这些预定义角度的所有位移组合。
在一些示例中,对分割模式的子集中的分割模式的选择取决于是否检查低延迟B帧(LDB)编解码。
在一些示例中,分割模式的不同子集用于LDB编解码和随机访问(RA)编解码。
在一些示例中,对分割模式的子集中的分割模式的选择取决于当前图片的参考图片列表中的参考图片。
在一些示例中,在所有参考图片在显示顺序中在当前图片之前的第一情况下并且在至少一个参考图片在显示顺序中在当前图片之后的第二情况下使用分割模式的不同子集。
在一些示例中,对分割模式的子集中的分割模式的选择取决于运动矢量候选的推导。
在一些示例中,当从时域运动矢量预测(TMVP)候选、空域运动候选或基于历史的运动矢量预测(HMVP)候选推导运动矢量候选时,使用分割模式的不同子集。
在一些示例中,分割模式的子集仅包含以与TPM模式相同的方式划分块的分割模式。
在一些示例中,分割模式的子集仅包含通过连接块的左上角和右下角的线或者通过连接块的右上角和左下角的线来划分块的分割模式。
在一些示例中,分割模式的子集仅包含对应于具有一个或多个距离或位移索引的对角角度的分割模式。
在一些示例中,对角角度指示对应于通过连接块的左上角和右下角的线或者通过连接块的右上角和左下角的线来划分块的划分边界的分割模式。
在一些示例中,分割模式的子集仅包含与等于0的距离或位移相关联的分割模式。
在一些示例中,分割模式的子集仅包含对应于与等于0的距离或位移相关联的任何角度的分割模式。
在一些示例中,分割模式的子集仅包含对应于与等于0的距离或位移相关联的对角角度的分割模式。
在一些示例中,分割模式的子集仅包含对应于对角角度的分割模式,该对角角度与对应于这些角度的所有距离或位移索引相关联。
在一些示例中,对于宽高比等于X的块,分割模式的子集仅包含与等于arctan(X)和/或π-arctan(X)和/或π+arctan(X)和/或2π-arctan(X)的角度尺寸以及对应于这些角度的所有距离索引相对应的分割模式,X是整数。
在一些示例中,X=1。
在一些示例中,水平角度和/或垂直角度被包括在角度的子集中。
在一些示例中,水平角度指示对应于90°和/或270°的角度索引。
在一些示例中,垂直角度指示对应于0°和/或180°的角度索引。
在一些示例中,与和等于0的距离/位移组合的水平角度和/或垂直角度相关联的分割模式被包括在允许角度的子集中。
在一些示例中,与和等于0的距离或位移组合的水平角度和/或垂直角度相关联的分割模式没有被包括在允许角度的子集中。
在一些示例中,与和所有距离或位移索引组合的水平角度和/或垂直角度相关联的分割模式被包括在允许角度的子集中。
在一些示例中,与和所有距离或位移索引组合的水平角度和/或垂直角度相关联的分割模式没有被包括在允许角度的子集中。
在一些示例中,是否使用分割模式或参数的子集的指示在SPS、VPS、PPS、图片标头、子图片、条带、条带标头、片、图块、CTU、VPDU、CU和块级别中的至少一个处被信令通知。
在一些示例中,使用分割模式或参数的哪个子集的指示在SPS、VPS、PPS、图片标头、子图片、条带、条带标头、片、图块、CTU、VPDU、CU和块级别中的至少一个处进一步被信令通知。
图16示出了用于视频处理的示例方法的流程图。该方法包括:对于视频的视频块和该视频块的比特流之间的转换,确定几何分割模式和不同于几何分割模式的第二编解码模式对视频块的启用(1602);以及基于该确定来执行转换(1604)。
在一些示例中,几何分割模式包括整个分割模式集合,整个分割模式集合中的每个分割模式将当前视频块分割为两个或更多个分区,并且对应于至少一个分割模式的两个或更多个分区是非正方形和非矩形的。
在一些示例中,第二编解码模式包括加权预测。
在一些示例中,当启用加权预测时,几何分割模式在视频块级别被禁用。
在一些示例中,当在条带级别启用加权预测时,几何分割模式在条带、PPS、SPS、片、子图片、CU、PU或TU级别中的至少一个处被禁用。
在一些示例中,几何分割模式是否与加权预测一起使用取决于加权预测的加权因子。
在一些示例中,如果加权预测的加权因子大于T,则几何分割模式被禁用,其中T是常数值。
在一些示例中,第二编解码模式包括利用编解码单元(CU)权重的双向预测(BCW)、利用光流的预测细化(PROF)模式、双向光流(BDOF)模式、解码器侧运动矢量细化(DMVR)模式或子块变换(SBT)模式。
在一些示例中,当几何分割模式被启用时,第二编解码模式被禁用。
在一些示例中,当几何分割模式被启用时,不信令通知第二编解码模式的指示。
在一些示例中,当第二编解码模式被启用时,几何分割模式被禁用。
在一些示例中,当第二编解码模式被启用时,不信令通知几何分割模式的指示。
在一些示例中,当加权预测被启用时,第二编解码模式被禁用。
在一些示例中,与视频块相关联的去方块过程取决于几何分割模式和第二编解码模式是否都被启用。
图17示出了用于视频处理的示例方法的流程图。该方法包括:对于视频的视频块和该视频块的比特流之间的转换,基于当前视频块是否以当前视频块的几何分割模式和/或颜色格式进行编解码,确定与视频块相关联的去方块过程(1702);以及基于去方块参数来执行转换(1704)。
在一些示例中,几何分割模式包括整个分割模式集合,整个分割模式集合中的每个分割模式将当前视频块分割为两个或更多个分区,并且对应于至少一个分割模式的两个或更多个分区是非正方形和非矩形的。
在一些示例中,当以几何分割模式对视频块进行编解码时,为视频块的第一分量生成的加权预测的加权值用于为视频块的第二分量推导加权值。
在一些示例中,第一分量是亮度分量,并且第二分量是Cb或Cr分量。
在一些示例中,该推导取决于视频块的颜色格式。
在一些示例中,颜色格式为4:2:0、4:2:2或4:4:4。
在一些示例中,第二分量的加权值通过对第一分量的加权值应用上采样或下采样来推导。
在一些示例中,分量的加权预测的加权值基于视频块的颜色格式。
在一些示例中,分量是Cb分量或Cr分量,并且其中颜色格式为4:2:0、4:2:2或4:4:4。
在一些示例中,当颜色格式为4:2:2时,与分割模式相关联的参数被调整以生成分量的加权值。
在一些示例中,几何分割模式包括几何merge模式、几何分区模式、楔形预测模式和三角形预测模式中的一个或多个。
在一些示例中,转换包括将视频块编码为比特流。
在一些示例中,转换包括从比特流解码视频块。
在一些示例中,转换包括从视频块生成比特流;该方法还包括:将比特流存储在非暂时性计算机可读记录介质中。
图17示出了用于视频处理的示例方法的流程图。该方法包括:对于视频的当前视频块和该视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码(1702),其中,几何分割模式包括整个分割模式集合;基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式(1704),其中,分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;以一个或多个分割模式从视频块生成比特流(1706);以及将比特流存储在非暂时性计算机可读记录介质中(1708)。
从前述内容中可以理解,为了说明的目的,本文已经描述了目前公开的技术的特定实施例,但是在不脱离本发明的范围的情况下,可以做出各种修改。因此,除了所附权利要求之外,目前公开的技术不受限制。
本主题的实施方式和本专利文档中描述的功能操作可以在各种系统、数字电子电路、或计算机软件、固件或硬件中实现,包括本说明书中所公开的结构及其结构等效体,或其中一个或多个的组合。所公开的和其他实施例能够实现为一个或多个计算机程序产品,即编码在有形的且非易失的计算机可读介质上的计算机程序指令的一个或多个模块,以供数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储设备、影响机器可读传播信号的物质组成或其中一个或其中多个的组合。术语“数据处理单元”或“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多处理器或计算机组。除硬件外,该装置还可以包括为计算机程序创建执行环境的代码,例如,构成处理器固件的代码、协议栈、数据库管理系统、操作系统或其中一个或多个的组合。传播的信号是人为生成的信号,例如,机器生成的电、光或电磁信号,其被生成以编码信息以传输到合适的接收器设备。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写,并且可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件对应。程序可以存储在保存其他程序或数据的文件的部分中(例如,存储在标记语言文档中的一个或多个脚本)、专用于该程序的单个文件中、或多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行,这些计算机位于一个站点上或分布在多个站点上,并通过通信网络互连。
本申请文件中描述的过程和逻辑流可以通过一个或多个可编程处理器执行,该处理器执行一个或多个计算机程序,通过在输入数据上操作并生成输出来执行功能。处理和逻辑流也可以通过特殊用途的逻辑电路来执行,并且装置也可以实现为特殊用途的逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
例如,适于执行计算机程序的处理器包括通用和专用微处理器,以及任何类型数字计算机的任何一个或多个。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常,计算机还将包括一个或多个用于存储数据的大容量存储设备,例如,磁盘、磁光盘或光盘,或通过操作耦合到一个或多个大容量存储设备来从其接收数据或将数据传输到一个或多个大容量存储设备,或两者兼有。然而,计算机不一定具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如,内部硬盘或可移动硬盘;磁光盘;以及CD ROM和DVD ROM盘。处理器和存储器可以由专用逻辑电路来补充,或合并到专用逻辑电路中。
虽然本专利文件包含许多细节,但不应将其解释为对任何发明或权利要求范围的限制,而应解释为对特定发明的特定实施例的特征的描述。本专利文件在单独实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独实施,或在任何合适的子组合中实施。此外,尽管上述特征可以描述为在某些组合中起作用,甚至最初要求是这样,但在某些情况下,可以从组合中移除权利要求组合中的一个或多个特征,并且权利要求的组合可以指向子组合或子组合的变体。
同样,尽管附图中以特定顺序描述了操作,但这不应理解为要获得想要的结果必须按照所示的特定顺序或顺序执行此类操作,或执行所有说明的操作。此外,本专利文件所述实施例中各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。
仅描述了一些实现和示例,可以基于本专利文件中描述和说明的内容做出其他实现、增强和变体。

Claims (98)

1.一种用于视频处理的方法,包括:
对于视频的当前视频块和所述视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码,其中,几何分割模式包括整个分割模式集合;
基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式,其中,所述分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;以及
基于一个或多个分割模式来执行转换。
2.根据权利要求1所述的方法,其中,整个分割模式集合中的每个分割模式将当前视频块分割为两个或更多个分区,并且对应于至少一个分割模式的两个或更多个分区是非正方形和非矩形的。
3.根据权利要求1或2所述的方法,其中,每个分割模式索引与包括角度、距离和/或位移中的至少一个的参数集合相关联。
4.根据权利要求3所述的方法,其中,分割模式索引和分割模式的对应关系取决于视频块的维度,其中,视频块的维度包括视频块的高度、宽度以及宽度和高度之比中的至少一个。
5.根据权利要求1-4中任一项所述的方法,其中,分割模式索引的二值化包括可变长度编解码,所述可变长度编解码为第一分割模式使用第一数量的二进制位,并且为第二分割模式使用第二数量的二进制位。
6.根据权利要求4所述的方法,其中,不同数量的分割模式或不同数量的参数用于不同的视频块中。
7.根据权利要求6所述的方法,其中,在视频块中使用的分割模式的数量或参数的数量取决于视频块的维度。
8.根据权利要求7所述的方法,其中,在当前视频块中使用的角度的数量多于在第二视频块中使用的角度的数量,其中,当前视频块是高度大于宽度的视频块,并且第二视频块是高度小于宽度的视频块。
9.根据权利要求8所述的方法,其中,所述角度是不对称的。
10.根据权利要求8所述的方法,其中,所述角度不是旋转对称的。
11.根据权利要求8所述的方法,其中,所述角度不是双边对称的。
12.根据权利要求8所述的方法,其中,所述角度不是四分对称的。
13.根据权利要求12所述的方法,其中,所述视频块包括编解码块、编解码单元、虚拟流水线数据单元(VPDU)、片、条带、图片、子图片、图块或视频中的至少一个。
14.根据权利要求1所述的方法,其中,比特流中分割模式的表示取决于分割模式的优先级。
15.根据权利要求14所述的方法,其中,所述优先级由与分割模式相关联的角度和/或距离确定。
16.根据权利要求15所述的方法,其中,面向小于预定值的角度的分割模式比面向大于预定值的角度的分割模式具有更高的优先级。
17.根据权利要求16所述的方法,其中,所述预定值为45或90。
18.根据权利要求15所述的方法,其中,与小于预定值的角度索引相关联的分割模式比与大于预定值的角度索引相关联的分割模式具有更高的优先级。
19.根据权利要求18所述的方法,其中,所述预定值为4或8或16。
20.根据权利要求14-19中任一项所述的方法,其中,在信令通知时,具有更高优先级的分割模式比具有更低优先级的分割模式需要更少的二进制位或比特。
21.根据权利要求1-20中任一项所述的方法,其中,分割模式被分类为两个或更多个类别,并且分割模式属于哪个类别的指示在与分割模式有关的其他信息之前被信令通知。
22.根据权利要求21所述的方法,其中,首先针对视频块信令通知以顺时针方向还是逆时针方向信令通知角度索引。
23.根据权利要求21所述的方法,其中,当以逆时针方向信令通知角度索引时,以逆时针信令通知的角度索引意味着更小的角度索引,更小的角度索引表示更小的角度尺寸。
24.根据权利要求23所述的方法,其中,如果angleIdx=0意味着角度尺寸等于0度,则angleIdx=8意味着角度尺寸等于90度;angleIdx=16意味着角度尺寸等于180度,而angleIdx=24意味着角度尺寸等于270度。
25.根据权利要求21所述的方法,其中,当以顺时针方向信令通知角度索引时,以顺时针信令通知的角度索引意味着更大的角度索引,更大的角度索引表示更大的角度尺寸。
26.根据权利要求25所述的方法,其中,如果angleIdx=0意味着角度尺寸等于0度,则angleIdx=8意味着角度尺寸等于270度;angleIdx=16意味着角度尺寸等于180度,而angleIdx=24意味着角度尺寸等于90度。
27.根据权利要求21所述的方法,其中,所述指示在视频块级别被信令通知。
28.根据权利要求27所述的方法,其中,所述指示在SPS、VPS、PPS、图片标头、子图片、条带、条带标头、片、图块、CTU、VPDU、CU和块级别中的至少一个处被信令通知。
29.根据权利要求28所述的方法,其中,高于块级别的高级别标志被信令通知,以指示与信令通知的分割模式相关联的角度是顺时针方向还是逆时针方向。
30.根据权利要求28所述的方法,其中,块级别标志被信令通知,以指示与信令通知的分割模式相关联的角度是顺时针方向还是逆时针方向。
31.一种用于视频处理的方法,包括:
对于视频的当前视频块和所述当前视频块的比特流之间的转换,确定当前视频块以几何分割模式进行编解码,其中,几何分割模式包括包含分割模式的多个子集的整个分割模式集合,并且每个分割模式与包括角度、距离和/或位移中的至少一个的参数集合相关联;
从当前视频块的整个分割模式或参数集合中选择分割模式或参数的子集;以及
基于分割模式或参数的子集来执行转换。
32.根据权利要求31所述的方法,其中,所述整个分割模式集合中的每个分割模式将当前视频块分割为两个或更多个分区,并且对应于至少一个分割模式的两个或更多个分区是非正方形和非矩形的。
33.根据权利要求31所述的方法,其中,仅分割模式的子集用于视频块。
34.根据权利要求31所述的方法,其中,仅与参数的子集相关联的分割模式用于视频块。
35.根据权利要求31所述的方法,其中,所选择的分割模式或参数是否在子集内的指示还被包括在比特流中。
36.根据权利要求31所述的方法,其中,分割模式的子集或参数的子集还是分割模式或参数集合用于视频块取决于当前视频块或者一个或多个先前解码的视频块的解码信息。
37.根据权利要求36所述的方法,其中,所述解码信息包括语法元素和/或视频块的块维度。
38.根据权利要求31所述的方法,其中,对分割模式的子集中的分割模式的选择取决于对应的角度。
39.根据权利要求37所述的方法,其中,分割模式的子集仅包含与等于0的距离或位移相关联的分割模式。
40.根据权利要求38所述的方法,其中,分割模式的子集仅包含与指定角度相关联的分割模式。
41.根据权利要求40所述的方法,其中,与指定角度相关联的分割模式包括与角度的预定义子集相关联的分割模式,所述角度的预定义子集与对应于这些预定义角度的所有位移组合。
42.根据权利要求31所述的方法,其中,对分割模式的子集中的分割模式的选择取决于是否检查低延迟B帧(LDB)编解码。
43.根据权利要求42所述的方法,其中,分割模式的不同子集用于LDB编解码和随机访问(RA)编解码。
44.根据权利要求31所述的方法,其中,对分割模式的子集中的分割模式的选择取决于当前图片的参考图片列表中的参考图片。
45.根据权利要求44所述的方法,其中,在所有参考图片在显示顺序中在当前图片之前的第一情况下并且在至少一个参考图片在显示顺序中在当前图片之后的第二情况下使用分割模式的不同子集。
46.根据权利要求31所述的方法,其中,对分割模式的子集中的分割模式的选择取决于运动矢量候选的推导。
47.根据权利要求46所述的方法,其中,当从时域运动矢量预测(TMVP)候选、空域运动候选或基于历史的运动矢量预测(HMVP)候选推导运动矢量候选时,使用分割模式的不同子集。
48.根据权利要求38所述的方法,其中,分割模式的子集仅包含以与TPM模式相同的方式划分块的分割模式。
49.根据权利要求48所述的方法,其中,分割模式的子集仅包含通过连接块的左上角和右下角的线或者通过连接块的右上角和左下角的线来划分块的分割模式。
50.根据权利要求38所述的方法,其中,分割模式的子集仅包含对应于具有一个或多个距离或位移索引的对角角度的分割模式。
51.根据权利要求50所述的方法,其中,对角角度指示对应于通过连接块的左上角和右下角的线或者通过连接块的右上角和左下角的线来划分块的划分边界的分割模式。
52.根据权利要求50所述的方法,其中,分割模式的子集仅包含与等于0的距离或位移相关联的分割模式。
53.根据权利要求52所述的方法,其中,分割模式的子集仅包含对应于与等于0的距离或位移相关联的任何角度的分割模式。
54.根据权利要求52所述的方法,其中,分割模式的子集仅包含对应于与等于0的距离或位移相关联的对角角度的分割模式。
55.根据权利要求50所述的方法,其中,分割模式的子集仅包含对应于对角角度的分割模式,所述对角角度与对应于这些角度的所有距离或位移索引相关联。
56.根据权利要求55所述的方法,其中,对于宽高比等于X的块,分割模式的子集仅包含与等于arctan(X)和/或π-arctan(X)和/或π+arctan(X)和/或2π-arctan(X)的角度尺寸以及对应于这些角度的所有距离索引相对应的分割模式,X是整数。
57.根据权利要求56所述的方法,其中,X=1。
58.根据权利要求57所述的方法,其中,水平角度和/或垂直角度被包括在角度的子集中。
59.根据权利要求58所述的方法,其中,水平角度指示对应于90°和/或270°的角度索引。
60.根据权利要求58所述的方法,其中,垂直角度指示对应于0°和/或180°的角度索引。
61.根据权利要求58所述的方法,其中,与和等于0的距离/位移组合的水平角度和/或垂直角度相关联的分割模式被包括在允许角度的子集中。
62.根据权利要求58所述的方法,其中,与和等于0的距离或位移组合的水平角度和/或垂直角度相关联的分割模式没有被包括在允许角度的子集中。
63.根据权利要求58所述的方法,其中,与和所有距离或位移索引组合的水平角度和/或垂直角度相关联的分割模式被包括在允许角度的子集中。
64.根据权利要求58所述的方法,其中,与和所有距离或位移索引组合的水平角度和/或垂直角度相关联的分割模式没有被包括在允许角度的子集中。
65.根据权利要求31到64中任一项所述的方法,其中,是否使用分割模式或参数的子集的指示在SPS、VPS、PPS、图片标头、子图片、条带、条带标头、片、图块、CTU、VPDU、CU和块级别中的至少一个处被信令通知。
66.根据权利要求65所述的方法,其中,使用分割模式或参数的哪个子集的指示在SPS、VPS、PPS、图片标头、子图片、条带、条带标头、片、图块、CTU、VPDU、CU和块级别中的至少一个处进一步被信令通知。
67.一种用于视频处理的方法,包括:
对视频的视频块和所述视频块的比特流之间的转换,确定几何分割模式和不同于几何分割模式的第二编解码模式对视频块的启用;以及
基于所述确定来执行转换。
68.根据权利要求67所述的方法,其中,几何分割模式包括整个分割模式集合,整个分割模式集合中的每个分割模式将当前视频块分割为两个或更多个分区,并且对应于至少一个分割模式的两个或更多个分区是非正方形和非矩形的。
69.根据权利要求68所述的方法,其中,第二编解码模式包括加权预测。
70.根据权利要求69所述的方法,其中,当启用加权预测时,几何分割模式在视频块级别被禁用。
71.根据权利要求70所述的方法,其中,当在条带级别启用加权预测时,几何分割模式在条带、PPS、SPS、片、子图片、CU、PU或TU级别中的至少一个处被禁用。
72.根据权利要求69所述的方法,其中,几何分割模式是否与加权预测一起使用取决于加权预测的加权因子。
73.根据权利要求72所述的方法,其中,如果加权预测的加权因子大于T,则几何分割模式被禁用,其中T是常数值。
74.根据权利要求68所述的方法,其中,第二编解码模式包括利用编解码单元(CU)权重的双向预测(BCW)、利用光流的预测细化(PROF)模式、双向光流(BDOF)模式、解码器侧运动矢量细化(DMVR)模式或子块变换(SBT)模式。
75.根据权利要求68所述的方法,其中,当几何分割模式被启用时,第二编解码模式被禁用。
76.根据权利要求75所述的方法,其中,当几何分割模式被启用时,不信令通知第二编解码模式的指示。
77.根据权利要求68所述的方法,其中,当第二编解码模式被启用时,几何分割模式被禁用。
78.根据权利要求77所述的方法,其中,当第二编解码模式被启用时,不信令通知几何分割模式的指示。
79.根据权利要求68所述的方法,其中,当加权预测被启用时,第二编解码模式被禁用。
80.根据权利要求68所述的方法,其中,与视频块相关联的去方块过程取决于几何分割模式和第二编解码模式是否都被启用。
81.一种用于视频处理的方法,包括:
对于视频的视频块和所述视频块的比特流之间的转换,基于当前视频块是否以当前视频块的几何分割模式和/或颜色格式进行编解码,来确定与视频块相关联的去方块过程;以及
基于去方块过程来执行转换。
82.根据权利要求81所述的方法,其中,几何分割模式包括整个分割模式集合,整个分割模式集合中的每个分割模式将当前视频块分割为两个或更多个分区,并且对应于至少一个分割模式的两个或更多个分区是非正方形和非矩形的。
83.根据权利要求82所述的方法,其中,当以几何分割模式对视频块进行编解码时,为视频块的第一分量生成的加权预测的加权值用于为视频块的第二分量推导加权值。
84.根据权利要求83所述的方法,其中,第一分量是亮度分量,并且第二分量是Cb或Cr分量。
85.根据权利要求84所述的方法,其中,推导取决于视频块的颜色格式。
86.根据权利要求85所述的方法,其中,颜色格式为4:2:0、4:2:2或4:4:4。
87.根据权利要求83所述的方法,其中,第二分量的加权值通过对第一分量的加权值应用上采样或下采样来推导。
88.根据权利要求81所述的方法,其中,分量的加权预测的加权值基于视频块的颜色格式。
89.根据权利要求88所述的方法,其中,分量是Cb分量或Cr分量,并且其中颜色格式为4:2:0、4:2:2或4:4:4。
90.根据权利要求89所述的方法,其中,当颜色格式为4:2:2时,与分割模式相关联的参数被调整以生成分量的加权值。
91.根据权利要求1-90中任一项所述的方法,其中,几何分割模式包括几何merge模式、几何分割模式、楔形预测模式和三角形预测模式中的一个或多个。
92.根据权利要求1-91中任一项所述的方法,其中,转换包括将视频块编码为比特流。
93.根据权利要求1-91中任一项所述的方法,其中,转换包括从比特流解码视频块。
94.根据权利要求1-91中任一项所述的方法,其中,转换包括从视频块生成比特流;
所述方法还包括:
将比特流存储在非暂时性计算机可读记录介质中。
95.一种用于处理视频数据的装置,包括处理器和其上具有指令的非暂时性存储器,其中,当由处理器执行时,所述指令使得所述处理器:
对于视频的当前视频块和所述视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码,其中,几何分割模式包括整个分割模式集合;
基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式,其中,分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;以及
基于一个或多个分割模式来执行转换。
96.一种存储指令的非暂时性计算机可读介质,所述指令使得处理器:
对于视频的当前视频块和所述视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码,其中,几何分割模式包括整个分割模式集合;
基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式,其中,分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;以及
基于一个或多个分割模式来执行转换。
97.一种存储通过由视频处理装置执行的方法生成的视频的比特流的非暂时性计算机可读介质,其中,所述方法包括:
对于视频的当前视频块和所述视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码,其中,几何分割模式包括整个分割模式集合;
基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式,其中,分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;以及
基于一个或多个分割模式从视频块生成比特流。
98.一种用于存储视频的比特流的方法,包括:
对于视频的当前视频块和所述视频的比特流之间的转换,确定当前视频块以几何分割模式进行编解码,其中,几何分割模式包括整个分割模式集合;
基于比特流中包括的分割模式索引来确定当前视频块的一个或多个分割模式,其中,分割模式索引从一个视频块到另一个视频块对应于不同的分割模式;
以一个或多个分割模式从视频块生成比特流;以及
将比特流存储在非暂时性计算机可读记录介质中。
CN202180013097.8A 2020-02-07 2021-02-07 几何分割模式 Pending CN115136601A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2020074499 2020-02-07
CNPCT/CN2020/074499 2020-02-07
PCT/CN2021/075821 WO2021155865A1 (en) 2020-02-07 2021-02-07 Geometric partitioning mode

Publications (1)

Publication Number Publication Date
CN115136601A true CN115136601A (zh) 2022-09-30

Family

ID=77200518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180013097.8A Pending CN115136601A (zh) 2020-02-07 2021-02-07 几何分割模式

Country Status (2)

Country Link
CN (1) CN115136601A (zh)
WO (1) WO2021155865A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024113311A1 (zh) * 2022-12-01 2024-06-06 Oppo广东移动通信有限公司 编解码方法、编解码器、码流以及存储介质
CN119544830A (zh) * 2023-08-28 2025-02-28 锐捷网络股份有限公司 决策树生成方法、报文处理方法、设备和存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118592024A (zh) * 2022-02-16 2024-09-03 北京达佳互联信息技术有限公司 利用预定义模式顺序进行几何分区模式拆分模式重排序的方法和设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100208827A1 (en) * 2007-10-16 2010-08-19 Thomson Licensing Methods and apparatus for video encoding and decoding geometerically partitioned super macroblocks
WO2011130186A2 (en) * 2010-04-12 2011-10-20 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012002785A2 (ko) * 2010-07-02 2012-01-05 (주)휴맥스 화면내 예측 부호화를 위한 영상 부호화/복호화 장치 및 방법
CN102611880B (zh) * 2011-01-19 2015-02-04 华为技术有限公司 标识图像块几何划分模式的编解码方法和设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100208827A1 (en) * 2007-10-16 2010-08-19 Thomson Licensing Methods and apparatus for video encoding and decoding geometerically partitioned super macroblocks
WO2011130186A2 (en) * 2010-04-12 2011-10-20 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAN GAO等: "CE4: CE4-1.1, CE4-1.2 and CE4-1.14: Geometric Merge Mode (GEO)", 《JOINT VIDEO EXPERTS TEAM (JVET)OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》, 25 September 2019 (2019-09-25), pages 2 - 5 *
SAVERIO BLASI: "CE4-6: Combination of geometric partitioning and CIIP", 《JOINT VIDEO EXPERTS TEAM (JVET)OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》, 7 January 2020 (2020-01-07), pages 1 - 2 *
ZHIPIN DENG等: "CE4-related: Further constraints on block shapes for GEO", 《JOINT VIDEO EXPERTS TEAM (JVET)OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》, 31 December 2019 (2019-12-31), pages 2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024113311A1 (zh) * 2022-12-01 2024-06-06 Oppo广东移动通信有限公司 编解码方法、编解码器、码流以及存储介质
CN119544830A (zh) * 2023-08-28 2025-02-28 锐捷网络股份有限公司 决策树生成方法、报文处理方法、设备和存储介质

Also Published As

Publication number Publication date
WO2021155865A1 (en) 2021-08-12

Similar Documents

Publication Publication Date Title
US11985323B2 (en) Quantized residual differential pulse code modulation representation of coded video
CN114902675B (zh) 使用几何分割的简化的帧间预测
CN114788278B (zh) 使用多个分量的跨分量预测
US11700378B2 (en) High level syntax for inter prediction with geometric partitioning
WO2020125795A1 (en) Indication of two step cross-component prediction mode
US20240121381A1 (en) Intra coded video using quantized residual differential pulse code modulation coding
WO2021110116A1 (en) Prediction from multiple cross-components
WO2023284694A1 (en) Method, apparatus, and medium for video processing
US20230097850A1 (en) Intra block copy using non-adjacent neighboring blocks
CN118285102A (zh) 用于视频处理的方法、装置和介质
US12477115B2 (en) Sample string processing in intra coding
WO2023030504A1 (en) Method, device, and medium for video processing
CN115136601A (zh) 几何分割模式
CN115136597B (zh) 视频处理方法、装置、介质及存储视频的比特流的方法
US11778176B2 (en) Intra block copy buffer and palette predictor update
EP4447440A1 (en) Transform selection for reconstructed-reordered template matching prediction (rrtmp)
US12439030B2 (en) Luma mapping for template matching
WO2022262689A1 (en) Method, device, and medium for video processing
US20250379988A1 (en) Method, apparatus, and medium for video processing
US20250373789A1 (en) Method, apparatus, and medium for video processing
US20250337883A1 (en) Method, apparatus, and medium for video processing
US20250386008A1 (en) Method, apparatus, and medium for video processing
CN120202661A (zh) 用于视频处理的方法、装置和介质
CN121176017A (zh) 用于视频处理的方法、装置和介质
CN120712779A (zh) 用于视频处理的方法、装置和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination