RU2575868C2

RU2575868C2 - Method and apparatus for image encoding and decoding using large transformation unit

Info

Publication number: RU2575868C2
Application number: RU2014104796/07A
Authority: RU
Inventors: Тамми ЛИ; Воо-Дзин ХАН; Цзяньлэ ЧЭНЬ; Хае-Киунг ДЗУНГ
Original assignee: Самсунг Электроникс Ко., Лтд.
Priority date: 2009-08-13
Filing date: 2014-02-11
Publication date: 2016-02-20

Abstract

FIELD: physics.

SUBSTANCE: disclosed is an image encoding method, comprising obtaining quantised transformation coefficients for a transformation unit in a coding unit; determining a coding unit which is obtained via hierarchical splitting of the maximum coding unit, using splitting information for a coding unit, determining at least one prediction unit which is obtained by splitting the coding unit, using information about a partition type, determining at least one transformation unit which is obtained by splitting the coding unit, using information about partitioning, obtaining residue values for the transformation unit by performing inverse quantisation on the quantised transformation coefficients of the transformation unit, performing intra- or inter-prediction using at least one prediction unit in order to generate a predictor, and restoring the coding unit using residue and predictor values. The invention is split into a plurality of maximum coding units comprising said maximum coding unit, and the size of the transformation unit is determined without taking into account the size of said at least one transformation unit in the coding unit.

EFFECT: high encoding efficiency.

4 cl, 18 dwg

Description

Область техники, к которой относится изобретениеFIELD OF THE INVENTION

Примерные варианты осуществления изобретения относятся к способу и устройству для кодирования и декодирования изображения, в частности, к способу и устройству для кодирования и декодирования изображения посредством преобразования изображения в пиксельной области в коэффициенты в частотной области.Exemplary embodiments of the invention relate to a method and apparatus for encoding and decoding an image, in particular, to a method and apparatus for encoding and decoding an image by converting an image in the pixel domain to coefficients in the frequency domain.

Уровень техникиState of the art

Для того чтобы выполнять сжатие изображения, большинство способов и устройств кодирования и декодирования изображения кодируют изображение посредством преобразования изображения в пиксельной области в коэффициенты частотной области. Дискретное косинусное преобразование (DCT), которое является одной из методик частотного преобразования, является хорошо известной методикой, которая широко используется при сжатии изображения или звука. Способ кодирования изображения, использующий DCT, касается выполнения DCT над изображением в пиксельной области, формирующего дискретные косинусные коэффициенты, квантования сформированных дискретных косинусных коэффициентов и выполнения энтропийного кодирования над сформированными дискретными косинусными коэффициентами.In order to perform image compression, most image encoding and decoding methods and devices encode the image by converting the image in the pixel domain into frequency-domain coefficients. Discrete cosine transform (DCT), which is one of the techniques of frequency conversion, is a well-known technique that is widely used in image or sound compression. An image coding method using DCT concerns performing a DCT on an image in a pixel region generating discrete cosine coefficients, quantizing the generated discrete cosine coefficients, and performing entropy coding on the generated discrete cosine coefficients.

Сущность изобретенияSUMMARY OF THE INVENTION

Решение задачиThe solution of the problem

Примерные варианты осуществления предоставляют способ и устройство для кодирования и декодирования изображения при помощи более эффективного дискретного косинусного преобразования (DCT), а так же предоставляют машиночитаемый носитель записи с записанной на нем программой для исполнения способа. Полезные результаты изобретенияExemplary embodiments provide a method and apparatus for encoding and decoding an image using a more efficient discrete cosine transform (DCT), and also provide a computer-readable recording medium with a program recorded thereon for executing the method. Useful Results of the Invention

В соответствии с одним или более примерными вариантами осуществления существует возможность установить единицу преобразования так, чтобы она была крупнее единицы предсказания, и выполнить DCT таким образом, чтобы изображение было эффективно сжато и закодировано.According to one or more exemplary embodiments, it is possible to set the transform unit to be larger than the prediction unit, and perform the DCT so that the image is efficiently compressed and encoded.

Краткое описание чертежейBrief Description of the Drawings

Вышеприведенные и прочие признаки примерных вариантов осуществления станут более очевидны из описания их примерных вариантов осуществления со ссылкой на прилагаемые чертежи, в которых:The above and other features of exemplary embodiments will become more apparent from the description of their exemplary embodiments with reference to the accompanying drawings, in which:

Фиг. 1 является блок-схемой устройства кодирования изображения в соответствии с примерным вариантом осуществления;FIG. 1 is a block diagram of an image encoding apparatus in accordance with an exemplary embodiment;

Фиг. 2 является схемой устройства декодирования изображения в соответствии с другим примерным вариантом осуществления;FIG. 2 is a diagram of an image decoding apparatus in accordance with another exemplary embodiment;

Фиг. 3 является схемой иерархической единицы кодирования в соответствии с другим примерным вариантом осуществления;FIG. 3 is a diagram of a hierarchical coding unit in accordance with another exemplary embodiment;

Фиг. 4 является блок-схемой кодера изображения основанного на единице кодирования в соответствии с другим примерным вариантом осуществления;FIG. 4 is a block diagram of a unit-based encoding image encoder in accordance with another exemplary embodiment;

Фиг. 5 является блок-схемой декодера изображения основанного на единице кодирования в соответствии с другим примерным вариантом осуществления;FIG. 5 is a block diagram of a unit-based encoding image decoder in accordance with another exemplary embodiment;

Фиг. 6 иллюстрирует максимальную единицу кодирования, суб-единицы кодирования, и единицы предсказания в соответствии с другим примерным вариантом осуществления;FIG. 6 illustrates a maximum coding unit, coding sub-unit, and prediction unit in accordance with another exemplary embodiment;

Фиг. 7 является схемой единицы кодирования и единицы преобразования в соответствии с другим примерным вариантом осуществления;FIG. 7 is a diagram of a coding unit and a conversion unit in accordance with another exemplary embodiment;

Фиг. 8a и 8b иллюстрируют формы разделения максимальной единицы кодирования, единицы предсказания и единицы преобразования в соответствии с другим примерным вариантом осуществления;FIG. 8a and 8b illustrate separation forms of a maximum coding unit, a prediction unit, and a conversion unit in accordance with another exemplary embodiment;

Фиг. 9 является блок-схемой устройства кодирования изображения в соответствии с другим примерным вариантом осуществления;FIG. 9 is a block diagram of an image encoding apparatus in accordance with another exemplary embodiment;

Фиг. 10 является схемой модуля преобразования;FIG. 10 is a diagram of a conversion module;

Фиг. 11a-11c иллюстрируют типы единиц преобразования в соответствии с другим примерным вариантом осуществления;FIG. 11a-11c illustrate types of conversion units in accordance with another exemplary embodiment;

Фиг. 12 иллюстрирует разные единицы преобразования в соответствии с другим примерным вариантом осуществления;FIG. 12 illustrates various conversion units in accordance with another exemplary embodiment;

Фиг. 13 является блок-схемой устройства декодирования изображения в соответствии с другим примерным вариантом осуществления; иFIG. 13 is a block diagram of an image decoding apparatus in accordance with another exemplary embodiment; and

Фиг. 14 является блок-схемой последовательности операций способа кодирования изображения, в соответствии с примерным вариантом осуществления.FIG. 14 is a flowchart of an image encoding method in accordance with an exemplary embodiment.

Фиг. 15 является блок-схемой последовательности операций способа декодирования изображения, в соответствии с другим примерным вариантом осуществления.FIG. 15 is a flowchart of an image decoding method in accordance with another exemplary embodiment.

Раскрытие изобретенияDisclosure of invention

В соответствии с аспектом примерного варианта осуществления изобретения, предложен способ кодирования изображения, включающий в себя операции, на которых задают единицу преобразования посредством выбора множества соседних единиц предсказания, преобразуют множество соседних единиц предсказания в частотную область в соответствии с единицей преобразования, формируют коэффициенты частотных составляющих, квантуют коэффициенты частотных составляющих и выполняют энтропийное кодирование над квантованными коэффициентами частотных составляющих.In accordance with an aspect of an exemplary embodiment of the invention, there is provided a method for encoding an image, including operations that specify a transform unit by selecting a plurality of neighboring prediction units, convert a plurality of neighboring prediction units into a frequency domain in accordance with a transform unit, generate frequency component coefficients, quantize the coefficients of the frequency components and perform entropy coding on the quantized coefficients of the frequency components Awlavers.

Операция, на которой задают единицу преобразования, может выполняться на основании глубины, указывающей степень уменьшения размера, которое постепенно происходит от максимальной единицы кодирования текущей последовательности макроблоков или текущего кадра до суб-единицы кодирования, содержащей множество соседних единиц предсказания.The operation at which the conversion unit is specified may be performed based on the depth indicating the degree of size reduction that gradually occurs from the maximum coding unit of the current macroblock sequence or current frame to a sub-coding unit containing a plurality of neighboring prediction units.

Операция, на которой задают единицу преобразования, может выполняться посредством выбора множества соседних единиц предсказания, над которыми предсказание выполняется в соответствии с одинаковым режимом предсказания.The operation on which the conversion unit is specified can be performed by selecting a plurality of neighboring prediction units over which the prediction is performed in accordance with the same prediction mode.

Одинаковым режимом предсказания может быть режим интер (inter)-предсказания или режим интра (intra)-предсказания.The same prediction mode can be an inter (inter) prediction mode or an intra (intra) prediction mode.

Способ кодирования изображения может дополнительно включать в себя операцию, на которой задают оптимальную единицу преобразования посредством повторяющегося выполнения вышеупомянутых операций над разными единицами преобразования, при этом вышеупомянутые операции включают в себя операции, на которых задают единицу преобразования посредством выбора множества соседних единиц предсказания, преобразуют множество соседних единиц предсказания в частотную область в соответствии с единицей преобразования и формируют коэффициенты частотных составляющих, квантуют коэффициенты частотных составляющих и выполняют энтропийное кодирование над квантованными коэффициентами частотных составляющих.The image encoding method may further include an operation in which an optimal conversion unit is set by repeatedly performing the above operations on different conversion units, while the above operations include operations in which the conversion unit is set by selecting a plurality of neighboring prediction units, transforming a plurality of neighboring ones units of prediction in the frequency domain in accordance with the unit of conversion and form coefficients often GOVERNMENTAL components of frequency components quantized coefficients and performing entropy coding on the quantized coefficients of the frequency components.

В соответствии с другим аспектом примерного варианта осуществления, предложено устройство кодирования изображения, включающее в себя модуль преобразования для задания единицы преобразования посредством выбора множества соседних единиц предсказания, преобразования множества соседних единиц предсказания в частотную область в соответствии с единицей преобразования и формирования коэффициентов частотных составляющих, модуль квантования для квантования коэффициентов частотных составляющих и модуль энтропийного кодирования для выполнения энтропийного кодирования над квантованными коэффициентами частотных составляющих.In accordance with another aspect of an exemplary embodiment, there is provided an image encoding apparatus including a transform unit for setting a transform unit by selecting a plurality of neighboring prediction units, converting a plurality of neighboring prediction units to a frequency domain in accordance with a transform unit, and generating frequency component coefficients, a module quantization to quantize the coefficients of the frequency components and the entropy coding module for ying entropy coding on the quantized coefficients of the frequency components.

В соответствии с другим аспектом примерного варианта осуществления предложен способ декодирования изображения, включающий в себя операции, на которых выполняют энтропийное декодирование коэффициентов частотных составляющих, которые сформированы посредством преобразования в частотную область в соответствии с единицей преобразования, выполняют обратное квантование коэффициентов частотных составляющих, выполняют обратное преобразование коэффициентов частотных составляющих в пиксельную область и воссоздают множество соседних единиц предсказания, содержащихся в единице преобразования.In accordance with another aspect of an exemplary embodiment, there is provided a method for decoding an image, including operations that perform entropy decoding of the coefficients of the frequency components that are generated by conversion to the frequency domain in accordance with the conversion unit, inverse quantization of the coefficients of the frequency components, perform the inverse transformation coefficients of the frequency components in the pixel region and recreate many neighboring units facing the predictions contained in the conversion unit.

В соответствии с другим аспектом примерного варианта осуществления предложено устройство декодирования изображения, включающее в себя энтропийный декодер для выполнения энтропийного декодирования коэффициентов частотных составляющих, которые сформированы посредством преобразования в частотную область в соответствии с единицей преобразования, модуль обратного квантования для обратного квантования коэффициентов частотных составляющих в пиксельную область и воссоздания множества соседних единиц предсказания, содержащихся в единице преобразования.In accordance with another aspect of an exemplary embodiment, there is provided an image decoding apparatus including an entropy decoder for performing entropy decoding of frequency component coefficients that are generated by conversion to a frequency domain in accordance with a conversion unit, an inverse quantization module for inverse quantization of frequency component coefficients into a pixel area and recreation of the set of neighboring prediction units contained in a single Its conversion.

В соответствии с другим аспектом примерного варианта осуществления предоставляется машиночитаемый носитель записи с записанной на нем программой для исполнения способов кодирования и декодирования изображения.In accordance with another aspect of an exemplary embodiment, a computer-readable recording medium with a program recorded thereon for executing image encoding and decoding methods is provided.

Осуществление изобретенияThe implementation of the invention

Далее со ссылкой на прилагаемые чертежи будут подробно описаны примерные варианты осуществления. В примерных вариантах осуществления, понятие «единица» может относиться, а может и не относиться к единичному блоку некоторого размера, в зависимости от контекста, в котором оно используется, а понятие «изображение» может обозначать неподвижное изображение (кадр), применительно к видео, или подвижное изображение, то есть само видео.Next, with reference to the accompanying drawings, exemplary embodiments will be described in detail. In exemplary embodiments, the concept of “unit” may or may not refer to a unit block of a certain size, depending on the context in which it is used, and the concept of “image” may mean a still image (frame) as applied to video, or a moving image, i.e. the video itself.

Фиг. 1 является блок-схемой устройства 100 для кодирования изображения, в соответствии с примерным вариантом осуществления.FIG. 1 is a block diagram of an image encoding apparatus 100, in accordance with an exemplary embodiment.

Согласно Фиг. 1, устройство 100 включает в себя модуль 110 разделения на максимальные единицы кодирования, модуль 120 определения глубины кодирования, кодер 130 данных изображения и кодер 140 информации кодирования.According to FIG. 1, apparatus 100 includes a maximum coding unit dividing unit 110, an encoding depth determining unit 120, an image data encoder 130 and an encoding information encoder 140.

Модуль 110 разделения на максимальные единицы кодирования может выполнять разделение текущего кадра или последовательности макроблоков на основе максимальной единицы кодирования, которая является единицей кодирования наибольшего размера. То есть модуль 110 разделения на максимальные единицы кодирования может выполнять разделение текущего кадра или последовательности макроблоков для получения по меньшей мере одной максимальной единицы кодирования.The maximum coding unit division unit 110 may split the current frame or sequence of macroblocks based on the maximum coding unit, which is the largest coding unit. That is, the maximum coding unit division module 110 may split the current frame or sequence of macroblocks to obtain at least one maximum coding unit.

В соответствии с примерным вариантом осуществления, единица кодирования может быть представлена при помощи максимальной единицы кодирования и глубины. Как описано выше, максимальная единица кодирования указывает единицу кодирования с самым крупным размером среди единиц кодирования текущего кадра, а глубина указывает размер суб-единицы кодирования, полученной посредством иерархического уменьшения единицы кодирования. По мере роста глубины, единица кодирования может уменьшаться в размере от максимальной единицы кодирования до минимальной единицы кодирования, при этом глубина максимальной единицы кодирования задается как минимальная глубина, а глубина минимальной единицы кодирования задается как максимальная глубина. Поскольку размер единицы кодирования уменьшается от максимальной единицы кодирования по мере увеличения глубины, то суб-единица кодирования k-й глубины может включать в себя множество суб-единиц кодирования (k+n)-й глубины (где k и n - целые числа, равные или больше 1).According to an exemplary embodiment, a coding unit may be represented using a maximum coding unit and depth. As described above, the maximum coding unit indicates the coding unit with the largest size among the coding units of the current frame, and the depth indicates the size of the coding sub-unit obtained by hierarchically decreasing the coding unit. As the depth increases, the coding unit may decrease in size from the maximum coding unit to the minimum coding unit, while the depth of the maximum coding unit is specified as the minimum depth, and the depth of the minimum coding unit is set as the maximum depth. Since the size of the coding unit decreases from the maximum coding unit as the depth increases, the coding sub-unit of the k-th depth may include many coding sub-units of the (k + n) -th depth (where k and n are integers equal to or more 1).

По мере роста размера кадра, который должен быть закодирован, кодирование изображения в более крупных единицах кодирования может привести к более высокой степени сжатия изображения. Однако если более крупная единица кодирования фиксирована, то изображение не может быть эффективно закодировано, учитывая постоянно меняющиеся характеристики изображения.As the size of the frame to be encoded increases, encoding the image in larger coding units can lead to a higher degree of image compression. However, if a larger coding unit is fixed, then the image cannot be effectively encoded, given the ever-changing characteristics of the image.

Например, когда кодируется ровная область, такая как море или небо, то чем крупнее единица кодирования, тем выше может быть степень сжатия. Однако когда кодируется сложная область, такая как человек или здания, то чем мельче единица кодирования, тем выше может быть степень сжатия.For example, when a flat area, such as the sea or sky, is encoded, the larger the coding unit, the higher the compression ratio. However, when a complex area, such as a person or building, is encoded, the smaller the coding unit, the higher the compression ratio.

Таким образом, в соответствии с примерным вариантом осуществления, для каждого кадра или последовательности макроблоков задается разная максимальная единица кодирования изображения и разная максимальная глубина. Поскольку максимальная глубина обозначает максимальное количество раз, в которое может уменьшаться единица кодирования, то размер каждой минимальной единицы кодирования, включенной в максимальную единицу кодирования, может задаться переменно, в соответствии максимальной глубиной.Thus, in accordance with an exemplary embodiment, for each frame or sequence of macroblocks, a different maximum image encoding unit and a different maximum depth are set. Since the maximum depth indicates the maximum number of times by which the coding unit can be reduced, the size of each minimum coding unit included in the maximum coding unit can be set in accordance with the maximum depth.

Модуль 120 определения глубины кодирования определяет максимальную глубину. Максимальная глубина может определяться на основании вычисления затрат Искажения к Скорости Передачи (R-D). Максимальная глубина может определяться по-разному для каждого кадра или последовательности макроблоков или для каждой максимальной единицы кодирования. Определенная максимальная глубина предоставляется кодеру 140 информации кодирования, а данные изображения в соответствии с максимальными единицами кодирования предоставляются кодеру 130 данных изображения.The coding depth determination unit 120 determines the maximum depth. The maximum depth can be determined based on the calculation of the cost of Distortion to Transmission Rate (R-D). The maximum depth may be determined differently for each frame or sequence of macroblocks or for each maximum coding unit. A certain maximum depth is provided to the encoding information encoder 140, and image data in accordance with the maximum encoding units is provided to the image data encoder 130.

Максимальная глубина обозначает единицу кодирования с наименьшим размером, которая может быть включена в максимальную единицу кодирования, т.е. минимальную единицу кодирования. Другими словами, максимальная единица кодирования может быть разделена на суб-единицы кодирования, имеющие разные размеры, на основе разных глубин. Это более подробно описывается ниже со ссылкой на Фиг. 8А и 8В. В дополнение, суб-единицы кодирования, имеющие разные размеры, которые включены в максимальную единицу кодирования, могут предсказываться или преобразовываться на основе единиц обработки, имеющих разные размеры. Другими словами, устройство 100 может выполнять множество операций обработки для кодирования изображения на основе единиц обработки, обладающих различными размерами и различными формами. Чтобы закодировать данные изображения выполняются такие операции обработки, как предсказание, преобразование и энтропийное кодирование, при этом для каждой операции могут использоваться единицы обработки одинакового размера или для каждой операции могут использоваться единицы обработки разных размеров.The maximum depth indicates the coding unit with the smallest size that can be included in the maximum coding unit, i.e. minimum coding unit. In other words, the maximum coding unit can be divided into sub-coding units having different sizes, based on different depths. This will be described in more detail below with reference to FIG. 8A and 8B. In addition, sub-coding units having different sizes that are included in the maximum coding unit can be predicted or converted based on processing units having different sizes. In other words, the device 100 can perform many processing operations to encode an image based on processing units having different sizes and different shapes. In order to encode image data, processing operations such as prediction, transformation, and entropy coding are performed, wherein processing units of the same size may be used for each operation, or processing units of different sizes may be used for each operation.

Например, устройство 100 может выбрать для предсказания единицы кодирования единицу обработки, отличную от единицы кодирования.For example, device 100 may select a processing unit other than a coding unit to predict a coding unit.

Когда размером единицы кодирования является 2N×2N (где N - положительное целое число), единицами обработки для предсказания могут быть 2N×2N, 2N×N, N×2N и N×N. Другими словами, предсказание движения может выполняться на основе единицы обработки, имеющей форму, при которой по меньшей мере одно из высоты или ширины единицы кодирования делятся на 2 равные части. Далее, единица обработки, которая является основой для предсказания, определяется в качестве «единицы предсказания».When the size of the coding unit is 2N × 2N (where N is a positive integer), the processing units for prediction may be 2N × 2N, 2N × N, N × 2N, and N × N. In other words, motion prediction can be performed based on a processing unit having the form in which at least one of the height or width of the coding unit is divided into 2 equal parts. Further, the processing unit, which is the basis for the prediction, is defined as a “prediction unit”.

Режим предсказания может быть по меньшей мере одним из режима интра-предсказания, режима интер-предсказания и режима с пропуском, и конкретный режим предсказания может выполняться применительно только к единице предсказания конкретного размера и формы. Например, режим интра-предсказания может выполняться только применительно к единицам предсказания размером 2N×2N и N×N, форма которых является квадратом. Дополнительно, режим с пропуском может выполняться только применительно к единице предсказания размером 2N×2N. Если в единице кодирования существует множество единиц предсказания, то после выполнения предсказания для каждой единицы предсказания может выбираться режим предсказания с наименьшими ошибками кодирования.The prediction mode may be at least one of an intra-prediction mode, an inter-prediction mode, and a skip mode, and a specific prediction mode may be performed for only a prediction unit of a specific size and shape. For example, the intra prediction mode can only be performed with respect to prediction units of size 2N × 2N and N × N, the shape of which is a square. Additionally, the skip mode can only be performed on a 2N × 2N prediction unit. If there are many prediction units in a coding unit, then after performing a prediction, a prediction mode with the smallest coding errors can be selected for each prediction unit.

В качестве альтернативы, устройство 100 может выполнять частотное преобразование над данными изображения на основании единиц обработки, имеющих размер, отличный от единицы кодирования. Применительно к частотному преобразованию в единице кодирования, частотное преобразование может выполняться на основании единицы обработки, имеющей размер равный или мельче размера единицы кодирования. Далее, единица обработки, которая является основой для частотного преобразования, определяется в качестве «единицы преобразования». Частотное преобразование может быть Дискретным Косинусным Преобразованием (DCT) или Преобразованием Карунена-Лоэва (KLT).Alternatively, device 100 may perform frequency conversion on image data based on processing units having a size other than the encoding unit. As applied to frequency conversion in a coding unit, frequency conversion can be performed based on a processing unit having a size equal to or smaller than the size of the coding unit. Further, the processing unit, which is the basis for the frequency conversion, is defined as a “conversion unit”. The frequency transform may be a Discrete Cosine Transform (DCT) or a Karunen-Loeve Transform (KLT).

Модуль 120 определения глубины кодирования может определять суб-единицу кодирования, включенную в максимальную единицу кодирования, при помощи оптимизации RD, основанной на множителе Лагранжа. Другими словами, модуль 120 определения глубины кодирования может определять формы множества суб-единиц кодирования, полученных путем разделения максимальной единицы кодирования, при этом множество суб-единиц кодирования имеют разные размеры в соответствии с их глубинами. Кодер 130 данных изображения выдает битовый поток посредством кодирования максимальной единицы кодирования на основании форм разделения, т.е. форм, которые разделяют максимальную единицу кодирования, как определено модулем 120 определения глубины кодирования.The coding depth determination unit 120 may determine a coding sub-unit included in the maximum coding unit using RD optimization based on the Lagrange multiplier. In other words, the coding depth determining unit 120 may determine the shapes of the plurality of coding sub-units obtained by dividing the maximum coding unit, the plurality of coding sub-units having different sizes according to their depths. The image data encoder 130 provides a bitstream by encoding a maximum coding unit based on separation forms, i.e. forms that share the maximum coding unit, as determined by the coding depth determining unit 120.

Кодер 140 информации кодирования кодирует информацию о режиме кодирования максимальной единицы кодирования определенном посредством модуля 120 определения глубины кодирования. Другими словами, кодер 140 информации кодирования выдает битовый поток посредством кодирования информации о форме разделения максимальной единицы кодирования, информации о максимальной глубине и информации о режиме кодирования суб-единиц кодирования применительно к каждой глубине. Информация о режиме кодирования суб-единицы кодирования может включать в себя информацию о единице предсказания суб-единицы кодирования, информацию о режиме предсказания для каждой единицы предсказания и информацию о единице преобразования суб-единицы кодирования.The coding information encoder 140 encodes coding mode information of a maximum coding unit determined by the coding depth determining unit 120. In other words, the encoding information encoder 140 provides a bitstream by encoding information on a separation form of a maximum encoding unit, maximum depth information, and information on an encoding mode of sub-encoding units with respect to each depth. Information about the encoding mode of the sub-coding unit may include information about the prediction unit of the sub-coding unit, information about the prediction mode for each prediction unit, and information about the conversion unit of the sub-coding unit.

Поскольку в каждой максимальной единице кодирования присутствуют суб-единицы кодирования разных размеров, а информация о режиме кодирования должна быть определена для каждой суб-единицы кодирования, то для одной максимальной единицы кодирования может быть определена информация о по меньшей мере одном режиме кодирования.Since sub-coding units of different sizes are present in each maximum coding unit, and coding mode information must be determined for each coding sub-unit, information for at least one coding mode can be determined for one maximum coding unit.

Устройство 100 может формировать суб-единицы кодирования посредством разделения поровну как высоты, так и ширины максимальной единицы кодирования на два в соответствии ростом глубины. То есть, когда размером единицы кодирования k-ой глубины является 2N×2N, то размером единицы кодирования (k+1)-ой глубины является N×N.The device 100 can generate sub-units of coding by dividing equally both the height and the width of the maximum coding unit into two in accordance with increasing depth. That is, when the size of the coding unit of the kth depth is 2N × 2N, then the size of the coding unit of the (k + 1) depth is N × N.

Таким образом, устройство 100 в соответствии с примерным вариантом осуществления может определять оптимальную форму разделения для каждой максимальной единицы кодирования на основании размеров максимальных единиц кодирования и максимальной глубине, учитывая характеристики изображения. Посредством переменной регулировки размера максимальной единицы кодирования с учетом характеристик изображения и кодирования изображения посредством разделения максимальной единицы кодирования на суб-единицы кодирования разных глубин, могут более эффективно кодироваться изображения различных разрешений.Thus, the device 100 in accordance with an exemplary embodiment can determine the optimal separation form for each maximum coding unit based on the sizes of the maximum coding units and maximum depth, taking into account image characteristics. By varying the size adjustment of the maximum coding unit taking into account image characteristics and image coding by dividing the maximum coding unit into sub-coding units of different depths, images of different resolutions can be more efficiently encoded.

Фиг. 2 является блок-схемой устройства 200 для декодирования изображения в соответствии с примерным вариантом осуществления.FIG. 2 is a block diagram of an apparatus 200 for decoding an image in accordance with an exemplary embodiment.

Согласно Фиг. 2 устройство 200 включает в себя модуль 210 получения данных изображения, модуль 220 извлечения информации кодирования и декодер 230 данных изображения.According to FIG. 2, the device 200 includes an image data acquiring module 210, an encoding information extraction module 220, and an image data decoder 230.

Модуль 210 получения данных изображения получает данные изображения на основе максимальных единиц кодирования, посредством анализа битового потока, принимаемого устройством 200, и выдает данные изображения декодеру 230 данных изображения. Модуль 210 получения данных изображения может извлекать информацию о максимальной единице кодирования текущего кадра или последовательности макроблоков из заголовка текущего кадра или последовательности макроблоков. Другими словами, модуль 210 получения данных изображения разделяет битовый поток на максимальные единицы кодирования таким образом, что декодер 230 данных изображения может декодировать данные изображения на основе максимальных единиц кодирования.The image data acquiring unit 210 obtains image data based on the maximum coding units by analyzing the bitstream received by the device 200, and provides image data to the image data decoder 230. The image data acquiring unit 210 may extract information about a maximum coding unit of a current frame or a sequence of macroblocks from a header of a current frame or a sequence of macroblocks. In other words, the image data acquisition unit 210 splits the bitstream into maximum coding units such that the image data decoder 230 can decode the image data based on the maximum coding units.

Модуль 220 извлечения информации кодирования посредством анализа битового потока, принятого устройством 200, извлекает из заголовка текущего кадра информацию о максимальной единице кодирования, максимальной глубине, форме разделения максимальной единицы кодирования, режиме кодирования суб-единиц кодирования. Информация о форме разделения и информация о режиме кодирования предоставляются декодеру 230 данных изображения.The encoding information extraction unit 220, by analyzing the bitstream received by the device 200, extracts information on the maximum encoding unit, maximum depth, separation form of the maximum encoding unit, and encoding mode of the sub-encoding units from the header of the current frame. Separation form information and encoding mode information are provided to the image data decoder 230.

Информация о форме разделения максимальной единицы кодирования может включать в себя информацию о суб-единицах кодирования, имеющих разные размеры на основе глубин, включенных в максимальную единицу кодирования, а информация о режиме кодирования может включать в себя информацию о единице предсказания на основе суб-единиц кодирования, информацию о режиме предсказания и информацию о единицах преобразования.Information about the separation form of the maximum coding unit may include information about sub-coding units having different sizes based on depths included in the maximum coding unit, and information about the encoding mode may include information about the prediction unit based on sub-coding units , prediction mode information and conversion unit information.

Декодер 230 данных изображения восстанавливает текущий кадр посредством декодирования данных изображения каждой максимальной единицы кодирования на основании информации, извлеченной модулем 220 извлечения информации кодирования. Декодер 230 данных изображения может декодировать суб-единицы кодирования, включенные в максимальную единицу кодирования, на основании информации о форме разделения максимальной единицы кодирования. Процесс декодирования может включать в себя процесс предсказания, включая интра-предсказание и компенсацию движения, и процесс обратного преобразования.The image data decoder 230 restores the current frame by decoding the image data of each maximum coding unit based on information extracted by the coding information extraction unit 220. The image data decoder 230 may decode the coding sub-units included in the maximum coding unit based on the separation form information of the maximum coding unit. The decoding process may include a prediction process, including intra prediction and motion compensation, and an inverse transformation process.

Декодер 230 данных изображения выполняет интра-предсказание или интер-предсказание на основе информации о единице предсказания и информации о режиме предсказания для того, чтобы предсказать единицу предсказания. Декодер 230 данных изображения так же может выполнять обратное преобразование для каждой суб-единицы кодирования на основании информации о единице преобразования суб-единицы кодирования.The image data decoder 230 performs intra prediction or inter prediction based on the prediction unit information and the prediction mode information in order to predict the prediction unit. The image data decoder 230 may also perform the inverse transform for each coding sub-unit based on the coding sub-unit conversion unit information.

Фиг. 3 иллюстрирует иерархические единицы кодирования в соответствии с примерным вариантом осуществления.FIG. 3 illustrates hierarchical coding units in accordance with an exemplary embodiment.

Согласно Фиг. 3 иерархические единицы кодирования в соответствии с примерным вариантом осуществления могут включатьAccording to FIG. 3 hierarchical coding units in accordance with an exemplary embodiment may include

в себя единицы кодирования, чьи ширина х высоту составляют 64×64, 32×32, 16×16, 8×8, и 4×4. Кроме этих единиц кодирования с полностью квадратной формой, могут существовать единицы кодирования, у которых ширина на высоту составляют 64×32, 32×64, 32×16, 16×32, 16×8, 8×16, 8×4 и 4×8.encoding units whose width x height are 64 × 64, 32 × 32, 16 × 16, 8 × 8, and 4 × 4. In addition to these coding units with a fully square shape, coding units may exist in which the width to height is 64 × 32, 32 × 64, 32 × 16, 16 × 32, 16 × 8, 8 × 16, 8 × 4 and 4 × 8.

Согласно Фиг. 3 для данных 310 изображения, для которых разрешение составляет 1920×1080, размер максимальной единицы кодирования установлен как 64×64, а максимальная глубина задается как 2.According to FIG. 3 for image data 310 for which the resolution is 1920 × 1080, the size of the maximum coding unit is set to 64 × 64, and the maximum depth is set to 2.

Для данных 320 изображения, для которых разрешение составляет 1920×1080, размер максимальной единицы кодирования установлен как 64×64, а максимальная глубина задается как 4. Для данных 330 изображения, для которых разрешение составляет 352×288, размер максимальной единицы кодирования установлен как 16×16, а максимальная глубина задается как 1.For image data 320, for which the resolution is 1920 × 1080, the maximum encoding unit size is set to 64 × 64, and the maximum depth is set to 4. For image data 330, for which the resolution is 352 × 288, the maximum encoding unit size is set to 16 × 16, and the maximum depth is set to 1.

Когда разрешение высокое или велик объем данных, предпочтительно, но не обязательно, чтобы максимальный размер единицы кодирования был относительно крупным для увеличения степени сжатия и точного отображения характеристик изображения. Соответственно, применительно к данным 310 и 320 изображения с разрешением выше, чем у данных 330 изображения, в качестве размера максимальной единицы кодирования может быть выбран размер 64×64.When the resolution is high or a large amount of data, it is preferable, but not necessary, that the maximum size of the coding unit is relatively large to increase the compression ratio and accurately display the image characteristics. Accordingly, with respect to image data 310 and 320 with a resolution higher than that of image data 330, a size of 64 × 64 may be selected as the size of the maximum coding unit.

Максимальная глубина указывает суммарное количество уровней в иерархических единицах кодирования. Поскольку максимальная глубина данных 310 изображения составляет 2, то единица 315 кодирования данных 310 изображения может включать в себя максимальную единицу кодирования, у которой размер по большей оси составляет 64, и суб-единицы кодирования, у которой размеры по большей оси составляют 32 и 16, в соответствии с увеличением глубины.Maximum depth indicates the total number of levels in hierarchical coding units. Since the maximum depth of the image data 310 is 2, the encoding unit 315 of the image data 310 may include a maximum encoding unit with a dimension along the major axis of 64 and sub-units of encoding with dimensions along the major axis of 32 and 16, in accordance with the increase in depth.

С другой стороны, поскольку максимальная глубина данных 330 изображения составляет 1, то единица 335 кодирования данных 330 изображения может включать в себя максимальную единицу кодирования, у которой размер по большей оси составляет 16, и единицы кодирования, у которой размеры по большей оси составляют 8, в соответствии с увеличением глубины.On the other hand, since the maximum depth of the image data 330 is 1, the encoding unit 335 of the image data 330 may include a maximum encoding unit with a dimension along the major axis of 16, and an encoding unit with dimensions along the major axis of 8, in accordance with the increase in depth.

Однако поскольку максимальная глубина данных 320 изображения составляет 4, единица 325 кодирования данных 320 изображения может включать в себя максимальную единицу кодирования, для которой размер по большей оси составляет 64, и суб-единицы кодирования, для которых размеры по большей оси составляют 32, 16, 8 и 4, в соответствии с увеличением глубины. Поскольку с увеличением глубины изображение кодируется на основе более мелких суб-единиц кодирования, то характерный вариант осуществления применим для кодирования изображения, включающего сцены с более мелкими деталями.However, since the maximum depth of the image data 320 is 4, the coding unit 325 of the image data 320 may include a maximum coding unit for which the size along the major axis is 64, and sub-coding units for which the sizes along the major axis are 32, 16, 8 and 4, in accordance with the increase in depth. Since, with increasing depth, the image is encoded based on smaller coding sub-units, a typical embodiment is applicable for encoding an image including scenes with finer details.

Фиг. 4 является блок-схемой кодера 400 изображения на основании единицы кодирования, в соответствии с примерным вариантом осуществления.FIG. 4 is a block diagram of an image encoder 400 based on a coding unit, in accordance with an exemplary embodiment.

Средство (предиктор) 410 интра-предсказания выполняет интра-предсказание в отношении единиц предсказания режима интра-предсказания в текущем кадре 405, а модуль 420 оценки движения и модуль 425 компенсации движения выполняют интер-предсказание и компенсацию движения в отношении единиц кодирования режима интер-предсказания, используя текущий кадр 405 и опорный кадр 495.The intra prediction tool (predictor) 410 performs intra prediction on the prediction units of the intra prediction mode in the current frame 405, and the motion estimation module 420 and the motion compensation module 425 perform inter prediction and motion compensation on the inter prediction coding units using the current frame 405 and the reference frame 495.

Значения остатка формируются на основе единиц предсказания, выдаваемых средством 410 интра-предсказания, модулем 420 оценки движения и модулем 426 компенсации движения, и сформированные значения остатка выдаются в качестве квантованных коэффициентов преобразования посредством прохода через модуль 430 преобразования и модуль 440 квантования.The remainder values are generated based on the prediction units provided by the intra prediction means 410, the motion estimation unit 420 and the motion compensation unit 426, and the generated remainder values are output as quantized transform coefficients by passing through the transform unit 430 and the quantization unit 440.

Квантованные коэффициенты преобразования восстанавливаются до значений остатка посредством прохода через модуль 460 обратного квантования и модуль 470 обратного частотного преобразования, и восстановленные значения остатка подвергаются постобработке посредством прохода через модуль 480 удаления блочности и модуль 490 низкочастотной фильтрации и выдаются в качестве опорного кадра 495. Квантованные коэффициенты преобразования могут выводиться в качестве битового потока 455 посредством прохода через энтропийный кодер 450.The quantized transform coefficients are reconstructed to remainder values by passing through the inverse quantization unit 460 and the inverse frequency transform unit 470, and the reconstructed residual values are post-processed by passing through the deblocking unit 480 and the low-pass filtering unit 490 and output as a reference frame 495. The quantized transform coefficients can be output as bitstream 455 by passing through an entropy encoder 450.

Для выполнения кодирования, основанного на способе кодирования в соответствии с примерным вариантом осуществления, компоненты кодера 400 изображения, т.е. средство 410 интра-предсказания, модуль 420 оценки движения, модуль 425 компенсации движения, модуль 430 преобразования, модуль 440 квантования, энтропийный кодер 450, модуль 460 обратного квантования, модуль 470 обратного частотного преобразования, модуль 480 удаления блочности и модуль 490 низкочастотной фильтрации, выполняют процессы кодирования на основании максимальной единицы кодирования, суб-единицы кодирования на основе глубин, единицы предсказания и единицы преобразования.To perform encoding based on the encoding method in accordance with an exemplary embodiment, the components of the image encoder 400, i.e. intra prediction means 410, motion estimation module 420, motion compensation module 425, transform module 430, quantization module 440, entropy encoder 450, inverse quantization module 460, inverse frequency transform module 470, blocking removal module 480, and low-pass filtering module 490, encoding processes based on the maximum coding unit, depth coding sub-unit, prediction unit and conversion unit.

Фиг. 5 является блок-схемой декодера 500 изображения, основанного на единице кодирования, в соответствии с примерным вариантом осуществления.FIG. 5 is a block diagram of a coding unit based image decoder 500 in accordance with an exemplary embodiment.

Битовый поток 505 проходит через модуль 510 анализа, чтобы проанализировать закодированные данные изображения, которые должны быть декодированы, и информацию кодирования, необходимую для декодирования. Закодированные данные изображения выдаются в качестве обратно квантованных данных посредством прохода через энтропийный декодер 520 и модуль 530 обратного квантования, и восстанавливаются до значений остатка посредством прохода через модуль 540 обратного частотного преобразования. Значения остатка восстанавливаются на основе единиц кодирования посредством сложения с результатом интра-предсказания средства 550 интра-предсказания или результатом компенсации движения модуля 560 компенсации движения. Восстановленные единицы кодирования используются для предсказания следующих единиц кодирования или следующего кадра посредством прохода через модуль 570 удаления блочности и модуль 580 низкочастотной фильтрации.Bitstream 505 passes through an analysis module 510 to analyze the encoded image data to be decoded and the encoding information necessary for decoding. The encoded image data is output as inverse quantized data by passing through an entropy decoder 520 and an inverse quantization module 530, and is restored to residual values by passing through an inverse frequency conversion module 540. The residual values are restored based on the coding units by adding the intra-prediction means 550 or the result of the motion compensation of the motion compensation module 560 with the result of the intra-prediction. The reconstructed coding units are used to predict the next coding units or the next frame by passing through the deblocking unit 570 and the low-pass filtering unit 580.

Для выполнения декодирования, основанного на способе декодирования в соответствии с примерным вариантом осуществления, компоненты декодера 500 изображения, т.е., модуль 510 анализа, энтропийный декодер 520, модуль 530 обратного квантования, модуль 540 обратного частотного преобразования, средство 550 интра-предсказания, модуль 560 компенсации движения, модуль 570 удаления блочности и модуль 580 низкочастотной фильтрации, выполняют процессы декодирования изображения на основании максимальной единицы кодирования, суб-единицы кодирования на основе глубин, единицы предсказания, и единицы преобразования.To perform decoding based on the decoding method in accordance with an exemplary embodiment, the components of the image decoder 500, i.e., analysis module 510, entropy decoder 520, inverse quantization module 530, inverse frequency conversion module 540, intra prediction means 550, motion compensation module 560, deblocking module 570, and low-pass filtering module 580, perform image decoding processes based on the maximum coding unit, sub-coding unit based on g Ubin, prediction units, and transformation units.

В частности, средство 550 интра-предсказания и модуль 560 компенсации движения определяют единицу предсказания и режим предсказания в суб-единице кодирования, принимая во внимание максимальную единицу кодирования и глубину, а модуль 540 обратного частотного преобразования выполняет обратное преобразование, принимая во внимание размер единицы преобразования.In particular, the intra prediction means 550 and the motion compensation module 560 determine the prediction unit and the prediction mode in the sub-coding unit, taking into account the maximum coding unit and the depth, and the inverse frequency conversion module 540 performs the inverse conversion, taking into account the size of the conversion unit .

Фиг. 6 иллюстрирует максимальную единицу кодирования, суб-единицу кодирования, и единицу предсказания в соответствии с примерным вариантом осуществления.FIG. 6 illustrates a maximum coding unit, a sub-coding unit, and a prediction unit in accordance with an exemplary embodiment.

Устройство 100 и устройство 200 в соответствии с примерным вариантом осуществления используют иерархические единицы кодирования для выполнения кодирования и декодирования, учитывая характеристики изображения. Максимальная единица кодирования и максимальная глубина могут адаптивно задаться в соответствии с характеристиками изображения, или переменно задаться в соответствии с требованиями пользователя.The device 100 and the device 200 in accordance with an exemplary embodiment use hierarchical coding units to perform encoding and decoding, taking into account image characteristics. The maximum coding unit and maximum depth can be adaptively set in accordance with the characteristics of the image, or variably set in accordance with the requirements of the user.

Иерархическая структура 600 единиц кодирования в соответствии с примерным вариантом осуществления иллюстрирует максимальную единицу 610 кодирования, чья высота и ширина составляют 64, а максимальная глубина составляет 4. Глубина растет вдоль вертикальной оси иерархической структуры 600 единиц кодирования, и по мере роста глубины, уменьшаются высота и ширина суб-единиц с 620 по 650 кодирования. Единицы предсказания максимальной единицы 610 кодирования и суб-единиц с 620 по 650 кодирования показаны вдоль горизонтальной оси иерархической структуры 600 единиц кодирования.The hierarchical structure 600 of coding units in accordance with an exemplary embodiment illustrates a maximum coding unit 610 whose height and width are 64 and the maximum depth is 4. The depth grows along the vertical axis of the hierarchical structure 600 coding units, and as the depth increases, the height decreases and width of sub-units from 620 to 650 coding. Prediction units of a maximum coding unit 610 and sub-units 620 to 650 coding are shown along the horizontal axis of the hierarchical structure of 600 coding units.

Максимальная единица 610 кодирования имеет глубину 0 и размер единицы кодирования, т.е. высоту и ширину, размером 64×64. Глубина растет вдоль вертикальной оси, и присутствуют: суб-единица 620 кодирования, размер которой составляет 32×32, а глубина равна 1; суб-единица 630 кодирования, размер которой составляет 16×16, а глубина равна 2; суб-единица 640 кодирования, размер которой составляет 8×8, а глубина равна 3; и суб-единица 640 кодирования, размер которой составляет 4×4, а глубина равна 4. Суб-единица 650 кодирования, размер которой составляет 4×4, а глубина равна 4, является минимальной единицей кодирования, и минимальная единица кодирования может быть разделена на единицы предсказания, каждая из которых мельче минимальной единицы кодирования.The maximum coding unit 610 has a depth of 0 and a coding unit size, i.e. height and width, 64 × 64 in size. The depth grows along the vertical axis, and there are: a coding sub-unit 620, the size of which is 32 × 32, and the depth is 1; coding sub-unit 630, the size of which is 16 × 16 and the depth is 2; sub-unit 640 coding, the size of which is 8 × 8, and the depth is 3; and a sub-unit 640 of coding, the size of which is 4 × 4 and a depth of 4. A sub-unit 650 of coding, which is 4 × 4 and a depth of 4, is the minimum coding unit, and the minimum coding unit can be divided into prediction units, each of which is smaller than the minimum coding unit.

Согласно Фиг. 6 примеры единицы предсказания показаны вдоль горизонтальной оси в соответствии с каждой глубиной. То есть, единицей предсказания максимальной единицы 610 кодирования, глубина которой равна 0, может быть единица предсказания, размер которой равен единице 610 кодирования, т.е., 64×64, или единица 612 предсказания, размер которой составляет 64×32, единица 614 предсказания, размер которой составляет 32×64, или единица 616 предсказания, размер которой составляет 32×32, которые имеют размер мельче единицы 610 кодирования, размер которой составляет 64×64.According to FIG. 6, examples of a prediction unit are shown along a horizontal axis in accordance with each depth. That is, the prediction unit of the maximum coding unit 610, the depth of which is 0, can be a prediction unit whose size is equal to a coding unit 610, i.e., 64 × 64, or a prediction unit 612, which is 64 × 32 in size, unit 614 a prediction with a size of 32 × 64, or a prediction unit 616 with a size of 32 × 32 that are smaller than a coding unit 610 whose size is 64 × 64.

Единицей предсказания единицы 620 кодирования, глубина которой равна 1, а размер составляет 32×32, может быть единица предсказания, размер которой равен единице 620 кодирования, т.е. 32×32, или единица 622 предсказания, размер которой составляет 32×16, единица 624 предсказания, размер которой составляет 16×32, или единица 626 предсказания, размер которой составляет 16×16, которые имеют размер мельче единицы 620 кодирования, размер которой составляет 32×32.The prediction unit of the coding unit 620, the depth of which is 1 and the size is 32 × 32, may be a prediction unit whose size is equal to the coding unit 620, i.e. 32 × 32, or 322 prediction unit 622, a 16 × 32 prediction unit 624, or 16 × 16 prediction unit 626, which are smaller than the coding unit 620, which is 32 × 32.

Единицей предсказания единицы 630 кодирования, глубина которой равна 2, а размер составляет 16×16, может быть единица предсказания, размер которой равен единице 630 кодирования, т.е. 16×16, или единица 632 предсказания, размер которой составляет 16×8, единица 634 предсказания, размер которой составляет 8×16, или единица 636 предсказания, размер которой составляет 8×8, которые имеют размер мельче единицы 630 кодирования, размер которой составляет 16×16.The prediction unit of the coding unit 630, the depth of which is 2 and the size is 16 × 16, may be a prediction unit whose size is equal to the coding unit 630, i.e. 16 × 16, or a prediction unit 632 that is 16 × 8 in size, a prediction unit 634 that is 8 × 16 in size, or a prediction unit 636 that is 8 × 8 in size, which are smaller than the coding unit 630, whose size is 16 × 16.

Единицей предсказания единицы 640 кодирования, глубина которой равна 3, а размер составляет 8×8, может быть единица предсказания, размер которой равен единице 640 кодирования, т.е. 8×8, или единица 642 предсказания, размер которой составляет 8×4, единица 644 предсказания, размер которой составляет 4×8, или единица 64 6 предсказания, размер которой составляет 4×4, которые имеют размер мельче единицы 640 кодирования, размер которой составляет 8×8.The prediction unit of the coding unit 640, the depth of which is 3 and the size is 8 × 8, may be a prediction unit whose size is equal to the coding unit 640, i.e. 8 × 8, or a prediction unit 642, the size of which is 8 × 4, a prediction unit 644, the size of which is 4 × 8, or a prediction unit 64 6, the size of which is 4 × 4, which are smaller than the encoding unit 640, the size of which is 8 × 8.

В заключение, единица 650 кодирования, глубина которой равна 4, а размер составляет 4×4 является минимальной единицей кодирования и единицей кодирования максимальной глубины, а единицей предсказания единицы 650 кодирования может быть единица 650 предсказания, размер которой составляет 4×4, или единица 652 предсказания, размер которой составляет 4×2, единица 654 предсказания, размер которой составляет 2×4, или единица 656 предсказания, размер которой составляет 2×2.In conclusion, a coding unit 650 with a depth of 4 and a size of 4 × 4 is a minimum coding unit and a maximum depth coding unit, and a prediction unit of a coding unit 650 may be a 4 × 4 prediction unit or a 652 unit a prediction with a size of 4 × 2, a prediction unit 654 with a size of 2 × 4, or a prediction unit 656 with a size of 2 × 2.

Фиг. 7 иллюстрирует единицу кодирования и единицу преобразования, в соответствии с примерным вариантом осуществления.FIG. 7 illustrates a coding unit and a conversion unit, in accordance with an exemplary embodiment.

Устройство 100 и устройство 200, в соответствии с примерным вариантом осуществления, выполняют кодирование при помощи самой максимальной единицы кодирования, или при помощи суб-единиц кодирования, которые равны или мельче максимальной единицы кодирования и которые получены разделением максимальной единицы кодирования.The device 100 and device 200, in accordance with an exemplary embodiment, perform encoding using the maximum coding unit, or using sub-coding units that are equal to or smaller than the maximum coding unit and which are obtained by dividing the maximum coding unit.

В процессе кодирования размер единицы преобразования для частотного преобразования выбирается таким образом, чтобы не быть крупнее размера соответствующей единицы кодирования. Например, когда единица 710 кодирования имеет размер 64×64, то частотное преобразование может выполняться, при помощи единицы 720 преобразования, имеющей размер 32×32.In the encoding process, the size of the conversion unit for the frequency conversion is selected so as not to be larger than the size of the corresponding coding unit. For example, when the encoding unit 710 has a size of 64 × 64, then the frequency conversion can be performed using the conversion unit 720 having a size of 32 × 32.

Фиг. 8a и 8b иллюстрируют формы разделения единицы кодирования, единицы предсказания и единицы преобразования в соответствии с примерным вариантом осуществления.FIG. 8a and 8b illustrate separation forms of a coding unit, a prediction unit, and a conversion unit in accordance with an exemplary embodiment.

Фиг. 8a иллюстрирует единицу кодирования и единицу предсказания в соответствии с примерным вариантом осуществления.FIG. 8a illustrates a coding unit and a prediction unit in accordance with an exemplary embodiment.

Левая часть Фиг. 8a показывает форму разделения, выбранную устройством 100, в соответствии с примерным вариантом осуществления, чтобы кодировать максимальную единицу 810 кодирования. Устройство 100 разделяет максимальную единицу 810 кодирования на различные формы, выполняет кодирование и выбирает оптимальную форму разделения посредством сравнения результатов кодирования различных форм разделения друг с другом на основании затрат R-D. Когда оптимальным считается кодирование максимальной единицы 810 кодирования, как она есть, то максимальная единица 810 кодирования может кодироваться без разделения максимальной единицы 810 кодирования в соответствии с тем, что проиллюстрировано на Фиг. 8a и 8b.The left part of FIG. 8a shows a separation form selected by the device 100, in accordance with an exemplary embodiment, to encode the maximum coding unit 810. The device 100 divides the maximum coding unit 810 into various forms, performs coding, and selects an optimal separation form by comparing the coding results of the various separation forms with each other based on R-D costs. When encoding of the maximum coding unit 810 is considered optimal, as it is, the maximum coding unit 810 may be encoded without dividing the maximum coding unit 810 in accordance with that illustrated in FIG. 8a and 8b.

Как изображено в левой части Фиг. 8a, максимальная единица 810 кодирования, глубина которой равна 1, кодируется посредством разделения ее на суб-единицы кодирования, глубины которых равны или больше, чем 1. То есть максимальная единица 810 кодирования разделяется на 4 суб-единицы кодирования, глубина которых равна 1, и все или некоторые суб-единицы кодирования, глубины которых равны 1, разделяются на суб-единицы кодирования, глубины которых равны 2.As shown on the left side of FIG. 8a, the maximum coding unit 810, the depth of which is 1, is encoded by dividing it into sub-coding units whose depths are equal to or greater than 1. That is, the maximum coding unit 810 is divided into 4 sub-coding units whose depth is 1, and all or some coding sub-units with depths of 1 are divided into coding sub-units with depths of 2.

Суб-единица кодирования, расположенная в верхней левой части, и суб-единица кодирования, расположенная в нижней левой части, из суб-единиц кодирования, глубины которых равны 1, разделяются на суб-единицы кодирования, глубины которых равны или больше чем 2. Некоторые из суб-единиц кодирования, глубины которых равны или больше 2, могут быть разделены на суб-единицы кодирования, глубины которых равны или больше 3.The coding sub-unit located in the upper left part and the coding sub-unit located in the lower left part of coding sub-units whose depths are 1 are divided into coding sub-units whose depths are equal to or greater than 2. Some of sub-coding units whose depths are equal to or greater than 2 can be divided into sub-coding units whose depths are equal to or greater than 3.

Правая сторона Фиг. 8a показывает форму разделения единиц предсказания для максимальной единицы 810 кодирования.The right side of FIG. 8a shows a prediction unit separation form for a maximum coding unit 810.

Как изображено на правой части Фиг. 8a, единица 860 предсказания для максимальной единицы 810 кодирования может быть разделена иначе, нежели максимальная единица 810 кодирования. Другими словами, единица предсказания для каждой из суб-единиц кодирования может быть мельче, чем соответствующая суб-единица кодирования.As shown on the right side of FIG. 8a, the prediction unit 860 for the maximum coding unit 810 may be divided differently than the maximum coding unit 810. In other words, the prediction unit for each of the coding sub-units may be smaller than the corresponding coding sub-unit.

Например, единица предсказания для суб-единицы 854 кодирования, расположенной в нижней правой части, из суб-единиц кодирования, глубины которых равны 1, может быть мельче суб-единицы 854 кодирования. В дополнения, единицы предсказания для некоторых (814, 816, 850 и 852) из суб-единиц 814, 816, 818, 828, 850 и 852 кодирования, глубины которых равны 2, могут быть мельче соответствующих суб-единиц 814, 816, 850 и 852 кодирования. В дополнение, единицы предсказания для суб-единиц 822, 832 и 848 кодирования, глубины которых равны 3, могут быть мельче соответствующих суб-единиц 822, 832 и 848 кодирования. Единицы предсказания могут иметь форму, с которой соответствующие суб-единицы кодирования делятся на две равные части по высоте или ширине, или имеют форму, с которой соответствующие суб-единицы кодирования делятся на четыре равные части по высоте и ширине.For example, the prediction unit for the coding sub-unit 854 located in the lower right-hand side of the coding sub-units with depths of 1 may be smaller than the coding sub-unit 854. In addition, the prediction units for some (814, 816, 850 and 852) of the coding sub-units 814, 816, 818, 828, 850 and 852, whose depths are 2, may be smaller than the corresponding sub-units 814, 816, 850 and 852 coding. In addition, prediction units for coding sub-units 822, 832, and 848, whose depths are 3, may be smaller than the corresponding coding sub-units 822, 832, and 848. Prediction units may take the form with which the corresponding coding sub-units are divided into two equal parts in height or width, or have the form with which the corresponding coding sub-units are divided into four equal parts in height and width.

Фиг. 8b иллюстрирует единицу предсказания и единицу преобразования, в соответствии с примерным вариантом осуществления.FIG. 8b illustrates a prediction unit and a conversion unit, in accordance with an exemplary embodiment.

Левая часть Фиг. 8b показывает форму разделения единиц предсказания для максимальной единицы 810 кодирования, показанной в правой части Фиг. 8a, а правая часть Фиг. 8b показывает форму разделения единиц преобразования максимальной единицы 810 кодирования.The left part of FIG. 8b shows a separation unit prediction form for the maximum coding unit 810 shown on the right side of FIG. 8a, and the right side of FIG. 8b shows a separation unit conversion form of a maximum coding unit 810.

Как изображено на правой части Фиг. 8b, форма разделения единицы 870 преобразования может задаваться отлично от единицы 860 предсказания.As shown on the right side of FIG. 8b, the division form of the transform unit 870 may be set different from the prediction unit 860.

Например, хотя единица предсказания для единицы 854 кодирования, глубина которой равна 1, выбирается с формой, при которой высота единицы 854 кодирования делится на две равные части, единица преобразования может выбираться того же размера, что и единица 854 кодирования. Аналогично, хотя единицы предсказания для единиц 814 и 850 кодирования, глубины которых равны 2, выбраны с формой, при которой высота каждой из единиц 814 и 850 кодирования делится на две равные части, единица преобразования может выбираться того же размера, что и исходный размер каждой из единиц 814 и 850 кодирования.For example, although the prediction unit for the coding unit 854, the depth of which is 1, is selected with a shape in which the height of the coding unit 854 is divided into two equal parts, the conversion unit may be selected the same size as the coding unit 854. Similarly, although the prediction units for coding units 814 and 850, whose depths are 2, are selected with a shape in which the height of each of the coding units 814 and 850 is divided into two equal parts, the conversion unit can be selected of the same size as the original size of each from units 814 and 850 coding.

Единица преобразования может выбираться меньшего размера, чем единицы предсказания. Например, когда единица предсказания для единицы 852 кодирования, глубина которой равна 2, выбирается с формой, при которой ширина единицы 852 делится на две равные части, единица преобразования может выбираться с формой, при которой единица 852 кодирования делится на четыре равные части по высоте и ширине, и которая имеет меньший размер, чем форма единицы предсказания.The conversion unit may be selected smaller than the prediction units. For example, when a prediction unit for a coding unit 852, the depth of which is 2, is selected with a shape in which the width of the 852 unit is divided into two equal parts, a transform unit can be selected with a shape in which the coding unit 852 is divided into four equal parts in height and width, and which is smaller than the shape of the prediction unit.

Фиг. 9 является блок-схемой устройства 900 кодирования изображения в соответствии с другим примерным вариантом осуществления.FIG. 9 is a block diagram of an image encoding apparatus 900 in accordance with another exemplary embodiment.

Согласно Фиг. 9 устройство 900 кодирования изображения в соответствии с настоящим примерным вариантом осуществления включает в себя модуль 910 преобразования, модуль 920 квантования и энтропийный кодер 930.According to FIG. 9, an image encoding apparatus 900 in accordance with the present exemplary embodiment includes a transform module 910, a quantization module 920, and an entropy encoder 930.

Модуль 910 преобразования принимает единицу обработки изображения пиксельной области и преобразует единицу обработки изображения в частотную область. Модуль 910 преобразования принимает множество единиц предсказания, включающих в себя значения остатка, сформированные посредством интра-предсказания или интер-предсказания, и преобразует единицы предсказания в частотную область. В результате преобразования в частотную область формируются коэффициенты частотных составляющих. В соответствии с настоящим примерным вариантом осуществления преобразование в частотную область может происходить через дискретное косинусное преобразование (DCT) или преобразование Карунена-Лоэва (KLT), и в результате DCT или KLT формируются коэффициенты частотной области. Далее, преобразование в частотную область может быть DCT, однако специалисту в соответствующей области должно быть очевидно, что преобразование в частотную область может быть любым преобразованием, имеющем отношение к преобразованию изображения из пиксельной области в частотную область.The conversion unit 910 receives the image processing unit of the pixel domain and converts the image processing unit to the frequency domain. Conversion unit 910 receives a plurality of prediction units including residual values generated by intra-prediction or inter-prediction, and converts the prediction units into a frequency domain. As a result of conversion to the frequency domain, the coefficients of the frequency components are formed. According to the present exemplary embodiment, the conversion to the frequency domain can occur through a discrete cosine transform (DCT) or a Karunen-Loeve transform (KLT), and frequency domain coefficients are generated as a result of the DCT or KLT. Further, the conversion to the frequency domain may be DCT, however, it should be apparent to one skilled in the art that the conversion to the frequency domain may be any conversion related to the conversion of the image from the pixel region to the frequency domain.

Так же, в соответствии с настоящим примерным вариантом осуществления, модуль 910 преобразования задает единицу преобразования посредством группировки множества единиц предсказания и выполняет преобразование в соответствии с единицей преобразования. Данный процесс будет подробно описан со ссылкой на Фиг. 10, 11a, 11b и 12.Also, in accordance with the present exemplary embodiment, the transform unit 910 defines a transform unit by grouping a plurality of prediction units and performs a transform in accordance with the transform unit. This process will be described in detail with reference to FIG. 10, 11a, 11b and 12.

Фиг. 10 является схемой модуля 910 преобразования.FIG. 10 is a diagram of a conversion module 910.

Согласно Фиг. 10 модуль 910 преобразования включает в себя модуль 1010 выбора и модуль 1020 выполнения преобразования.According to FIG. 10, the conversion module 910 includes a selection module 1010 and a conversion execution module 1020.

Модуль 1010 выбора задает единицу преобразования посредством выбора множества соседних единиц предсказания.Selection module 1010 defines a transform unit by selecting a plurality of neighboring prediction units.

Устройство кодирования изображения в соответствии со связанной областью техники выполняет интра-предсказание или интер-предсказание на основе блока, обладающего заранее определенным размером, т.е. на основе единицы предсказания, и выполняет DCT на основании размера, который меньше либо равен данной единице предсказания. Другими словами, устройство кодирования изображения в соответствии со связанной областью техники выполняет DCT при помощи единиц преобразования, которые меньше либо равны единице предсказания.An image encoding apparatus according to a related field of technology performs intra prediction or inter prediction based on a block having a predetermined size, i.e. based on the prediction unit, and performs a DCT based on a size that is less than or equal to the given prediction unit. In other words, an image encoding apparatus in accordance with the related art performs DCT using transform units that are less than or equal to the prediction unit.

Однако из-за множества частей информации заголовка, добавляемых к единицам преобразования, добавочные служебные данные растут по мере уменьшения единиц преобразования, тем самым ухудшается степень сжатия операции кодирования изображения. Для того чтобы решить данную проблему, устройство 900 кодирования изображения в соответствии с настоящим примерным вариантом осуществления группирует множество соседних единиц предсказания в единицу преобразования и выполняет преобразование в соответствии с единицей преобразования, которая сформирована группировкой. Существует высокая вероятность того, что соседние единицы предсказания могут включать в себя одинаковые значения остатка, и таким образом, если соседние единицы предсказания группируются в единицу преобразования и затем над ними выполняется преобразование, то может быть значительно увеличена степень сжатия операции кодирования.However, due to the plurality of pieces of header information added to the conversion units, additional overhead increases as the conversion units decrease, thereby degrading the compression ratio of the image encoding operation. In order to solve this problem, the image encoding apparatus 900 in accordance with the present exemplary embodiment groups the plurality of neighboring prediction units into a transform unit and performs the conversion in accordance with the transform unit that is formed by the grouping. There is a high probability that neighboring prediction units may include the same residual values, and thus, if neighboring prediction units are grouped into a transformation unit and then a transformation is performed on them, the compression ratio of the encoding operation can be significantly increased.

Для такого увеличения, модуль 1010 выбирает соседние единицы предсказания, которые будут сгруппированы в единицу преобразования. Данный процесс будет подробно описан со ссылкой на Фиг. 11a-11c и 12.For such an increase, module 1010 selects the adjacent prediction units to be grouped into a transform unit. This process will be described in detail with reference to FIG. 11a-11c and 12.

Фиг. 11Аa-11c иллюстрируют типы единицы преобразования в соответствии с другим примерным вариантом осуществления.FIG. 11Aa-11c illustrate conversion unit types in accordance with another exemplary embodiment.

Согласно Фиг. 11a-11c, единица 1120 предсказания для единицы 1110 кодирования может иметь форму разделения, полученную посредством разделения пополам ширины единицы 1110 кодирования. Единица 1110 кодирования может быть максимальной единицей кодирования, или может быть суб-единицей кодирования с размером меньшим, чем максимальная единица кодирования.According to FIG. 11a-11c, the prediction unit 1120 for the encoding unit 1110 may have a separation form obtained by halving the width of the encoding unit 1110. The coding unit 1110 may be a maximum coding unit, or may be a sub-coding unit with a size smaller than the maximum coding unit.

Как проиллюстрировано на Фиг. 11a, размер единицы 1130 преобразования может быть меньше единицы 1120 предсказания, или, как проиллюстрировано на Фиг. 11b, размер единицы 1140 предсказания может быть равным единице 1120 предсказания. Так же, как проиллюстрировано на Фиг. 11c, размер единицы 1150 преобразования может быть больше единицы 1120 предсказания. То есть, единицы с 1130 по 1150 преобразования могут быть установлены без привязки к единице 1120 предсказания.As illustrated in FIG. 11a, the size of the conversion unit 1130 may be smaller than the prediction unit 1120, or, as illustrated in FIG. 11b, the size of the prediction unit 1140 may be equal to the prediction unit 1120. Just as illustrated in FIG. 11c, the size of the transform unit 1150 may be larger than the prediction unit 1120. That is, units 1130 to 1150 conversions can be set without reference to prediction unit 1120.

Фиг. 11c иллюстрирует пример, при котором единица 1120 предсказания задается посредством группировки множества единиц 1120 предсказания, включенных в единицу 1110 кодирования. Однако единица преобразования может задаваться большей, чем единица кодирования, когда множество единиц предсказания, которые включены не в одну единицу кодирования, а во множество единиц кодирования, установлены в качестве одной единицы преобразования. Другими словами, как описано со ссылкой на Фиг. 11a-11c, единица преобразования может задаваться равной или меньшей, чем размер единицы кодирования, или большей, чем размер единицы кодирования. То есть, единица преобразования может задаваться без привязки к единице предсказания и единице кодирования.FIG. 11c illustrates an example in which a prediction unit 1120 is specified by grouping a plurality of prediction units 1120 included in a coding unit 1110. However, the conversion unit may be set larger than the coding unit when a plurality of prediction units, which are included not in one coding unit, but in a plurality of coding units, are set as one conversion unit. In other words, as described with reference to FIG. 11a-11c, the conversion unit may be set equal to or less than the size of the coding unit, or greater than the size of the coding unit. That is, a conversion unit can be specified without reference to a prediction unit and a coding unit.

Хотя Фиг. 11a-11c иллюстрируют примеры, в которых единица преобразования имеет квадратную форму, однако, в соответствии со способом группировки соседних единиц предсказания, единица преобразования может иметь прямоугольную форму. Например, в случае, где единица предсказания задается не как имеющая прямоугольные формы, что проиллюстрировано на Фиг. 11a-11c, а задается как имеющая четыре квадратные формы, полученные посредством разделения на четыре части единицы 1110 кодирования, верхняя и нижняя единицы предсказания или левая и правая единицы предсказания группируются таким образом, что единица преобразования может иметь прямоугольную форму, у которой горизонтальная сторона или вертикальная сторона длиннее.Although FIG. 11a-11c illustrate examples in which the transform unit is square, however, in accordance with the method of grouping adjacent prediction units, the transform unit may be rectangular. For example, in the case where the prediction unit is not defined as having rectangular shapes, as illustrated in FIG. 11a-11c, but is defined as having four square shapes obtained by dividing the coding unit 1110 into four parts, the upper and lower prediction units or the left and right prediction units are grouped so that the transform unit can have a rectangular shape with a horizontal side or the vertical side is longer.

Со ссылкой на Фиг. 10, не существует ограничений по критерию, на основании которого модуль 1010 выбора производит выбор соседних единиц предсказания. Однако в соответствии с примерным вариантом осуществления модуль 1010 выбора может производить выбор единицы преобразования на основе глубины. Как описано выше, глубина указывает степень уменьшения размера, которое постепенно происходит от максимальной единицы кодирования текущей последовательности макроблоков или текущего кадра до суб-единицы кодирования. Как описано выше со ссылкой на Фиг. 3 и 6, по мере роста глубины уменьшается размер суб-единицы кодирования, и, вследствие этого, также уменьшается единица предсказания, включенная в суб-единицу кодирования. В данном случае, если преобразование выполняется в соответствии с единицей преобразования, которая меньше или равна единице предсказания, то степень сжатия операции кодирования изображения ухудшается, поскольку в каждую единицу преобразования добавляется информация заголовка.With reference to FIG. 10, there are no restrictions on the criterion on the basis of which the selection module 1010 selects neighboring prediction units. However, in accordance with an exemplary embodiment, the selection module 1010 may select a conversion unit based on depth. As described above, depth indicates the degree of size reduction that gradually occurs from the maximum coding unit of the current macroblock sequence or current frame to the sub-coding unit. As described above with reference to FIG. 3 and 6, as the depth increases, the size of the coding sub-unit decreases, and as a result, the prediction unit included in the coding sub-unit also decreases. In this case, if the conversion is performed in accordance with a conversion unit that is less than or equal to the prediction unit, then the compression ratio of the image encoding operation is deteriorated since header information is added to each conversion unit.

Таким образом, применительно к суб-единице кодирования на глубине, соответствующей заранее определенному значению, предпочтительно, но необязательно, чтобы единицы предсказания, включенные в суб-единицу кодирования, группировались и задавались в качестве единицы преобразования, и затем над ней выполнялось преобразование. Для этого модуль 1010 выбора задает единицу преобразования на основе глубины суб-единицы кодирования. Например, в случае, где глубина единицы 1110 кодирования на Фиг. 11c больше чем к, модуль 1010 выбора группирует единицы 1120 предсказания и задает их в качестве единицы 1150 преобразования.Thus, for a coding sub-unit at a depth corresponding to a predetermined value, it is preferable, but not necessary, that the prediction units included in the coding sub-unit are grouped and set as a conversion unit, and then a transformation is performed on it. For this, selection module 1010 sets a transform unit based on the depth of the coding sub-unit. For example, in the case where the depth of the coding unit 1110 in FIG. 11c is larger than k, the selection module 1010 groups the prediction units 1120 and sets them as the conversion unit 1150.

В соответствии с другим примерным вариантом осуществления модуль 1010 выбора может группировать множество соседних единиц предсказания, над которыми выполняется предсказание, согласно одинаковому режиму предсказания, и может задать их в качестве одной единицы преобразования. Модуль 1010 выбора группирует соседние единицы предсказания, над которыми выполняется предсказание на основе интра-предсказания или интерпредсказания, и затем задает их в качестве одной единицы преобразования. Поскольку существует высокая вероятность того, что соседние единицы предсказания, над которыми выполняется предсказание согласно одинаковому режиму предсказания, включают в себя одинаковые значения остатка, то существует возможность сгруппировать соседние единицы предсказания в единицу преобразования, а затем выполнить преобразование над соседними единицами предсказания.According to another exemplary embodiment, the selection module 1010 may group a plurality of neighboring prediction units over which the prediction is performed according to the same prediction mode, and may set them as one transformation unit. Selection module 1010 groups adjacent prediction units over which intra-prediction or inter-prediction prediction is performed, and then sets them as one transform unit. Since there is a high probability that neighboring prediction units over which prediction is performed according to the same prediction mode include the same residual values, it is possible to group neighboring prediction units into a transformation unit, and then perform the conversion on neighboring prediction units.

Когда модуль 101 выбора задает единицу преобразования, то модуль 1020 выполнения преобразования преобразует соседние единицы предсказания в частотную область в соответствии с единицей преобразования. Модуль 1020 выполнения преобразования выполняет DCT над соседними единицами преобразования в соответствии с единицей преобразования и формирует дискретные косинусные коэффициенты.When the selection unit 101 defines a transform unit, the transform unit 1020 converts the adjacent prediction units to the frequency domain in accordance with the transform unit. Transform execution unit 1020 performs DCT on adjacent transform units in accordance with the transform unit and generates discrete cosine coefficients.

Согласно Фиг. 9 модуль 920 квантования квантует коэффициенты частотных составляющих, сформированные модулем 910 преобразования, например, дискретные косинусные коэффициенты. Модуль 920 квантования может квантовать дискретные косинусные коэффициенты, которые вводятся в соответствии с заранее определенным шагом квантования.According to FIG. 9, quantization module 920 quantizes frequency component coefficients generated by transform module 910, for example, discrete cosine coefficients. Quantization module 920 may quantize discrete cosine coefficients that are input in accordance with a predetermined quantization step.

Энтропийный кодер 930 выполняет энтропийное кодирование коэффициентов частотных составляющих, квантованных модулем 920 квантования. Энтропийный кодер 930 может выполнять энтропийное кодирование над дискретными косинусными коэффициентами посредством использования контекстно-зависимого адаптивного переменного арифметического кодирования (САВАС) или контекстно-зависимого адаптивного кодирования с переменной длиной (CAVLC).Entropy encoder 930 performs entropy encoding of the coefficients of the frequency components quantized by quantization module 920. Entropy encoder 930 can perform entropy coding on discrete cosine coefficients by using context-sensitive adaptive variable arithmetic coding (CABAC) or context-sensitive adaptive variable-length coding (CAVLC).

Устройство 900 кодирования изображения может определять оптимальную единицу преобразования посредством повторяющегося выполнения DCT, квантования и энтропийного кодирования над разными единицами преобразования. Для определения оптимальной единицы преобразования процедура выбора соседних единиц предсказания может повторяться. Оптимальная единица преобразования может определяться, принимая во внимание вычисление затрат RD, как подробно описано со ссылкой на Фиг. 12.The image encoding apparatus 900 can determine an optimal transform unit by repeatedly performing DCT, quantization, and entropy encoding on different transform units. To determine the optimal transform unit, the procedure for selecting adjacent prediction units may be repeated. The optimal conversion unit may be determined taking into account the calculation of RD costs, as described in detail with reference to FIG. 12.

Фиг. 12 иллюстрирует разные единицы преобразования в соответствии с другим примерным вариантом осуществления.FIG. 12 illustrates various conversion units in accordance with another exemplary embodiment.

Согласно Фиг. 12 устройство 900 кодирования изображения неоднократно выполняет операцию кодирования над разными единицами преобразования.According to FIG. 12, an image encoding apparatus 900 repeatedly performs an encoding operation on different conversion units.

Как проиллюстрировано на Фиг. 12, единица 1210 кодирования может предсказываться и кодироваться на основе единицы 1220 предсказания, имеющей меньший размер, чем единица 1210 кодирования. Преобразование выполняется над значениями остатка, которые сформированы результатом предсказания, и здесь, как проиллюстрировано Фиг. 12, DCT может выполняться над значениями остатка на основе разных единиц преобразования.As illustrated in FIG. 12, a coding unit 1210 may be predicted and encoded based on a prediction unit 1220 having a smaller size than the coding unit 1210. A conversion is performed on the remainder values that are generated by the prediction result, and here, as illustrated in FIG. 12, a DCT may be performed on residual values based on different conversion units.

Первая проиллюстрированная единица 1230 преобразования имеет тот же размер, что и единица 1210 кодирования, и имеет размер, полученный группировкой всех единиц предсказания, включенных в единицу 1210 кодирования.The first illustrated conversion unit 1230 is the same size as the coding unit 1210, and has a size obtained by grouping all the prediction units included in the coding unit 1210.

Вторая проиллюстрированная единица 1240 преобразования имеет размеры, полученные посредством разделения пополам ширины единицы 1210 кодирования, и размеры, полученные посредством группировки каждых двух единиц предсказания, соседствующих друг с другом в вертикальном направлении, соответственно.The second illustrated conversion unit 1240 has dimensions obtained by halving the width of the coding unit 1210, and sizes obtained by grouping each two prediction units adjacent to each other in the vertical direction, respectively.

Третья проиллюстрированная единица 1250 преобразования имеет размеры, полученные посредством разделения пополам высоты единицы 1210 кодирования, и размеры, полученные посредством группировки каждых двух единиц предсказания, соседствующих друг с другом в горизонтальном направлении, соответственно.The third illustrated conversion unit 1250 has dimensions obtained by halving the height of the coding unit 1210, and dimensions obtained by grouping each two prediction units adjacent to each other in the horizontal direction, respectively.

Четвертая проиллюстрированная единица 1260 преобразования используется, когда преобразование выполняется на основании четвертой проиллюстрированной единицы 1260 преобразования имеющий тот же размер, что и единица 1220 предсказания.The fourth illustrated conversion unit 1260 is used when the conversion is performed based on the fourth illustrated conversion unit 1260 having the same size as the prediction unit 1220.

Фиг. 13 является блок-схемой устройства 1300 декодирования изображения в соответствии с другим примерным вариантом осуществления.FIG. 13 is a block diagram of an image decoding apparatus 1300 in accordance with another exemplary embodiment.

Согласно Фиг. 13 устройство 1300 декодирования изображения в соответствии с настоящим примерным вариантом осуществления, включает в себя энтропийный декодер 1310, модуль 1320 обратного квантования и модуль 1330 обратного преобразования.According to FIG. 13, an image decoding apparatus 1300 in accordance with the present exemplary embodiment includes an entropy decoder 1310, an inverse quantization unit 1320, and an inverse transform unit 1330.

Энтропийный декодер 1310 выполняет энтропийное декодирование над коэффициентами частотных составляющих в отношении заранее определенной единицы преобразования. Как описано выше, со ссылкой на Фиг. 11a-11c и 12, заранее определенная единица преобразования может быть единицей преобразования, сформированной посредством группировки множества соседних единиц предсказания.Entropy decoder 1310 performs entropy decoding on the coefficients of the frequency components in relation to a predetermined conversion unit. As described above, with reference to FIG. 11a-11c and 12, a predetermined transform unit may be a transform unit formed by grouping a plurality of neighboring prediction units.

Как описано выше со ссылкой на устройство 900 кодирования изображения, единица преобразования может быть сформирована посредством группировки соседних единиц предсказания на основе глубины или может быть сформирована посредством группировки множества соседних единиц предсказания, над которыми предсказание выполняется согласно одинаковому режиму предсказания, то есть в соответствии с режимом интра-предсказания или режимом интер-предсказания.As described above with reference to the image encoding apparatus 900, a transform unit may be generated by grouping neighboring prediction units based on depth, or may be formed by grouping a plurality of neighboring prediction units over which the prediction is performed according to the same prediction mode, that is, in accordance with the mode intra prediction or inter prediction mode.

Множество единиц предсказания могут быть включенными не в одну единицу кодирования, а включенными во множество единиц кодирования. Другими словами, как описано выше со ссылкой на Фиг. 11a-11c, единица преобразования, которая энтропийно декодируется энтропийным декодером 1310, может задаваться как равная или меньше, чем размер единицы кодирования, или больше размера единицы кодирования.A plurality of prediction units may not be included in a single coding unit, but included in a plurality of coding units. In other words, as described above with reference to FIG. 11a-11c, a transform unit that is entropy decoded by the entropy decoder 1310 may be set to be equal to or smaller than the size of the coding unit, or larger than the size of the coding unit.

Как описано выше со ссылкой на Фиг. 12, единица преобразования может быть оптимальной единицей преобразования, выбранной посредством повторения процедуры группировки множества соседних единиц предсказания и посредством повторяющегося выполнения преобразования, квантования и энтропийного декодирования над разными единицами преобразования.As described above with reference to FIG. 12, a transform unit may be an optimal transform unit selected by repeating the procedure of grouping a plurality of neighboring prediction units and by repeatedly performing conversion, quantization, and entropy decoding on different transform units.

Модуль 1320 обратного квантования обратно квантует коэффициенты частотных составляющих, которые энтропийно декодированы энтропийным декодером 1310.The inverse quantization module 1320 inversely quantizes the coefficients of the frequency components that are entropy decoded by the entropy decoder 1310.

Модуль 1320 обратного квантования обратно квантует энтропийно декодированные коэффициенты частотных составляющих в соответствии с шагом квантования, который использовался при кодировании единицы преобразования.The inverse quantization module 1320 inverse quantizes the entropy-decoded coefficients of the frequency components in accordance with the quantization step that was used to encode the transform unit.

Модуль 1330 обратного преобразования выполняет обратное преобразование обратно квантованных коэффициентов частотных составляющих в пиксельную область. Модуль обратного преобразования может выполнять обратное-DCT над обратно квантованными дискретными косинусными коэффициентами (т.е., обратно квантованными коэффициентами частотных составляющих) и затем может воссоздавать единицу преобразования в пиксельной области. Воссозданная единица преобразования может включать в себя соседние единицы предсказания.The inverse transform unit 1330 performs the inverse transform of the inverse quantized coefficients of the frequency components into the pixel region. The inverse transform module can perform inverse-DCT on inverse quantized discrete cosine coefficients (i.e., inverse quantized coefficients of the frequency components) and then can recreate the transform unit in the pixel domain. A reconstructed transform unit may include adjacent prediction units.

Фиг. 14 является блок-схемой последовательности операций способа кодирования изображения в соответствии с примерным вариантом осуществления.FIG. 14 is a flowchart of an image encoding method in accordance with an exemplary embodiment.

Согласно Фиг. 14 в операции 1410, устройство кодирования изображения задает единицу преобразования посредством выбора множества соседних единиц предсказания. Устройство кодирования изображения может выбрать множество соседних единиц предсказания в соответствии с глубиной или может выбрать множество соседних единиц предсказания, над которыми предсказание выполняется согласно одинаковому режиму предсказания.According to FIG. 14 in operation 1410, the image encoding apparatus sets the transform unit by selecting a plurality of neighboring prediction units. The image encoding device may select a plurality of neighboring prediction units in accordance with the depth, or may select a plurality of neighboring prediction units over which prediction is performed according to the same prediction mode.

В операции 1420 устройство кодирования изображения преобразует соседние единицы предсказания в частотную область, в соответствии с единицей преобразования, установленной на операции 1420. Устройство кодирования изображения группирует соседние единицы предсказания, выполняет DCT над соседними единицами предсказания и таким образом формирует дискретные косинусные коэффициенты.In operation 1420, the image encoding device converts neighboring prediction units to the frequency domain, in accordance with the conversion unit set in operation 1420. The image encoding device groups neighboring prediction units, performs DCT on neighboring prediction units, and thus generates discrete cosine coefficients.

В операции 1430 устройство кодирования изображения квантует коэффициенты частотных составляющих, сформированные на операции 1420, в соответствии с шагом квантования.In operation 1430, the image encoding apparatus quantizes the frequency component coefficients generated in operation 1420 in accordance with the quantization step.

В операции 1440 устройство кодирования изображения выполняет энтропийное кодирование над коэффициентами частотных составляющих, квантованными в операции 1430. Устройство кодирования изображения выполняет энтропийное кодирование над дискретными косинусными коэффициентами при помощи САВАС или CAVLC.In operation 1440, the image encoding device performs entropy encoding on the frequency component coefficients quantized in operation 1430. The image encoding device performs entropy encoding on the discrete cosine coefficients using CABAC or CAVLC.

Способ кодирования изображения в соответствии с другим примерным вариантом осуществления может дополнительно включать в себя операцию по установке оптимальной единицы преобразования посредством повторяющегося выполнения операций 1410-1440 над разными единицами преобразования. То есть, посредством повторяющегося выполнения преобразования, квантования и энтропийного кодирования над разными единицами преобразования, как проиллюстрировано на Фиг. 12, существует возможность установить оптимальную единицу преобразования.An image encoding method in accordance with another exemplary embodiment may further include an operation for setting an optimal conversion unit by repeatedly performing operations 1410-1440 on different conversion units. That is, by repeatedly performing conversion, quantization, and entropy coding on different transformation units, as illustrated in FIG. 12, it is possible to establish an optimal conversion unit.

Фиг. 15 является блок-схемой последовательности операций способа декодирования изображения в соответствии с другим примерным вариантом осуществления.FIG. 15 is a flowchart of an image decoding method in accordance with another exemplary embodiment.

Согласно Фиг. 15 в операции 1510, устройство декодирования изображения выполняет энтропийное декодирование над коэффициентами частотных составляющих по отношению к заранее определенной единице преобразования. Коэффициенты частотных составляющих могут быть дискретными косинусными коэффициентами.According to FIG. 15 in operation 1510, an image decoding apparatus performs entropy decoding on the coefficients of the frequency components with respect to a predetermined conversion unit. The coefficients of the frequency components may be discrete cosine coefficients.

В операции 1520 устройство декодирования изображения обратно квантует коэффициенты частотных составляющих, которые энтропийно декодированы в операции 1510. Устройство декодирования изображения обратно квантует дискретные косинусные коэффициенты посредством использования шага квантования, использованного на операции кодирования.In operation 1520, the image decoding apparatus inverse quantizes the coefficients of the frequency components that are entropy decoded in operation 1510. The image decoding apparatus inverse quantizes the discrete cosine coefficients by using the quantization step used in the encoding operation.

В операции 1530 устройство декодирования изображения обратно преобразует коэффициенты частотных составляющих, которые были обратно квантованы в операции 1520, в пиксельную область и затем воссоздает единицу преобразования. Воссозданная единица преобразования задается посредством группировки множества соседних единиц предсказания. Как описано выше, единица преобразования может задаваться посредством группировки соседних единиц предсказания на основе глубины или может задаваться посредством группирования множества соседних единиц предсказания, предсказание над которыми выполняется согласно одинаковому режиму предсказания.In operation 1530, the image decoding apparatus inversely converts the coefficients of the frequency components that were inverse quantized in operation 1520 into the pixel region and then recreates the transform unit. A reconstructed transform unit is defined by grouping a plurality of neighboring prediction units. As described above, the conversion unit may be set by grouping adjacent prediction units based on depth, or may be set by grouping a plurality of neighboring prediction units predicted over according to the same prediction mode.

В соответствии с одним или более примерными вариантами осуществления, существует возможность задания единицы преобразования таким образом, чтобы она была крупнее единицы предсказания, и выполнения DCT таким образом, чтобы изображение могло быть эффективно сжато и закодировано.In accordance with one or more exemplary embodiments, it is possible to set the transform unit so that it is larger than the prediction unit, and perform the DCT so that the image can be efficiently compressed and encoded.

Примерные варианты осуществления также могут быть воплощены в качестве машиночитаемых кодов на машиночитаемом носителе записи. Машиночитаемый носитель записи является любым устройством хранения данных, которое может хранить данные, которые впоследствии могут быть считаны компьютерной системой.Exemplary embodiments may also be embodied as computer-readable codes on a computer-readable recording medium. A computer-readable recording medium is any data storage device that can store data that can subsequently be read by a computer system.

Примеры машиночитаемого носителя записи включают в себя постоянную память (ROM), оперативную память (RAM), CD-ROM, магнитные ленты, гибкие диски и оптические устройства хранения данных. Машиночитаемый носитель записи также может быть распределен между объединенными в сеть компьютерными системами таким образом, что машиночитаемый код хранится и исполняется распределенным образом.Examples of computer-readable recording media include read-only memory (ROM), random access memory (RAM), CD-ROM, magnetic tapes, floppy disks, and optical storage devices. A computer-readable recording medium may also be distributed between networked computer systems such that the computer-readable code is stored and executed in a distributed manner.

Например, каждое из устройства кодирования изображения, устройства декодирования изображения, кодер изображения и декодер изображения в соответствии с одним или более вариантами осуществления может включать в себя шину, связанную с каждым модулем в устройстве, как проиллюстрировано на Фиг. 1-2, 4-5, 9-10 и 14, и по меньшей мере один процессор, связанный с шиной. Каждое из устройства кодирования изображения, устройства декодирования изображения, кодера изображения и декодера изображения в соответствии с одним или более вариантами осуществления может включать в себя память, связанную с по меньшей мере одним процессором, который связан с шиной, чтобы хранить команды, принимаемые сообщения или формируемые сообщения и исполнять команды.For example, each of an image encoding device, an image decoding device, an image encoder, and an image decoder in accordance with one or more embodiments may include a bus associated with each module in the device, as illustrated in FIG. 1-2, 4-5, 9-10 and 14, and at least one processor associated with the bus. Each of the image encoding device, image decoding device, image encoder, and image decoder in accordance with one or more embodiments may include memory associated with at least one processor that is connected to the bus to store commands, received messages, or generated messages and execute commands.

Хотя настоящее изобретение подробно показано и описано со ссылкой на его примерные варианты осуществления, специалисту в соответствующей области должно быть понятно, что применительно к ним могут быть выполнены различные изменения по форме и деталях, не отступая от сущности и объема изобретения, как определено прилагаемой формулой изобретения. Примерные варианты осуществления должны рассматриваться исключительно в пояснительном смысле, а не в целях наложения ограничений. Вследствие этого объем изобретения определяется не подробным описанием изобретения, а прилагаемой формулой изобретения, и все отличия, лежащие в рамках объема, должны рассматриваться как включенные в настоящее изобретение.Although the present invention has been shown and described in detail with reference to its exemplary embodiments, one skilled in the art will appreciate that various changes can be made in form and detail to them without departing from the spirit and scope of the invention as defined by the appended claims. . Exemplary embodiments should be considered solely in an explanatory sense, and not for purposes of limitation. Consequently, the scope of the invention is determined not by a detailed description of the invention, but by the appended claims, and all differences that are within the scope of the scope should be construed as being included in the present invention.

Claims

1. A method of decoding an image, comprising stages in which:
obtaining quantized transform coefficients for the transform unit in the coding unit by performing entropy decoding on the bitstream encoded based on the coding unit;
determining a coding unit, which is obtained by hierarchically partitioning the maximum coding unit, using the partitioning information for the coding unit, wherein the partitioning information is obtained by analysis from the bitstream;
determining at least one prediction unit, which is obtained by partitioning the coding unit using the partition type information, wherein the partition type information is obtained by analysis from the bitstream;
determining at least one transform unit, which is obtained by partitioning the coding unit, using partition information for at least one transform unit, wherein separation information for at least one transform unit is obtained by analysis from the bitstream;
obtaining residual values for the transform unit by performing inverse quantization and inverse transform with respect to the quantized transform unit coefficients of the transform unit obtained by analysis from the bitstream;
performing intra prediction or inter prediction using at least one prediction unit included in the coding unit to form a predictor, and restoring the coding unit using the remainder and predictor values, wherein
the image is divided into many maximum coding units containing said maximum coding unit,
the size of the conversion unit obtained by partitioning the coding unit is determined without considering the size of the at least one conversion unit in the coding unit.

2. The method of claim 1, wherein the size of the transform unit is different from the size of the prediction unit.

3. The method of claim 1, wherein when said partitioning information indicates a partitioning for a current depth, a prediction unit with a current depth is divided into four square coding units of lower depth, regardless of adjacent coding units.

4. An image decoding device comprising:
a processor that is configured to obtain quantized transform coefficients for the transform unit in the coding unit by performing entropy decoding on the bitstream encoded based on the coding unit;
a decoder that is configured to recover the residual values for the transform unit by performing inverse quantization and inverse transform with respect to the quantized transform unit coefficients obtained by analysis from the bitstream, and perform intra prediction or inter prediction using at least one prediction unit, included in the coding unit,
while the processor is configured:
determine the coding unit, which is obtained by hierarchical partitioning of the maximum coding unit, using the partition information for the coding unit, and the partitioning information is obtained by analysis from the bitstream,
determine at least one prediction unit that is obtained by partitioning the coding unit using the partition type information, wherein the partition type information is obtained by analysis from the bitstream, and
determine at least one transform unit that is obtained by partitioning the coding unit using partition information for at least one transform unit, wherein separation information for at least one transform unit is obtained by analysis from the bitstream; wherein
the image is divided into many maximum coding units containing said maximum coding unit,
the size of the conversion unit obtained by partitioning the coding unit is determined without taking into account the size of the at least one conversion unit in the coding unit.