RU2305377C2 - Method for decreasing distortion of compressed video image and device for realization of the method - Google Patents
Method for decreasing distortion of compressed video image and device for realization of the method Download PDFInfo
- Publication number
- RU2305377C2 RU2305377C2 RU2003114715/09A RU2003114715A RU2305377C2 RU 2305377 C2 RU2305377 C2 RU 2305377C2 RU 2003114715/09 A RU2003114715/09 A RU 2003114715/09A RU 2003114715 A RU2003114715 A RU 2003114715A RU 2305377 C2 RU2305377 C2 RU 2305377C2
- Authority
- RU
- Russia
- Prior art keywords
- block
- image
- distortion
- linear interpolation
- frame
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 22
- 230000003247 decreasing effect Effects 0.000 title 1
- 230000001419 dependent effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 12
- 230000009466 transformation Effects 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 230000006835 compression Effects 0.000 description 9
- 238000007906 compression Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 210000003850 cellular structure Anatomy 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
Изобретение относится к области радиотехники и может быть использовано для цифровой обработки видеосигналов, передающих изображение.The invention relates to the field of radio engineering and can be used for digital processing of video signals transmitting an image.
Ограниченная пропускная способность телекоммуникационных каналов затрудняет качественную передачу изображений, в особенности динамических. Поэтому при передаче видеосигналов прибегают к их сжатию за счет изъятия повторяющихся или практически малоизменяющихся фрагментов с последующим их восстановлением при воспроизведении видеосигналов.The limited bandwidth of telecommunication channels impedes high-quality transmission of images, especially dynamic ones. Therefore, when transmitting video signals, they are resorted to their compression due to the removal of repeating or practically unchanging fragments with their subsequent recovery when playing video signals.
Действующие международные стандарты на представление видеосигнала (MPEG-1, MPEG-2, MPEG-4, Н-261, Н-263 и др.) не регламентируют способов сжатия видеосигнала, а только определяет, как должен выглядеть битовый поток кодированного видеосигнала, поэтому конкретные алгоритмы являются интеллектуальной собственностью фирм - производителей оборудования. Например, компания Сименс АГ запатентовала «Способ декодирования сжатых видеоданных с уменьшенной потребностью в памяти» (опубликованная заявка-аналог RU 97104164) [1]. Известна также американская разработка «Способ низкошумового кодирования и декодирования» (российский патент-аналог RU 2201654) [2], в которой требования к ширине полосы цифрового видеодекодера снижены за счет того, что стандартному МРЕG2-кодеру предшествует адаптивный процессор цифрового изображения, который адаптивно фильтрует сигнал по низким частотам. Японские специалисты предложили «Схему коррекции качества изображения», описанную в российской заявке-аналоге RU 2000133250 [3], в которой реализована схема, содержащая счетчик частоты появления уровня яркости, линейный интерполятор и корректор качества изображения. Известны отечественные разработки способов цифровой обработки видеосигналов, при которых осуществляется сжатие видеосигналов, передающих динамическое изображение. В патенте RU 2131172 описан «Интерполяционный способ сжатия телевизионного сигнала» [4], суть которого заключается в искусственном исключении сигналов строк и их восстановлении с помощью интерполяции по фрагментам не исключенных частей строк, что позволяет сократить избыточность телевизионного сигнала.The current international standards for the presentation of a video signal (MPEG-1, MPEG-2, MPEG-4, H-261, H-263, etc.) do not regulate the methods of video compression, but only determines what the bitstream of the encoded video signal should look like, therefore, specific Algorithms are the intellectual property of equipment manufacturers. For example, Siemens AG patented the "Method for decoding compressed video data with reduced memory requirements" (published application-analogue RU 97104164) [1]. Also known is the American development of the “Method of low noise encoding and decoding” (Russian patent analogue RU 2201654) [2], in which the bandwidth requirements of the digital video decoder are reduced due to the fact that the standard MPEG2 encoder is preceded by an adaptive digital image processor that adaptively filters low frequency signal. Japanese experts proposed the “Image Quality Correction Scheme” described in the Russian application analogue RU 2000133250 [3], which implements a circuit containing a counter for the frequency of occurrence of the brightness level, a linear interpolator, and an image quality corrector. Known domestic development of methods for digital processing of video signals, in which the compression of video signals that transmit a dynamic image. RU 2131172 describes an “Interpolation method for compressing a television signal” [4], the essence of which is the artificial exclusion of line signals and their reconstruction by interpolation from fragments of non-excluded parts of lines, which reduces the redundancy of the television signal.
Известно, что в ходе разработки международных стандартов определились общие принципы обработки видеосигналов и их сжатия (см. Стандарт ISO-11172 и Стандарт ISO-13818, части 1, 2, 3, ноябрь 1994 г.) [5]. В частности, было установлено, что процесс сжатия цифрового видеосигнала может быть разбит на ряд последовательных операций: преобразование аналогового сигнала в цифровую форму, предварительная обработка, дискретное косинусное преобразование, квантование, кодирование.It is known that during the development of international standards the general principles for processing video signals and their compression were determined (see ISO-11172 and ISO-13818,
Основная идея стандарта MPEG состоит в том, что из всего потока видеокадров изображения полностью передаются только избранные (опорные) кадры, для остальных же передаются лишь их изменения по отношению к опорным.The main idea of the MPEG standard is that only the selected (reference) frames are completely transmitted from the entire stream of video frames of the image, while for the rest, only their changes with respect to the reference ones are transmitted.
На самом деле в подвижном изображении от кадра к кадру в большинстве случаев меняется только его часть. Например, при выступлении диктора в новостях меняется только его мимика. Полная же смена кадра, когда очередной кадр нельзя восстановить как изменение предыдущего (в этом случае проще передать сам кадр), происходит относительно редко. Например, в американских фильмах это обычно 4-5 секунд, в европейских (и особенно в отечественных) этот интервал значительно больше.In fact, in a moving image from frame to frame in most cases only part of it changes. For example, when a speaker speaks in the news, only his facial expressions change. A complete frame change, when the next frame cannot be restored as a change to the previous one (in this case it is easier to transfer the frame itself), is relatively rare. For example, in American films it is usually 4-5 seconds, in European (and especially in domestic) this interval is much larger.
По этой причине в MPEG-2 определено три типа кадров:For this reason, MPEG-2 defines three types of frames:
I-кадры (intra frames); Р-кадры (predicted frames); В-кадры (bidirectional frames).I-frames (intra frames); P-frames (predicted frames); B-frames (bidirectional frames).
I-кадры несут полноценное неподвижное изображение и вдобавок используются для построения Р- и В-кадров. P-кадры, то есть "предсказуемые", строятся на базе последнего (с точки зрения приемника) принятого I- или P-кадра. Правда если он сильно от него отличается (например, произошла смена плана), то P-кадр кодируется как I-кадр.I-frames carry a full-fledged still image and in addition are used to build P- and B-frames. P-frames, that is, "predictable", are built on the basis of the last (from the receiver's point of view) received I- or P-frame. True, if it is very different from it (for example, a plan change occurred), then the P-frame is encoded as an I-frame.
Наиболее сложно восстанавливаются В-кадры или "интерполируемые". Такой кадр может строиться либо как продолжение предыдущего I(Р)-кадра, либо как предшественник следующего за ним I(Р)-кадра, либо как интерполяция между обоими. При этом если В-кадр значительно отличается и от первого, и от второго, то он кодируется как I-кадр.B frames or “interpolated” are most difficult to recover. Such a frame can be constructed either as a continuation of the previous I (P) -frame, or as a predecessor of the next I (P) -frame, or as an interpolation between both. Moreover, if the B-frame is significantly different from the first and second, then it is encoded as an I-frame.
Все типы кадров группируются в определенной последовательности. Группа из 12 кадров образует так называемую GOP (Group of Pictures). Таким образом, при частоте 25 кадров в секунду новый I-кадр приходит максимум через 12×(1/25)=0,48 секунды. Вместе с ним восстанавливается полная (в известном смысле) идентичность передаваемого и принимаемого изображения). В связи с тем, что при декодировании для получения В-кадров необходимо уже иметь следующий за ним P-кадр, то при передаче последовательность кадров должна быть строго определенной.All types of frames are grouped in a certain sequence. A group of 12 frames forms the so-called GOP (Group of Pictures). Thus, at a frequency of 25 frames per second, a new I-frame arrives at a maximum of 12 × (1/25) = 0.48 seconds. Together with it, the full (in a sense) identity of the transmitted and received images is restored). Due to the fact that when decoding to obtain B-frames it is necessary to have the next P-frame, then during transmission the sequence of frames must be strictly defined.
Для кодирования отдельных кадров также существует специальная процедура. Например, для кодирования цветного изображения используется схема YUV, применяемая в обычном телевещании. При этом изображение раскладывается не по трем каналам цветности (схема RGB), а по двум каналам цветности (U, V) и по каналу яркости (Y).There is also a special procedure for encoding individual frames. For example, to encode a color image, the YUV scheme used in conventional television broadcasting is used. In this case, the image is displayed not in three color channels (RGB scheme), but in two color channels (U, V) and in the luminance channel (Y).
Изображение в канале яркости - это, по существу, черно-белое изображение. Подмечено, что одна из особенностей восприятия изображения человеческим глазом состоит в том, что он обладает большим разрешением по каналу яркости (Y), чем по каналам цветности (U, V). Поэтому расслаивая цветной кадр на эти три составляющие, мы можем подвергнуть слои U и V большему сжатию, чем слой Y. Этот принцип был использован еще при создании цветного аналогового телевидения, где U, V передаются не одновременно, а поочередно.An image in a luminance channel is essentially a black and white image. It is noted that one of the features of the perception of the image by the human eye is that it has a higher resolution in the luminance channel (Y) than in the color channels (U, V). Therefore, layering a color frame into these three components, we can subject the layers U and V to more compression than the layer Y. This principle was used even when creating color analog television, where U, V are transmitted not simultaneously, but alternately.
I-кадр кодируется как статическое изображение следующим образом. Каждый слой кадра разбивается на блоки размером 8×8 точек и повергается дискретному косинус-преобразованию (ДКП, DCT). ДКП является полностью обратимым преобразованием. По сути ДКП - это частный случай преобразования Фурье для четной функции, когда функция раскладывается только на косинусные гармоники.The I-frame is encoded as a static image as follows. Each layer of the frame is divided into blocks of 8 × 8 pixels and is subjected to a discrete cosine transform (DCT). DCT is a fully reversible transformation. In essence, DCT is a special case of the Fourier transform for an even function, when the function decomposes only into cosine harmonics.
При использовании ДКП вместо значения пикселя (то есть уровня цветности и яркости) в ячейке блока ставится коэффициент ДКП. То есть блок преобразуется в свой двумерный спектр. Как правило, энергетический спектр изображения сосредотачивается в низкочастотных гармониках, поэтому коэффициенты, расположенные ближе к верхнему левому углу, имеют большие значения, чем остальные. Чем меньше соседние пиксели отличаются друг от друга в исходном блоке, тем ближе к нулю значения большинства коэффициентов ДКП.When using DCT, instead of the pixel value (that is, the level of color and brightness), the DCT coefficient is set in the block cell. That is, the block is converted into its two-dimensional spectrum. As a rule, the energy spectrum of the image is concentrated in the low-frequency harmonics, so the coefficients located closer to the upper left corner are larger than the others. The smaller the neighboring pixels differ from each other in the source block, the closer to zero the values of most DCT coefficients.
Для пикселей монотонного изображения коэффициенты ДКП равны нулю, за исключением коэффициента в левом верхнем углу, который задает интенсивность изображения.For pixels of a monotonous image, the DCT coefficients are zero, except for the coefficient in the upper left corner, which sets the image intensity.
Полученные коэффициенты квантуются (то есть округляются до некоторой степени 2). Главная задача при этом - увеличить количество нулевых коэффициентов. По сути отбрасываются высокочастотные гармоники. Как показывает опыт, обычно это практически не влияет на качество изображения.The resulting coefficients are quantized (i.e., rounded to a certain degree 2). The main task in this case is to increase the number of zero coefficients. In fact, high-frequency harmonics are discarded. As experience shows, usually this practically does not affect image quality.
Полученный набор двоичных векторов (коэффициентов) сжимается известным кодом Хаффмана. Так формируется сжатый I-кадр, который с известной потерей качества можно восстановить независимо от других кадров. Р- и В-кадры кодируются с учетом их отличия от опорных I- и P-кадров. Поэтому они поддаются более сильному сжатию, чем I- кадры. При кодировании P-кадра (В-кадры кодируются практически аналогичным образом), он также разбивается на блоки 8х8 и сравнивается с исходным кадром (будем считать, что это I-кадр, хотя может быть и предшествующий P-кадр). Если некоторый блок в кодируемом P-кадре совпадает с аналогичным блоком в опорном кадре, то достаточно указать, что он тот же самый. Другим случаем является нахождение точно такого же блока в опорном I-кадре, но в другой позиции, поэтому вместо блока P-кадра можно указать лишь ссылку на другой блок I-кадра в виде вектора смещения. Остальные блоки кодируются так же, как в случае I-кадра.The resulting set of binary vectors (coefficients) is compressed by the well-known Huffman code. Thus, a compressed I-frame is formed, which, with a known loss of quality, can be restored independently of other frames. P- and B-frames are encoded taking into account their difference from the reference I- and P-frames. Therefore, they are more compressible than I-frames. When encoding a P-frame (B-frames are encoded in almost the same way), it is also divided into 8x8 blocks and compared with the original frame (we assume that this is an I-frame, although there may be a previous P-frame). If some block in the encoded P-frame coincides with a similar block in the reference frame, then it is sufficient to indicate that it is the same. Another case is finding the exact same block in the reference I-frame, but in a different position, so instead of a P-frame block, you can only specify a link to another I-frame block in the form of an offset vector. The remaining blocks are encoded in the same way as in the case of the I-frame.
Заметим, что если в подвижном изображении часть объектов будет двигаться поступательно (а это бывает часто), то несколько блоков будут закодированы одним и тем же вектором смещения. При последующем сжатии по методу Хаффмана это даст дополнительное увеличение степени компрессии P-кадра. С другой стороны, при увеличении степени сжатия большая часть коэффициентов становится равной нулю в результате квантования и, таким образом, блок кодируется либо только средним значением яркости, либо небольшим количеством низкочастотных коэффициентов ДКП. Поскольку блоки не перекрываются, то из-за разности средних значений яркости соседних блоков между ними возникает хорошо заметный перепад яркости, причем перепады яркости, как правило, в целом образуют регулярную клеточную структуру на декодированном изображении. В случае если при сжатии видео использовалась компенсации движения, блочная структура может меняться со временем, теряя регулярность расположения блоков, в связи с тем, что блоки из опорных кадров могут смещаться в предсказанных кадрах.Note that if in a moving image some of the objects will move forward (and this happens often), then several blocks will be encoded with the same displacement vector. With subsequent compression using the Huffman method, this will give an additional increase in the degree of compression of the P-frame. On the other hand, with an increase in the compression ratio, most of the coefficients become equal to zero as a result of quantization and, thus, the block is encoded either only by the average brightness value or by a small number of low-frequency DCT coefficients. Since the blocks do not overlap, due to the difference in the average values of the brightness of the neighboring blocks, a clearly noticeable difference in brightness occurs between them, and the difference in brightness, as a rule, as a whole forms a regular cellular structure in the decoded image. If motion compensation was used in video compression, the block structure can change over time, losing the regularity of the blocks, due to the fact that blocks from the reference frames can be shifted in the predicted frames.
Каждая из вышеуказанных разработок [1-5] позволяет решать лишь некоторые аспекты комплексной проблемы «запись/воспроизведение качественного видеоизображения», при этом любое, даже незначительное, повышение качества сжатого видеоизображения требует значительных вычислительных затрат, что препятствует широкому внедрению этих разработок. Особенно сложным является устранение искажения динамического изображения в виде клетчатой структуры.Each of the above developments [1-5] allows us to solve only some aspects of the complex problem “recording / playback of high-quality video”, while any, even slight, improvement in the quality of compressed video requires significant computational costs, which impedes the widespread adoption of these developments. Particularly difficult is the elimination of distortion of the dynamic image in the form of a cellular structure.
Представляется, что сочетание низкочастотной фильтрации с линейной или билинейной интерполяцией может обеспечить существенное улучшение сжатого динамического видеоизображения при достаточно скромных вычислительных затратах. Преимущество линейной интерполяции заключается в простоте вычислений, а именно: она может быть вычислена с использованием операции полусуммы либо с использованием предварительно рассчитанных таблиц. Недостаток линейной интерполяции заключается в том, что она менее эффективно устраняет блочные искажения по сравнению с низкочастотным фильтром, либо по сравнению с интерполяцией полиномами более высоких порядков.It seems that the combination of low-pass filtering with linear or bilinear interpolation can provide a significant improvement in compressed dynamic video at a fairly modest computational cost. The advantage of linear interpolation is the simplicity of the calculations, namely: it can be calculated using the half-sum operation or using pre-calculated tables. The disadvantage of linear interpolation is that it less efficiently eliminates block distortion compared to a low-pass filter, or compared to interpolation by higher order polynomials.
Наиболее близким к предлагаемому является способ, описанный в диссертации Joceli Mayer, "Blending Models for Image Enhancement and Coding", Ph.D. Thesis, University of California, Santa Cruz, Advisor: Prof. Glen G. Langdon, Ph.D., December 1999 [6]; в которой предусмотрено использование интерполяции второго порядка (в частности полиномами Безье). Однако, использование интерполирующих полиномов более чем первого порядка требует значительно больших вычислительных затрат, чем линейная интерполяция (т.е. интерполяция полиномом первого порядка).Closest to the proposed is the method described in the thesis of Joceli Mayer, "Blending Models for Image Enhancement and Coding", Ph.D. Thesis, University of California, Santa Cruz, Advisor: Prof. Glen G. Langdon, Ph.D., December 1999 [6]; which provides for the use of second-order interpolation (in particular, Bezier polynomials). However, the use of interpolating polynomials of more than first order requires significantly greater computational costs than linear interpolation (i.e., interpolation by a first order polynomial).
Предлагаемое изобретение решает задачу улучшения качества сжатого видеоизображения при незначительных вычислительных затратах.The present invention solves the problem of improving the quality of compressed video at a low computational cost.
Для достижения названного технического результата в предлагаемом способе, включающем разбивание обрабатываемого изображения на блоки с последующим преобразованием каждого блока с помощью ДКП, с квантованием и кодированием получившихся коэффициентов, осуществляют вычисление корректирующих характеристических точек, обычно называемых опорными точками, при помощи низкочастотной фильтрации и затем проводят линейную интерполяцию между вычисленными таким образом опорными точками. Эта процедура несколько напоминает выбор опорного кадра в стандарте MPEG. При этом, поскольку число опорных точек интерполяции меньше числа обрабатываемых точек изображения, суммарная вычислительная сложность, вызванная введением низкочастотной фильтрации, увеличивается незначительно.To achieve the named technical result in the proposed method, which includes splitting the processed image into blocks with the subsequent transformation of each block using DCT, with quantization and coding of the resulting coefficients, the calculation of the correction characteristic points, usually called reference points, using low-pass filtering and then linear interpolation between reference points calculated in this way. This procedure somewhat resembles the choice of a reference frame in the MPEG standard. Moreover, since the number of interpolation reference points is less than the number of processed image points, the total computational complexity caused by the introduction of low-pass filtering increases slightly.
Отличительными признаками предложенного способа является процедура выбора опорных точек с помощью низкочастотной фильтрации и замена обработки точек изображения обработкой значительно меньшего количества вычисленных таким образом опорных точек. При этом освобождающиеся вычислительные мощности направляются на осуществление одного из типов интерполяции - по строкам, столбцам или даже билинейной интерполяции, требующей наибольших вычислительных затрат.Distinctive features of the proposed method is the procedure for selecting control points using low-pass filtering and replacing the processing of image points by processing a significantly smaller number of reference points calculated in this way. In this case, the released computing power is directed to the implementation of one of the types of interpolation — by rows, columns, or even bilinear interpolation, which requires the greatest computational cost.
Предлагаемый способ поясняется чертежами, на которых приведены:The proposed method is illustrated by drawings, which show:
На фиг.1 - схема разбиения обрабатываемого изображения на блоки и порядок обработки блоков.Figure 1 - diagram of the division of the processed image into blocks and the processing order of the blocks.
На фиг.2 - схема использования линейной интерполяции для обработки строк блока изображения.Figure 2 - diagram of the use of linear interpolation to process the lines of the image block.
На фиг.3 - схема использования билинейной интерполяции для обработки блока изображения.Figure 3 - diagram of the use of bilinear interpolation to process the image block.
На фиг.4 - функциональная схема устройства, реализующего настоящее изобретение.Figure 4 is a functional diagram of a device that implements the present invention.
На фиг.1 показана схема разбиения обрабатываемого изображения 1 на обрабатываемые блоки 3 и очередность 4 обработки блоков 3. При обработке все изображение 1 разбивают на квадратные блоки 3 с размером, меньшим, чем размер блока 2 ДКП, использованного при кодировании. Наиболее выгодно использовать блок 3 с линейными размерами в два раза меньше блока 2 ДКП (т.е. блок 4×4 при размере блока 2 ДКП 8×8). Блоки 3 обрабатывают последовательно и результатом вычислений замещают обработанный блок 3. Хотя очередность 4 обработки не имеет значения, везде в дальнейшем предполагается очередность 4 обработки блоков 3 слева-направо-сверху-вниз.Figure 1 shows the scheme of dividing the processed image 1 into
На фиг.2 показана схема использования линейной интерполяции для уменьшения блочных искажений на строке обрабатываемого блока 3. При этом предполагается, что блочные искажения на столбцах отсутствуют или незначительны. Левую опорную точку 7 выбирают на крайней правой границе левого (возможно обработанного на предыдущем шаге) блока 3. Правую опорную точку 7 вычисляют при помощи низкочастотной фильтрации пикселей, лежащих по обе стороны от границы блока 3. С точки зрения эффективности вычислений в качестве низкочастотного фильтра целесообразно использовать фильтр длиной 2 и весами {0.5; 0.5}, или иными словами, подсчитывать полусумму яркостей пикселей по обе стороны границы блока 3. После вычислений левой и правой опорных точек 7 значения пикселей, находящихся между ними, замещают значениями, вычисленными по формуле линейной интерполяции:Figure 2 shows a diagram of the use of linear interpolation to reduce block distortion on the row of the processed
Пиксель[i]=Л+(П-Л)/n·i i=[1,n];Pixel [i] = L + (R-L) / n · i i = [1, n];
Где Л - значение левой опорной точки, П - значение правой опорной точки, n - число интерполируемых точек, i - номер интерполируемого элемента изображения.Where L is the value of the left reference point, P is the value of the right reference point, n is the number of interpolated points, i is the number of the interpolated image element.
Данную процедуру производят для каждой строки обрабатываемого блока 3.This procedure is performed for each row of the processed
Уменьшение блочных искажений на столбцах изображения производят аналогично, при этом предполагается, что искажения на строках отсутствуют или незначительны.The reduction of block distortion on the image columns is carried out similarly, while it is assumed that the distortion on the rows is absent or insignificant.
На фиг.3 показана схема использования билинейного интерполятора 8 для уменьшения блочных искажений одновременно в строках и столбцах блока изображения.Figure 3 shows a diagram of the use of bilinear interpolator 8 to reduce block distortion simultaneously in the rows and columns of the image block.
В случае билинейной интерполяции вычисляют значения четырех опорных точек. Для этого также используют низкочастотные фильтры 5, подключаемые к входам билинейного интерполятора 8. Предпочтительно использовать низкочастотные фильтры 5 со следующими коэффициентами:In the case of bilinear interpolation, the values of the four reference points are calculated. For this, low-pass filters 5 are also used, which are connected to the inputs of the bilinear interpolator 8. It is preferable to use low-pass filters 5 with the following coefficients:
При таком выборе коэффициентов точки, обработанные на предыдущем шаге, имеют большие веса.With this choice of coefficients, the points processed in the previous step have large weights.
На фиг.4 показана функциональная схема устройства, реализующего предлагаемый способ.Figure 4 shows a functional diagram of a device that implements the proposed method.
Устройство состоит из классификатора 10 блоков, анализирующего блоки 3 и выявляющего наличие и тип блочных искажений, и набора низкочастотных фильтров 5 и интерполяторов 11-13, осуществляющих обработку поступивших данных. При отсутствии блочных искажений в обрабатываемом блоке 3 интерполяция не применяется. При наличии блочных искажений блок 3 обрабатывают в зависимости от типа блочных искажений одним из трех интерполяторов: линейным интерполятором 11 по строкам, линейным интерполятором 12 по столбцам, либо билинейным интерполятором 13. Выбор типа классификатора 10 блоков осуществляют, например, исходя из следующего требования:The device consists of a block classifier 10, which analyzes
- наличие блочных искажений по строкам (столбцам) фиксируют в случае, если все строки (столбцы) обрабатываемого блока 3 содержат не более одного перепада яркости и абсолютное значение этого перепада не превосходит удвоенного шага квантования коэффициентов ДКП для данного блока 3.- the presence of block distortions in rows (columns) is fixed if all rows (columns) of the processed
Фактически, данные от обрабатываемого блока 3, находящегося в буфере 9 изображения, поступают на вход классификатора 10 и на переключатель 14, реагирующий, как и переключатель 15, на команды классификатора 10. При отсутствии блочных искажений переключатели 14 и 15 устанавливаются в крайнее верхнее положение (см. фиг.4), при этом сигналы с обрабатываемого блока 3 минуют блок фильтров 5 и блок интерполяторов 11-13. Это означает, что коррекция блочных искажений в данном случае не требуется. Если классификатор 10 выявляет наличие блочных искажений, то, в зависимости от выявленного типа искажений, переключатели 14 и 15 активируют соответствующую линейку: интерполяцию строк, столбцов или билинейную интерполяцию.In fact, the data from the processed
Claims (2)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2003114715/09A RU2305377C2 (en) | 2003-05-20 | 2003-05-20 | Method for decreasing distortion of compressed video image and device for realization of the method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2003114715/09A RU2305377C2 (en) | 2003-05-20 | 2003-05-20 | Method for decreasing distortion of compressed video image and device for realization of the method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2003114715A RU2003114715A (en) | 2004-11-20 |
| RU2305377C2 true RU2305377C2 (en) | 2007-08-27 |
Family
ID=36116931
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2003114715/09A RU2305377C2 (en) | 2003-05-20 | 2003-05-20 | Method for decreasing distortion of compressed video image and device for realization of the method |
Country Status (1)
| Country | Link |
|---|---|
| RU (1) | RU2305377C2 (en) |
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009041843A1 (en) * | 2007-09-28 | 2009-04-02 | Vsevolod Yurievich Mokrushin | Method of encoding digital signals (variants), method of decoding digital signals (variants), device for implementation thereof (variants), and system for image transmission via limited throughput communication channels (variants) |
| RU2477576C2 (en) * | 2008-04-10 | 2013-03-10 | Квэлкомм Инкорпорейтед | Interpolation filter support for sub-pixel resolution in video coding |
| US8462842B2 (en) | 2008-04-10 | 2013-06-11 | Qualcomm, Incorporated | Symmetry for interpolation filtering of sub-pixel positions in video coding |
| RU2485712C2 (en) * | 2008-06-25 | 2013-06-20 | Квэлкомм Инкорпорейтед | Fragmented link in time compression for video coding |
| US8705622B2 (en) | 2008-04-10 | 2014-04-22 | Qualcomm Incorporated | Interpolation filter support for sub-pixel resolution in video coding |
| US8804831B2 (en) | 2008-04-10 | 2014-08-12 | Qualcomm Incorporated | Offsets at sub-pixel resolution |
| US8948822B2 (en) | 2008-04-23 | 2015-02-03 | Qualcomm Incorporated | Coordinating power management functions in a multi-media device |
| US8948270B2 (en) | 2008-08-19 | 2015-02-03 | Qualcomm Incorporated | Power and computational load management techniques in video processing |
| US8964828B2 (en) | 2008-08-19 | 2015-02-24 | Qualcomm Incorporated | Power and computational load management techniques in video processing |
| US9077971B2 (en) | 2008-04-10 | 2015-07-07 | Qualcomm Incorporated | Interpolation-like filtering of integer-pixel positions in video coding |
| RU2573747C2 (en) * | 2011-06-27 | 2016-01-27 | Ниппон Телеграф Энд Телефон Корпорейшн | Video encoding method and apparatus, video decoding method and apparatus and programmes therefor |
| US9547886B2 (en) | 2010-04-05 | 2017-01-17 | Samsung Electronics Co., Ltd. | Method and apparatus for performing interpolation based on transform and inverse transform |
| US10440388B2 (en) | 2008-04-10 | 2019-10-08 | Qualcomm Incorporated | Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8595281B2 (en) | 2006-01-11 | 2013-11-26 | Qualcomm Incorporated | Transforms with common factors |
| US8849884B2 (en) | 2006-03-29 | 2014-09-30 | Qualcom Incorporate | Transform design with scaled and non-scaled interfaces |
| JP4747975B2 (en) * | 2006-07-14 | 2011-08-17 | ソニー株式会社 | Image processing apparatus and method, program, and recording medium |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5646697A (en) * | 1994-01-19 | 1997-07-08 | Sony Corporation | Special effects video processor |
| RU2093968C1 (en) * | 1995-08-02 | 1997-10-20 | Закрытое акционерное общество "Техно-ТМ" | Method for encoding and decoding images and device which implements said method |
| RU2118064C1 (en) * | 1995-05-11 | 1998-08-20 | ЛДТ ГмбХ унд Ко. Лазер-Дисплей-Технологи КГ | Method and device for frame processing |
| RU2131172C1 (en) * | 1996-12-10 | 1999-05-27 | Полыковский Андрей Маркович | Interpolation method for compressing tv signal |
| TW462181B (en) * | 2000-06-19 | 2001-11-01 | Media Scope Technologies Corp | Method for interpolation and increasing the sharpness of digital image |
| US6330367B2 (en) * | 1994-04-20 | 2001-12-11 | Oki Electric Industry Co., Ltd. | Image encoding and decoding using separate hierarchical encoding and decoding of low frequency images and high frequency edge images |
| WO2003021970A1 (en) * | 2001-09-04 | 2003-03-13 | Faroudja Cognition Systems, Inc. | Low bandwidth video compression |
| RU2201654C2 (en) * | 1997-12-23 | 2003-03-27 | Томсон Лайсенсинг С.А. | Low-noise coding and decoding method |
| US6545719B1 (en) * | 2000-03-31 | 2003-04-08 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for concealing interpolation artifacts in a video interlaced to progressive scan converter |
-
2003
- 2003-05-20 RU RU2003114715/09A patent/RU2305377C2/en not_active IP Right Cessation
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5646697A (en) * | 1994-01-19 | 1997-07-08 | Sony Corporation | Special effects video processor |
| US6330367B2 (en) * | 1994-04-20 | 2001-12-11 | Oki Electric Industry Co., Ltd. | Image encoding and decoding using separate hierarchical encoding and decoding of low frequency images and high frequency edge images |
| RU2118064C1 (en) * | 1995-05-11 | 1998-08-20 | ЛДТ ГмбХ унд Ко. Лазер-Дисплей-Технологи КГ | Method and device for frame processing |
| RU2093968C1 (en) * | 1995-08-02 | 1997-10-20 | Закрытое акционерное общество "Техно-ТМ" | Method for encoding and decoding images and device which implements said method |
| RU2131172C1 (en) * | 1996-12-10 | 1999-05-27 | Полыковский Андрей Маркович | Interpolation method for compressing tv signal |
| RU2201654C2 (en) * | 1997-12-23 | 2003-03-27 | Томсон Лайсенсинг С.А. | Low-noise coding and decoding method |
| US6545719B1 (en) * | 2000-03-31 | 2003-04-08 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for concealing interpolation artifacts in a video interlaced to progressive scan converter |
| TW462181B (en) * | 2000-06-19 | 2001-11-01 | Media Scope Technologies Corp | Method for interpolation and increasing the sharpness of digital image |
| WO2003021970A1 (en) * | 2001-09-04 | 2003-03-13 | Faroudja Cognition Systems, Inc. | Low bandwidth video compression |
Cited By (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009041843A1 (en) * | 2007-09-28 | 2009-04-02 | Vsevolod Yurievich Mokrushin | Method of encoding digital signals (variants), method of decoding digital signals (variants), device for implementation thereof (variants), and system for image transmission via limited throughput communication channels (variants) |
| US8374446B2 (en) | 2007-09-28 | 2013-02-12 | Vsevolod Yurievich Mokrushin | Encoding and decoding of digital signals based on compression of hierarchical pyramid |
| US8705622B2 (en) | 2008-04-10 | 2014-04-22 | Qualcomm Incorporated | Interpolation filter support for sub-pixel resolution in video coding |
| RU2477577C2 (en) * | 2008-04-10 | 2013-03-10 | Квэлкомм Инкорпорейтед | Interpolation-like filtering of integer pixel positions in video coding |
| US8462842B2 (en) | 2008-04-10 | 2013-06-11 | Qualcomm, Incorporated | Symmetry for interpolation filtering of sub-pixel positions in video coding |
| US10440388B2 (en) | 2008-04-10 | 2019-10-08 | Qualcomm Incorporated | Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter |
| US8804831B2 (en) | 2008-04-10 | 2014-08-12 | Qualcomm Incorporated | Offsets at sub-pixel resolution |
| RU2477576C2 (en) * | 2008-04-10 | 2013-03-10 | Квэлкомм Инкорпорейтед | Interpolation filter support for sub-pixel resolution in video coding |
| US11683519B2 (en) | 2008-04-10 | 2023-06-20 | Qualcomm Incorporated | Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter |
| US9077971B2 (en) | 2008-04-10 | 2015-07-07 | Qualcomm Incorporated | Interpolation-like filtering of integer-pixel positions in video coding |
| US8948822B2 (en) | 2008-04-23 | 2015-02-03 | Qualcomm Incorporated | Coordinating power management functions in a multi-media device |
| RU2485712C2 (en) * | 2008-06-25 | 2013-06-20 | Квэлкомм Инкорпорейтед | Fragmented link in time compression for video coding |
| US8908763B2 (en) | 2008-06-25 | 2014-12-09 | Qualcomm Incorporated | Fragmented reference in temporal compression for video coding |
| US8948270B2 (en) | 2008-08-19 | 2015-02-03 | Qualcomm Incorporated | Power and computational load management techniques in video processing |
| US9462326B2 (en) | 2008-08-19 | 2016-10-04 | Qualcomm Incorporated | Power and computational load management techniques in video processing |
| US9565467B2 (en) | 2008-08-19 | 2017-02-07 | Qualcomm Incorporated | Power and computational load management techniques in video processing |
| US8964828B2 (en) | 2008-08-19 | 2015-02-24 | Qualcomm Incorporated | Power and computational load management techniques in video processing |
| US9547886B2 (en) | 2010-04-05 | 2017-01-17 | Samsung Electronics Co., Ltd. | Method and apparatus for performing interpolation based on transform and inverse transform |
| RU2612613C2 (en) * | 2010-04-05 | 2017-03-09 | Самсунг Электроникс Ко., Лтд. | Method and apparatus for performing interpolation based on transform and inverse transform |
| RU2612612C2 (en) * | 2010-04-05 | 2017-03-09 | Самсунг Электроникс Ко., Лтд. | Method and apparatus for performing interpolation based on transform and inverse transform |
| RU2612614C2 (en) * | 2010-04-05 | 2017-03-09 | Самсунг Электроникс Ко., Лтд. | Method and apparatus for performing interpolation based on transform and inverse transform |
| RU2612611C2 (en) * | 2010-04-05 | 2017-03-09 | Самсунг Электроникс Ко., Лтд. | Method and apparatus for performing interpolation based on transform and inverse transform |
| RU2573747C2 (en) * | 2011-06-27 | 2016-01-27 | Ниппон Телеграф Энд Телефон Корпорейшн | Video encoding method and apparatus, video decoding method and apparatus and programmes therefor |
Also Published As
| Publication number | Publication date |
|---|---|
| RU2003114715A (en) | 2004-11-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1999958B1 (en) | Method of reducing computations in intra-prediction mode decision processes in a digital video encoder | |
| CN104639948B (en) | For Video coding and decoded loop adaptive wiener filter | |
| RU2305377C2 (en) | Method for decreasing distortion of compressed video image and device for realization of the method | |
| JP4393875B2 (en) | System and method for providing a single layer video encoded bitstream suitable for reduced complexity decoding | |
| US7343045B2 (en) | Image information compression device | |
| WO2009132145A1 (en) | Boundary artifact correction within video units | |
| US20050129125A1 (en) | Method and apparatus for pitcure compression using variable block of arbitrary size | |
| KR100229796B1 (en) | Image decoding system with compensation function for degraded image | |
| US7787541B2 (en) | Dynamic pre-filter control with subjective noise detector for video compression | |
| JPH11146367A (en) | Mobile videophone | |
| JP2940422B2 (en) | Method for reducing block distortion generated when decoding transform-coded image data and decoding device for transform-coded image data | |
| US7613351B2 (en) | Video decoder with deblocker within decoding loop | |
| US20060133490A1 (en) | Apparatus and method of encoding moving picture | |
| JPH06133303A (en) | Video coding device | |
| JP3800435B2 (en) | Video signal processing device | |
| EP1720356A1 (en) | A frequency selective video compression | |
| JP3935667B2 (en) | Measuring video image activity by filtering DCT and prediction error coefficients | |
| KR100627494B1 (en) | Video encoder and encoding method using same | |
| JP2007516639A (en) | Encoding method and encoding apparatus | |
| JP2008544621A (en) | Encoding and decoding method and apparatus for improving video error concealment | |
| JP2004356857A (en) | Image data encoder | |
| Basavaraju et al. | Modified pre and post processing methods for optimizing and improving the quality of VP8 video codec | |
| CN119999185A (en) | Simplified derivation of filter coefficients for cross-component prediction | |
| JPH0993580A (en) | Image decoding device | |
| Cheung et al. | Optimizing MPEG-4 coding performance by taking post-processing into account |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20060111 |
|
| FZ9A | Application not withdrawn (correction of the notice of withdrawal) |
Effective date: 20060202 |
|
| MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20150521 |