[go: up one dir, main page]

RU2238587C1 - Method for recognition of encoded images - Google Patents

Method for recognition of encoded images Download PDF

Info

Publication number
RU2238587C1
RU2238587C1 RU2003103637A RU2003103637A RU2238587C1 RU 2238587 C1 RU2238587 C1 RU 2238587C1 RU 2003103637 A RU2003103637 A RU 2003103637A RU 2003103637 A RU2003103637 A RU 2003103637A RU 2238587 C1 RU2238587 C1 RU 2238587C1
Authority
RU
Russia
Prior art keywords
values
chain
current
coded
fragment
Prior art date
Application number
RU2003103637A
Other languages
Russian (ru)
Other versions
RU2003103637A (en
Inventor
В.Л. Лысенко (RU)
В.Л. Лысенко
Original Assignee
Войсковая часть 45807
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Войсковая часть 45807 filed Critical Войсковая часть 45807
Priority to RU2003103637A priority Critical patent/RU2238587C1/en
Publication of RU2003103637A publication Critical patent/RU2003103637A/en
Application granted granted Critical
Publication of RU2238587C1 publication Critical patent/RU2238587C1/en

Links

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

FIELD: computers.
SUBSTANCE: method includes operations for dividing interval of possible values of bit number in each coded string of scanning on K sub-intervals ak (k=1,2,…,K), displaying at learning stage of each q standard fragment in chain Aq of numbers a (q) k sub-intervals, placement of received chains in bank for standard chains, forming on recognition stage of standard fragments in current facsimile image of current chain Ax of numbers a (x) k of given sub-intervals, comparing to each other of a (x) k and a (q) k elements with same order numbers k and taking decision about belonging of current fragment of facsimile image to one of given standard fragments.
EFFECT: higher precision.
3 cl, 1 dwg

Description

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации.The invention relates to automation and computer technology and can be used to recognize and select the specified types of fragments of encoded documentary messages in the processing of facsimile information.

Известен способ распознавания фрагментов изображения [1], основанный на нахождении в памяти пиксельных данных, описывающих вставку размером n*n пикселов в первом изображении, производстве свертки величин интенсивности пикселов вставки с величинами ядра Лапласа с нулевым средним и получении лапласовой вставки, данные которой описывают координаты х, у и величины интенсивности пикселов со знаками, производстве свертки величин интенсивности лапласовой вставки с ядром Гаусса вдоль осей х и у и получении изображения, данные которого описывают положения и величины интенсивностей пикселов со знаками, упорядочивании чисел ядра Гаусса в гауссову последовательность и преобразовании пиксельных данных в бинарные, повторении преобразования над данными вставки размером m*m (m<n) пикселов из второго изображения, получении для каждого из возможных сдвигов величины корреляции пикселов, сравнивании величины корреляций и определении на основе максимальной величины корреляции сдвига.A known method of recognizing image fragments [1], based on finding in the memory pixel data describing an insert of size n * n pixels in the first image, producing a convolution of the intensity values of the pixels of the insert with the values of the Laplace core with a zero mean and obtaining a Laplace insert, the data of which describe the coordinates x, y and intensity values of pixels with signs, producing a convolution of the intensity values of the Laplace insert with the Gaussian core along the x and y axes, and obtaining an image whose data I describe the positions and magnitudes of the intensities of pixels with signs, arranging the numbers of the Gaussian kernel in a Gaussian sequence and converting the pixel data to binary, repeating the conversion over the insert data of size m * m (m <n) pixels from the second image, obtaining for each of the possible shifts the correlation value pixels, comparing the correlation value and determining based on the maximum shift correlation value.

Недостатком данного изобретения является существенная вычислительная сложность, обусловленная необходимостью обеспечения свертки величин интенсивностей матриц пикселов размера n*n и m*m с соответствующими величинами ядер Лапласа и Гаусса, а также вычисления соответствующих величин корреляций пикселов с последующим их сравнением.The disadvantage of this invention is the significant computational complexity due to the need to ensure the convolution of the intensity values of the matrix of pixels of size n * n and m * m with the corresponding values of the Laplace and Gaussian nuclei, as well as the calculation of the corresponding values of the correlations of pixels with their subsequent comparison.

Известен также способ распознавания текстовых изображений [2], основанный на определении прямоугольников, ограничивающих части изображения, потенциально содержащие текст, генерировании последовательности признаков для каждой части изображения, определении набора обученных скрытых марковских моделей (СММ) одиночных знаков с учетом структурных параметров каждого знака, объединении СММ, соответствующих знакам ключевого слова и имеющих один и тот же контекст, конструировании сети СММ, содержащей СММ ключевого слова, и определении с ее помощью наличия ключевого слова во входном изображении.There is also known a method for recognizing text images [2], based on the determination of rectangles bounding the parts of the image that potentially contain text, generating a sequence of signs for each part of the image, determining a set of trained hidden Markov models (SMM) of single characters, taking into account the structural parameters of each character, combining SMMs corresponding to the characters of the keyword and having the same context, designing the SMM network containing the SMM of the keyword, and determining it by the power of having a keyword in the input image.

Как показано в [3], хранение факсимильных изображений в факсимильных банках данных наиболее целесообразно осуществлять в сжатой форме, что обеспечивается использованием специальных видов кодирования, таких как модифицированный код Хаффмана (код МН) или модифицированный код READ (код MR) [4], обеспечивающих меньший объем памяти, необходимой для хранения факсимильного изображения, чем в случае использования других графических форматов.As shown in [3], it is most expedient to store facsimile images in facsimile data banks in a compressed form, which is ensured by using special types of coding, such as a modified Huffman code (MH code) or a modified READ code (MR code) [4], which provide less memory required for storing a facsimile image than with other image formats.

В этой связи недостатком приведенного выше способа является низкая точность распознавания фрагментов факсимильных изображений, представленных в кодированной форме (МН или MR), так как при этом биты знаков ключевых слов заменяются кодами длин серий двоичных нулей и единиц, что исключает возможность использования признаков, предложенных в указанном выше способе.In this regard, the disadvantage of the above method is the low recognition accuracy of fragments of facsimile images presented in coded form (MH or MR), since in this case the bits of the characters of the keywords are replaced by the codes for the lengths of the series of binary zeros and ones, which excludes the possibility of using the features proposed in the above method.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания кодированных изображений [5], основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров Ni этих участков, причем выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из М последовательных участков соседних “белых” строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N0 и выделяют р-е группы, состоящие из L последовательных “небелых” кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N1, оценивают наличие квазипериодичности следования участков, соответствующих кодированным “белым” строкам развертки изображения, определяют среднюю величину квазипериода Qr, оценивают абсолютные величины ip разностей размеров соседних кодированных “небелых” строк, вычисляют отношения dp максимальных и минимальных значений разностей ip, сравнивают полученные величины отношений dp с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.The closest in essence to the claimed invention is a method for recognizing encoded images [5], based on the operation of dividing the image, presented in the form of encoded electrical signals, into several sections and estimating the sizes N i of these sections, moreover, the encoded horizontal sections of electrical signals enclosed between two adjacent code words of the end of the image scan line, overflow filling bits in the selected line sections are deleted, the rth load is distinguished and allocated pp, consisting of M consecutive sections of adjacent “white” lines of minimum dimension, compare the numbers of these groups with the corresponding threshold value N 0 and select the pth groups consisting of L consecutive “non-white” coded lines, compare the numbers of these groups with the corresponding threshold value N 1 , evaluate the presence of the quasiperiodic sequence of the sections corresponding to the encoded “white” lines of the image scan, determine the average value of the quasiperiod Q r , evaluate the absolute values of i p differences the sizes of adjacent coded “non-white” lines, calculate the ratios d p of the maximum and minimum values of the differences i p , compare the obtained values of the ratios d p with an a priori specified threshold value D and decide whether the encoded image or its fragment belongs to a graphic or text form.

Недостатком данного способа является низкая точность распознавания кодированных фрагментов факсимильных изображений, представленных в одинаковой форме (графической или текстовой), поскольку используемые в нем признаки предназначены исключительно для различения между собой двух разных форм кодированных фрагментов факсимильных изображений: текстовой и графической. Таким образом, данный способ не позволяет обеспечить достоверное распознавание априорно заданных кодированных текстовых фрагментов среди множества возможных кодированных текстовых фрагментов (так же, как и кодированных графических фрагментов заданного вида среди множества возможных кодированных графических фрагментов факсимильных изображений).The disadvantage of this method is the low recognition accuracy of coded fragments of facsimile images presented in the same form (graphic or text), since the features used in it are intended solely to distinguish between two different forms of coded fragments of facsimile images: text and graphic. Thus, this method does not allow reliable recognition of a priori coded text fragments among the many possible coded text fragments (as well as coded graphic fragments of a given type among the many possible coded graphic fragments of facsimile images).

Целью изобретения является повышение точности распознавания фрагментов заданного вида в кодированном факсимильном изображении.The aim of the invention is to increase the recognition accuracy of fragments of a given type in an encoded facsimile image.

Цель достигается тем, что в известный способ, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, согласно изобретению введены операции, при которых интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания возможных значений длин этих строк, представляют на этапе обучения каждого "q"-ro (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а (q) k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущую цепочку Ax номеров а (x) k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а (x) k и а (q) k с одинаковыми порядковыми номерами "k", входящие в текущую цепочку Ах и в эталонные цепочки Aq, и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.The goal is achieved by the fact that in the known method, including the selection of coded line sections of electrical signals, the removal of service bits and code combinations from them, the allocation of groups of adjacent coded scan lines, the estimation of the number of bits in each coded line included in this group, according to the invention, the following operations at which the interval of possible values of the number of bits in each coded scan line is divided into “K” sub-intervals a k (k = 1, 2, ..., K), numbered in ascending order of the possible values of the lengths of these lines, represent at the training stage each "q" -ro (q = 1, 2, ..., Q, Q is the number of specified reference fragments of the facsimile image) of the reference fragment by the chain A q of numbers a (q) k sub-intervals following in the order of receipt of the corresponding current encoded lines of the reference fragment of the facsimile image, place the obtained chains in the bank of reference chains, form at the stage of recognition of reference fragments in the current facsimile image the current chain A x numbers a (x) k the specified sub-intervals into which the values of the sizes of the successive coded strings fall, the elements a are compared with each other (x) k and a (q) k with the same serial numbers "k", included in the current chain A x and in the reference chains A q , and decide on whether the current fragment of the facsimile image belongs to one of the specified reference fragments.

Оценивают абсолютные величины разностей | a (x) k -a (x) k-1 | и | a (x) k | -a (x) k+1 между значениями текущего элемента а (x) k цепочки Ах и значениями предыдущего a (x) k-1 и последующего a (x) k+1 элементов цепочки Ах и заменяют элемент а (x) k на среднее значение <a (x) k >=(a (x) k-1 -a (x) k+1 )/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины δ .Estimate the absolute values of the differences | a (x) k -a (x) k-1 | and | a (x) k | -a (x) k + 1 between the values of the current element a (x) k chains A x and the values of the previous a (x) k-1 and subsequent a (x) k + 1 elements of the chain A x and replace element a (x) k on average <a (x) k > = (a (x) k-1 -a (x) k + 1 ) / 2 of the previous and subsequent elements in case of exceeding the values of both differences of a given value δ.

Выносят решение о принадлежности текущего фрагмента, заданного цепочкой Ax, "q"-мy эталонному фрагменту, заданному цепочкой Aq, если абсолютные величины разностей значений элементов а (x) k и а (q) k цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин η (q) k .A decision is made on whether the current fragment specified by the chain A x belongs to the “q” -my reference fragment specified by the chain A q if the absolute values of the differences in the values of the elements a (x) k and a (q) k chains A x and A q with the same serial numbers "k" do not exceed the specified values η (q) k .

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается новыми операциями разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, представления на этапе обучения каждого "q"-го (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а (q) k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а (x) k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнения друг с другом элементов а (x) k и а (q) k с одинаковыми порядковыми номерами "k", входящими в текущую цепочку Ах и в эталонные цепочки Aq и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов; а также введены операции оценки абсолютной величины разностей | a (x) k -a (x) k-1 | и | a (x) k -a (x) k+1 | между значениями текущего элемента а (x) k цепочки Ах и значениями предыдущего a (x) k-1 и последующего a (x) k+1 элементов цепочки Ах и замены элемента а (x) k на среднее значение <a (x) k >=(a (x) k-1 -a (x) k+1 )/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины δ ; а также введены операции вынесения решения о принадлежности текущего фрагмента, заданного цепочкой Ах, "q"-мy эталонному фрагменту, заданному цепочкой Aq, если разности значений элементов а (x) k и а (q) k цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин η (q) k .Comparative analysis with the method selected as a prototype shows that the inventive method is distinguished by new operations for dividing the interval of possible values of the number of bits in each coded scan line into "K" sub-intervals a k (k = 1, 2, ..., K), numbered in increasing order of the values of the lengths of these lines, representing at the training stage each "q" th (q = 1, 2, ..., Q, Q is the number of specified reference fragments of the facsimile image) of the reference fragment by the chain A q numbers (q) k sub-intervals following in the order of receipt of the corresponding current coded lines of the reference fragment of the facsimile image, placing the obtained chains in the bank of the reference chains, forming at the stage of recognition of reference fragments in the current facsimile image of the current chain A x numbers a (x) k predetermined sub-intervals into which the values of the sizes of successive coded strings fall, comparing with each other the elements a (x) k and a (q) k with the same serial numbers "k" included in the current chain A x and in the reference chains A q and deciding whether the current fragment of the facsimile image belongs to one of the specified reference fragments; and also introduced the operation of evaluating the absolute value of the differences | a (x) k -a (x) k-1 | and | a (x) k -a (x) k + 1 | between the values of the current element a (x) k chains A x and the values of the previous a (x) k-1 and subsequent a (x) k + 1 elements of the chain A x and replace the element a (x) k on average <a (x) k > = (a (x) k-1 -a (x) k + 1 ) / 2 of the previous and subsequent elements in case of exceeding the values of both differences of a given value δ; and also, operations are introduced for deciding whether the current fragment specified by the chain A x belongs to the “q” -my reference fragment specified by the chain A q , if the difference in values of the elements a (x) k and a (q) k chains A x and A q with the same serial numbers "k" do not exceed the specified values η (q) k .

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".Thus, the claimed method meets the criteria of the invention of "novelty."

Изобретение имеет "изобретательский уровень", т.к. оно для специалиста явным образом не следует из уровня техники.The invention has an "inventive step", because it does not explicitly follow from the prior art for a specialist.

Изобретение может быть использовано в различных областях промышленности, а именно связанных с техникой передачи и обработки изображений, с информационно-вычислительной техникой, а также в других областях народного хозяйства, и соответствует критерию "промышленная применимость".The invention can be used in various fields of industry, namely, associated with the technology of transmission and image processing, with information technology, as well as in other areas of the national economy, and meets the criterion of "industrial applicability".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.The drawing shows a block diagram of an algorithm for recognizing encoded images.

Предлагаемый способ реализуется следующим образом.The proposed method is implemented as follows.

В последовательности двоичных кодированных электрических сигналов факсимильного изображения после удаления служебных битов и кодовых слов выделяются текущие группы соседних кодированных строк развертки и затем производится оценка числа бит в каждой кодированной строке, входящей в данную группу. Далее на этапе обучения интервал возможных значений числа бит в каждой кодированной строке развертки разделяется на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, а каждый "q"-й (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент представляется цепочкой Aq номеров а (q) k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, и полученные цепочки размещаются в банке эталонных цепочек. На этапе распознавания эталонных фрагментов в текущем факсимильном изображении формируется текущая цепочка Ах номеров а (x) k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, производится оценка абсолютной величины разностей | a (x) k -a (x) k-1 | и | a (x) k -a (x) k+1 | между значениями текущего элемента а (х) k цепочки Ах и значениями предыдущего а (x) k-1 и последующего а (x) k+1 элементов цепочки Ах и замена элемента а (x) k на среднее значение <a (x) k >=(a (x) k-1 -a (x) k+1 )/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины δ ; элементы а (x) k и а (q) k с одинаковыми порядковыми номерами "k", входящими в текущую цепочку Ах и в эталонные цепочки Aq, сравниваются друг с другом и выносится решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов, если разности значений элементов а (x) k и а (q) k цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин η (q) k .In the sequence of binary coded electrical signals of the facsimile image, after removing the service bits and code words, the current groups of adjacent coded scan lines are selected and then the number of bits in each coded line included in this group is estimated. Then, at the training stage, the interval of possible values of the number of bits in each coded scan line is divided into “K” subintervals a k (k = 1, 2, ..., K), numbered in ascending order of the length values of these lines, and each “q” -th (q = 1, 2, ..., Q, Q is the number of specified reference fragments of the facsimile image) the reference fragment is represented by a chain A q of numbers a (q) k sub-intervals following in the order of receipt of the corresponding current encoded lines of the reference fragment of the facsimile image, and the resulting chains are placed in the bank of the reference chains. At the stage of recognition of reference fragments in the current facsimile image, the current chain A x numbers a is formed (x) k of the given sub-intervals into which the values of the sizes of the successive coded strings fall, the absolute value of the differences is estimated | a (x) k -a (x) k-1 | and | a (x) k -a (x) k + 1 | between the values of the current element a (x) k chain A x and the values of the previous a (x) k-1 and subsequent a (x) k + 1 elements of the chain A x and replacement of element a (x) k on average <a (x) k > = (a (x) k-1 -a (x) k + 1 ) / 2 of the previous and subsequent elements in case of exceeding the values of both differences of a given value δ; elements a (x) k and a (q) k with the same serial numbers "k" included in the current chain A x and in the reference chains A q , are compared with each other and a decision is made on whether the current fragment of the facsimile image belongs to one of the given reference fragments, if the difference in values of the elements a (x) k and a (q) k chains A x and A q with the same serial numbers "k" do not exceed the specified values η (q) k .

Способ реализуется на базе использования однокристальной микроЭВМ или ПЭВМ с процессором PENTIUM, обеспечивающих ввод данных кодированного факсимильного изображения объема 50-150 кбайт в память ОЭВМ/ПЭВМ и последующую арифметико-логическую обработку этих данных.The method is implemented on the basis of using a single-chip microcomputer or PC with a PENTIUM processor, which provides input of data of a coded facsimile image of 50-150 kB in memory to a PC / PC and subsequent arithmetic-logical processing of these data.

Способ позволяет на базе введенных операций использовать связь между структурой строчного фрагмента факсимильного изображения и структурой сформированных цепочек номеров интервалов величин размеров кодированных строк этого фрагмента и тем самым повысить точность распознавания заданных фрагментов в кодированном факсимильном изображении.The method allows to use the relationship between the structure of the line fragment of the facsimile image and the structure of the generated chains of numbers of intervals of the sizes of the encoded lines of this fragment, and thereby increase the recognition accuracy of the specified fragments in the encoded facsimile image.

Источники информацииSources of information

1. Патент США №5604819, МКИ G 06 K 9/00 от 15.03.93.1. US patent No. 5604819, MKI G 06 K 9/00 from 03/15/93.

2. Патент США №5592568, МКИ G 06 K 9/68 от 13.02.93.2. US patent No. 5592568, MKI G 06 K 9/68 from 02/13/93.

3. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, сер. Информатика, - 1993, №3, с.6.3. Introduction to the implementation of the facsimile image retrieval system. Express information, ser. Informatics, - 1993, No. 3, p.6.

4. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т. VII, вып. VII.3, 1988, с.17.4. CCITT recommendations. Series T.4. Blue Book. T. VII, no. VII.3, 1988, p. 17.

5. Патент РФ №2126552, МКИ G 06 K 9/00.5. RF patent №2126552, MKI G 06 K 9/00.

Claims (3)

1. Способ распознавания кодированных изображений, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, отличающийся тем, что интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на К субинтервалов ak (k=1,2,... ,К), нумерованных в порядке возрастания значений длин этих строк, представляют на этапе обучения каждый q-й (q=1,2,... ,Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент цепочкой Aq номеров а (q) k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а (x) k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а (x) k и а (q) k с одинаковыми порядковыми номерами k, входящими в текущую цепочку Ах и в эталонные цепочки Aq и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.1. A method for recognizing coded images, including the selection of coded line sections of electrical signals, the removal of service bits and code combinations from them, the allocation of groups of adjacent coded scan lines, an estimate of the number of bits in each coded line included in this group, characterized in that the interval of possible the values of the number of bits in each coded scan line are divided into K sub-intervals a k (k = 1,2, ..., K), numbered in increasing order of the length values of these lines, represent at the training stage each qth (q = 1,2, ..., Q, Q is the number of specified reference fragments of a facsimile image) a reference fragment with a chain A q of numbers a (q) k sub-intervals following in the order of receipt of the corresponding current encoded lines of the reference fragment of the facsimile image, place the obtained chains in the bank of reference chains, form at the stage of recognition of reference fragments in the current facsimile image of the current chain A x numbers a (x) k the specified sub-intervals into which the values of the sizes of the successive coded strings fall, the elements a are compared with each other (x) k and a (q) k with the same serial numbers k included in the current chain A x and in the reference chains A q and decide on whether the current fragment of the facsimile image belongs to one of the given reference fragments. 2. Способ по п.1, отличающийся тем, что оценивают абсолютные величины разностей | а (x) k (x) k-1 | и | а (x) k (x) k+1 | между значениями текущего элемента а (x) k цепочки Ах и значениями предыдущего а (x) k-1 и последующего a (x) k+1 элементов цепочки Ах и заменяют элемент а (x) k на среднее значение <a (x) k >=(a (x) k-1 -a (x) k+1 )/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины д.2. The method according to claim 1, characterized in that they evaluate the absolute values of the differences | a (x) k -a (x) k-1 | and | a (x) k -a (x) k + 1 | between the values of the current element a (x) k chain A x and the values of the previous a (x) k-1 and subsequent a (x) k + 1 elements of the chain A x and replace element a (x) k on average <a (x) k > = (a (x) k-1 -a (x) k + 1 ) / 2 of the previous and subsequent elements in case of exceeding the values of both differences of a given value d. 3. Способ по п.1, отличающийся тем, что выносят решение о принадлежности текущего фрагмента, заданного цепочкой Ах, q-му эталонному фрагменту, заданному цепочкой Aq, если абсолютные величины разностей значений элементов а (x) k и а (q) k цепочек Ах и Aq с одинаковыми порядковыми номерами k не превышают заданных величин η (q) k .3. The method according to claim 1, characterized in that a decision is made on whether the current fragment specified by the chain A x belongs to the q-th reference fragment specified by the chain A q if the absolute values of the differences of the values of the elements a (x) k and a (q) k chains A x and A q with the same serial numbers k do not exceed the specified values η (q) k .
RU2003103637A 2003-02-06 2003-02-06 Method for recognition of encoded images RU2238587C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2003103637A RU2238587C1 (en) 2003-02-06 2003-02-06 Method for recognition of encoded images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2003103637A RU2238587C1 (en) 2003-02-06 2003-02-06 Method for recognition of encoded images

Publications (2)

Publication Number Publication Date
RU2003103637A RU2003103637A (en) 2004-08-20
RU2238587C1 true RU2238587C1 (en) 2004-10-20

Family

ID=33537577

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2003103637A RU2238587C1 (en) 2003-02-06 2003-02-06 Method for recognition of encoded images

Country Status (1)

Country Link
RU (1) RU2238587C1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2312467C1 (en) * 2006-03-10 2007-12-10 Войсковая часть 45807 Method for automatic recognition of signals of colored facsimile messages

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5745600A (en) * 1992-12-17 1998-04-28 Xerox Corporation Word spotting in bitmap images using text line bounding boxes and hidden Markov models
US5787202A (en) * 1989-06-29 1998-07-28 Canon Kabushiki Kaisha Character recognition apparatus
RU2126552C1 (en) * 1995-05-22 1999-02-20 Войсковая часть 25714 Method for recognition of encoded images
JP2000148911A (en) * 1991-12-23 2000-05-30 At & T Corp Character recognition method and text recognition system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5787202A (en) * 1989-06-29 1998-07-28 Canon Kabushiki Kaisha Character recognition apparatus
JP2000148911A (en) * 1991-12-23 2000-05-30 At & T Corp Character recognition method and text recognition system
US5745600A (en) * 1992-12-17 1998-04-28 Xerox Corporation Word spotting in bitmap images using text line bounding boxes and hidden Markov models
RU2126552C1 (en) * 1995-05-22 1999-02-20 Войсковая часть 25714 Method for recognition of encoded images

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2312467C1 (en) * 2006-03-10 2007-12-10 Войсковая часть 45807 Method for automatic recognition of signals of colored facsimile messages

Similar Documents

Publication Publication Date Title
DK175021B1 (en) Optical machine-readable, binary code, and method of reading and generating them
JP3689455B2 (en) Information processing method and apparatus
CN112050820B (en) Road matching method, device, electronic equipment and readable storage medium
CN111382298B (en) Image retrieval method and device based on picture content and electronic equipment
EP0410739B1 (en) Method and apparatus for compressing halftone image data
JPS60142793A (en) Character recognition method
JPH04298162A (en) Method for compressing neighboring-block estimating bit
CN114745553B (en) A method for storing image data based on big data
CN112347223A (en) Document retrieval method, document retrieval equipment and computer-readable storage medium
CN116523555B (en) Clue business opportunity insight system based on NLP text processing technology
CN117520104B (en) A system for predicting abnormal state of hard disk
CN109874018A (en) Image encoding method, system, terminal and storage medium neural network based
CN117216022B (en) Digital engineering consultation data management system
CN101923650A (en) Random Forest Classification Method and Classifier Based on Contrastive Patterns
KR101064256B1 (en) Optimal Database Selection Device Using Maximum Conceptual Strength Recognition Method and Its Method
RU2238587C1 (en) Method for recognition of encoded images
CN117807189A (en) Accounting voucher search method and system
US20050244067A1 (en) Palettized image compression
RU2126552C1 (en) Method for recognition of encoded images
CN113283514B (en) Unknown class classification method, device and medium based on deep learning
CN115455966A (en) Safe word stock construction method and safe code extraction method thereof
JP2003264703A (en) Data encoding device, data encoding method, and program therefor
EP1087533A1 (en) Method and apparatus for making code book, vector quantizing device, device and method for data compression, device and method for data decompression, system for data compression/decompression
CN117540382A (en) Malicious code detection method and device, electronic equipment and storage medium
CN111897987B (en) Molecular structure diagram retrieval method based on evolution calculation multi-view fusion

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20100207