RU2238587C1 - Method for recognition of encoded images - Google Patents
Method for recognition of encoded images Download PDFInfo
- Publication number
- RU2238587C1 RU2238587C1 RU2003103637A RU2003103637A RU2238587C1 RU 2238587 C1 RU2238587 C1 RU 2238587C1 RU 2003103637 A RU2003103637 A RU 2003103637A RU 2003103637 A RU2003103637 A RU 2003103637A RU 2238587 C1 RU2238587 C1 RU 2238587C1
- Authority
- RU
- Russia
- Prior art keywords
- values
- chain
- current
- coded
- fragment
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 239000012634 fragment Substances 0.000 claims abstract description 48
- 239000000126 substance Substances 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
Landscapes
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
Description
Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации.The invention relates to automation and computer technology and can be used to recognize and select the specified types of fragments of encoded documentary messages in the processing of facsimile information.
Известен способ распознавания фрагментов изображения [1], основанный на нахождении в памяти пиксельных данных, описывающих вставку размером n*n пикселов в первом изображении, производстве свертки величин интенсивности пикселов вставки с величинами ядра Лапласа с нулевым средним и получении лапласовой вставки, данные которой описывают координаты х, у и величины интенсивности пикселов со знаками, производстве свертки величин интенсивности лапласовой вставки с ядром Гаусса вдоль осей х и у и получении изображения, данные которого описывают положения и величины интенсивностей пикселов со знаками, упорядочивании чисел ядра Гаусса в гауссову последовательность и преобразовании пиксельных данных в бинарные, повторении преобразования над данными вставки размером m*m (m<n) пикселов из второго изображения, получении для каждого из возможных сдвигов величины корреляции пикселов, сравнивании величины корреляций и определении на основе максимальной величины корреляции сдвига.A known method of recognizing image fragments [1], based on finding in the memory pixel data describing an insert of size n * n pixels in the first image, producing a convolution of the intensity values of the pixels of the insert with the values of the Laplace core with a zero mean and obtaining a Laplace insert, the data of which describe the coordinates x, y and intensity values of pixels with signs, producing a convolution of the intensity values of the Laplace insert with the Gaussian core along the x and y axes, and obtaining an image whose data I describe the positions and magnitudes of the intensities of pixels with signs, arranging the numbers of the Gaussian kernel in a Gaussian sequence and converting the pixel data to binary, repeating the conversion over the insert data of size m * m (m <n) pixels from the second image, obtaining for each of the possible shifts the correlation value pixels, comparing the correlation value and determining based on the maximum shift correlation value.
Недостатком данного изобретения является существенная вычислительная сложность, обусловленная необходимостью обеспечения свертки величин интенсивностей матриц пикселов размера n*n и m*m с соответствующими величинами ядер Лапласа и Гаусса, а также вычисления соответствующих величин корреляций пикселов с последующим их сравнением.The disadvantage of this invention is the significant computational complexity due to the need to ensure the convolution of the intensity values of the matrix of pixels of size n * n and m * m with the corresponding values of the Laplace and Gaussian nuclei, as well as the calculation of the corresponding values of the correlations of pixels with their subsequent comparison.
Известен также способ распознавания текстовых изображений [2], основанный на определении прямоугольников, ограничивающих части изображения, потенциально содержащие текст, генерировании последовательности признаков для каждой части изображения, определении набора обученных скрытых марковских моделей (СММ) одиночных знаков с учетом структурных параметров каждого знака, объединении СММ, соответствующих знакам ключевого слова и имеющих один и тот же контекст, конструировании сети СММ, содержащей СММ ключевого слова, и определении с ее помощью наличия ключевого слова во входном изображении.There is also known a method for recognizing text images [2], based on the determination of rectangles bounding the parts of the image that potentially contain text, generating a sequence of signs for each part of the image, determining a set of trained hidden Markov models (SMM) of single characters, taking into account the structural parameters of each character, combining SMMs corresponding to the characters of the keyword and having the same context, designing the SMM network containing the SMM of the keyword, and determining it by the power of having a keyword in the input image.
Как показано в [3], хранение факсимильных изображений в факсимильных банках данных наиболее целесообразно осуществлять в сжатой форме, что обеспечивается использованием специальных видов кодирования, таких как модифицированный код Хаффмана (код МН) или модифицированный код READ (код MR) [4], обеспечивающих меньший объем памяти, необходимой для хранения факсимильного изображения, чем в случае использования других графических форматов.As shown in [3], it is most expedient to store facsimile images in facsimile data banks in a compressed form, which is ensured by using special types of coding, such as a modified Huffman code (MH code) or a modified READ code (MR code) [4], which provide less memory required for storing a facsimile image than with other image formats.
В этой связи недостатком приведенного выше способа является низкая точность распознавания фрагментов факсимильных изображений, представленных в кодированной форме (МН или MR), так как при этом биты знаков ключевых слов заменяются кодами длин серий двоичных нулей и единиц, что исключает возможность использования признаков, предложенных в указанном выше способе.In this regard, the disadvantage of the above method is the low recognition accuracy of fragments of facsimile images presented in coded form (MH or MR), since in this case the bits of the characters of the keywords are replaced by the codes for the lengths of the series of binary zeros and ones, which excludes the possibility of using the features proposed in the above method.
Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания кодированных изображений [5], основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров Ni этих участков, причем выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из М последовательных участков соседних “белых” строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N0 и выделяют р-е группы, состоящие из L последовательных “небелых” кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N1, оценивают наличие квазипериодичности следования участков, соответствующих кодированным “белым” строкам развертки изображения, определяют среднюю величину квазипериода Qr, оценивают абсолютные величины ip разностей размеров соседних кодированных “небелых” строк, вычисляют отношения dp максимальных и минимальных значений разностей ip, сравнивают полученные величины отношений dp с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.The closest in essence to the claimed invention is a method for recognizing encoded images [5], based on the operation of dividing the image, presented in the form of encoded electrical signals, into several sections and estimating the sizes N i of these sections, moreover, the encoded horizontal sections of electrical signals enclosed between two adjacent code words of the end of the image scan line, overflow filling bits in the selected line sections are deleted, the rth load is distinguished and allocated pp, consisting of M consecutive sections of adjacent “white” lines of minimum dimension, compare the numbers of these groups with the corresponding threshold value N 0 and select the pth groups consisting of L consecutive “non-white” coded lines, compare the numbers of these groups with the corresponding threshold value N 1 , evaluate the presence of the quasiperiodic sequence of the sections corresponding to the encoded “white” lines of the image scan, determine the average value of the quasiperiod Q r , evaluate the absolute values of i p differences the sizes of adjacent coded “non-white” lines, calculate the ratios d p of the maximum and minimum values of the differences i p , compare the obtained values of the ratios d p with an a priori specified threshold value D and decide whether the encoded image or its fragment belongs to a graphic or text form.
Недостатком данного способа является низкая точность распознавания кодированных фрагментов факсимильных изображений, представленных в одинаковой форме (графической или текстовой), поскольку используемые в нем признаки предназначены исключительно для различения между собой двух разных форм кодированных фрагментов факсимильных изображений: текстовой и графической. Таким образом, данный способ не позволяет обеспечить достоверное распознавание априорно заданных кодированных текстовых фрагментов среди множества возможных кодированных текстовых фрагментов (так же, как и кодированных графических фрагментов заданного вида среди множества возможных кодированных графических фрагментов факсимильных изображений).The disadvantage of this method is the low recognition accuracy of coded fragments of facsimile images presented in the same form (graphic or text), since the features used in it are intended solely to distinguish between two different forms of coded fragments of facsimile images: text and graphic. Thus, this method does not allow reliable recognition of a priori coded text fragments among the many possible coded text fragments (as well as coded graphic fragments of a given type among the many possible coded graphic fragments of facsimile images).
Целью изобретения является повышение точности распознавания фрагментов заданного вида в кодированном факсимильном изображении.The aim of the invention is to increase the recognition accuracy of fragments of a given type in an encoded facsimile image.
Цель достигается тем, что в известный способ, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, согласно изобретению введены операции, при которых интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания возможных значений длин этих строк, представляют на этапе обучения каждого "q"-ro (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а
Оценивают абсолютные величины разностей | a
Выносят решение о принадлежности текущего фрагмента, заданного цепочкой Ax, "q"-мy эталонному фрагменту, заданному цепочкой Aq, если абсолютные величины разностей значений элементов а
Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается новыми операциями разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, представления на этапе обучения каждого "q"-го (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а
Таким образом, заявляемый способ соответствует критерию изобретения "новизна".Thus, the claimed method meets the criteria of the invention of "novelty."
Изобретение имеет "изобретательский уровень", т.к. оно для специалиста явным образом не следует из уровня техники.The invention has an "inventive step", because it does not explicitly follow from the prior art for a specialist.
Изобретение может быть использовано в различных областях промышленности, а именно связанных с техникой передачи и обработки изображений, с информационно-вычислительной техникой, а также в других областях народного хозяйства, и соответствует критерию "промышленная применимость".The invention can be used in various fields of industry, namely, associated with the technology of transmission and image processing, with information technology, as well as in other areas of the national economy, and meets the criterion of "industrial applicability".
На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.The drawing shows a block diagram of an algorithm for recognizing encoded images.
Предлагаемый способ реализуется следующим образом.The proposed method is implemented as follows.
В последовательности двоичных кодированных электрических сигналов факсимильного изображения после удаления служебных битов и кодовых слов выделяются текущие группы соседних кодированных строк развертки и затем производится оценка числа бит в каждой кодированной строке, входящей в данную группу. Далее на этапе обучения интервал возможных значений числа бит в каждой кодированной строке развертки разделяется на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, а каждый "q"-й (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент представляется цепочкой Aq номеров а
Способ реализуется на базе использования однокристальной микроЭВМ или ПЭВМ с процессором PENTIUM, обеспечивающих ввод данных кодированного факсимильного изображения объема 50-150 кбайт в память ОЭВМ/ПЭВМ и последующую арифметико-логическую обработку этих данных.The method is implemented on the basis of using a single-chip microcomputer or PC with a PENTIUM processor, which provides input of data of a coded facsimile image of 50-150 kB in memory to a PC / PC and subsequent arithmetic-logical processing of these data.
Способ позволяет на базе введенных операций использовать связь между структурой строчного фрагмента факсимильного изображения и структурой сформированных цепочек номеров интервалов величин размеров кодированных строк этого фрагмента и тем самым повысить точность распознавания заданных фрагментов в кодированном факсимильном изображении.The method allows to use the relationship between the structure of the line fragment of the facsimile image and the structure of the generated chains of numbers of intervals of the sizes of the encoded lines of this fragment, and thereby increase the recognition accuracy of the specified fragments in the encoded facsimile image.
Источники информацииSources of information
1. Патент США №5604819, МКИ G 06 K 9/00 от 15.03.93.1. US patent No. 5604819, MKI G 06 K 9/00 from 03/15/93.
2. Патент США №5592568, МКИ G 06 K 9/68 от 13.02.93.2. US patent No. 5592568, MKI G 06 K 9/68 from 02/13/93.
3. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, сер. Информатика, - 1993, №3, с.6.3. Introduction to the implementation of the facsimile image retrieval system. Express information, ser. Informatics, - 1993, No. 3, p.6.
4. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т. VII, вып. VII.3, 1988, с.17.4. CCITT recommendations. Series T.4. Blue Book. T. VII, no. VII.3, 1988, p. 17.
5. Патент РФ №2126552, МКИ G 06 K 9/00.5. RF patent №2126552, MKI G 06 K 9/00.
Claims (3)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2003103637A RU2238587C1 (en) | 2003-02-06 | 2003-02-06 | Method for recognition of encoded images |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2003103637A RU2238587C1 (en) | 2003-02-06 | 2003-02-06 | Method for recognition of encoded images |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2003103637A RU2003103637A (en) | 2004-08-20 |
| RU2238587C1 true RU2238587C1 (en) | 2004-10-20 |
Family
ID=33537577
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2003103637A RU2238587C1 (en) | 2003-02-06 | 2003-02-06 | Method for recognition of encoded images |
Country Status (1)
| Country | Link |
|---|---|
| RU (1) | RU2238587C1 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2312467C1 (en) * | 2006-03-10 | 2007-12-10 | Войсковая часть 45807 | Method for automatic recognition of signals of colored facsimile messages |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5745600A (en) * | 1992-12-17 | 1998-04-28 | Xerox Corporation | Word spotting in bitmap images using text line bounding boxes and hidden Markov models |
| US5787202A (en) * | 1989-06-29 | 1998-07-28 | Canon Kabushiki Kaisha | Character recognition apparatus |
| RU2126552C1 (en) * | 1995-05-22 | 1999-02-20 | Войсковая часть 25714 | Method for recognition of encoded images |
| JP2000148911A (en) * | 1991-12-23 | 2000-05-30 | At & T Corp | Character recognition method and text recognition system |
-
2003
- 2003-02-06 RU RU2003103637A patent/RU2238587C1/en not_active IP Right Cessation
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5787202A (en) * | 1989-06-29 | 1998-07-28 | Canon Kabushiki Kaisha | Character recognition apparatus |
| JP2000148911A (en) * | 1991-12-23 | 2000-05-30 | At & T Corp | Character recognition method and text recognition system |
| US5745600A (en) * | 1992-12-17 | 1998-04-28 | Xerox Corporation | Word spotting in bitmap images using text line bounding boxes and hidden Markov models |
| RU2126552C1 (en) * | 1995-05-22 | 1999-02-20 | Войсковая часть 25714 | Method for recognition of encoded images |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2312467C1 (en) * | 2006-03-10 | 2007-12-10 | Войсковая часть 45807 | Method for automatic recognition of signals of colored facsimile messages |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DK175021B1 (en) | Optical machine-readable, binary code, and method of reading and generating them | |
| JP3689455B2 (en) | Information processing method and apparatus | |
| CN112050820B (en) | Road matching method, device, electronic equipment and readable storage medium | |
| CN111382298B (en) | Image retrieval method and device based on picture content and electronic equipment | |
| EP0410739B1 (en) | Method and apparatus for compressing halftone image data | |
| JPS60142793A (en) | Character recognition method | |
| JPH04298162A (en) | Method for compressing neighboring-block estimating bit | |
| CN114745553B (en) | A method for storing image data based on big data | |
| CN112347223A (en) | Document retrieval method, document retrieval equipment and computer-readable storage medium | |
| CN116523555B (en) | Clue business opportunity insight system based on NLP text processing technology | |
| CN117520104B (en) | A system for predicting abnormal state of hard disk | |
| CN109874018A (en) | Image encoding method, system, terminal and storage medium neural network based | |
| CN117216022B (en) | Digital engineering consultation data management system | |
| CN101923650A (en) | Random Forest Classification Method and Classifier Based on Contrastive Patterns | |
| KR101064256B1 (en) | Optimal Database Selection Device Using Maximum Conceptual Strength Recognition Method and Its Method | |
| RU2238587C1 (en) | Method for recognition of encoded images | |
| CN117807189A (en) | Accounting voucher search method and system | |
| US20050244067A1 (en) | Palettized image compression | |
| RU2126552C1 (en) | Method for recognition of encoded images | |
| CN113283514B (en) | Unknown class classification method, device and medium based on deep learning | |
| CN115455966A (en) | Safe word stock construction method and safe code extraction method thereof | |
| JP2003264703A (en) | Data encoding device, data encoding method, and program therefor | |
| EP1087533A1 (en) | Method and apparatus for making code book, vector quantizing device, device and method for data compression, device and method for data decompression, system for data compression/decompression | |
| CN117540382A (en) | Malicious code detection method and device, electronic equipment and storage medium | |
| CN111897987B (en) | Molecular structure diagram retrieval method based on evolution calculation multi-view fusion |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20100207 |