[go: up one dir, main page]

RU2603495C1 - Классификация изображений документов на основе параметров цветовых слоев - Google Patents

Классификация изображений документов на основе параметров цветовых слоев Download PDF

Info

Publication number
RU2603495C1
RU2603495C1 RU2015123026/08A RU2015123026A RU2603495C1 RU 2603495 C1 RU2603495 C1 RU 2603495C1 RU 2015123026/08 A RU2015123026/08 A RU 2015123026/08A RU 2015123026 A RU2015123026 A RU 2015123026A RU 2603495 C1 RU2603495 C1 RU 2603495C1
Authority
RU
Russia
Prior art keywords
image
document
category
values
document image
Prior art date
Application number
RU2015123026/08A
Other languages
English (en)
Inventor
Анатолий Анатольевич Смирнов
Original Assignee
Общество с ограниченной ответственностью "Аби Девелопмент"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Аби Девелопмент" filed Critical Общество с ограниченной ответственностью "Аби Девелопмент"
Priority to RU2015123026/08A priority Critical patent/RU2603495C1/ru
Priority to US14/855,707 priority patent/US20160371543A1/en
Application granted granted Critical
Publication of RU2603495C1 publication Critical patent/RU2603495C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/469Contour-based spatial representations, e.g. vector-coding
    • G06V10/473Contour-based spatial representations, e.g. vector-coding using gradient analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

Изобретение относится к технологиям обработки электронных документов. Техническим результатом является обеспечение классификации изображений документов на основе функции классификации. Предложен способ для классификации изображений документов. Способ содержит этап, на котором получают изображение документа с помощью устройства обработки. Далее, согласно способу, представляют цветовую карту изображения. А также, осуществляют извлечение одного или более цветовых слоев из представления цветовой карты изображения. Далее, вычисляют значения одного или более параметров изображения документа, на основании информации из цветовых слоев изображения документа. 3 н. и 17 з.п. ф-лы, 5 ил.

Description

ОБЛАСТЬ ТЕХНИКИ
[0001] Настоящее изобретение в целом относится к вычислительным системам, в частности к системам и способам обработки электронных документов.
УРОВЕНЬ ТЕХНИКИ
[0002] Электронный документ можно получить путем сканирования или создания иным способом изображения бумажного документа и выполнения оптического распознавания символов (OCR) для получения текста, относящегося к документу.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0003] Настоящее изобретение иллюстрируется с помощью примеров, а не способом ограничения, и может быть лучше понято при рассмотрении приведенного ниже описания предпочтительных вариантов реализации в сочетании с чертежами, на которых:
[0004] на Фиг. 1 приведена блок-схема одного из вариантов реализации вычислительной системы, работающей в соответствии с одним или более аспектами настоящего изобретения;
[0005] на Фиг. 2 схематически показано изображение бумажного документа, которое может быть классифицировано в соответствии с одним или более аспектами настоящего изобретения;
[0006] на Фиг. 3 приведена блок-схема иллюстративного примера способа обработки образцов изображений с известной классификацией для обучения классификатора в соответствии с одним или более аспектами настоящего изобретения;
[0007] на Фиг. 4 приведена блок-схема иллюстративного примера способа классификации изображения документа в соответствии с одним или более аспектами настоящего изобретения, и
[0008] на Фиг. 5 приведена более подробная схема иллюстративного примера вычислительной системы, в которой реализованы способы настоящего изобретения.
ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ РЕАЛИЗАЦИИ
[0009] В настоящем документе описываются способы и системы классификации изображений документов на основе параметров цветовых слоев.
[00010] В этом документе термин «электронный документ» относится к файлу, содержащему один или более элементов цифрового содержимого, которые могут быть переданы визуально для создания визуального представления электронного документа (например, на дисплее или на печатном носителе). Электронный документ можно получить путем сканирования или создания иным способом изображения бумажного документа. В различных иллюстративных примерах электронные документы могут быть представлены в виде файлов определенного формата, например PDF, PDF/A, JPEG, JPEG 2000, JBIG2, BMP, DjVu, EPub, DOC, ODT и т.д.
[00011] В настоящем документе термин «вычислительная система» означает устройство обработки данных, оснащенное универсальным процессором, памятью и, по меньшей мере, одним интерфейсом связи. Примерами вычислительных систем, которые могут использовать описанные в этом документе способы, являются, в частности, настольные компьютеры, ноутбуки, планшетные компьютеры и смартфоны.
[00012] Система оптического распознавания символов (OCR) может получить изображение бумажного документа и преобразовать это изображение в машиночитаемый формат, допускающий поиск и содержащий текстовую информацию, извлеченную из изображения бумажного документа. В различных иллюстративных примерах исходный бумажный документ может содержать одну или более страниц, таким образом, изображение документа может содержать изображения одной или более страниц документа. В последующем описании «изображение документа» означает изображение, по меньшей мере, части исходного документа (например, страницы документа).
[00013] В различных иллюстративных примерах бумажные документы могут быть разнообразных типов, например книги, журнальные статьи, письменные договоры, рукописные или печатные письма на фирменных или личных бланках, документы, удостоверяющие личность (например, водительские права), и т.д. Бумажный документ может иметь смешанное содержимое, в том числе рукописный или печатный текстовый материал (например, отдельные буквы, группы букв, слова, колонки текста, целые страницы или части страниц или фрагменты текста, например выноски с текстом, относящиеся к графическому материалу), который может быть распознан с использованием, например, системы оптического распознавания символов (OCR), а также графический материал (например, иллюстрации, фотографии или иные графические элементы, например логотипы).
[00014] Некоторые процессы производственной деятельности могут включать классификацию различных бумажных документов по нескольким заранее заданным категориям. В иллюстративном примере в процессе страхового андеррайтинга могут рассматриваться соответствие клиента требованиям и некоторые характеристики страхуемого имущества. Процесс может включать извлечение определенной информации из множества бумажных документов различных типов, включая договоры, фотографии, кассовые квитанции, письма и т.д. Некоторые из этих документов могут иметь заданные особенности, например печати определенного цвета, которые могут содержать определенный текст, определенные логотипы, элементы бланка и (или) иные визуальные элементы, которые могут быть выполнены в различных цветах даже в черно-белых документах. В иллюстративном примере письмо может содержать черно-белый текст, напечатанный на цветном бланке. В другом иллюстративном примере договор может содержать черно-белый текст и цветной оттиск печати с определенной текстовой строкой. Процесс андеррайтинга может включать классификацию входящих документов по определенным категориям, которые могут быть установлены на основе определенных особенностей документа. Особенности документов могут быть представлены значениями определенных параметров изображений документов.
[00015] Вычислительная система, реализующая способы настоящего изобретения, может получать изображение документа и определять значения различных заданных параметров изображения. В некоторых вариантах реализации значения одного или более параметров изображения могут быть определены при извлечении одного или более цветовых слоев из представления цветовой карты изображения (например, в цветовом пространстве HSV или цветовом пространстве YCbCr). Примеры таких параметров: наличие одного или более определенных цветов в изображении; отношение количества пикселей одного или более определенных цветов к общему количеству пикселей изображения; отношение площади изображения, занятой определенным цветовым слоем, к общей площади изображения; наличие текста в определенном цветовом слое и (или) наличие определенного текста в определенном цветовом слое. Цветовой слой в настоящем документе означает графический слой, содержащий один или более цветов. Слой может быть извлечен из изображения документа одним их известных способов, например представлением изображения в цветовом пространстве (например, YCbCr, HSV и т.п.) и применением цветового фильтра.
[00016] Расчетные параметры могут быть бинарного типа или типа диапазона. Бинарные параметры указывают на наличие или отсутствие определенного параметра в изображении документа (например, в виде «ДА»/«НЕТ» или «0»/«1»). Примеры бинарных параметров: наличие одного или более из заданных цветов в изображении, наличие текста в определенном цветовом слое, наличие заданного текста в определенном цветовом слое и т.д. Наличие одного или более цветов может быть установлено по тому, были ли они извлечены из изображения документа. Наличие текста в слое может быть установлено с использованием, например, анализа компоновки документа. Для определения того, включает ли цветовой слой определенный текст, в одном варианте реализации может использоваться способ распознавания символов (например, OCR). В другом варианте реализации могут применяться любые иные способы определения того, является ли рассматриваемый текст определенным текстом. В случае параметров типа диапазон пользователем, системой и т.д. могут быть заданы различные пороговые значения заданных параметров. Например, пороговые значения для параметра «отношение площади изображения, занятой определенным цветовым слоем, к общей площади изображения» могут быть заданы как диапазоны: 0…1 и свыше 1. Специалистам в данной области техники будет понятно, что диапазоны могут различаться в зависимости от параметра и его функции.
[00017] На основе значений параметров вычислительная система, реализующая методы настоящего изобретения, может отнести изображение документа к определенной категории из множества категорий. В некоторых вариантах реализации входящие изображения документов могут быть отнесены к определенной категории на основе наличия в изображении документа одного или более заданных объектов с определенными цветами. В различных иллюстративных примерах такие объекты могут представлять собой оттиск определенной печати, текст, определенный текст или определенный графический элемент (например, элемент бланка, визуальный разделитель, логотип, водяной знак и т.п.). В определенных вариантах реализации после отнесения изображения документа к определенной категории из множества категорий может осуществляться категоризация исходного документа. Если изображение документа является страницей исходного одностраничного документа, документ может быть автоматически категоризован на основе категории его изображения. Если изображение документа является страницей исходного многостраничного документа, документ может быть отнесен к определенной категории на основе одной или более категорий изображений его страниц.
[00018] В определенных вариантах реализации вычислительная система, реализующая способы, описанные в настоящем документе, может использовать функцию классификации для определения категории, к которой относится изображение документа. Значение этой функции может отражать степень соответствия изображения документа определенной категории из множества категорий (например, вероятность отнесения изображения документа к определенной категории). Вычислительная система может определить значение выбранной функции для каждой категории из множества категорий и затем отнести изображение документа к категории, соответствующей оптимальному значению функции классификации.
[00019] В определенных вариантах реализации при определении степени соответствия изображения документа определенной категории из множества категорий функция классификации может учитывать набор известных данных, являющихся свидетельствами соответствия параметров изображений документов категориям изображений документов. В иллюстративном примере вычислительная система, реализующая методы настоящего изобретения, может создавать и (или) обновлять массив известных данных путем обработки множества образцов изображений с известной классификацией. Для каждого образца изображения вычислительная система может определить значения параметров изображения и сохранить установленные значения вместе с идентификатором категории, к которой отнесен образец изображения. В качестве альтернативы вычислительная система, реализующая методы настоящего изобретения, может получить набор известных данных из внешнего источника (например, из другой вычислительной системы).
[00020] Различные аспекты упомянутых выше способов и систем подробно описаны ниже в этом документе с помощью примеров, а не способом ограничения.
[00021] На Фиг. 1 приведена блок-схема одного из вариантов реализации вычислительной системы 100, работающей в соответствии с одним или более аспектами настоящего изобретения. В иллюстративных примерах вычислительная система 100 может представлять собой разнообразные вычислительные устройства, включая планшетный компьютер, смартфон, ноутбук или настольный компьютер.
[00022] Вычислительная система 100 может содержать процессор 110, подключенный к системной шине 120. Другие устройства, подключенные к системной шине 120, могут включать в себя память 130, дисплей 140, клавиатуру 150, оптическое устройство ввода 160 и один или несколько интерфейсов связи 170. Термин «подключенный» в настоящем документе означает электрическое соединение и (или) обмен данными через одно или более интерфейсных устройств, адаптеров и т.п.
[00023] В различных иллюстративных примерах процессор 110 может быть представлен одним или более устройствами обработки, такими как универсальные и (или) специализированные процессоры. Память 130 может представлять собой одно или более энергозависимых устройств памяти (например, микросхемы ОЗУ), одно или более энергонезависимых устройств памяти (например, микросхемы ПЗУ или ЭППЗУ) и (или) одно или более запоминающих устройств (например, оптические или магнитные диски). Оптическое устройство ввода 160 может представлять собой сканер или фотокамеру, предназначенную для улавливания света, отраженного от объектов, расположенных в ее поле зрения. Пример вычислительного устройства, в котором реализованы аспекты настоящего изобретения, будет рассмотрен более подробно ниже в описании Фиг. 5.
[00024] Память 130 может содержать инструкции приложения 190 для классификации изображений документов с использованием информации о цветовых слоях. В иллюстративном примере приложение 190 может быть реализовано как функция, которая вызывается через пользовательский интерфейс другого приложения. В качестве альтернативы приложение 190 может быть реализовано в виде автономного приложения.
[00025] В соответствии с одним или более аспектами настоящего изобретения вычислительная система 100 может получать изображение документа и извлекать один или более цветовых слоев из представления цветовой карты полученного изображения. На Фиг. 2 схематически показано изображение бумажного документа, которое может быть классифицировано в соответствии с одним или более аспектами настоящего изобретения. Изображение документа 200 может иметь белый фон и содержать красный логотип 203, черный фрагмент текста 205 и синий оттиск печати 207. Логотип 203 и оттиск печати 207 могут содержать определенные визуальные разделители и определенный текст. Красный цветовой слой 200А изображения документа 200 содержит изображение логотипа 203, а синий цветовой слой 200 В изображения документа 200 содержит изображение оттиска печати 207.
[00026] В иллюстративном примере после получения изображения документа вычислительная система 100 может создать представление цветовой карты изображения в цветовом пространстве «тон-насыщенность-значение» (HSV). Цветовое пространство HSV получается преобразованием значений цветового пространства RGB в цилиндрические координаты. Угол относительно центральной вертикальной оси соответствует «тону», а расстояние от оси соответствует «насыщенности». Высота соответствует значению, которое отражает воспринимаемую яркость по отношению к насыщенности [https://en.wikipedia.org/wiki/HSL_and_HSV]. В другом иллюстративном примере после получения изображения документа вычислительная система 100 создает представление цветовой карты изображения в цветовом пространстве YCBCR, где Y - компонента яркости, а Cb и Cr - синяя и красная цветоразностные компоненты.
[00027] Используя представление цветовой карты, вычислительная система 100 может затем извлечь из него один или более цветовых слоев. В иллюстративном примере на Фиг. 2 вычислительная система 100 может извлечь из представления цветовой карты изображения документа 200 красный цветовой слой 200А и синий цветовой слой 200 В. Красный цветовой слой 200А изображения документа 200 может содержать изображение логотипа 203, а синий цветовой слой 200 В изображения документа 200 - изображение оттиска печати 207.
[00028] Вычислительная система 100 может использовать представление цветовых слоев для определения значений набора заданных параметров изображения. Примеры таких параметров: наличие одного или более определенных цветов в изображении; отношение количества пикселей одного или более определенных цветов к общему количеству пикселей изображения; отношение площади изображения, занятой определенным цветовым слоем, к общей площади изображения; наличие текста в определенном цветовом слое и (или) наличие определенного текста в определенном цветовом слое.
[00029] В различных иллюстративных примерах вычислительная система 100 также может определять значения других заданных параметров изображения, включая, например, относительные или абсолютные позиции колонок текста и (или) разделителей текста, наличие или частоту определенных лексем, наличие определенных штрих-кодов и иных графических носителей кодированной информации и т.д.
[00030] На основе полученных значений параметров вычислительная система 100 может отнести изображение документа к определенной категории из множества категорий. Классификация может использовать одну или несколько категорий, отражающих наличие в изображении документа одного или более заданных объектов с определенными цветами. В различных иллюстративных примерах такие объекты могут представлять собой оттиск определенной печати в определенном цветовом слое, определенный текст в определенном цветовом слое или определенный графический элемент (например, элемент бланка, визуальный разделитель, логотип, водяной знак и т.п.) в определенном цветовом слое.
[00031] В определенных вариантах реализации вычислительная система 100 может использовать функцию классификации для определения категории, к которой относится изображение документа. Значения функции классификации могут отражать степень соответствия изображения документа определенной категории из множества категорий (например, вероятность отнесения изображения документа к определенной категории). Вычислительная система может определять значение выбранной функции классификации для каждой категории из множества категорий, а затем относить изображение документа к категории, соответствующей оптимальному (например, минимальному или максимальному) значению функции классификации. Хотя в иллюстративном примере, подробно описанном ниже, функция классификации представлена наивным байесовским классификатором, способы, описанные в настоящем документе, могут использовать другие вероятностные или детерминированные функции.
[00032] В иллюстративном примере функция классификации может быть представлена наивным байесовским классификатором:
Figure 00000001
[00033] где p(Ck|F1, …, Fn) - это условная вероятность того, что объект, имеющий значения параметров F1, …, Fn, относится к категории Ck;
P(Ck) - априорная вероятность того, что объект относится к категории Ck;
Z - нормализующая константа и
P(Fi|Ck) - вероятность того, что объект, имеющий значение параметра Fi, относится к категории Ck.
[00034] В определенных вариантах реализации вычислительная система 100 для каждой категории из множества категорий классификации изображений документов может вычислять значение выбранной функции классификации (например, наивного байесовского классификатора), отражающее вероятность того, что изображение документа относится к соответствующей категории. Вычислительная система 100 затем может выбрать оптимальное (например, максимальное) значение среди вычисленных значений и отнести изображение документа к категории, соответствующей выбранному оптимальному значению функции классификации.
[00035] В некоторых вариантах реализации вычисление функции классификации может основываться на наборе известных данных по соотнесению параметров изображений документов и категорий изображений документов. В иллюстративном примере значения Р(Ck) и P(Fi|Ck) вычислены на основе массива известных данных.
[00036] Вычислительная система 100 может создать и (или) обновить набор известных данных на этапе обучения классификатора путем обработки множества образцов изображений с известной классификацией. Для каждого образца изображения вычислительная система может определить значения параметров изображения и сохранить установленные значения вместе с идентификатором категории, к которой отнесен образец изображения. В качестве альтернативы вычислительная система, реализующая методы настоящего изобретения, может получить набор известных данных из внешнего источника (например, из другой вычислительной системы).
[00037] На Фиг. 3 приведена блок-схема одного иллюстративного примера способа 300 обработки образцов изображений с известной классификацией для обучения классификатора в соответствии с одним или более аспектами настоящего изобретения. Способ 300 и (или) каждая из его отдельных функций, стандартных программ, подпрограмм или операций может выполняться с помощью одного или более процессоров вычислительной системы (например, устройства обработки 100 на Фиг. 1), реализующей способ. В некоторых вариантах реализации способ 300 может выполняться в одном потоке обработки. В качестве альтернативы способ 300 может выполняться с использованием двух и более потоков обработки, при этом каждый поток выполняет одну или более отдельных функций, стандартных программ, подпрограмм или операций способа. В иллюстративном примере потоки обработки, реализующие способ 300, могут быть синхронизированы (например, с помощью семафоров, критических секций и (или) других механизмов синхронизации потоков). В качестве альтернативы потоки обработки, реализующие способ 300, могут выполняться асинхронно по отношению друг к другу.
[00038] В блоке 310 устройство обработки, реализующее способ, получает изображение документа. В иллюстративном примере изображение может быть получено с помощью оптического устройства ввода 160 модельного устройства обработки 100, показанного на Фиг. 1.
[00039] В блоке 320 устройство обработки определяет значения набора заданных параметров образца изображения документа. Как указано выше в настоящем документе, значения одного или более параметров изображения могут быть определены при извлечении одного или более цветовых слоев из представления цветовой карты изображения (например, в цветовом пространстве HSV или цветовом пространстве YCbCr). Примеры таких параметров: наличие одного или более определенных цветов в изображении; отношение количества пикселей одного или более определенных цветов к общему количеству пикселей изображения; отношение площади изображения, занятой определенным цветовым слоем, к общей площади изображения; наличие текста в определенном цветовом слое и (или) наличие определенного текста в определенном цветовом слое. Примеры других определяемых параметров образца изображения документа: относительные или абсолютные позиции колонок текста и (или) разделителей текста, наличие или частота определенных лексем, наличие определенных штрих-кодов и иных графических носителей кодированной информации и т.д.
[00040] В блоке 330 устройство обработки сохраняет значения параметров вместе с идентификатором категории изображения в памяти, например в файле или базе данных.
[00041] После определения в блоке 340 необходимости обработки другого образца изображения документа происходит переход в начало цикла для получения образца изображения документа в блоке 310, в противном случае цикл останавливается.
[00042] На Фиг. 4 приведена блок-схема иллюстративного примера способа 400 классификации изображения документа в соответствии с одним или более аспектами настоящего изобретения. Способ 400 и (или) каждая из его отдельных функций, стандартных программ, подпрограмм или операций может выполняться с помощью одного или более процессоров вычислительной системы (например, устройства обработки 100 на Фиг. 1), реализующей способ. В некоторых вариантах реализации способ 400 может выполняться в одном потоке обработки. В качестве альтернативы способ 400 может выполняться с использованием двух и более потоков обработки, при этом каждый поток выполняет одну или более отдельных функций, стандартных программ, подпрограмм или операций способа. В иллюстративном примере потоки обработки, реализующие способ 400, могут быть синхронизированы (например, с помощью семафоров, критических секций и (или) других механизмов синхронизации потоков). В качестве альтернативы потоки обработки, реализующие способ 400, могут выполняться асинхронно по отношению друг к другу.
[00043] В блоке 410 устройство обработки, реализующее способ, получает изображение документа. В иллюстративном примере изображение может быть получено с помощью оптического устройства ввода 160 модельного устройства обработки 100, показанного на Фиг. 1.
[00044] В блоке 420 устройство обработки определяет значения набора заданных параметров изображения документа. Как указано выше в настоящем документе, значения одного или более параметров изображения могут быть определены при извлечении одного или более цветовых слоев из представления цветовой карты изображения (например, в цветовом пространстве HSV или цветовом пространстве YCbCr). Примеры таких параметров: наличие одного или более определенных цветов в изображении; отношение количества пикселей одного или более определенных цветов к общему количеству пикселей изображения; отношение площади изображения, занятой определенным цветовым слоем, к общей площади изображения; наличие текста в определенном цветовом слое и (или) наличие определенного текста в определенном цветовом слое. Примеры других определяемых параметров изображения документа: относительные или абсолютные позиции колонок текста и (или) разделителей текста, наличие или частота определенных лексем, наличие определенных штрих-кодов и иных графических носителей кодированной информации и т.д.
[00045] В блоке 430 устройство обработки определяет набор значений выбранной функции классификации. Каждое значение функции классификации может отражать вероятность того, что изображение документа относится к определенной категории из множества категорий. В определенных вариантах реализации функция классификации может быть представлена наивным байесовским классификатором, подробно описанным выше в настоящем документе.
[00046] В блоке 440 устройство обработки выбирает оптимальное значение функции классификации из набора установленных значений.
[00047] В блоке 450 устройство обработки относит изображение документа к категории, соответствующей выбранному оптимальному значению функции классификации.
[00048] После определения в блоке 460 необходимости обработки другого изображения документа происходит переход в начало цикла для получения изображения документа в блоке 410, в противном случае цикл останавливается.
[00049] На Фиг. 5 представлена более подробная схема примера вычислительной системы 1000, внутри которой исполняется набор команд, которые вызывают выполнение вычислительной системой любого из способов или нескольких способов настоящего изобретения. Вычислительная система 1000 может включать те же компоненты, что и вычислительная система 100 на Фиг. 1, а также некоторые дополнительные или другие компоненты, некоторые из которых могут быть опциональными и необязательными для реализации аспектов настоящего изобретения. Вычислительная система может быть соединена с другой вычислительной системой по локальной сети, корпоративной сети, сети экстранет или сети Интернет. Вычислительная система может работать в качестве сервера или клиента в сетевой среде «клиент/сервер», или в качестве однорангового вычислительного устройства в одноранговой (или распределенной) сетевой среде. Вычислительная система может быть представлена персональным компьютером (ПК), планшетным ПК, телевизионной приставкой (STB), карманным ПК (PDA), сотовым телефоном или любой вычислительной системой, способной выполнять набор команд (последовательно или иным образом), определяющих операции, которые должны быть выполнены этой вычислительной системой. Кроме того (хотя показана только одна вычислительная система), термин «вычислительная система» также может включать любую совокупность вычислительных систем, которые отдельно или совместно выполняют набор (или несколько наборов) команд для выполнения одной или более методик, обсуждаемых в настоящем документе.
[00050] Пример вычислительной системы 1000 включает процессор 502, основную память 504 (например, постоянное запоминающее устройство (ПЗУ) или динамическую оперативную память (DRAM)) и устройство хранения данных 518, которые взаимодействуют друг с другом по шине 530.
[00051] Процессор 502 может быть представлен одним или более универсальными устройствами обработки данных, например микропроцессором, центральным процессором и т.п. В частности, процессор 502 может представлять собой микропроцессор с полным набором команд (CISC), микропроцессор с сокращенным набором команд (RISC), микропроцессор с командными словами сверхбольшой длины (VLIW) или процессор, реализующий другой набор команд, или процессоры, реализующие комбинацию наборов команд. Процессор 502 также может представлять собой одно или более устройств обработки специального назначения, например заказную интегральную микросхему (ASIC), программируемую пользователем вентильную матрицу (FPGA), процессор цифровых сигналов (DSP), сетевой процессор и т.п. Процессор 502 настроен на выполнение команд 526 для осуществления рассмотренных в настоящем документе операций и функций.
[00052] Вычислительная система 1000 может дополнительно включать устройство сетевого интерфейса 522, устройство визуального отображения 510, устройство ввода символов 512 (например, клавиатуру) и устройство ввода в виде сенсорного экрана 514.
[00053] Устройство хранения данных 518 может содержать машиночитаемый носитель данных 524, в котором хранится один или более набор команд 526 и в котором реализована одна или более методик или функций, рассмотренных в настоящем документе. Команды 526 также могут находиться полностью или, по меньшей мере, частично в основной памяти 504 и (или) в процессоре 502 во время выполнения их в вычислительной системе 1000, при этом оперативная память 504 и процессор 502 также представляют собой машиночитаемый носитель данных. Команды 526 также могут передаваться или приниматься по сети 516 через устройство сетевого интерфейса 522.
[00054] В некоторых вариантах реализации команды 526 могут включать в себя команды приложения 190 для классификации изображений документов с использованием информации о цветовых слоях и могут выполняться приложением 190 на Фиг. 1. Хотя машиночитаемый носитель данных 524, показанный в примере на Фиг. 5, является единым носителем, термин «машиночитаемый носитель» может включать один носитель или несколько носителей (например, централизованную или распределенную базу данных и (или) соответствующие кэши и серверы), в которых хранится один или несколько наборов команд. Термин «машиночитаемый носитель данных» также может включать любой носитель, который может хранить, кодировать или содержать набор команд для выполнения машиной и который обеспечивает выполнение машиной любой одной или более методик настоящего изобретения. Соответственно, термин «машиночитаемый носитель данных» также включает, в частности, устройства твердотельной памяти, оптические и магнитные носители.
[00055] Описанные в документе способы, компоненты и функции могут быть реализованы дискретными компонентами оборудования, либо они могут быть интегрированы в функции других аппаратных компонентов, таких как ASICS, FPGA, DSP или подобных устройств. Кроме того, способы, компоненты и функции могут быть реализованы с помощью модулей встроенного программного обеспечения или функциональных схем аппаратного обеспечения. Способы, компоненты и функции также могут быть реализованы с помощью любой комбинации аппаратного обеспечения и программных компонентов, либо исключительно с помощью программного обеспечения.
[00056] В приведенном выше описании изложены многочисленные детали. Однако любому специалисту в этой области техники, ознакомившемуся с этим описанием, очевидно, что настоящее изобретение может быть осуществлено на практике без этих конкретных деталей. В некоторых случаях хорошо известные структуры и устройства показаны в виде блок-схем, а не подробно, чтобы не усложнять описание настоящего изобретения.
[00057] Некоторые части описания предпочтительных вариантов реализации представлены в виде алгоритмов и символического представления операций с битами данных в памяти компьютера. Такие описания и представления алгоритмов представляют собой средства, используемые специалистами в области обработки данных, чтобы наиболее эффективно передавать сущность своей работы другим специалистам в данной области. Здесь и в целом алгоритмом называется логически непротиворечивая последовательность операций, приводящих к требуемому результату. Операции требуют физических манипуляций с физическими величинами. Обычно (хотя и не обязательно) эти величины принимают форму электрических или магнитных сигналов, которые можно хранить, передавать, комбинировать, сравнивать и подвергать другим манипуляциям. Иногда удобно, прежде всего, для обычного использования, описывать эти сигналы в виде битов, значений, элементов, символов, терминов, цифр и т.п.
[00058] Однако следует иметь в виду, что все эти и подобные термины должны быть связаны с соответствующими физическими величинами, и что они являются лишь удобными обозначениями, применяемыми к этим величинам. Если не указано иное, принимается, что в последующем описании термины «определение», «вычисление», «расчет», «получение», «установление», «изменение» и т.п. относятся к действиям и процессам вычислительной системы или аналогичной электронной вычислительной системы, которая использует и преобразует данные, представленные в виде физических (например, электронных) величин в реестрах и устройствах памяти вычислительной системы, в другие данные, аналогично представленные в виде физических величин в устройствах памяти или реестрах вычислительной системы или иных устройствах хранения, передачи или отображения такой информации.
[00059] Настоящее изобретение также относится к устройству для выполнения операций, описанных в настоящем документе. Такое устройство может быть специально сконструировано для требуемых целей, или оно может содержать универсальный компьютер, который избирательно активируется или реконфигурируется с помощью компьютерной программы, хранящейся на компьютере. Такая компьютерная программа может храниться на машиночитаемом носителе данных, например, в частности, на диске любого типа, включая дискеты, оптические диски, CD-ROM и магнитно-оптические диски, постоянные запоминающие устройства (ПЗУ), оперативные запоминающие устройства (ОЗУ), СППЗУ, ЭППЗУ, магнитные или оптические карты и носитель любого типа, подходящий для хранения электронной информации.
[00060] Следует понимать, что вышеприведенное описание носит иллюстративный, а не ограничительный характер. Различные другие варианты реализации станут очевидными специалистам в данной области техники после прочтения и понимания приведенного выше описания. Область применения изобретения поэтому должна определяться с учетом прилагаемой формулы изобретения, а также всех областей применения эквивалентных способов, которые покрывает формула изобретения.

Claims (20)

1. Способ для классификации изображений документов, заключающийся в:
получении изображения документа с помощью устройства обработки;
представлении цветовой карты изображения;
извлечении одного или более цветовых слоев из представления цветовой карты изображения;
вычислении значений одного или более параметров изображения документа на основе информации из цветовых слоев изображения документа; и
отнесении изображения документа к категории из множества категорий на основе функции классификации и вычисленных значений параметров, где множество категорий включает категорию, отражающую наличие в изображении документа определенного объекта с одним или более определенными цветами.
2. Способ по п. 1, отличающийся тем, что параметры содержат, по меньшей мере, один параметр из группы, являющийся бинарным параметром или параметром типа диапазон.
3. Способ по п. 1, отличающийся тем, что, по меньшей мере, один параметр означает: наличие одного или более определенных цветов в изображении документа; отношение количества пикселей одного или более определенных цветов к общему количеству пикселей изображения документа; отношение площади изображения документа, занятой определенным цветовым слоем, к общей площади изображения документа; наличие текста в определенном цветовом слое или наличие определенного текста в определенном цветовом слое.
4. Способ по п. 1, дополнительно включающий:
получение образца изображения документа, отнесенного к определенной категории;
определение значений параметров образца изображения документа; и
сохранение в памяти установленных значений вместе с идентификатором определенной категории.
5. Способ по п. 1, отличающийся тем, что отнесение изображения документа к категории из множества категорий заключается в:
определении множества значений функции классификации, при этом каждое значение функции классификации отражает вероятность отнесения изображения документа к определенной категории из множества категорий;
выборе оптимального значения функции классификации из множества установленных значений; и
отнесении изображения документа к категории, соответствующей выбранному оптимальному значению функции классификации.
6. Способ по п. 5, отличающийся тем, что функция классификации представлена наивным байесовским классификатором.
7. Способ по п. 5, отличающийся тем, что определение множества значений функции классификации заключается в получении из памяти значений параметров множества образцов изображений документов, отнесенных к множеству категорий.
8. Способ по п. 1, отличающийся тем, что извлечение цветовых слоев осуществляется с использованием представления цветовой карты изображения документа, по меньшей мере, в одном из цветовых пространств: HSV или YCbCr.
9. Способ по п. 8, отличающийся тем, что представление цветовой карты содержит множество цветовых значений, соответствующих множеству пикселей, составляющих изображение документа.
10. Способ по п. 1, отличающийся тем, что определение параметра включает анализ компоновки документа для извлеченного цветового слоя изображения документа.
11. Способ по п. 1, отличающийся тем, что определение параметра включает оптическое распознавание символов (OCR) для извлеченного цветового слоя изображения документа.
12. Способ по п. 11, отличающийся тем, что объект является, по меньшей мере, оттиском определенной печати, текстом, определенным текстом или определенным графическим элементом.
13. Система для классификации изображений документов, содержащая:
память;
устройство обработки, подключенное к памяти, причем устройство обработки предназначено для:
получения изображения документа с помощью устройства обработки;
представления цветовой карты изображения;
извлечения одного или более цветовых слоев из представления цветовой карты изображения;
вычисления значений одного или более параметров изображения документа на основе информации из цветовых слоев изображения документа; и
отнесения изображения документа к категории из множества категорий на основе функции классификации и вычисленных значений параметров, где множество категорий включает категорию, отражающую наличие в изображении документа определенного объекта с одним или более определенными цветами.
14. Система по п. 13, отличающаяся тем, что, по меньшей мере, один параметр означает: наличие одного или более определенных цветов в изображении документа; отношение количества пикселей одного или более определенных цветов к общему количеству пикселей изображения документа; отношение площади изображения документа, занятой определенным цветовым слоем, к общей площади изображения документа; наличие текста в определенном цветовом слое или наличие определенного текста в определенном цветовом слое.
15. Система по п. 13, отличающаяся тем, что устройство обработки также предназначено для:
получения образца изображения документа, отнесенного к определенной категории;
определения значений параметров образца изображения документа; и
сохранения в памяти установленных значений вместе с идентификатором определенной категории.
16. Система по п. 13, отличающаяся тем, что отнесение изображения документа к категории из множества категорий заключается в:
определении множества значений функции классификации, при этом каждое значение функции классификации отражает вероятность отнесения изображения документа к определенной категории из множества категорий;
выборе оптимального значения функции классификации из множества установленных значений; и
отнесении изображения документа к категории, соответствующей выбранному оптимальному значению функции классификации.
17. Постоянный машиночитаемый носитель данных, содержащий исполняемые команды, которые при исполнении их устройством обработки приводят к выполнению операций, включающих в себя:
получение изображения документа с помощью устройства обработки;
представление цветовой карты изображения;
извлечение одного или более цветовых слоев из представления цветовой карты изображения;
вычисление значений одного или более параметров изображения документа на основе информации из цветовых слоев изображения документа; и
отнесение изображения документа к категории из множества категорий на основе функции классификации и вычисленных значений параметров, где множество категорий включает категорию, отражающую наличие в изображении документа определенного объекта с одним или более определенными цветами.
18. Постоянный машиночитаемый носитель данных по п. 17, отличающийся тем, что, по меньшей мере, один параметр означает: наличие одного или более определенных цветов в изображении документа; отношение количества пикселей одного или более определенных цветов к общему количеству пикселей изображения документа; отношение площади изображения документа, занятой определенным цветовым слоем, к общей площади изображения документа; наличие текста в определенном цветовом слое или наличие определенного текста в определенном цветовом слое.
19. Постоянный машиночитаемый носитель данных по п. 17, дополнительно содержащий исполняемые команды для устройства обработки, обеспечивающие:
получение образца изображения документа, отнесенного к определенной категории;
определение значений параметров образца изображения документа; и
сохранение в памяти установленных значений вместе с идентификатором определенной категории.
20. Постоянный машиночитаемый носитель данных по п. 17, отличающийся тем, что отнесение изображения документа к категории из множества категорий заключается в:
определении множества значений функции классификации, при этом каждое значение функции классификации отражает вероятность отнесения изображения документа к определенной категории из множества категорий;
выборе оптимального значения функции классификации из множества установленных значений; и
отнесении изображения документа к категории, соответствующей выбранному оптимальному значению функции классификации.
RU2015123026/08A 2015-06-16 2015-06-16 Классификация изображений документов на основе параметров цветовых слоев RU2603495C1 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2015123026/08A RU2603495C1 (ru) 2015-06-16 2015-06-16 Классификация изображений документов на основе параметров цветовых слоев
US14/855,707 US20160371543A1 (en) 2015-06-16 2015-09-16 Classifying document images based on parameters of color layers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2015123026/08A RU2603495C1 (ru) 2015-06-16 2015-06-16 Классификация изображений документов на основе параметров цветовых слоев

Publications (1)

Publication Number Publication Date
RU2603495C1 true RU2603495C1 (ru) 2016-11-27

Family

ID=57587086

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015123026/08A RU2603495C1 (ru) 2015-06-16 2015-06-16 Классификация изображений документов на основе параметров цветовых слоев

Country Status (2)

Country Link
US (1) US20160371543A1 (ru)
RU (1) RU2603495C1 (ru)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2737720C1 (ru) * 2019-11-20 2020-12-02 Общество с ограниченной ответственностью "Аби Продакшн" Извлечение полей с помощью нейронных сетей без использования шаблонов
RU2807460C1 (ru) * 2023-08-29 2023-11-15 Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" Способ контроля цветности документа по его изображению, полученному в неконтролируемых условиях съемки
US12046016B2 (en) 2021-12-09 2024-07-23 Abbyy Development Inc. Division of images into separate color layers

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI536798B (zh) * 2014-08-11 2016-06-01 虹光精密工業股份有限公司 影像分檔方法
GB2609768A (en) * 2020-11-02 2023-02-15 Zhejiang Lab Multi-task language model-oriented meta-knowledge fine tuning method and platform

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2234126C2 (ru) * 2002-09-09 2004-08-10 Аби Софтвер Лтд. Способ распознавания текста с применением настраиваемого классификатора
RU2254610C2 (ru) * 2003-09-04 2005-06-20 Государственное научное учреждение научно-исследовательский институт "СПЕЦВУЗАВТОМАТИКА" Способ автоматической классификации документов

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5596655A (en) * 1992-08-18 1997-01-21 Hewlett-Packard Company Method for finding and classifying scanned information
JP4189506B2 (ja) * 2000-06-09 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理のための装置、方法及び記録媒体
US20030198386A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for identifying and extracting character strings from captured image data
JP2004021765A (ja) * 2002-06-19 2004-01-22 Pfu Ltd 画像認識方法
JP4610930B2 (ja) * 2003-06-05 2011-01-12 オリンパス株式会社 画像処理装置、画像処理プログラム
JP4331159B2 (ja) * 2005-11-25 2009-09-16 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、画像処理プログラムおよびその記録媒体
US20070253040A1 (en) * 2006-04-28 2007-11-01 Eastman Kodak Company Color scanning to enhance bitonal image
US7630520B2 (en) * 2006-07-31 2009-12-08 Canadian Bank Note Company, Limited Method and system for document comparison using cross plane comparison
US9280839B2 (en) * 2008-01-29 2016-03-08 International Business Machines Corporation Generation of a vector graphic from a hand-drawn diagram
US8520941B2 (en) * 2008-12-09 2013-08-27 Xerox Corporation Method and system for document image classification
US8593478B2 (en) * 2010-10-19 2013-11-26 Hewlett-Packard Development Company, L.P. Extraction of a color palette model from an image of a document
EP2447884B1 (en) * 2010-10-28 2014-12-17 CycloMedia Technology B.V. Method for detecting and recognising an object in an image, and an apparatus and a computer program therefor
DE102010063965A1 (de) * 2010-12-22 2012-06-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bestimmung von Objekten einer Farbaufnahme
US8472726B2 (en) * 2011-01-07 2013-06-25 Yuval Gronau Document comparison and analysis
EP2737437A2 (en) * 2011-07-28 2014-06-04 Au10tix Limited System and methods for computerized machine-learning based authentication of electronic documents including use of linear programming for classification
US9483794B2 (en) * 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
JP5911062B2 (ja) * 2012-04-26 2016-04-27 株式会社メガチップス 物体検出装置およびプログラム
SG10201510667SA (en) * 2012-06-27 2016-01-28 Agency Science Tech & Res Text detection devices and text detection methods
US20140313216A1 (en) * 2013-04-18 2014-10-23 Baldur Andrew Steingrimsson Recognition and Representation of Image Sketches
US9076056B2 (en) * 2013-08-20 2015-07-07 Adobe Systems Incorporated Text detection in natural images
WO2015054666A1 (en) * 2013-10-10 2015-04-16 Board Of Regents, The University Of Texas System Systems and methods for quantitative analysis of histopathology images using multi-classifier ensemble schemes
US9699468B2 (en) * 2014-02-10 2017-07-04 Microsoft Technology Licensing, Llc Adaptive screen and video coding scheme
US9471853B2 (en) * 2014-05-19 2016-10-18 Jinling Institute Of Technology Method and apparatus for image processing
US9978095B2 (en) * 2014-08-30 2018-05-22 Digimarc Corporation Methods and arrangements including data migration among computing platforms, E.G. through use of steganographic screen encoding
US9563824B2 (en) * 2015-06-15 2017-02-07 Qualcomm Incorporated Probabilistic color classification
JP6491581B2 (ja) * 2015-10-06 2019-03-27 キヤノン株式会社 画像処理装置およびその制御方法ならびにプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2234126C2 (ru) * 2002-09-09 2004-08-10 Аби Софтвер Лтд. Способ распознавания текста с применением настраиваемого классификатора
RU2254610C2 (ru) * 2003-09-04 2005-06-20 Государственное научное учреждение научно-исследовательский институт "СПЕЦВУЗАВТОМАТИКА" Способ автоматической классификации документов

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2737720C1 (ru) * 2019-11-20 2020-12-02 Общество с ограниченной ответственностью "Аби Продакшн" Извлечение полей с помощью нейронных сетей без использования шаблонов
US12046016B2 (en) 2021-12-09 2024-07-23 Abbyy Development Inc. Division of images into separate color layers
RU2807460C1 (ru) * 2023-08-29 2023-11-15 Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" Способ контроля цветности документа по его изображению, полученному в неконтролируемых условиях съемки
RU2807460C9 (ru) * 2023-08-29 2023-12-22 Общество с ограниченной ответственностью "СМАРТ ЭНДЖИНС СЕРВИС" Способ контроля цветности документа по его изображению, полученному в неконтролируемых условиях съемки

Also Published As

Publication number Publication date
US20160371543A1 (en) 2016-12-22

Similar Documents

Publication Publication Date Title
US20250218150A1 (en) Iterative recognition-guided thresholding and data extraction
US11302109B2 (en) Range and/or polarity-based thresholding for improved data extraction
US9311531B2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
US11983910B2 (en) Image processing system, image processing method, and storage medium each for obtaining pixels of object using neural network
US9454696B2 (en) Dynamically generating table of contents for printable or scanned content
US10142499B2 (en) Document distribution system, document distribution apparatus, information processing method, and storage medium
CN111898520A (zh) 证件真伪识别方法、装置、计算机可读介质及电子设备
CN101295359A (zh) 图像处理程序及图像处理装置
RU2581786C1 (ru) Определение преобразований изображения для повышения качества оптического распознавания символов
KR20170101125A (ko) 정보 처리장치, 정보 처리방법, 및 기억매체
RU2603495C1 (ru) Классификация изображений документов на основе параметров цветовых слоев
KR20150091948A (ko) 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법
JP6882362B2 (ja) 身元確認書類を含む画像を識別するシステムおよび方法
US9740927B2 (en) Identifying screenshots within document images
Wydyanto et al. A hybrid approach to detect and identify text in picture
US8411940B2 (en) Method for fast up-scaling of color images and method for interpretation of digitally acquired documents
US8830487B2 (en) System and method for separating image and text in a document
US9424488B2 (en) Applying a segmentation engine to different mappings of a digital image
US12430724B2 (en) Autonomously removing scan marks from digital documents utilizing content-aware filters
US11948342B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium for determining extraction target pixel
US20240144711A1 (en) Reliable determination of field values in documents with removal of static field elements
RU2630743C1 (ru) Способ и устройство классификации изображений печатных копий документов и система сортировки печатных копий документов
AU2007249098B2 (en) Method of multi-level decomposition for colour document layout analysis
Tian et al. Self-verifiable paper documents and automatic content verification
JP2008124975A (ja) 画像データ作成装置、画像出力装置、およびプログラム

Legal Events

Date Code Title Description
QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20170613

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20171031

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20180710

PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181121

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311