[go: up one dir, main page]

WO1997010565A1 - Indicia device and optical scanning method - Google Patents

Indicia device and optical scanning method Download PDF

Info

Publication number
WO1997010565A1
WO1997010565A1 PCT/FR1996/001389 FR9601389W WO9710565A1 WO 1997010565 A1 WO1997010565 A1 WO 1997010565A1 FR 9601389 W FR9601389 W FR 9601389W WO 9710565 A1 WO9710565 A1 WO 9710565A1
Authority
WO
WIPO (PCT)
Prior art keywords
sign
signs
analysis
type
zones
Prior art date
Application number
PCT/FR1996/001389
Other languages
French (fr)
Inventor
Jean-Pierre Moussette
Original Assignee
Moussette Jean Pierre
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Moussette Jean Pierre filed Critical Moussette Jean Pierre
Priority to EP96931101A priority Critical patent/EP0850459A1/en
Publication of WO1997010565A1 publication Critical patent/WO1997010565A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K19/00Record carriers for use with machines and with at least a part designed to carry digital markings
    • G06K19/06Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
    • G06K19/06009Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking

Definitions

  • the invention relates to a device for alphanumeric and symbolic signs with manuscript or printed filling and to a method of recognition by optoelectronic reading of these signs or of any object contained in a document.
  • Programs for the optical reading of documents containing handwritten alphanumeric characters are the subject of considerable research. To be effective, these programs require computer processing power, both in terms of hardware and software, which is very expensive, for reliability of the results which is still limited. Provided that the progress of these techniques is rapid? their application in the field of industrial and administrative information circulation is far from obvious.
  • check boxes allow a certain reliability for the processing of binary information of the yes-no type by computer program, it should be noted that no simple, reliable handwritten system, using only a surface roughly equivalent to alphanumeric characters manuscripts are not available.
  • Our signs are intended to be recognized as numerical value. They are made up on the principle of single or multiple zones which are intended to receive handwritten or printed bars. Our signs may include a. two, three or more zones (Zl, Z2). These areas are intended to receive handwritten or printed indications in the form of bars. These zones are associated with a reference zone, or target zone (ZC) inseparable from the sign in its use by the recognition processing (FIG-1). For reasons of space saving and ergonomics, the target zone can be confused with another zone (FIG-2) but this is only a particular mode of use of our signs which present themselves thus.
  • ZC target zone
  • the zone can take 2 values, 0 and 1 depending on whether it is empty or checked (FIG. 3).
  • the target area is integrated into the box which performs 2 functions: handwritten information support and reference area (see below).
  • the 2-zone signs include (FIG. 4): - a zone representing the units (ZU) and intended to support from 0 to 4 bars, - another representing the value 5 (Z5) intended to support 0 or 1 single bar.
  • the combination of these 2 zones allows any numbering between 0 and 9.
  • the target zone (ZC) is merged with the value zone 5 which performs 2 functions.
  • the three-zone signs (FIG. 5) are intended for the production of values between 0 and 49 as minimally as possible on the surface.
  • the principle is the same for the unit area (ZU) and the value 5 (Z5), the additional area (ZD) is intended to support from 0 to 4 bars representing the tens.
  • the target zone is also confused with the value zone 5. In this case the sign is a number between 0 and 49, it is isolated and cannot give rise to the sequential use of classical numbering.
  • the sign is therefore only the visual mnemonic aid to facilitate the registration of bars II is defined above all by its center and a double perimeter of analysis.
  • the first perimeter defines the search start areas of the crossbars according to the search axes, the second the search end limit. This external perimeter is not equidistant from the center (FIG 7) If a research axis does not exist. the outline of these two perimeters coincide on this axis.
  • the area of the point of origin is also an inscription area (value area 1 in the case of a check mark for the check boxes, 5 for the other signs), in order to make the sign more compact. and * in the ergonomics of use facihtei so it is a particular form of the general principle.
  • the signs of our device can take different presentations based on the principles defined.
  • the signs of the check box type are presented in conventional form (FIG 8) and have only one simple zone.
  • the numeric signs can be presented in two vertical or horizontal forms from a basic module (FIG 9), the position of the empty edge can be according to the direction, top or bottom, left or right
  • the filling of the signs is done in an identical way whatever the orientation of the sign (FIG 10 and 1 1)
  • the square box is worth 0 if it is empty, 5 if it has a bar, the unit area is in the axial extension of the box, a bar in the unit area is worth 1, two bars are worth 2, three bars 3, four bars 4
  • This simple system allows serial and sequential use, as illustrated by FIG. 4 A grouping of these signs can be used for filling in information whose values are limited to a maximum. 99. 999 (FIG 12)
  • This system of handwritten filling signs has the advantage over handwritten numbers of being able to be incremented and allowing filling in several times For example for a control between 0 and 9, it suffices for the operator ensure that the number is less than or greater than 5, then in the latter case, adjust by incrementing the units.
  • the use of erasable ink and eraser allows the marks to be corrected without prejudice to optoelectronic reading.
  • the general system described above has variants of presentation and use.
  • the sign can be completed by 2 small tens bars.
  • These signs can be personalized by a letter or a logo characterizing the type of information to be worn, to help the operator in filling it out. This customization also allows a posteriori control and easy visual reading. Software control of the consistency of the information carried is ensured during computer processing. For this type of sign, the sign is also isolated, and cannot give rise to the sequential use of classic numbering.
  • the signs representing dates can be put in special form (D / M / Y) as illustrated (FIG. 13).
  • the two short lines are intended to receive the handwritten bars of tens, 3 maximum for the 31 days of the month, 1 for the months, then then 2 standard numerical signs of our device for the years
  • the signs representing hours can be put in the form h / m illustrated (FIG. 14).
  • the alphabetical signs can be produced from a conventional digital mapping modifying handwritten (or the printing directly) the sign of Figure 15.
  • Figure 16 illustrates the codification of classical French alphabet.
  • the signs that can be defined on the basis of these principles are sufficiently simple and differentiated to allow rapid filling of administrative documents. These signs can be generated in the form of images, structures or computerized fonts in any application: word processor, spreadsheet.
  • the signs are printed either in their blank forms, to be filled in by hand, or in filled printed forms (sheet code, constant references ). In the latter case, the printed signs may include an indication of their value: 1, 2, 3, ..., A, B, C, D, ... indicated next to the sign (instead of ⁇ , h, m above).
  • the sheets containing such signs are intended to be successively: - digitally read by optoelectronic reading system,
  • These sheets and documents can include various zones: printed alphanumeric zones (FIG. 2 ⁇ ), graphic zones characterized by any type of information treated as an image (FIG. 20®), checkbox zones and zones comprising our device of case signs (FIG. 20®). These areas can have mixed content. These areas will undergo appropriate treatment:
  • Each zone can be the subject of different types of treatment.
  • A- The sign device analysis process The type of device sign analysis is directly linked to the characteristics of our blank signs, and to their filling system.
  • each sign begins from a predefined point whose coordinates are supposed to be inside the target box.
  • Each sign is identified and positioned beforehand in the image (see below: Self-control and learning).
  • the target box constitutes the starting point for the analysis of each sign.
  • the state of the target reference box is recognized as crossed out.
  • a global analysis is carried out to confirm its external outline (the box should not be largely covered by a black spot, a software alarm system allows this extreme case to be resolved).
  • a software likelihood check is performed by algorithm (example: no more than 3 tens bars for the sign relating to the days of the month).
  • This learning is stored by the program in a definition file specific to a type of sheet which will include all the information allowing the processing by optoelectronic reading and recognition of the information carried on this type of sheet
  • Each zone corresponds to a portion of the image of the sheet, defined by the coordinates of a virtual rectangle containing the zone
  • These zones are indexed and their type of content - alphanumeric, printed, graphic, device of box signs or zones and check box, sheet identification code (FIG 20 ⁇ ), is associated with this index o
  • the alphanumeric zones ⁇ and the graphic zones (D are treated according to the conventional methods of computer processing of such digital data
  • the reading program will produce a digital image of each sheet, this image will be immediately analyzed in conjunction with the definition file specific to the type of sheet.
  • the specific processing of each zone will be launched sequentially to obtain a set of graphic information, alphanumeric which must be organized to be saved in a file
  • the recording of the data interpreted after digital reading for each sheet includes all the interpreted information relating to the different types of zones.
  • Each field of the record associates a type of zone and information contained in this zone (if these are differentiated). This is imperative for the zones comprising our device because the information relating to a sign can be found in the result file between 2 information relating to other zones.
  • the sheets may have their own code (FIG. 20®) of the type of our device. It is the reading of this code that will trigger each time the process of accessing the sheet definition file (see below Self-checking of the sheet type).
  • the training file or sheet definition file will therefore contain a set of data, ordered according to the user's needs, which will allow the program to produce a result file comprising a complex and heterogeneous series of data from: analysis of signs of our system, graphic images, and alphanumeric texts.
  • the analysis system makes it possible to recognize empty and full boxes and to ensure that empty or full boxes are the boxes sought. What all of these signs have in common is the target square (square, quadrilateral or closed shape). This box is the initial target. Each sign is identified and positioned by type of sheet in areas specific to our image system.
  • This code allows automatic self-checking of the sheet read, by associating its sheet definition file with it.
  • a hardware device for locating and controlling the image is therefore necessary.
  • a frame is drawn around the areas containing the signs to be analyzed (FIG. 22 ⁇ ). These frames have on the model sheet (FIG. 20) a positioning, relative to each other and with each sign, perfectly defined. These boxes can include the zone or zones containing the signs to be analyzed, where not to include them, the relative location participating in the same logical procedure. Likewise, the location of signs can be identified from standardized header and footer frames for a number of documents.
  • the sheet definition file therefore contains the coordinates of the frame (s) in relation to the image (to speed up their search), and the coordinates of each point of origin of the analysis of our signs in relation to these frames.
  • test sheets make it possible to take into account the local deformation effects at the level of the optoelectronic reading system, and systematically corrects (if necessary) the preceding vector transformation. Filling the signs of such a document is as simple and fast as filling it with handwritten numbers and letters, its optoelectronic reading and its computer processing are almost instantaneous and error-free.
  • learning and self-checking methods can be used for reading documents comprising: sheet type code zones; various printed alphanumeric zones; graphic areas; checkbox zones or zones comprising the box sign or zone sign device; areas with any structured information to be analyzed from a specific point of origin.
  • the closed target box to allow self-control, can be transformed into a simple zone whose coordinates of the starting point of our spectral type analysis are defined (FIG. 18 / l (D, 12 ⁇ and FIG. 19 ⁇ )
  • the number of handwritten or printed bars contained in the zones assigned to the units ⁇ , and possibly to the zones of values 5 or tens ⁇ can be recognized according to our method If these zones are wide enough, our auto-correction system can s "prove useless because the risks of angular variations or by zoom effect leading to reading errors, decrease with the increase in the size of the signs and bars. Any system derived from our analysis process and our signs device , based on the analysis of the number of bars in predefined areas, must therefore be considered within the scope of our claims
  • the signs can be identified being located inside one or more frames (FIG. 23) or outside these frames; these frames may be non-existent (FIG. 17).
  • the target cell or reference zone can consist of a cell in a table, other cells receiving the bars of tens or 5 units (FIG. 18).
  • the target cell can be common to several zones corresponding to different signs.
  • the invention is not limited to the embodiments described and shown for which other variants are possible in:

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

An indicia device wherein the indiciae can be modified by handwriting and correspond to related symbolic or alphanumeric values. The indiciae are modified by entering simple bars in predetermined areas, and can be directly printed with their final values. The invention provides such a device, with a related method for analysing the image obtained by the optoelectronic scanning of the document bearing said indiciae. The method includes a system for analysing and detecting the sheet type, the areas with indiciae, the indiciae inside the areas, and any handwritten or printed changes to the base indiciae. It also includes a self-correcting technique for the optoelectronically scanned document images and a technique for learning the type and structure of the document contents. The method is useful for filling administrative documents and for repetitive checking applications, and for the fast and error-free computer acquisition thereof by optoelectronic scanning.

Description

DISPOSITIF DE SIGNES ET PROCEDE DE LECTURE OPTIQUESIGN DEVICE AND OPTICAL READING METHOD
DESCRIPTIONDESCRIPTION
L'invention est relative à un dispositif de signes alphanumériques et symboliques à remplissage manuscrit ou imprimé et à un procédé de reconnaissance par lecture optoélectronique de ces signes ou de tout objet contenu dans un document. Les programmes de lecture optique de documents comportant des caractères alphanumériques manuscrits font l'objet de recherches importantes. Pour être efficaces, ces programmes nécessitent une puissance de traitement informatique, tant au niveau matériel que logiciel, très onéreuse, pour une fiabilité des résultats encore limitée. Pour autant que le progrès de ces techniques soit rapide ? leur application dans le domaine de la circulation de l'information industrielle et administrative est loin d'être évidente.The invention relates to a device for alphanumeric and symbolic signs with manuscript or printed filling and to a method of recognition by optoelectronic reading of these signs or of any object contained in a document. Programs for the optical reading of documents containing handwritten alphanumeric characters are the subject of considerable research. To be effective, these programs require computer processing power, both in terms of hardware and software, which is very expensive, for reliability of the results which is still limited. Provided that the progress of these techniques is rapid? their application in the field of industrial and administrative information circulation is far from obvious.
De nombreux documents techniques comportant un remplissage alphanumérique manuscrit doivent être ressaisis par des opérateurs informatiques exécutant des tâches ingrates avec une fiabilité également imparfaite.Many technical documents with a handwritten alphanumeric filling must be re-entered by IT operators performing thankless tasks with equally imperfect reliability.
Si les cases à cocher permettent avec une certaine fiabilité le traitement d'informations binaires de type oui-non par programme informatique, on doit constater qu'aucun système manuscrit simple, fiable, et n'utilisant qu'une surface sensiblement équivalente aux caractères alphanumériques manuscrits n'est disponible.If the check boxes allow a certain reliability for the processing of binary information of the yes-no type by computer program, it should be noted that no simple, reliable handwritten system, using only a surface roughly equivalent to alphanumeric characters manuscripts are not available.
Tous les procédés utilisés à ce jour reconnaissent la case à cocher comme zone en terme de valeur blanche (vide) ou grise (cochée) sans identifier la case vide ou cochée d'où les difficultés des programmes associés. En dehors du problème délicat du paramétrage des emplacements des cases à cocher qui doivent toujours se positionner au même endroit dans les procédés mécaniques et optoélectroniques de lecture, cette technique est très sensible au parasitage (ou bruit) des graffitis périphériques aux cases à cocher. Tout incident de positionnement du document aboutit à des erreurs d'interprétation graves des données. Surtout, ces systèmes nécessitent 10 cases par chiffre, 26 par lettre ce qui rend pénible leur remplissage, longue leur lecture et obère leur fiabilité.All the procedures used to date recognize the check box as an area in terms of white (empty) or gray (checked) value without identifying the empty or checked box, hence the difficulties of the associated programs. Apart from the delicate problem of setting the locations of the check boxes which must always be positioned in the same place in the mechanical and optoelectronic reading processes, this technique is very sensitive to the interference (or noise) of peripheral graffiti in the check boxes. Any document positioning incident results in serious data interpretation errors. Above all, these systems require 10 boxes per number, 26 per letter which makes filling them difficult, long to read and compromises their reliability.
C'est pourquoi nous nous sommes orientés vers une solution mixant la conception matérielle du document, du signe et le programme informatique, en écartant les techniques décrites. Notre invention permet une totale fiabilité de lecture, en associant:This is why we are oriented towards a solution mixing the material design of the document, the sign and the computer program, by discarding the techniques described. Our invention allows complete reading reliability, by combining:
- une définition de signe ergonomiquement simple à remplir de manière manuscrite,- a definition of sign ergonomically simple to fill in by hand,
- un système de lecture par dispositif optoélectronique (scanner, appareil photo caméra LCD et tout système de lecture numérique), - un procédé d'analyse- a reading system using an optoelectronic device (scanner, camera, LCD camera and any digital reading system), - an analysis process
- du type de feuilles- the type of leaves
- des zones comportant ces signes,- areas with these signs,
- des signes à l'intérieur de ces zones,- signs inside these areas,
- des modifications manuscrites ou imprimées apportées aux signes de base. - une méthodologie:- handwritten or printed modifications to the basic signs. - a methodology:
- d'autocorrection des images des documents lus optoelectroniquement,- autocorrection of images of documents read optoelectronically,
- d'apprentissage du type et de la structure du contenu du document. Nous avons eu pour objectif de définir:- learning the type and structure of the document content. Our objective was to define:
- des signes modifiables par l'agent responsable de la saisie manuelle; ces modifications sont particulièrement simples à effectuer et relèvent de références culturelles quasi universelles,- signs that can be modified by the agent responsible for manual entry; these modifications are particularly simple to carry out and come from almost universal cultural references,
- un système d'analyse complètement original par rapport aux systèmes cases à cocher classiques sur la base des données du système de lecture optoélectronique.- a completely original analysis system compared to conventional checkbox systems based on the data from the optoelectronic reading system.
- des possibilités d'auto-contrôle et d'apprentissage dans le processus de reconnaissance et de traitement.- possibilities for self-checking and learning in the recognition and processing process.
Les caractéristiques et les avantages de l'invention seront illustrés par la description détaillée d'au moins un mode de réalisation de l'invention donné à titre indicatif et représenté aux figures 1 à 24.The characteristics and advantages of the invention will be illustrated by the detailed description of at least one embodiment of the invention given as an indication and shown in Figures 1 to 24.
1 - Les signes La composition structurelle et spatiale du signe :1 - The signs The structural and spatial composition of the sign:
Nos signes sont destinés à être reconnus comme valeur numérique. Ils sont constitués sur le principe de zones simples ou multiples qui sont destinées à recevoir des barres manuscrites ou imprimées. Nos signes peuvent comporter une. deux, trois zones ou plus (Zl, Z2 . . .). Ces zones sont destinées à recevoir des indications manuscrites ou imprimées sous forme de barres. Ces zones sont associées à une zone de référence, ou zone-cible (ZC) indissociable du signe dans son utilisation par le traitement de reconnaissance (FIG- 1 ). Pour des raisons de gain de place et d'ergonomie, la zone-cible peut être confondue avec une autre zone (FIG-2) mais il ne s'agit là que d'un mode particulier d'utilisation de nos signes qui se présentent ainsi.Our signs are intended to be recognized as numerical value. They are made up on the principle of single or multiple zones which are intended to receive handwritten or printed bars. Our signs may include a. two, three or more zones (Zl, Z2...). These areas are intended to receive handwritten or printed indications in the form of bars. These zones are associated with a reference zone, or target zone (ZC) inseparable from the sign in its use by the recognition processing (FIG-1). For reasons of space saving and ergonomics, the target zone can be confused with another zone (FIG-2) but this is only a particular mode of use of our signs which present themselves thus.
Les signes à une zone, connus sous le terme classique de cases à cocher, ne présentent aucune originalité en eux-mêmes. La zone peut prendre 2 valeurs, 0 et 1 selon qu'elle est vide ou cochée (FIG. 3). La zone-cible est intégrée à la case qui assure 2 fonctions: support d'information manuscrite et zone de référence (voir infra).Single-zone signs, known by the classic term of check boxes, are not original in themselves. The zone can take 2 values, 0 and 1 depending on whether it is empty or checked (FIG. 3). The target area is integrated into the box which performs 2 functions: handwritten information support and reference area (see below).
Les signes à 2 zones comportent (FIG. 4): - une zone représentant les unités (ZU) et destinée à supporter de 0 à 4 barres, - une autre représentant la valeur 5 (Z5) destinée à supporter 0 ou 1 barre unique. La combinaison de ces 2 zones permet toute numérotation entre 0 et 9. La combinaison de ce type de signes à 2 zones permet de rendre compte de toute valeur entre 0 et l'infini. La zone-cible (ZC) est confondue à la zone de valeur 5 qui assure 2 fonctions. Les signes à trois zones (FIG. 5) sont destinés à la production de valeurs entre 0 et 49 de la manière la plus réduite possible en surface. Le principe est le même pour la zone des unités (ZU) et de la valeur 5 (Z5), la zone supplémentaire (ZD) est destinée à supporter de 0 à 4 barres représentant les dizaines. La zone-cible est également confondue à la zone de valeur 5. Dans ce cas le signe est un nombre entre 0 et 49, il est isolé et ne peut donner lieu à l'utilisation séquentielle de la numérotation classique.The 2-zone signs include (FIG. 4): - a zone representing the units (ZU) and intended to support from 0 to 4 bars, - another representing the value 5 (Z5) intended to support 0 or 1 single bar. The combination of these 2 zones allows any numbering between 0 and 9. The combination of this type of signs with 2 zones makes it possible to account for any value between 0 and infinity. The target zone (ZC) is merged with the value zone 5 which performs 2 functions. The three-zone signs (FIG. 5) are intended for the production of values between 0 and 49 as minimally as possible on the surface. The principle is the same for the unit area (ZU) and the value 5 (Z5), the additional area (ZD) is intended to support from 0 to 4 bars representing the tens. The target zone is also confused with the value zone 5. In this case the sign is a number between 0 and 49, it is isolated and cannot give rise to the sequential use of classical numbering.
Deux zones complémentaires (FIG. 6) ZC 1 et ZC 2 peuvent aisément être adjointes à ces zones pour des significations complémentaires: signe négatif, puissance... la zone-cible restant toujours confondue à la zone de valeur 5. Le principe du signeTwo complementary zones (FIG. 6) ZC 1 and ZC 2 can easily be added to these zones for additional meanings: negative sign, power ... the target zone always remaining merged with the value zone 5. The principle of the sign
L'intérêt de cette représentation de données numériques sous cette forme, réside dans le système d'interprétation par lecture optique et que nous avons mis au point (voir infra 2- Le système d'analyse du dispositif des signes). Pour être interprétés correctement par notre système d'analyse, et permettre l'apprentissage et l' auto-contrôle mis au point, les signes doivent satisfaire aux principes ci-après définis.The interest of this representation of digital data in this form, lies in the interpretation system by optical reading and that we have developed (see infra 2- The system of analysis of the device of signs). To be properly interpreted by our analysis system, and enable learning and self-control developed, signs must meet the following defined principles.
Ces signes doivent comporter une zone contenant le point d'origine de l'analyse du signe. C'est à partir de ce point que l'analyse de l'image numérique du signe est faite. Ce point de référence est le centre de toute recherche de l'état des pixels de son environnement. Les zones radiales doivent permettre l'inscription de barres perpendiculaires au rayon partant du point d'origineThese signs must include an area containing the original point of the analysis of the sign. It is from this point that the analysis of the digital image of the sign is made. This reference point is the center of all research on the state of the pixels of its environment. The radial zones must allow the registration of bars perpendicular to the radius starting from the point of origin
Le signe n'est donc que le support visuel d'aide mnémotechnique facilitant l'inscription des barres II se définit avant tout par son centre et un double périmètre d'analyse. Le premier périmètre définit les zones de début de recherche des barres transversales selon les axes de recherche, le second la limite de fin de recherche . Ce périmètre externe n'est pas équidistant du centre (FIG 7) Si un axe de recherche n'existe pas. le contour de ces deux périmètres sont confondus sur cet axe. Dans les formes de signes proposées, la zone du point d'origine est également une zone d'inscription (zone de valeur 1 en cas de cochage pour les cases à cocher, 5 pour les autres signes), afin de rendre plus compact le signe et d*en facihtei l'ergonomie d'utilisation Ce n'est donc qu'une forme particulière du principe général.The sign is therefore only the visual mnemonic aid to facilitate the registration of bars II is defined above all by its center and a double perimeter of analysis. The first perimeter defines the search start areas of the crossbars according to the search axes, the second the search end limit. This external perimeter is not equidistant from the center (FIG 7) If a research axis does not exist. the outline of these two perimeters coincide on this axis. In the forms of signs offered, the area of the point of origin is also an inscription area (value area 1 in the case of a check mark for the check boxes, 5 for the other signs), in order to make the sign more compact. and * in the ergonomics of use facihtei so it is a particular form of the general principle.
Les signes proposésThe proposed signs
Les signes de notre dispositif peuvent prendre différentes présentations sur la base des principes définis.The signs of our device can take different presentations based on the principles defined.
Les signes de type case à cocher se présentent sous forme classique (FIG 8) et ne comportent qu'une zone simple Les signes numériques peuvent se présenter sous deux formes verticales ou horizontales à partir d'un module de base (FIG 9), la position du carre vide pouvant être selon le sens, en haut ou en bas, à gauche ou à droite Le remplissage des signes se fait de manière identique quelque soit l'orientation du signe (FIG 10 et 1 1 ) La case carrée vaut 0 si elle est vide, 5 si elle comporte une barre, la zone des unîtes se trouve dans le prolongement axial de la case, une barre dans la zone des unîtes vaut 1 , deux barres valent 2, trois barres 3, quatre barres 4The signs of the check box type are presented in conventional form (FIG 8) and have only one simple zone. The numeric signs can be presented in two vertical or horizontal forms from a basic module (FIG 9), the position of the empty edge can be according to the direction, top or bottom, left or right The filling of the signs is done in an identical way whatever the orientation of the sign (FIG 10 and 1 1) The square box is worth 0 if it is empty, 5 if it has a bar, the unit area is in the axial extension of the box, a bar in the unit area is worth 1, two bars are worth 2, three bars 3, four bars 4
Ce système simple permet une utilisation sérielle et séquentielle, comme illustre pai la figure 4 Un regroupement de ces signes peut être utilisé pour le remplissage d'informations dont les valeurs sont limitées à un maximum. 99. 999 (FIG 12) Ce système de signes à remplissage manuscrit présente par rapport aux chiffres manuscrits, l'avantage de pouvoir être incrémenté et de permettre un remplissage en plusieurs temps Par exemple pour un contrôle entre 0 et 9, il suffit à l'opérateur de s'assurer que le chiffre est inférieur ou supérieur à 5 puis dans ce dernier cas, d'ajuster en incrémentant les unités. L'utilisation d'encre effaçable et d'effaceur permet de rectifier les marques sans préjudice pour la lecture optoélectronique. Le système général exposé ci-dessus possède des variantes de présentation et d'utilisation. Si une information numérique est comprise, non entre 0 et 9, mais entre 0 et 10, le même signe peut être utilisé (barre des unités plus longue) avec un contrôle logiciel permettant le dénombrement d'une unité supplémentaire. Dans ce cas, le signe- chiffre est isolé et ne peut donner lieu à l'utilisation séquentielle de la numérotation classique.This simple system allows serial and sequential use, as illustrated by FIG. 4 A grouping of these signs can be used for filling in information whose values are limited to a maximum. 99. 999 (FIG 12) This system of handwritten filling signs has the advantage over handwritten numbers of being able to be incremented and allowing filling in several times For example for a control between 0 and 9, it suffices for the operator ensure that the number is less than or greater than 5, then in the latter case, adjust by incrementing the units. The use of erasable ink and eraser allows the marks to be corrected without prejudice to optoelectronic reading. The general system described above has variants of presentation and use. If numerical information is included, not between 0 and 9, but between 0 and 10, the same sign can be used (longer unit bar) with software control allowing the enumeration of an additional unit. In this case, the digit sign is isolated and cannot give rise to the sequential use of conventional numbering.
Si une information numérique est comprise entre 0 et 31 comme pour les dates, les heures, les valeurs alphabétiques, le signe peut être complété par 2 petites barres des dizaines. Ces signes peuvent être personnalisés par une lettre ou un logo caractérisant le type d'information à y porter, pour aider l'opérateur dans son remplissage. Cette personnalisation permet en outre un contrôle a posteriori et une lecture visuelle aisée. Un contrôle logiciel de la cohérence des informations portées est assuré lors du traitement informatique. Pour ce type de signe, le signe est également isolé, et ne peut donner lieu à l'utilisation séquentielle de la numérotation classique. Les signes représentant des dates peuvent être mis sous forme particulière (J/M/A) comme illustré (FIG. 13).If numerical information is between 0 and 31 as for dates, times, alphabetical values, the sign can be completed by 2 small tens bars. These signs can be personalized by a letter or a logo characterizing the type of information to be worn, to help the operator in filling it out. This customization also allows a posteriori control and easy visual reading. Software control of the consistency of the information carried is ensured during computer processing. For this type of sign, the sign is also isolated, and cannot give rise to the sequential use of classic numbering. The signs representing dates can be put in special form (D / M / Y) as illustrated (FIG. 13).
Les deux courtes lignes, ici en haut, sont destinées à recevoir les barres manuscrites des dizaines, 3 maximum pour les 31 jours du mois, 1 pour les mois, puis ensuite 2 signes numériques standards de notre dispositif pour les années Les signes représentant des heures peuvent être mis sous la forme h/m illustrée (FIG. 14).The two short lines, here at the top, are intended to receive the handwritten bars of tens, 3 maximum for the 31 days of the month, 1 for the months, then then 2 standard numerical signs of our device for the years The signs representing hours can be put in the form h / m illustrated (FIG. 14).
Les signes alphabétiques peuvent être produits à partir d'une correspondance numérique classique en modifiant de façon manuscrite (ou en les imprimant directement) le signe de la figure 15. La figure 16 illustre la codification de l'alphabet classique français.The alphabetical signs can be produced from a conventional digital mapping modifying handwritten (or the printing directly) the sign of Figure 15. Figure 16 illustrates the codification of classical French alphabet.
Les signes pouvant être définis à partir de ces principes sont suffisamment simples et différenciés pour permettre un remplissage rapide des documents administratifs. Ces signes peuvent être générés sous forme d'images, de structures ou de polices de caractères informatisées dans toute application: traitement de texte, feuille de calcul. Les signes sont imprimés soit sous leurs formes vierges, à remplir de façon manuscrite, soit sous formes remplies imprimées (code de feuille, références constantes ...). Dans ce dernier cas, les signes imprimés peuvent comporter l'indication de leur valeur: 1 , 2, 3, ..., A, B, C, D, ...indiquée à coté du signe (à la place de α, h, m ci-dessus).The signs that can be defined on the basis of these principles are sufficiently simple and differentiated to allow rapid filling of administrative documents. These signs can be generated in the form of images, structures or computerized fonts in any application: word processor, spreadsheet. The signs are printed either in their blank forms, to be filled in by hand, or in filled printed forms (sheet code, constant references ...). In the latter case, the printed signs may include an indication of their value: 1, 2, 3, ..., A, B, C, D, ... indicated next to the sign (instead of α, h, m above).
2- Le système d'analyse du dispositif des signes2- The system for analyzing the device of signs
Les feuilles comportant de tels signes sont destinées à faire l'objet, successivement: - d'une lecture numérique par système de lecture optoélectronique,The sheets containing such signs are intended to be successively: - digitally read by optoelectronic reading system,
- d'une analyse de l'image numérique,- an analysis of the digital image,
- d'une reconnaissance de la valeur alphanumérique ou symbolique de ces signes- recognition of the alphanumeric or symbolic value of these signs
- et d'un enregistrement des informations recueillies pour un traitement informatique. Le traitement informatique de l'analyse et la reconnaissance, pour être très rapide, nécessitent une définition préalable des feuilles à reconnaître, et un apprentissage des types d'informations qui s'y trouvent.- and a record of the information collected for computer processing. Computer processing of analysis and recognition, to be very fast, requires a prior definition of the sheets to be recognized, and learning the types of information found there.
Ces feuilles et documents peuvent comporter des zones diverses : des zones alphanumériques imprimées (FIG. 2θΦ), des zones graphiques caractérisées par tout type d'information traitée comme une image (FIG. 20®), des zones cases à cocher et des zones comportant notre dispositif de signes-cases (FIG. 20®). Ces zones peuvent présenter un contenu mixte. Ces zones subiront un traitement approprié:These sheets and documents can include various zones: printed alphanumeric zones (FIG. 2θΦ), graphic zones characterized by any type of information treated as an image (FIG. 20®), checkbox zones and zones comprising our device of case signs (FIG. 20®). These areas can have mixed content. These areas will undergo appropriate treatment:
- reconnaissance de caractères pour les zones alphanumériques imprimées - capture d'image et traitement de celle-ci pour les zones graphiques- character recognition for printed alphanumeric areas - image capture and processing for graphic areas
- traitement spécifique décrit ci-dessous pour les zones comportant notre dispositif de signes, et notamment pour la zone d'identification de la feuille.- specific treatment described below for the areas comprising our sign system, and in particular for the identification area of the sheet.
Chaque zone peut être l'objet des différents types de traitement.Each zone can be the subject of different types of treatment.
A- Le procédé d'analyse du dispositif de signes Le type d'analyse du dispositif de nos signes est directement lié aux caractéristiques de nos signes vierges, et à leur système de remplissage. Au système d'analyse classique de zone interne à la case à cocher (pixels blancs, pixels noirs), nous substituons un système d'analyse de type spectral à partir du centre de la case de référence cible.A- The sign device analysis process The type of device sign analysis is directly linked to the characteristics of our blank signs, and to their filling system. In the system of classical analysis of internal area in the check box (white pixels, black pixels), we substitute a spectral type analysis system from the center of the target reference box.
1 - L'analyse de chaque signe commence à partir d'un point prédéfini dont les coordonnées sont sensées se trouver à l'intérieur de la case cible. Chaque signe est repéré et positionné préalablement dans l'image (voir infra : L'auto-contrôle et l'apprentissage). La case-cible constitue le point de départ de l'analyse de chaque signe.1 - The analysis of each sign begins from a predefined point whose coordinates are supposed to be inside the target box. Each sign is identified and positioned beforehand in the image (see below: Self-control and learning). The target box constitutes the starting point for the analysis of each sign.
2- L'analyse du signe se poursuit par un contrôle pour s'assurer que la case vide est bien la case que l'on recherche et non une zone simplement blanche (qui impliquerait une erreur de positionnement). Si la case est vide (non barrée), le nombre des pixels blancs trouvés avant les pixels noirs de son contour, dans les sens vertical et horizontal, confirme la forme et l'état (non-barré) de la case.2- The analysis of the sign continues with a check to ensure that the empty box is the box we are looking for and not a simply white area (which would imply a positioning error). If the box is empty (not crossed out), the number of white pixels found before the black pixels of its outline, in the vertical and horizontal directions, confirms the shape and the state (not crossed out) of the box.
Si la case comporte des pixels noirs internes, l'état de la case de référence cible est reconnu comme barré. Une analyse globale est menée pour confirmer son contour externe (la case ne doit pas être largement recouverte par une tache noire, un système d'alarme logiciel permet de régler ce cas extrême).If the box has internal black pixels, the state of the target reference box is recognized as crossed out. A global analysis is carried out to confirm its external outline (the box should not be largely covered by a black spot, a software alarm system allows this extreme case to be resolved).
Dans les deux cas, un calcul du centre de la forme de case trouvée est fait, pour affiner les coordonnées du point de départ du processus suivant d'analyse.In both cases, a calculation of the center of the box shape found is made, to refine the coordinates of the starting point of the following analysis process.
3- Le point de départ de l'analyse étant vérifié et recalculé, une recherche à partir du contour de la case est menée (périmètre interne FIG. 7), pixel par pixel à l'intérieur de la zone située entre les 2 fines barres prolongeant la case cible (FIG. 22 ©). Cette analyse dépend du type de signe. Les directions, longueurs de recherche de l'analyse, dépendront du signe choisi dans la table de référence pour cet emplacement, lors de l'apprentissage, et défini dans le fichier de définition de la feuille. Le nombre de barres est reconnu par interprétation de la succession des pixels blancs et noirs. L'analyse s'arrête à la fin de chaque zone (dont les coordonnées sont contenues dans le fichier de définition de la feuille).3- The starting point of the analysis being checked and recalculated, a search from the outline of the box is carried out (internal perimeter FIG. 7), pixel by pixel inside the area located between the 2 thin bars extending the target square (FIG. 22 ©). This analysis depends on the type of sign. Directions, search lengths of the analysis will depend on the sign chosen in the reference table for that location, when learning, and defined in the definition file of the sheet. The number of bars is recognized by interpretation of the succession of white and black pixels. The analysis stops at the end of each zone (the coordinates of which are contained in the sheet definition file).
Un contrôle logiciel des vraisemblances est effectué par algorithme (exemple: pas plus de 3 barres des dizaines pour le signe relatif aux jours du mois). B- L'apprentissage général propre à une feuilleA software likelihood check is performed by algorithm (example: no more than 3 tens bars for the sign relating to the days of the month). B- General learning specific to a sheet
Cet apprentissage est mémorisé par le programme dans un fichier de définition propre à un type de feuille qui comportera toutes les informations permettant le traitement par lecture optoélectronique et la reconnaissance des informations portées sur ce type de feuilleThis learning is stored by the program in a definition file specific to a type of sheet which will include all the information allowing the processing by optoelectronic reading and recognition of the information carried on this type of sheet
A partir d'une image de la feuille-modèle vierge (FIG 20) obtenue par lecture optoélectronique, on repère chaque zone générale à reconnaître (Φ, ©. Φ @ )From an image of the blank model sheet (FIG 20) obtained by optoelectronic reading, we identify each general area to be recognized (Φ, ©. Φ @)
5 Chaque zone correspond à une portion de l'image de la feuille, définie par les coordonnées d'un rectangle virtuel contenant la zone Ces zones sont indexées et leur type de contenu- alphanuméπque imprimé, graphique, dispositif de signes- cases ou zones et case à cocher, code d'identification de la feuille (FIG 20 ©), est associé à cet index o Les zones alphanumériques impπmées Φ et les zones graphiques (D sont traitées selon les modalités classiques de traitement informatique de telles données numériques5 Each zone corresponds to a portion of the image of the sheet, defined by the coordinates of a virtual rectangle containing the zone These zones are indexed and their type of content - alphanumeric, printed, graphic, device of box signs or zones and check box, sheet identification code (FIG 20 ©), is associated with this index o The alphanumeric zones π and the graphic zones (D are treated according to the conventional methods of computer processing of such digital data
Le programme de lecture produira une image numérique de chaque feuille, cette image sera immédiatement analysée en liaison avec le fichier de définition propre 5 au type de feuille Le traitement spécifique de chaque zone sera lancé de manière séquentielle pour obtenir un ensemble d'informations graphiques, alphanumériques qui devront être organisées pour être enregistrées dans un fichierThe reading program will produce a digital image of each sheet, this image will be immediately analyzed in conjunction with the definition file specific to the type of sheet. The specific processing of each zone will be launched sequentially to obtain a set of graphic information, alphanumeric which must be organized to be saved in a file
C- L'apprentissage d'une zone contenant notre dispositifC- Learning an area containing our device
En sélectionnant dans l'image générale la zone comportant notre dispositif de 0 signes, cette zone apparaît seule à l'écran (FIG 21 )By selecting in the general image the zone comprising our device of 0 signs, this zone appears alone on the screen (FIG 21)
On définit la structure d'analyse propre à chaque signe de la zone On part du premier signe sélectionné (ce peut être n'importe lequel dans la zone) en cliquant avec un dispositif de pointage (souris, table graphique), dans la case fermée du signe (ou sur un point blanc qui est ainsi défini comme point de départ deWe define the analysis structure specific to each sign in the area We start from the first selected sign (it can be any sign in the area) by clicking with a pointing device (mouse, graphic table), in the closed box of the sign (or on a white point which is thus defined as the starting point of
25 l'analyse du signe-zone) (FIG. 22) Le centre de la case fermée est automatiquement recalculé pour produire les coordonnées servant d origine a l'analyse de son environnement (FIG. 22 (D) selon le type de signe correspondant a cet emplacement On définit les propriétés du signe en référence à une table de signes (FIG 17 et25 the analysis of the sign-zone) (FIG. 22) The center of the closed box is automatically recalculated to produce the coordinates serving as origin for the analysis of its environment (FIG. 22 (D) according to the type of corresponding sign at this location We define the properties of the sign with reference to a table of signs (FIG 17 and
30 23)30 23)
- type alphabétique, numérique, heure,- alphabetical, numeric, hour type,
- forme dimensions, barres des unités, des dizaines éventuelles, a gauche, a droite, - position du point de départ de l'analyse du signe, par rapport au cadre virtuel de la zone ). Ces propriétés sont mémorisées par le programme dans le fichier de définition. On passe ensuite au signe suivant dans l'ordre désiré de positionnement dans le fichier d'enregistrement des données interprétées. Les signes ayant fait l'objet d'un apprentissage sont mis sur un fond coloré (FIG. 24), afin de les distinguer des signes restant à définir.- shape dimensions, bars of units, possible tens, on the left, on the right, - position of the starting point for the analysis of the sign, in relation to the virtual frame of the area). These properties are memorized by the program in the definition file. We then pass to the next sign in the desired order of positioning in the recording file of the interpreted data. The signs that have been trained are placed on a colored background (FIG. 24), in order to distinguish them from the signs that remain to be defined.
L'enregistrement des données interprétées après lecture numérique pour chaque feuille, comporte toutes les informations interprétées relatives aux différents types de zones. Chaque champ de l'enregistrement associe un type de zone et une information contenue dans cette zone (si ceux-ci sont différenciés). Ceci est impératif pour les zones comportant notre dispositif car les informations relatives à un signe peuvent se trouver dans le fichier résultat entre 2 informations relatives à d'autres zones. Les feuilles peuvent comporter un code propre (FIG. 20®) du type de notre dispositif. C'est la lecture de ce code qui déclenchera à chaque lecture le processus d'accès au fichier de définition de la feuille (voir infra L'auto-contrôle du type de feuille). Le fichier d'apprentissage ou fichier de définition de la feuille comportera donc un ensemble de données, ordonnées selon les besoins de l'utilisateur, qui permettront au programme de produire un fichier résultat comportant une suite complexe et hétérogène de données issues: de l'analyse de signes de notre dispositif, d'images graphiques, et de textes alphanumériques.The recording of the data interpreted after digital reading for each sheet, includes all the interpreted information relating to the different types of zones. Each field of the record associates a type of zone and information contained in this zone (if these are differentiated). This is imperative for the zones comprising our device because the information relating to a sign can be found in the result file between 2 information relating to other zones. The sheets may have their own code (FIG. 20®) of the type of our device. It is the reading of this code that will trigger each time the process of accessing the sheet definition file (see below Self-checking of the sheet type). The training file or sheet definition file will therefore contain a set of data, ordered according to the user's needs, which will allow the program to produce a result file comprising a complex and heterogeneous series of data from: analysis of signs of our system, graphic images, and alphanumeric texts.
3 - Le système d'auto-contrôle dans le processus de lecture, de reconnaissance, et de traitement3 - The system of self-control in the process of reading, recognition, and processing
Le système d'analyse permet de reconnaître les cases vides et les cases pleines et de s'assurer que les cases vides ou pleines soient bien les cases recherchées. Le point commun à tous ces signes est la case cible (carrée, quadrilatère ou forme fermée). Cette case est la cible initiale. Chaque signe est repéré et positionné par type de feuille dans des zones spécifiques à notre dispositif de l'image.The analysis system makes it possible to recognize empty and full boxes and to ensure that empty or full boxes are the boxes sought. What all of these signs have in common is the target square (square, quadrilateral or closed shape). This box is the initial target. Each sign is identified and positioned by type of sheet in areas specific to our image system.
L'auto-contrôle du type de feuille L'indication du type de feuille, et donc du fichier de définition de la feuille, doit être transmise au programme, en préalable à toute analyse logicielle de l'image obtenue par lecture optoélectronique. Cette indication peut être transmise au programme par l'opérateur avant chaque lecture d'une ou plusieurs feuilles de même type. Cette méthode présente l'inconvénient de ne pas permettre un auto¬ contrôle, car même en cas de composition en principe homogène d'un lot de feuilles, certaines feuilles peuvent appartenir à un autre type, ou être mal introduites lors de la lecture optoélectronique. Il est beaucoup plus simple d'intégrer dans chaque feuille un code qui soit reconnu immédiatement après numérisation de l'image. Ce code à positionnement constant sur toutes les feuilles lues doit donc être intégré aux feuilles. Ce code est constitué par un ensemble de signes numériques (FIG. 20 ® ).Self-checking the sheet type The indication of the type of sheet, and therefore of the sheet definition file, must be transmitted to the program, prior to any software analysis of the image obtained by optoelectronic reading. This indication can be transmitted to the program by the operator before each reading of one or more sheets of the same type. This method has the drawback of not allowing self-checking, because even in the case of a homogeneous composition in principle of a batch of sheets, certain sheets may belong to another type, or be poorly introduced during optoelectronic reading. It is much simpler to integrate in each sheet a code which is recognized immediately after scanning the image. This code with constant positioning on all the sheets read must therefore be integrated into the sheets. This code consists of a set of numerical signs (FIG. 20 ®).
L'intégration de ce code permet une lecture de lot de feuilles de types hétérogènes, possédant chacune un fichier de définition de feuille différent, sans aucune intervention extérieure.The integration of this code allows a batch reading of sheets of heterogeneous types, each having a different sheet definition file, without any external intervention.
Ce code permet l' auto-contrôle automatique de la feuille lue, en lui associant son fichier de définition de feuille.This code allows automatic self-checking of the sheet read, by associating its sheet definition file with it.
L'auto-contrôle de lecture du dispositif des signes :Self-checking of the sign device:
Le problème du contrôle du positionnement du point de départ de l'analyse de chaque signe est complexe puisqu'un déplacement de 2 ou 3 dixièmes de millimètre peut générer des erreurs générales de lecture des zones de notre dispositif de signes. Ces erreurs peuvent provenir:The problem of controlling the positioning of the starting point for the analysis of each sign is complex since a displacement of 2 or 3 tenths of a millimeter can generate general errors in reading the areas of our sign system. These errors can come from:
- de la production des copies de feuilles: impression, photocopies décalées, de biais, présentant des effets de zoom, - du système de lecture optoélectronique: introduction imparfaite, introducteur mal réglé, inégalité de traitement de l'image pour raisons mécaniques ou électroniques. Un dispositif matériel de repérage et de contrôle de l'image est donc nécessaire. Un cadre est tracé autour des zones contenant les signes à analyser (FIG. 22 Φ ). Ces cadres possèdent sur la feuille-modèle (FIG. 20) un positionnement, relatif entre eux et avec chaque signe, parfaitement défini. Ces cadres peuvent inclure la ou les zones contenant les signes à analyser, où ne pas les inclure, le repérage relatif participant de la même procédure logique. De même l'emplacement des signes peut être repéré à partir de cadres en-têtes et pieds de pages standardisés pour un certain nombre de documents.- the production of copies of sheets: printing, offset photocopies, biased, presenting zoom effects, - the optoelectronic reading system: imperfect introduction, poorly adjusted introducer, unequal image processing for mechanical or electronic reasons. A hardware device for locating and controlling the image is therefore necessary. A frame is drawn around the areas containing the signs to be analyzed (FIG. 22 Φ). These frames have on the model sheet (FIG. 20) a positioning, relative to each other and with each sign, perfectly defined. These boxes can include the zone or zones containing the signs to be analyzed, where not to include them, the relative location participating in the same logical procedure. Likewise, the location of signs can be identified from standardized header and footer frames for a number of documents.
En pointant lors de l'apprentissage, sur les angles du cadre, on mémorise les coordonnées de ces angles par rapport aux bords de l'image (FIG. 22 Φ). Lors de la lecture des feuilles reproduites à partir de la feuille modèle, l'image produite par le système de lecture optoélectronique renvoie l'image de ces cadres. Leurs positions et leurs coordonnées dans l'image sont recherchées et comparées à celles de la feuille modèle contenue dans le fichier de définition. Une transformation vectorielle de ces cadres-images retraduit l'ensemble du positionnement des pixels de l'image de la zone pour les faire correspondre au positionnement de référence de la feuille modèle et corriger les effets de zoom et de rotation. En cas d'utilisation de notre procédé d'auto-contrôle, le fichier de définition de la feuille contient donc les coordonnées du ou des cadres par rapport à l'image (pour accélérer leur recherche), et les coordonnées de chaque point d'origine de l'analyse de nos signes par rapport à ces cadres.By pointing during learning, on the angles of the frame, the coordinates of these angles are memorized relative to the edges of the image (FIG. 22 Φ). When reading the sheets reproduced from the model sheet, the image produced by the optoelectronic reading system returns the image of these frames. Their positions and coordinates in the image are searched and compared to those of the model sheet contained in the definition file. A vector transformation of these picture frames retranslates the entire positioning of the pixels of the image of the area to make them correspond to the reference positioning of the model sheet and correct the zoom and rotation effects. When using our self-checking process, the sheet definition file therefore contains the coordinates of the frame (s) in relation to the image (to speed up their search), and the coordinates of each point of origin of the analysis of our signs in relation to these frames.
Une analyse de feuilles-test permet de prendre en compte les effets de déformation locaux au niveau du système de lecture optoélectronique, et corrige (si besoin) systématiquement la transformation vectorielle précédente. Le remplissage des signes d'un tel document est aussi simple et rapide qu'un remplissage à l'aide de chiffres et lettres manuscrits, sa lecture optoélectronique et son traitement informatique sont quasi-instantanés et sans erreur. Ces procédés d'apprentissage et d'auto-contrôle sont utilisables pour la lecture de documents comportant : des zones de code de type de feuilles; des zones diverses alphanumériques imprimées; des zones graphiques; des zones cases à cocher ou des zones comportant le dispositif de signes-cases ou de signes-zone; des zones comportant toute information structurée devant être analysée à partir d'un point d'origine précis.An analysis of test sheets makes it possible to take into account the local deformation effects at the level of the optoelectronic reading system, and systematically corrects (if necessary) the preceding vector transformation. Filling the signs of such a document is as simple and fast as filling it with handwritten numbers and letters, its optoelectronic reading and its computer processing are almost instantaneous and error-free. These learning and self-checking methods can be used for reading documents comprising: sheet type code zones; various printed alphanumeric zones; graphic areas; checkbox zones or zones comprising the box sign or zone sign device; areas with any structured information to be analyzed from a specific point of origin.
Variantes de notre dispositif de signes et de leur analyse Notre dispositif de signes repose sur une case-cible fermée, dont le repérage est effectué sur la base d'un système d'apprentissage et d'un procédé d'auto-contrôle très précis. Avec une résolution d'image élevée, il est possible de reconnaître une quantité de signes-équivalents-caractères largement supérieure à 2000 par page A4 avec une fiabilité totale.Variants of our sign system and their analysis Our sign system is based on a closed target box, the location of which is carried out on the basis of a very precise learning system and self-checking process. With a high image resolution, it is possible to recognize a quantity of signs-equivalent-characters far greater than 2000 per A4 page with total reliability.
Si le nombre des signes-équivalents-caractères est inférieur à cette quantité, les contraintes de notre dispositif de signes et de notre procédé d'apprentissage, d'auto- contrôle et d'analyse, permettant une totale sécurité de lecture, peuvent être allégées.If the number of character-equivalent signs is less than this quantity, the constraints of our sign system and our learning, self-checking and analysis process, allowing total reading security, can be eased .
La case cible fermée, pour permettre l' auto-contrôle, peut être transformée en simple zone dont on définit les coordonnées du point de départ de notre analyse de type spectral (FIG. 18 /l (D, 12 Φ et FIG. 19 Φ) Le nombre de barres manuscrites ou imprimées contenues dans les zones affectées aux unités Φ, et éventuellement aux zones des valeurs 5 ou des dizaines Φ peut être reconnu selon notre méthode Si ces zones sont assez larges, notre système d'auto-correction peut s'avérer inutile car les risques de vaπations angulaires ou par effet de zoom conduisant à des erreurs de lecture, diminuent avec l'augmentation de la dimension des signes et des barres. Tout système dérivé de notre procédé d'analyse et de notre dispositif de signes, basé sur l'analyse du nombre de barres dans des zones prédéfinies, doit donc être considéré dans le champ de nos revendicationsThe closed target box, to allow self-control, can be transformed into a simple zone whose coordinates of the starting point of our spectral type analysis are defined (FIG. 18 / l (D, 12 Φ and FIG. 19 Φ ) The number of handwritten or printed bars contained in the zones assigned to the units Φ, and possibly to the zones of values 5 or tens Φ can be recognized according to our method If these zones are wide enough, our auto-correction system can s "prove useless because the risks of angular variations or by zoom effect leading to reading errors, decrease with the increase in the size of the signs and bars. Any system derived from our analysis process and our signs device , based on the analysis of the number of bars in predefined areas, must therefore be considered within the scope of our claims
Les signes peuvent être repérés étant situés à l'intérieur d'un ou plusieurs cadres (FIG.23) ou à l'extérieur de ces cadres ; ces cadres pouvant être inexistants (FIG.17).The signs can be identified being located inside one or more frames (FIG. 23) or outside these frames; these frames may be non-existent (FIG. 17).
Exemple: la case cible ou zone de référence peut être constituée d'une cellule d'un tableau, d'autres cellules recevant les barres des unités des dizaines ou des valeurs 5 (FIG. 18). La case cible peut être commune à plusieurs zones correspondant à des signes différents. Bien entendu, l'invention n'est pas limitée aux modes de réalisation décrits et représentés pour lesquels d'autres variantes sont possibles dans :Example: the target cell or reference zone can consist of a cell in a table, other cells receiving the bars of tens or 5 units (FIG. 18). The target cell can be common to several zones corresponding to different signs. Of course, the invention is not limited to the embodiments described and shown for which other variants are possible in:
• le nombres de signes, de cases, de zones• the number of signs, boxes, zones
• le nombre de cadres de repérage• the number of locating frames
• le nombre et le type d'objets analysés et reconnus sur le document • le type de document, sans pour cela sortir du cadre de l'invention. • the number and type of objects analyzed and recognized on the document • the type of document, without departing from the scope of the invention.

Claims

REVENDICATIONS
1 - Ensemble de signes pouvant être modifiés de manière manuscrite et correspondant à des valeurs alphanumériques de caractère d'imprimerie classique ainsi qu'à toute valeur numérique associée à des symboles; caractérisé en ce que la modification des signes s'opère par l'inscription de barres simples dans des zones définies correspondant à des valeurs numériques; et en ce que ces signes peuvent être utilisés sous forme d'images, de structures ou de polices de caractères d'imprimerie et être imprimés avec leurs valeurs alphanumériques ou symboliques nulles (sans barre) ou définitives (barres imprimées). 2 - Ensemble de signes, selon la revendication 1 , caractérisé en ce qu'il comporte au moins une première zone pouvant comporter de 0 à 4 barres représentant chacune le chiffre 1 et une deuxième zone pouvant comporter une barre représentant le chiffre 5, l'ensemble desdites deux zones permettant d'écrire les chiffres de 0 à 9 ; ces signes peuvent être utilisés séquentiellement pour signifier des valeurs numériques illimitées .1 - Set of signs which can be modified by hand and corresponding to alphanumeric values of a classic printing character as well as to any numerical value associated with symbols; characterized in that the modification of the signs is effected by the inscription of simple bars in defined zones corresponding to numerical values; and in that these signs can be used in the form of images, structures or typefaces for printing and be printed with their alphanumeric or symbolic values zero (without bar) or definitive (printed bars). 2 - set of signs, according to claim 1, characterized in that it comprises at least a first zone which can comprise from 0 to 4 bars each representing the number 1 and a second zone which can comprise a bar representing the number 5, the set of said two zones making it possible to write the digits from 0 to 9; these signs can be used sequentially to signify unlimited numerical values.
3- Ensemble de signes, selon la revendication 2, caractérisé en ce qu'il comporte des zones complémentaires, associées auxdites deux zones de base, comportant également des barres, servant notamment à l'indication des dizaines, du signe du nombre, des puissances du nombre. 4 - Ensemble de signes, selon l'une quelconque des revendications 1 à 3, caractérisé en ce que le signe comporte une case fermée, reconnaissable dans sa forme et ses dimensions, servant d'origine à l'analyse de son environnement, et en ce que cet environnement peut être modifié par l'adjonction de barres manuscrites ou imprimées pour signifier une valeur alphanumérique ou symbolique. 5 - Ensemble de signes, selon l'une quelconque des revendications 1 à 3. caractérisé en ce que le signe comporte une zone repérable par un point servant d'origine à l'analyse de son environnement, et en ce que cet environnement peut être modifié par l'adjonction de barres manuscrites ou imprimées pour signifier une valeur alphanumérique ou symbolique. 6 - Procédé d'apprentissage d'analyse de signes-cases, selon la revendication 4, caractérisé en ce que les coordonnées du centre de la case fermée sont recalculées pour servir d'origine à l'analyse de son environnement selon le type de signe correspondant à cet emplacement et en ce que le type de signe-case est défini lors de cet apprentissage : définition des coordonnées de la case-signe par rapport à l'image ou au cadre de la zone, définition des dimensions de la case-cible fermée, du type de signe par rapport à une table de référence des signes.3- set of signs, according to claim 2, characterized in that it comprises complementary zones, associated with said two basic zones, also comprising bars, used in particular for the indication of tens, the sign of the number, the powers of the number. 4 - set of signs according to any one of claims 1 to 3, characterized in that the sign comprises a closed box, recognizable in its shape and dimensions, serving as an origin for the analysis of its environment, and in what this environment can be changed by adding handwritten or printed bars to signify an alphanumeric or symbolic value. 5 - set of signs, according to any one of claims 1 to 3. characterized in that the sign comprises an area identifiable by a point serving as an origin for the analysis of its environment, and in that this environment can be modified by adding handwritten or printed bars to signify an alphanumeric or symbolic value. 6 - Method for learning analysis of case signs, according to claim 4, characterized in that the coordinates of the center of the closed case are recalculated to serve as an origin for the analysis of its environment according to the type of sign corresponding to this location and in that the type of checkbox is defined during this training: definition of the coordinates of the checkbox relative to the image or frame of the area, definition of the dimensions of the target checkbox closed, of the type of sign compared to a table of reference of the signs.
7 - Procédé d'apprentissage d'analyse de signes-zones, selon la revendication 5, caractérisé en ce que la zone est repérée par un point servant d'origine à son environnement, selon le type de signe correspondant à cet emplacement et en ce que le type de signe-zone est défini par apprentissage : définition des coordonnées du point servant d'origine à l'analyse par rapport à l'image ou au cadre de la zone, du type de signe par rapport à une table de référence de signes.7 - Method for learning the analysis of sign-zones, according to claim 5, characterized in that the zone is identified by a point serving as the origin of its environment, according to the type of sign corresponding to this location and in that the type of sign-zone is defined by learning: defining coordinates of the point serving as the origin to the analysis with respect to the picture or frame of the area, the sign of deviation from a reference table signs.
8 - Procédé d'apprentissage de lecture optoélectronique de document du genre comportant :8 - Method for learning optoelectronic reading of documents of the kind comprising:
- des zones de code de type de feuilles;- sheet type code areas;
- des zones diverses alphanumériques imprimées;- various alphanumeric zones printed;
- des zones graphiques;- graphic areas;
- des zones cases à cocher ou des zones comportant le dispositif de signes-cases ou de signes-zone;- checkbox zones or zones comprising the device of box signs or zone signs;
- des zones comportant toute information structurée devant être analysée à partir d'un point d'origine précis ; selon l'une quelconque des revendications 1 à 5, caractérisé en ce qu'il permet d'établir à partir du document modèle, la structure du fichier informatique résultant de la lecture optoélectronique des reproductions du document modèle remplies de façon manuscrite ou imprimée, et en ce qu'il donne une possibilité de reconnaissance du code du type des feuilles lues, permettant la lecture et la reconnaissance automatique en désordre de feuilles de types différents, en assurant la possibilité de contrôle logique et un reroutage des informations lues vers les fichiers résultats destinés à recevoir les informations, avec enregistrement des données interprétées après lecture numérique, pour chaque feuille, comportant toutes les informations interprétées relatives aux différents types de zones, chaque champ de l'enregistrement étant relatif à un type de zone et à une information contenue dans cette zone. 9 - Procédé d'analyse de signes-cases selon la revendication 6 caractérisé en ce que le signe-case comportant une case fermée, reconnue dans sa forme, ses dimensions et son état servant d'origine à l'analyse de son environnement selon le type de signe correspondant à cet emplacement, le centre de la case fermée pour produire les coordonnées servant d'origine à l'analyse, le type de signes-case est défini lors d'un apprentissage préliminaire : définition des coordonnées de la case-signe par rapport à l'image ou au cadre de la zone, définition des dimensions de la case-cible fermée, du type de signe par rapport à une table de référence de signes.- areas containing any structured information to be analyzed from a precise point of origin; according to any one of claims 1 to 5, characterized in that it makes it possible to establish from the model document, the structure of the computer file resulting from the optoelectronic reading of the reproductions of the model document filled in by hand or in printed form, and in that it gives a possibility of recognition of the code of the type of the sheets read, allowing the reading and the automatic recognition in disorder of sheets of different types, by ensuring the possibility of logical control and a rerouting of the information read towards the results files intended to receive the information, with recording of the data interpreted after digital reading, for each sheet, comprising all the interpreted information relating to the different types of zones, each field of the recording being relative to a type of zone and to information contained in this zone. 9 - A method of analyzing sign-boxes according to claim 6 characterized in that the sign-box comprising a closed box, recognized in its shape, its dimensions and its state serving as an origin for the analysis of its environment according to the type of sign corresponding to this location, the center of the box closed to produce the coordinates used for the analysis, the type of box signs is defined during a preliminary training: definition of the coordinates of the box sign in relation to the image or frame of the zone, definition of the dimensions of the closed target box, of the type of sign in relation to a reference table of signs.
10 - Procédé d'analyse de signes-zones selon la revendication 7 caractérisé en ce que le signe-zone étant repéré lors de l'apprentissage par un point servant d'origine à l'analyse de son environnement, l'analyse est conduite selon le type de signe correspondant à cet emplacement et détermine l'état de la surface proche du point d'origine (présence ou non de pixels noirs) puis l'état des autres zones du signe, le type de signe-zone étant défini lors d'un apprentissage préliminaire : définition des coordonnées du point servant d'origine à l'analyse par rapport à l'image ou au cadre de la zone, du type de signe par rapport à une table de référence de signes.10 - A method of analysis of sign-zones according to claim 7 characterized in that the sign-zone being identified during learning by a point serving as an origin for the analysis of its environment, the analysis is conducted according to the type of sign corresponding to this location and determines the state of the surface close to the point of origin (presence or not of black pixels) then the state of the other areas of the sign, the type of sign-area being defined during '' preliminary learning: definition of the coordinates of the point used for the origin of the analysis in relation to the image or the frame of the area, of the type of sign in relation to a reference table of signs.
1 1 - Procédé d'auto-contrôle de lecture optoélectronique de document comportant des zones incluant le dispositif de signes-cases selon la revendication 4, ou tout signe à positionnement précis, caractérisé en ce qu'il implique l'utilisation d'un ou plusieurs cadres imprimés par rapport auxquels sont référencées les coordonnées des signes selon les procédés des revendications 9 et 10. 1 1 - Method for self-checking optoelectronic document reading comprising areas including the device of case signs according to claim 4, or any sign with precise positioning, characterized in that it involves the use of one or several printed frames relative to which the coordinates of the signs are referenced according to the methods of claims 9 and 10.
PCT/FR1996/001389 1995-09-13 1996-09-09 Indicia device and optical scanning method WO1997010565A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP96931101A EP0850459A1 (en) 1995-09-13 1996-09-09 Indicia device and optical scanning method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR95/10803 1995-09-13
FR9510803A FR2738650B1 (en) 1995-09-13 1995-09-13 METHOD OF RECOGNITION BY OPTOELECTRONIC READING OF ALPHANUMERIC AND SYMBOLIC SIGNS WITH HAND-WRITTEN OR PRINTED FILLING

Publications (1)

Publication Number Publication Date
WO1997010565A1 true WO1997010565A1 (en) 1997-03-20

Family

ID=9482561

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR1996/001389 WO1997010565A1 (en) 1995-09-13 1996-09-09 Indicia device and optical scanning method

Country Status (3)

Country Link
EP (1) EP0850459A1 (en)
FR (1) FR2738650B1 (en)
WO (1) WO1997010565A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543624A (en) * 2018-05-28 2019-12-06 珠海金山办公软件有限公司 A method, device, and electronic device for identifying checkboxes in PDF documents

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3845279A (en) * 1972-03-01 1974-10-29 L Rosdorff Notation system
EP0288820A2 (en) * 1987-04-17 1988-11-02 I.C.S. & TRADING CO., LTD. A slip and method of and apparatus for automatic reading of the slip
US4924078A (en) * 1987-11-25 1990-05-08 Sant Anselmo Carl Identification symbol, system and method
US5175774A (en) * 1990-10-16 1992-12-29 Micron Technology, Inc. Semiconductor wafer marking for identification during processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3845279A (en) * 1972-03-01 1974-10-29 L Rosdorff Notation system
EP0288820A2 (en) * 1987-04-17 1988-11-02 I.C.S. & TRADING CO., LTD. A slip and method of and apparatus for automatic reading of the slip
US4924078A (en) * 1987-11-25 1990-05-08 Sant Anselmo Carl Identification symbol, system and method
US5175774A (en) * 1990-10-16 1992-12-29 Micron Technology, Inc. Semiconductor wafer marking for identification during processing

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543624A (en) * 2018-05-28 2019-12-06 珠海金山办公软件有限公司 A method, device, and electronic device for identifying checkboxes in PDF documents
CN110543624B (en) * 2018-05-28 2023-06-23 珠海金山办公软件有限公司 Method, device and electronic device for identifying check boxes in PDF documents

Also Published As

Publication number Publication date
FR2738650B1 (en) 1997-10-17
FR2738650A1 (en) 1997-03-14
EP0850459A1 (en) 1998-07-01

Similar Documents

Publication Publication Date Title
US9239952B2 (en) Methods and systems for extraction of data from electronic images of documents
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
CN106415251B (en) Medicine imaging device
US9805511B2 (en) Interacting with data fields on a page using augmented reality
US9762528B2 (en) Generating a conversation in a social network based on mixed media object context
US20110182508A1 (en) Segregation of handwritten information from typographic information on a document
US11054431B2 (en) Barcode scanning of bulk sample containers
US20140247965A1 (en) Indicator mark recognition
FR2963695A1 (en) POLICE WEIGHT LEARNING FOR TEST SAMPLES IN MANUSCRIPTED KEYWORD REPORTING
FR2956230A1 (en) METHOD FOR CATEGORIZATION AND SEPARATION OF DOCUMENTS IN ONE STEP
US11941478B2 (en) Barcode scanning of bulk sample containers
CN116303871A (en) Exercise book reading method
Chabchoub et al. SmartATID: A mobile captured Arabic Text Images Dataset for multi-purpose recognition tasks
EP0850459A1 (en) Indicia device and optical scanning method
EP1234272B1 (en) Adaptive technology for automatic document analysis
EP4531005A1 (en) Method for extracting data from a structured graphic document, program product and recording medium for implementing such a method
EP3440827B1 (en) Method and system for separating documents during batch digitization
Quy et al. Application of Optical Mark Recognition Techniques to Survey Answer Sheets at Dalat University
WO2016012694A1 (en) Pre-printed surface for handwriting, comprising a pre-printed graphical representation of the passing of a period of time, and associated computer program
CN117115848B (en) Method and system for realizing user fingertip positioning questions
Stulik et al. The first scientific investigation of Niépce’s images from UK and US collections: image layer and image formation
Wang et al. Spoofing Attacks Utilizing a More Realistic Contactless Palm Vein Correction Algorithm
Shriver An Assessment of Media Consumers’ Ability to Distinguish the Level of Post-Processing in Journalistic Images
Al-Barhamtoshy et al. Universal metadata repository for document analysis and recognition
WO2018065381A1 (en) Method for reading a series of two-dimensional barcodes arranged on a support, associated computer program product and reading device

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CA JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FI FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1996931101

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1996931101

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: CA

WWW Wipo information: withdrawn in national office

Ref document number: 1996931101

Country of ref document: EP