DISPOSITIF DE SIGNES ET PROCEDE DE LECTURE OPTIQUE
DESCRIPTION
L'invention est relative à un dispositif de signes alphanumériques et symboliques à remplissage manuscrit ou imprimé et à un procédé de reconnaissance par lecture optoélectronique de ces signes ou de tout objet contenu dans un document. Les programmes de lecture optique de documents comportant des caractères alphanumériques manuscrits font l'objet de recherches importantes. Pour être efficaces, ces programmes nécessitent une puissance de traitement informatique, tant au niveau matériel que logiciel, très onéreuse, pour une fiabilité des résultats encore limitée. Pour autant que le progrès de ces techniques soit rapide ? leur application dans le domaine de la circulation de l'information industrielle et administrative est loin d'être évidente.
De nombreux documents techniques comportant un remplissage alphanumérique manuscrit doivent être ressaisis par des opérateurs informatiques exécutant des tâches ingrates avec une fiabilité également imparfaite.
Si les cases à cocher permettent avec une certaine fiabilité le traitement d'informations binaires de type oui-non par programme informatique, on doit constater qu'aucun système manuscrit simple, fiable, et n'utilisant qu'une surface sensiblement équivalente aux caractères alphanumériques manuscrits n'est disponible.
Tous les procédés utilisés à ce jour reconnaissent la case à cocher comme zone en terme de valeur blanche (vide) ou grise (cochée) sans identifier la case vide ou cochée d'où les difficultés des programmes associés. En dehors du problème délicat du paramétrage des emplacements des cases à cocher qui doivent toujours se positionner au même endroit dans les procédés mécaniques et optoélectroniques de lecture, cette technique est très sensible au parasitage (ou bruit) des graffitis périphériques aux cases à cocher. Tout incident de positionnement du document aboutit à des erreurs d'interprétation graves des données. Surtout, ces systèmes nécessitent 10 cases par chiffre, 26 par lettre ce qui rend pénible leur remplissage, longue leur lecture et obère leur fiabilité.
C'est pourquoi nous nous sommes orientés vers une solution mixant la conception matérielle du document, du signe et le programme informatique, en écartant les techniques décrites.
Notre invention permet une totale fiabilité de lecture, en associant:
- une définition de signe ergonomiquement simple à remplir de manière manuscrite,
- un système de lecture par dispositif optoélectronique (scanner, appareil photo caméra LCD et tout système de lecture numérique), - un procédé d'analyse
- du type de feuilles
- des zones comportant ces signes,
- des signes à l'intérieur de ces zones,
- des modifications manuscrites ou imprimées apportées aux signes de base. - une méthodologie:
- d'autocorrection des images des documents lus optoelectroniquement,
- d'apprentissage du type et de la structure du contenu du document. Nous avons eu pour objectif de définir:
- des signes modifiables par l'agent responsable de la saisie manuelle; ces modifications sont particulièrement simples à effectuer et relèvent de références culturelles quasi universelles,
- un système d'analyse complètement original par rapport aux systèmes cases à cocher classiques sur la base des données du système de lecture optoélectronique.
- des possibilités d'auto-contrôle et d'apprentissage dans le processus de reconnaissance et de traitement.
Les caractéristiques et les avantages de l'invention seront illustrés par la description détaillée d'au moins un mode de réalisation de l'invention donné à titre indicatif et représenté aux figures 1 à 24.
1 - Les signes La composition structurelle et spatiale du signe :
Nos signes sont destinés à être reconnus comme valeur numérique. Ils sont constitués sur le principe de zones simples ou multiples qui sont destinées à recevoir des barres manuscrites ou imprimées. Nos signes peuvent comporter une. deux, trois zones ou plus (Zl, Z2 . . .). Ces zones sont destinées à recevoir des indications manuscrites ou imprimées sous forme de barres. Ces zones sont associées à une zone de référence, ou zone-cible (ZC) indissociable du signe dans son utilisation par le traitement de reconnaissance (FIG- 1 ). Pour des raisons de gain de place et d'ergonomie, la zone-cible peut être confondue avec une autre zone
(FIG-2) mais il ne s'agit là que d'un mode particulier d'utilisation de nos signes qui se présentent ainsi.
Les signes à une zone, connus sous le terme classique de cases à cocher, ne présentent aucune originalité en eux-mêmes. La zone peut prendre 2 valeurs, 0 et 1 selon qu'elle est vide ou cochée (FIG. 3). La zone-cible est intégrée à la case qui assure 2 fonctions: support d'information manuscrite et zone de référence (voir infra).
Les signes à 2 zones comportent (FIG. 4): - une zone représentant les unités (ZU) et destinée à supporter de 0 à 4 barres, - une autre représentant la valeur 5 (Z5) destinée à supporter 0 ou 1 barre unique. La combinaison de ces 2 zones permet toute numérotation entre 0 et 9. La combinaison de ce type de signes à 2 zones permet de rendre compte de toute valeur entre 0 et l'infini. La zone-cible (ZC) est confondue à la zone de valeur 5 qui assure 2 fonctions. Les signes à trois zones (FIG. 5) sont destinés à la production de valeurs entre 0 et 49 de la manière la plus réduite possible en surface. Le principe est le même pour la zone des unités (ZU) et de la valeur 5 (Z5), la zone supplémentaire (ZD) est destinée à supporter de 0 à 4 barres représentant les dizaines. La zone-cible est également confondue à la zone de valeur 5. Dans ce cas le signe est un nombre entre 0 et 49, il est isolé et ne peut donner lieu à l'utilisation séquentielle de la numérotation classique.
Deux zones complémentaires (FIG. 6) ZC 1 et ZC 2 peuvent aisément être adjointes à ces zones pour des significations complémentaires: signe négatif, puissance... la zone-cible restant toujours confondue à la zone de valeur 5. Le principe du signe
L'intérêt de cette représentation de données numériques sous cette forme, réside dans le système d'interprétation par lecture optique et que nous avons mis au point (voir infra 2- Le système d'analyse du dispositif des signes). Pour être interprétés correctement par notre système d'analyse, et permettre l'apprentissage et l' auto-contrôle mis au point, les signes doivent satisfaire aux principes ci-après définis.
Ces signes doivent comporter une zone contenant le point d'origine de l'analyse du signe. C'est à partir de ce point que l'analyse de l'image numérique du signe est faite. Ce point de référence est le centre de toute recherche de l'état des pixels de
son environnement. Les zones radiales doivent permettre l'inscription de barres perpendiculaires au rayon partant du point d'origine
Le signe n'est donc que le support visuel d'aide mnémotechnique facilitant l'inscription des barres II se définit avant tout par son centre et un double périmètre d'analyse. Le premier périmètre définit les zones de début de recherche des barres transversales selon les axes de recherche, le second la limite de fin de recherche . Ce périmètre externe n'est pas équidistant du centre (FIG 7) Si un axe de recherche n'existe pas. le contour de ces deux périmètres sont confondus sur cet axe. Dans les formes de signes proposées, la zone du point d'origine est également une zone d'inscription (zone de valeur 1 en cas de cochage pour les cases à cocher, 5 pour les autres signes), afin de rendre plus compact le signe et d*en facihtei l'ergonomie d'utilisation Ce n'est donc qu'une forme particulière du principe général.
Les signes proposés
Les signes de notre dispositif peuvent prendre différentes présentations sur la base des principes définis.
Les signes de type case à cocher se présentent sous forme classique (FIG 8) et ne comportent qu'une zone simple Les signes numériques peuvent se présenter sous deux formes verticales ou horizontales à partir d'un module de base (FIG 9), la position du carre vide pouvant être selon le sens, en haut ou en bas, à gauche ou à droite Le remplissage des signes se fait de manière identique quelque soit l'orientation du signe (FIG 10 et 1 1 ) La case carrée vaut 0 si elle est vide, 5 si elle comporte une barre, la zone des unîtes se trouve dans le prolongement axial de la case, une barre dans la zone des unîtes vaut 1 , deux barres valent 2, trois barres 3, quatre barres 4
Ce système simple permet une utilisation sérielle et séquentielle, comme illustre pai la figure 4 Un regroupement de ces signes peut être utilisé pour le remplissage d'informations dont les valeurs sont limitées à un maximum. 99. 999 (FIG 12) Ce système de signes à remplissage manuscrit présente par rapport aux chiffres manuscrits, l'avantage de pouvoir être incrémenté et de permettre un remplissage en plusieurs temps Par exemple pour un contrôle entre 0 et 9, il suffit à l'opérateur de
s'assurer que le chiffre est inférieur ou supérieur à 5 puis dans ce dernier cas, d'ajuster en incrémentant les unités. L'utilisation d'encre effaçable et d'effaceur permet de rectifier les marques sans préjudice pour la lecture optoélectronique. Le système général exposé ci-dessus possède des variantes de présentation et d'utilisation. Si une information numérique est comprise, non entre 0 et 9, mais entre 0 et 10, le même signe peut être utilisé (barre des unités plus longue) avec un contrôle logiciel permettant le dénombrement d'une unité supplémentaire. Dans ce cas, le signe- chiffre est isolé et ne peut donner lieu à l'utilisation séquentielle de la numérotation classique.
Si une information numérique est comprise entre 0 et 31 comme pour les dates, les heures, les valeurs alphabétiques, le signe peut être complété par 2 petites barres des dizaines. Ces signes peuvent être personnalisés par une lettre ou un logo caractérisant le type d'information à y porter, pour aider l'opérateur dans son remplissage. Cette personnalisation permet en outre un contrôle a posteriori et une lecture visuelle aisée. Un contrôle logiciel de la cohérence des informations portées est assuré lors du traitement informatique. Pour ce type de signe, le signe est également isolé, et ne peut donner lieu à l'utilisation séquentielle de la numérotation classique. Les signes représentant des dates peuvent être mis sous forme particulière (J/M/A) comme illustré (FIG. 13).
Les deux courtes lignes, ici en haut, sont destinées à recevoir les barres manuscrites des dizaines, 3 maximum pour les 31 jours du mois, 1 pour les mois, puis ensuite 2 signes numériques standards de notre dispositif pour les années Les signes représentant des heures peuvent être mis sous la forme h/m illustrée (FIG. 14).
Les signes alphabétiques peuvent être produits à partir d'une correspondance numérique classique en modifiant de façon manuscrite (ou en les imprimant directement) le signe de la figure 15. La figure 16 illustre la codification de l'alphabet classique français.
Les signes pouvant être définis à partir de ces principes sont suffisamment simples et différenciés pour permettre un remplissage rapide des documents administratifs.
Ces signes peuvent être générés sous forme d'images, de structures ou de polices de caractères informatisées dans toute application: traitement de texte, feuille de calcul. Les signes sont imprimés soit sous leurs formes vierges, à remplir de façon manuscrite, soit sous formes remplies imprimées (code de feuille, références constantes ...). Dans ce dernier cas, les signes imprimés peuvent comporter l'indication de leur valeur: 1 , 2, 3, ..., A, B, C, D, ...indiquée à coté du signe (à la place de α, h, m ci-dessus).
2- Le système d'analyse du dispositif des signes
Les feuilles comportant de tels signes sont destinées à faire l'objet, successivement: - d'une lecture numérique par système de lecture optoélectronique,
- d'une analyse de l'image numérique,
- d'une reconnaissance de la valeur alphanumérique ou symbolique de ces signes
- et d'un enregistrement des informations recueillies pour un traitement informatique. Le traitement informatique de l'analyse et la reconnaissance, pour être très rapide, nécessitent une définition préalable des feuilles à reconnaître, et un apprentissage des types d'informations qui s'y trouvent.
Ces feuilles et documents peuvent comporter des zones diverses : des zones alphanumériques imprimées (FIG. 2θΦ), des zones graphiques caractérisées par tout type d'information traitée comme une image (FIG. 20®), des zones cases à cocher et des zones comportant notre dispositif de signes-cases (FIG. 20®). Ces zones peuvent présenter un contenu mixte. Ces zones subiront un traitement approprié:
- reconnaissance de caractères pour les zones alphanumériques imprimées - capture d'image et traitement de celle-ci pour les zones graphiques
- traitement spécifique décrit ci-dessous pour les zones comportant notre dispositif de signes, et notamment pour la zone d'identification de la feuille.
Chaque zone peut être l'objet des différents types de traitement.
A- Le procédé d'analyse du dispositif de signes Le type d'analyse du dispositif de nos signes est directement lié aux caractéristiques de nos signes vierges, et à leur système de remplissage. Au système d'analyse classique de zone interne à la case à cocher (pixels blancs, pixels noirs), nous
substituons un système d'analyse de type spectral à partir du centre de la case de référence cible.
1 - L'analyse de chaque signe commence à partir d'un point prédéfini dont les coordonnées sont sensées se trouver à l'intérieur de la case cible. Chaque signe est repéré et positionné préalablement dans l'image (voir infra : L'auto-contrôle et l'apprentissage). La case-cible constitue le point de départ de l'analyse de chaque signe.
2- L'analyse du signe se poursuit par un contrôle pour s'assurer que la case vide est bien la case que l'on recherche et non une zone simplement blanche (qui impliquerait une erreur de positionnement). Si la case est vide (non barrée), le nombre des pixels blancs trouvés avant les pixels noirs de son contour, dans les sens vertical et horizontal, confirme la forme et l'état (non-barré) de la case.
Si la case comporte des pixels noirs internes, l'état de la case de référence cible est reconnu comme barré. Une analyse globale est menée pour confirmer son contour externe (la case ne doit pas être largement recouverte par une tache noire, un système d'alarme logiciel permet de régler ce cas extrême).
Dans les deux cas, un calcul du centre de la forme de case trouvée est fait, pour affiner les coordonnées du point de départ du processus suivant d'analyse.
3- Le point de départ de l'analyse étant vérifié et recalculé, une recherche à partir du contour de la case est menée (périmètre interne FIG. 7), pixel par pixel à l'intérieur de la zone située entre les 2 fines barres prolongeant la case cible (FIG. 22 ©). Cette analyse dépend du type de signe. Les directions, longueurs de recherche de l'analyse, dépendront du signe choisi dans la table de référence pour cet emplacement, lors de l'apprentissage, et défini dans le fichier de définition de la feuille. Le nombre de barres est reconnu par interprétation de la succession des pixels blancs et noirs. L'analyse s'arrête à la fin de chaque zone (dont les coordonnées sont contenues dans le fichier de définition de la feuille).
Un contrôle logiciel des vraisemblances est effectué par algorithme (exemple: pas plus de 3 barres des dizaines pour le signe relatif aux jours du mois). B- L'apprentissage général propre à une feuille
Cet apprentissage est mémorisé par le programme dans un fichier de définition propre à un type de feuille qui comportera toutes les informations permettant le
traitement par lecture optoélectronique et la reconnaissance des informations portées sur ce type de feuille
A partir d'une image de la feuille-modèle vierge (FIG 20) obtenue par lecture optoélectronique, on repère chaque zone générale à reconnaître (Φ, ©. Φ @ )
5 Chaque zone correspond à une portion de l'image de la feuille, définie par les coordonnées d'un rectangle virtuel contenant la zone Ces zones sont indexées et leur type de contenu- alphanuméπque imprimé, graphique, dispositif de signes- cases ou zones et case à cocher, code d'identification de la feuille (FIG 20 ©), est associé à cet index o Les zones alphanumériques impπmées Φ et les zones graphiques (D sont traitées selon les modalités classiques de traitement informatique de telles données numériques
Le programme de lecture produira une image numérique de chaque feuille, cette image sera immédiatement analysée en liaison avec le fichier de définition propre 5 au type de feuille Le traitement spécifique de chaque zone sera lancé de manière séquentielle pour obtenir un ensemble d'informations graphiques, alphanumériques qui devront être organisées pour être enregistrées dans un fichier
C- L'apprentissage d'une zone contenant notre dispositif
En sélectionnant dans l'image générale la zone comportant notre dispositif de 0 signes, cette zone apparaît seule à l'écran (FIG 21 )
On définit la structure d'analyse propre à chaque signe de la zone On part du premier signe sélectionné (ce peut être n'importe lequel dans la zone) en cliquant avec un dispositif de pointage (souris, table graphique), dans la case fermée du signe (ou sur un point blanc qui est ainsi défini comme point de départ de
25 l'analyse du signe-zone) (FIG. 22) Le centre de la case fermée est automatiquement recalculé pour produire les coordonnées servant d origine a l'analyse de son environnement (FIG. 22 (D) selon le type de signe correspondant a cet emplacement On définit les propriétés du signe en référence à une table de signes (FIG 17 et
30 23)
- type alphabétique, numérique, heure,
- forme dimensions, barres des unités, des dizaines éventuelles, a gauche, a droite,
- position du point de départ de l'analyse du signe, par rapport au cadre virtuel de la zone ). Ces propriétés sont mémorisées par le programme dans le fichier de définition. On passe ensuite au signe suivant dans l'ordre désiré de positionnement dans le fichier d'enregistrement des données interprétées. Les signes ayant fait l'objet d'un apprentissage sont mis sur un fond coloré (FIG. 24), afin de les distinguer des signes restant à définir.
L'enregistrement des données interprétées après lecture numérique pour chaque feuille, comporte toutes les informations interprétées relatives aux différents types de zones. Chaque champ de l'enregistrement associe un type de zone et une information contenue dans cette zone (si ceux-ci sont différenciés). Ceci est impératif pour les zones comportant notre dispositif car les informations relatives à un signe peuvent se trouver dans le fichier résultat entre 2 informations relatives à d'autres zones. Les feuilles peuvent comporter un code propre (FIG. 20®) du type de notre dispositif. C'est la lecture de ce code qui déclenchera à chaque lecture le processus d'accès au fichier de définition de la feuille (voir infra L'auto-contrôle du type de feuille). Le fichier d'apprentissage ou fichier de définition de la feuille comportera donc un ensemble de données, ordonnées selon les besoins de l'utilisateur, qui permettront au programme de produire un fichier résultat comportant une suite complexe et hétérogène de données issues: de l'analyse de signes de notre dispositif, d'images graphiques, et de textes alphanumériques.
3 - Le système d'auto-contrôle dans le processus de lecture, de reconnaissance, et de traitement
Le système d'analyse permet de reconnaître les cases vides et les cases pleines et de s'assurer que les cases vides ou pleines soient bien les cases recherchées. Le point commun à tous ces signes est la case cible (carrée, quadrilatère ou forme fermée). Cette case est la cible initiale. Chaque signe est repéré et positionné par type de feuille dans des zones spécifiques à notre dispositif de l'image.
L'auto-contrôle du type de feuille
L'indication du type de feuille, et donc du fichier de définition de la feuille, doit être transmise au programme, en préalable à toute analyse logicielle de l'image obtenue par lecture optoélectronique. Cette indication peut être transmise au programme par l'opérateur avant chaque lecture d'une ou plusieurs feuilles de même type. Cette méthode présente l'inconvénient de ne pas permettre un auto¬ contrôle, car même en cas de composition en principe homogène d'un lot de feuilles, certaines feuilles peuvent appartenir à un autre type, ou être mal introduites lors de la lecture optoélectronique. Il est beaucoup plus simple d'intégrer dans chaque feuille un code qui soit reconnu immédiatement après numérisation de l'image. Ce code à positionnement constant sur toutes les feuilles lues doit donc être intégré aux feuilles. Ce code est constitué par un ensemble de signes numériques (FIG. 20 ® ).
L'intégration de ce code permet une lecture de lot de feuilles de types hétérogènes, possédant chacune un fichier de définition de feuille différent, sans aucune intervention extérieure.
Ce code permet l' auto-contrôle automatique de la feuille lue, en lui associant son fichier de définition de feuille.
L'auto-contrôle de lecture du dispositif des signes :
Le problème du contrôle du positionnement du point de départ de l'analyse de chaque signe est complexe puisqu'un déplacement de 2 ou 3 dixièmes de millimètre peut générer des erreurs générales de lecture des zones de notre dispositif de signes. Ces erreurs peuvent provenir:
- de la production des copies de feuilles: impression, photocopies décalées, de biais, présentant des effets de zoom, - du système de lecture optoélectronique: introduction imparfaite, introducteur mal réglé, inégalité de traitement de l'image pour raisons mécaniques ou électroniques. Un dispositif matériel de repérage et de contrôle de l'image est donc nécessaire. Un cadre est tracé autour des zones contenant les signes à analyser (FIG. 22 Φ ). Ces cadres possèdent sur la feuille-modèle (FIG. 20) un positionnement, relatif entre eux et avec chaque signe, parfaitement défini. Ces cadres peuvent inclure la ou les zones contenant les signes à analyser, où ne pas les inclure, le repérage relatif
participant de la même procédure logique. De même l'emplacement des signes peut être repéré à partir de cadres en-têtes et pieds de pages standardisés pour un certain nombre de documents.
En pointant lors de l'apprentissage, sur les angles du cadre, on mémorise les coordonnées de ces angles par rapport aux bords de l'image (FIG. 22 Φ). Lors de la lecture des feuilles reproduites à partir de la feuille modèle, l'image produite par le système de lecture optoélectronique renvoie l'image de ces cadres. Leurs positions et leurs coordonnées dans l'image sont recherchées et comparées à celles de la feuille modèle contenue dans le fichier de définition. Une transformation vectorielle de ces cadres-images retraduit l'ensemble du positionnement des pixels de l'image de la zone pour les faire correspondre au positionnement de référence de la feuille modèle et corriger les effets de zoom et de rotation. En cas d'utilisation de notre procédé d'auto-contrôle, le fichier de définition de la feuille contient donc les coordonnées du ou des cadres par rapport à l'image (pour accélérer leur recherche), et les coordonnées de chaque point d'origine de l'analyse de nos signes par rapport à ces cadres.
Une analyse de feuilles-test permet de prendre en compte les effets de déformation locaux au niveau du système de lecture optoélectronique, et corrige (si besoin) systématiquement la transformation vectorielle précédente. Le remplissage des signes d'un tel document est aussi simple et rapide qu'un remplissage à l'aide de chiffres et lettres manuscrits, sa lecture optoélectronique et son traitement informatique sont quasi-instantanés et sans erreur. Ces procédés d'apprentissage et d'auto-contrôle sont utilisables pour la lecture de documents comportant : des zones de code de type de feuilles; des zones diverses alphanumériques imprimées; des zones graphiques; des zones cases à cocher ou des zones comportant le dispositif de signes-cases ou de signes-zone; des zones comportant toute information structurée devant être analysée à partir d'un point d'origine précis.
Variantes de notre dispositif de signes et de leur analyse Notre dispositif de signes repose sur une case-cible fermée, dont le repérage est effectué sur la base d'un système d'apprentissage et d'un procédé d'auto-contrôle très précis. Avec une résolution d'image élevée, il est possible de reconnaître une
quantité de signes-équivalents-caractères largement supérieure à 2000 par page A4 avec une fiabilité totale.
Si le nombre des signes-équivalents-caractères est inférieur à cette quantité, les contraintes de notre dispositif de signes et de notre procédé d'apprentissage, d'auto- contrôle et d'analyse, permettant une totale sécurité de lecture, peuvent être allégées.
La case cible fermée, pour permettre l' auto-contrôle, peut être transformée en simple zone dont on définit les coordonnées du point de départ de notre analyse de type spectral (FIG. 18 /l (D, 12 Φ et FIG. 19 Φ) Le nombre de barres manuscrites ou imprimées contenues dans les zones affectées aux unités Φ, et éventuellement aux zones des valeurs 5 ou des dizaines Φ peut être reconnu selon notre méthode Si ces zones sont assez larges, notre système d'auto-correction peut s'avérer inutile car les risques de vaπations angulaires ou par effet de zoom conduisant à des erreurs de lecture, diminuent avec l'augmentation de la dimension des signes et des barres. Tout système dérivé de notre procédé d'analyse et de notre dispositif de signes, basé sur l'analyse du nombre de barres dans des zones prédéfinies, doit donc être considéré dans le champ de nos revendications
Les signes peuvent être repérés étant situés à l'intérieur d'un ou plusieurs cadres (FIG.23) ou à l'extérieur de ces cadres ; ces cadres pouvant être inexistants (FIG.17).
Exemple: la case cible ou zone de référence peut être constituée d'une cellule d'un tableau, d'autres cellules recevant les barres des unités des dizaines ou des valeurs 5 (FIG. 18). La case cible peut être commune à plusieurs zones correspondant à des signes différents. Bien entendu, l'invention n'est pas limitée aux modes de réalisation décrits et représentés pour lesquels d'autres variantes sont possibles dans :
• le nombres de signes, de cases, de zones
• le nombre de cadres de repérage
• le nombre et le type d'objets analysés et reconnus sur le document • le type de document, sans pour cela sortir du cadre de l'invention.