[go: up one dir, main page]

JP3006294B2 - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JP3006294B2
JP3006294B2 JP4202809A JP20280992A JP3006294B2 JP 3006294 B2 JP3006294 B2 JP 3006294B2 JP 4202809 A JP4202809 A JP 4202809A JP 20280992 A JP20280992 A JP 20280992A JP 3006294 B2 JP3006294 B2 JP 3006294B2
Authority
JP
Japan
Prior art keywords
unit
box
frame
enclosing frame
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4202809A
Other languages
Japanese (ja)
Other versions
JPH0652351A (en
Inventor
健志 大河原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4202809A priority Critical patent/JP3006294B2/en
Publication of JPH0652351A publication Critical patent/JPH0652351A/en
Application granted granted Critical
Publication of JP3006294B2 publication Critical patent/JP3006294B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は光学的文字読取装置に関
し、特に伝票等の帳票を読取る帳票読取用の光学的文字
読取装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reading device, and more particularly to an optical character reading device for reading forms such as slips.

【0002】[0002]

【従来の技術】従来、帳票読取用の光学的文字読取装置
の使用においては、全額欄等の桁ズレ等に起因する誤読
防止,あるいは読取性能の向上のために、帳票上の各文
字の位置および文字種等の書式をあらかじめ記述してお
くのが一般的であった。これらの作業は繁雑で多くの時
間を要するものである。
2. Description of the Related Art Conventionally, in the use of an optical character reading apparatus for reading a form, the position of each character on the form has to be reduced in order to prevent erroneous reading due to a displacement of a digit in a full amount column or the like or to improve reading performance. In general, a format such as a character type and the like was described in advance. These tasks are tedious and time-consuming.

【0003】ところが、帳票の各項目の文字配置には一
定のパターンがあるため、帳票を新たに設計したり、変
更する場合、常に類似した書式を入力していることが多
い。
However, since there is a certain pattern in the character arrangement of each item of the form, when a new form is designed or changed, a similar format is often input.

【0004】[0004]

【発明が解決しようとする課題】従来の帳票読取用の光
学的文字読取装置では、帳票の新規作成あるいは変更に
よって帳票上の各文字の文字種や位置等の書式が変更と
なる場合、新たに書式を作成しなければならない。その
ため、1種類の帳票に1つの書式が必要となるので、帳
票の新規作成や変更を行うごとに書式の数が増え、その
管理方法が複雑になる。
In a conventional form-reading optical character reading apparatus, when the form such as the character type and position of each character on the form is changed by newly creating or changing the form, a new format is required. Must be created. Therefore, one form is required for one type of form, and the number of forms increases each time a form is newly created or changed, and the management method becomes complicated.

【0005】さらに、同一帳票内に同一形式の項目がた
くさんある場合、すべての項目に対して同様な内容を繰
り返し指定しなければならず、書式指定が繁雑になると
いう問題点があった。
Further, when there are many items of the same format in the same form, it is necessary to repeatedly specify the same contents for all the items, and there is a problem that the format specification becomes complicated.

【0006】なお、印刷文書や表の読取を対象として、
書式の自動解析が行なわれているが、通常の帳票に対し
て、その記載内容を正しく判別すること並びに文字を1
文字ずつ正しく抽出する性能が現段階では不十分である
という問題点があった。
[0006] For reading printed documents and tables,
Although the format is automatically analyzed, it is necessary to correctly determine the content of the description on a normal form
There is a problem that the performance of correctly extracting characters character by character is insufficient at this stage.

【0007】本発明の目的は上述した問題点を解決し、
事前に文字位置・文字種等の情報を与えておくことによ
り運用効率のよい帳票読取が可能となる光学的文字読取
装置を提供することにある。
An object of the present invention is to solve the above-mentioned problems,
It is an object of the present invention to provide an optical character reading apparatus that can read a form with high operational efficiency by giving information such as a character position and a character type in advance.

【0008】[0008]

【課題を解決するための手段】本発明の光学的文字読取
装置は、帳票などの囲み枠を含む紙面上のデータを光学
的に入力して入力画像を得る画像入力部と、前記入力画
像上の前記囲み枠の検知を行なう囲み枠検知部と、検知
された前記囲み枠の種別の識別を行う囲み枠識別部と、
前記囲み枠の種別に対応した前記囲み枠内の文字や画像
に関する文字種や位置情報を含む記載内容を記憶した記
載内容記憶部と、前記囲み枠識別部が識別した前記囲み
枠の種別に対応した前記囲み枠内の前記記載内容を前記
記載内容記憶部から読み出し抽出する記載内容抽出部
と、前記記載内容に応じて前記囲み枠内の文字あるいは
画像を抽出し読取処理を行なう認識部とを備えて構成さ
れている
According to the present invention, there is provided an optical character reading apparatus comprising: an image input unit for optically inputting data on a sheet including a box such as a form to obtain an input image; An enclosing frame detecting unit that detects the enclosing frame, and an enclosing frame identifying unit that identifies the type of the detected enclosing frame,
A description storage unit that stores description contents including character types and position information relating to characters and images in the box corresponding to the type of the box; and the box identified by the box identification unit.
A description extracting unit that reads out and extracts the written content in the enclosing frame corresponding to the type of the frame from the written content storage unit, and performs a reading process by extracting a character or an image in the enclosing frame according to the written content. It is configured to include a recognition unit for performing
Have been .

【0009】[0009]

【実施例】次に、本発明について図面を参照して説明す
る。
Next, the present invention will be described with reference to the drawings.

【0010】図1は、本発明の一実施例のブロック図で
ある。図1に示す実施例は、帳票等の紙面上のデータを
光学的に撮像する画像入力部11と、画像入力部11で
取得した入力画像に含む囲み枠を検知する囲み枠検知部
12と、検知した囲み枠の種別の識別を行なう囲み枠識
別部13と、囲み枠の種別に対応した枠内記載内容を記
憶した記載内容記憶部14と、囲み枠識別部13で識別
した囲み枠の識別にもとづいて記載内容記憶部14から
囲み枠内の記載内容を抽出する記載内容抽出部15と、
記載内容の認識を行なう認識部16とを備えた構成を有
する。
FIG. 1 is a block diagram of one embodiment of the present invention. The embodiment illustrated in FIG. 1 includes an image input unit 11 that optically captures data on a paper surface such as a form, a frame detection unit 12 that detects a frame included in the input image acquired by the image input unit 11, A box identification unit 13 for identifying the type of the detected box, a description storage unit 14 that stores the contents described in the frame corresponding to the type of the box, and an identification of the box identified by the box identification unit 13. A description content extraction unit 15 for extracting the description content in the surrounding frame from the description content storage unit 14 based on the
And a recognition unit 16 for recognizing the written contents.

【0011】次に、本実施例の動作について説明する。Next, the operation of this embodiment will be described.

【0012】帳票上のデータは、画像入力部11によっ
て光学的に取り込まれ、取り込まれた入力画像に囲み枠
が存在するかどうかが囲み枠検知部12によって検知さ
れる。
The data on the form is optically captured by the image input unit 11, and the frame detection unit 12 detects whether a frame is present in the captured input image.

【0013】囲み枠が検知された場合には、その囲み枠
の種別を囲み枠識別部13によって判定する。
When an enclosing frame is detected, the type of the enclosing frame is determined by the enclosing frame identifying section 13.

【0014】囲み枠の種別が判定されると、その囲み枠
内に記述されている文字や画像に関する記載内容があら
かじめ格納されている記載内容記憶部14から、記載内
容を記載内容抽出部15が抽出し、抽出した記載内容に
対して認識部16が入力画像上の囲み枠内から文字ある
いは画像を抽出して読取による認識処理を行なう。
When the type of the enclosing frame is determined, the written content extracting unit 15 extracts the written content from the written content storage unit 14 in which the written content relating to the characters and images described in the enclosing frame is stored in advance. The recognition unit 16 extracts characters or images from the enclosed frame on the input image and performs recognition processing by reading the extracted written contents.

【0015】図2は、本実施例において使用する帳票の
一例である。帳票5の紙面上には囲み枠21で読取領域
22が囲まれており、また囲み枠21の左上の隅に囲み
枠21の種別を判定するための識別枠23がある。
FIG. 2 shows an example of a form used in this embodiment. The reading area 22 is surrounded by an enclosing frame 21 on the paper of the form 5, and an identification frame 23 for determining the type of the enclosing frame 21 is provided at the upper left corner of the enclosing frame 21.

【0016】その識別枠23には、記載内容記憶部14
に記憶されている囲み枠21に割り当てられた囲み枠識
別コード24たとえば「01」が記入されている。
In the identification frame 23, the description content storage unit 14
, The box identification code 24 assigned to the box 21 stored therein, for example, "01" is entered.

【0017】記載内容記憶部14には、囲み枠21の種
別枠23内に記入された囲み枠識別コードと、囲み枠識
別コード24が記入されている囲み枠21内の文字や画
像に関する文字種や位置情報といった記載内容情報が記
憶されている。
The description content storage unit 14 stores a box identification code entered in the type box 23 of the box 21 and a character type and a character related to the character and image in the box 21 in which the box identification code 24 is entered. Described content information such as position information is stored.

【0018】囲み枠検知部12では、画像入力部11で
取得した入力画像上の囲み枠の位置を検知し、その位置
情報を囲み枠識別部13へ出力する。なお、囲み枠検知
部12における囲み枠の位置検知は、周知の技術を用い
て実現することができるのでここでは詳細な説明を省略
する。
The frame detection unit 12 detects the position of the frame on the input image acquired by the image input unit 11 and outputs the position information to the frame identification unit 13. The detection of the position of the enclosing frame in the enclosing frame detecting unit 12 can be realized by using a well-known technique, and thus a detailed description is omitted here.

【0019】囲み枠識別部13は、囲み枠検知部12か
ら提供される囲み枠の位置情報にもとづき、囲み枠21
の識別枠23内に記述された囲み枠識別コード24を検
出する。このために、まず、囲み枠検知部12から入力
された格納位置にある囲み枠21から識別枠23を検出
する。次に識別枠23内の画像データを認識部16入力
し、画像データ内から囲み枠識別コード24を読み取ら
せ、その結果を認識部16から受ける。受け取った結果
は、囲み枠識別コード24として記載内容抽出部15へ
入力する。
The enclosing frame identifying unit 13 generates an enclosing frame 21 based on the encircling frame position information provided from the enclosing frame detecting unit 12.
Of the box frame identification code 24 described in the box 23 of FIG. For this purpose, first, the identification frame 23 is detected from the surrounding frame 21 at the storage position input from the surrounding frame detecting unit 12. Next, the image data in the identification frame 23 is input to the recognition unit 16, the surrounding frame identification code 24 is read from the image data, and the result is received from the recognition unit 16. The received result is input to the written content extraction unit 15 as the box identification code 24.

【0020】本実施例では、囲み枠識別コード24を数
字で表現しているが、他の種類の文字であっても、また
バーコード等の符号であってもかまわない。また、帳票
内であればいずれの位置に設定してもかまわない。
In this embodiment, the enclosing frame identification code 24 is represented by a numeral, but may be another type of character or a code such as a bar code. Further, any position may be set within the form.

【0021】記載内容抽出部15は、囲み枠識別部13
から入力された囲み枠識別コード24の指定内容を記載
内容記憶部14から読み出し、囲み枠識別コード24に
対応する記載内容情報を認識部16へ入力する。
The description extracting unit 15 includes the box identifying unit 13.
The specified content of the box identification code 24 input from the storage unit 14 is read from the description storage unit 14, and the description information corresponding to the box identification code 24 is input to the recognition unit 16.

【0022】認識部16は、前述した如く、囲み枠識別
部13が抽出した識別枠23内の画像データの文字読取
処理を行い、読取結果を囲み枠識別部13へ転送すると
ともに、記載内容抽出部15で抽出された記載内容に従
って入力画像上の囲み枠内の文字あるいは画像の読取処
理を行う。
As described above, the recognition unit 16 performs a character reading process on the image data in the identification frame 23 extracted by the box identification unit 13, transfers the read result to the box identification unit 13, and extracts the written contents. In accordance with the description contents extracted by the unit 15, reading processing of characters or images in a box on the input image is performed.

【0023】[0023]

【発明の効果】以上説明したように本発明は、画像入力
部により帳票などの紙面上のデータを光学的に入力し、
囲み枠検知部により入力画像上の囲み枠を検知し、囲み
枠識別部により囲み枠の種別を識別し、記載内容抽出部
により、囲み枠の種別に対応した囲み枠内の文字や画像
に関する文字種や位置情報を含む記載内容を記載内容記
憶部にあらかじめ格納した記載内容群の中から抽出し、
認識部により、抽出された記載内容に従って、囲み枠内
の文字あるいは画像の読取処理を行うため、囲み枠の種
別に対応した予め記憶した記載内容に従って囲み枠内の
文字や画像の読取処理ができる。このため、帳票上の囲
み枠位置を自動検知し、囲み枠内の文字や画像を抽出す
る際に必要な書式を囲み枠を識別して設定することによ
り、帳票の新規作成や変更によって新たに書式を作成す
る必要がなく、書式管理が容易にでき、また同一帳票内
に同一形式の項目がたくさんある場合、1項目分の指定
ですむため、書式指定が簡単に行えるという効果があ
る。
As described above, according to the present invention, image input
Optically input data on paper such as forms by the department,
The surrounding frame detection unit detects the surrounding frame on the input image and
The frame identification unit identifies the type of the enclosing frame, and the written content extraction unit
The characters and images in the box corresponding to the type of box
A description of the description, including the character type and position information
Extract from the content group stored in advance in the storage unit,
According to the description contents extracted by the recognition unit,
To read the characters or images
According to the previously stored contents corresponding to the
Capable of reading characters and images. For this reason, by automatically detecting the position of the frame on the form and identifying and setting the format required for extracting characters and images in the form, the form can be newly created or changed by creating or changing the form. There is no need to create a format, and it is easy to manage the format. In addition, when there are many items of the same format in the same form, only one item needs to be specified, so that the format can be easily specified.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例のブロック図である。FIG. 1 is a block diagram of one embodiment of the present invention.

【図2】図1の実施例で使用する帳票の一例を示す図で
ある。
FIG. 2 is a diagram showing an example of a form used in the embodiment of FIG.

【符号の説明】[Explanation of symbols]

11 画像入力部 12 囲み枠検知部 13 囲み枠識別部 14 記載内容記憶部 15 記載内容抽出部 16 認識部 21 囲み枠 22 読取領域 23 識別枠 24 囲み枠識別コード DESCRIPTION OF SYMBOLS 11 Image input part 12 Surrounding frame detection part 13 Surrounding frame identification part 14 Description content storage part 15 Description contents extraction part 16 Recognition part 21 Surrounding frame 22 Reading area 23 Identification frame 24 Enclosure frame identification code

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 帳票などの囲み枠を含む紙面上のデータ
を光学的に入力して入力画像を得る画像入力部と、 前記入力画像上の前記囲み枠の検知を行なう囲み枠検知
部と、 検知された前記囲み枠の種別の識別を行う囲み枠識別部
と、 前記囲み枠の種別に対応した前記囲み枠内の文字や画像
に関する文字種や位置情報を含む記載内容を記憶した記
載内容記憶部と、前記囲み枠識別部が識別した前記囲み枠の種別に対応し
前記囲み枠内の前記記載内容を前記記載内容記憶部か
ら読み出し抽出する記載内容抽出部と、 前記記載内容に応じて前記囲み枠内の文字あるいは画像
を抽出し読取処理を行なう認識部と、 を備えることを特徴とする光学的文字読取装置。
An image input unit for optically inputting data on a sheet including a box such as a form to obtain an input image; a box detection unit for detecting the box on the input image; An enclosing frame identification unit for identifying the type of the detected enclosing frame; and a description content storage unit for storing a description content including a character type and a position information relating to characters and images in the enclosing frame corresponding to the type of the enclosing frame. Corresponding to the type of the enclosing frame identified by the enclosing frame identifying unit.
A description content extracting unit that reads and extracts the description content in the box from the description content storage unit, and a recognition unit that extracts and reads a character or image in the box according to the description . An optical character reading device comprising:
JP4202809A 1992-07-30 1992-07-30 Optical character reader Expired - Lifetime JP3006294B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4202809A JP3006294B2 (en) 1992-07-30 1992-07-30 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4202809A JP3006294B2 (en) 1992-07-30 1992-07-30 Optical character reader

Publications (2)

Publication Number Publication Date
JPH0652351A JPH0652351A (en) 1994-02-25
JP3006294B2 true JP3006294B2 (en) 2000-02-07

Family

ID=16463565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4202809A Expired - Lifetime JP3006294B2 (en) 1992-07-30 1992-07-30 Optical character reader

Country Status (1)

Country Link
JP (1) JP3006294B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1221842C (en) 2002-01-23 2005-10-05 索尼公司 Image display and image projector

Also Published As

Publication number Publication date
JPH0652351A (en) 1994-02-25

Similar Documents

Publication Publication Date Title
US20020141660A1 (en) Document scanner, system and method
JPS6159568A (en) document processing device
JP3001065B2 (en) How to create a program
JP2003018393A (en) Image processing system
JP2008108114A (en) Document processing apparatus and document processing method
EP1202213B1 (en) Document format identification apparatus and method
US5854860A (en) Image filing apparatus having a character recognition function
JP3006294B2 (en) Optical character reader
JP3732254B2 (en) Format information generation method and format information generation apparatus
JP7037237B1 (en) Data processing equipment, data processing methods and programs
JP7445364B2 (en) Image processing program, image processing method, and image processing device
JP2877380B2 (en) Optical character reader
JPH06111057A (en) Optical character reader
JP2000339405A (en) Optical character recognition system, method for creating form control in form in the system, and storage medium storing the method
JP2004164376A (en) Form with attached identification code, form reading program, and form creation program
JP2000331117A (en) Document reading system
JPH07152856A (en) Optical character reader
JPH06333085A (en) Optical character reader
JP3001618B2 (en) How to copy characters on paper and how to recognize symbols
JPH03103996A (en) Optical character reader
JPS63137383A (en) Character reader
JPS6074094A (en) character recognition device
JPH04123262A (en) List type data processor
JPH1125206A (en) Method for recognizing mark
JPH01191986A (en) reading device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19991026