JP2008186399A - 文字認識装置 - Google Patents
文字認識装置 Download PDFInfo
- Publication number
- JP2008186399A JP2008186399A JP2007021656A JP2007021656A JP2008186399A JP 2008186399 A JP2008186399 A JP 2008186399A JP 2007021656 A JP2007021656 A JP 2007021656A JP 2007021656 A JP2007021656 A JP 2007021656A JP 2008186399 A JP2008186399 A JP 2008186399A
- Authority
- JP
- Japan
- Prior art keywords
- barcode
- type
- size
- distance
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000000605 extraction Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
【解決手段】帳票のバーコードの大きさおよび帳票におけるバーコードの位置が共通する帳票の種類を同一の帳票群になるように分類し、その帳票群毎にバーコードの大きさ並びに帳票におけるバーコードの位置を示す情報および帳票の種類を示す帳票種別からなる帳票分類情報(レイアウトグループテーブル60)を予め記憶部3に記憶しておき、帳票読取部2が読み取った帳票の画像情報から算出したバーコードの大きさおよび帳票における位置に基づいて帳票分類情報を検索して帳票種別を抽出し、その帳票種別の中から帳票の種類を特定して文字が存在する領域を検出するようにした。
【選択図】 図1
Description
図1は実施例における文字認識装置の構成を示すブロック図である。
図1において、1は文字認識装置であり、公共料金や各種税金の払込用紙等のバーコードが印刷された帳票の画像を読取り、その帳票に印刷された文字を認識するOCR(Optical Character Reader)装置等である。
3は記憶部であり、メモリ素子や磁気ディスク等で構成され、情報を記憶し、また記憶した情報を読み出すことができるものである。
31は帳票イメージメモリであり、帳票読取部2で読み取った帳票の画像情報を記憶するためのものである。
図6(a)は帳票例の説明図であり、51は帳票A、52は帳票B、53は帳票Cを表し、いずれの帳票もバーコード501が印刷等されているものとする。なお、バーコードとは、2次元コードを含む概念である。
図6(b)はレイアウトグループテーブルの構成を示す説明図であり、レイアウトグループテーブル60はレイアウトグループ61、バーコード501の幅XW62、バーコード501の高さYW63、帳票50の左端からバーコード501の左端までの距離XL64、帳票50の右端からバーコード501の右端までの距離XR65、帳票50の上端からバーコード501の上端までの距離YT66、帳票50の下端からバーコード501の下端までの距離YB67、および帳票種別68で構成されている。
また、枠構造参照テーブルは、予め各帳票の枠構造の特徴を示す枠構造特徴情報(例えば、表を構成する罫線の始点や終点、交点の座標情報)を登録したものであり、帳票読取部2で読取った帳票の画像情報から画像から水平および垂直方向の罫線やその罫線の交点等を抽出し、さらに抽出した罫線やその罫線の交点等から枠構造の特徴情報を抽出し、その枠構造の特徴情報と枠構造参照テーブルの枠構造特徴情報とを照合して帳票の種類を識別することができるものである。
このように記憶部3は、帳票イメージメモリ31、帳票辞書32、および認識領域データメモリ33等で構成されている。
なお、記憶部3は帳票イメージメモリ31、帳票辞書32、および認識領域データメモリ33の他、文字認識装置1を制御するために必要な制御プログラム(ソフトウェア)や各種情報を記憶するものとする。
また、制御部4は帳票イメージメモリ31に記憶された帳票の画像情報からバーコードを検出し、さらにそのバーコードの大きさや帳票における位置を検出するバーコード検出手段41、検出したバーコードの大きさや位置の情報に基づいて帳票辞書32のレイアウトグループテーブル60を検索して帳票種別を抽出する帳票識別手段42、帳票の画像情報から枠構造の特徴を抽出し、その枠構造の特徴と帳票識別手段42が抽出した帳票種別毎の枠構造の特徴(枠構造参照テーブルに記憶された枠構造の特徴)とを照合し、帳票の種類を特定して文字が存在する領域を検出する認識領域抽出手段43、抽出した文字が存在する領域の文字を認識する文字認識手段44等で構成されている。
上述した構成の作用について説明する。
なお、以下に説明する各部の動作は、図示しないメモリや磁気ディスク等の記憶手段に格納されたプログラム(ソフトウェア)に基づいて図示しない中央処理装置等の制御手段により制御される。
S2:読み取った帳票の画像情報を帳票イメージメモリ31に記憶させるとバーコード検出手段41は帳票に印刷されたバーコードを検出する処理を行う。
ここで、バーコードを検出する処理を説明する。
なお、バーコード501以外の文字が印刷された部分も解析の対象となるがその部分は公知の解析処理によりバーコードでないと判定されるものとする。
検出したバーコード候補の領域を、帳票イメージメモリ31において高解像度の画像(2次画像)に変換し、バーコード検出手段41がバーコード候補の領域内からバーコードを検出する方法としてもよい。
バーコード501として検出するとバーコード検出手段41は、帳票の画像情報の画素数から図4に示すようにバーコード501の幅XWおよび高さYWを算出する。すなわち、バーコード501の大きさを算出する。
なお、算出したバーコード501の大きさおよび位置を示す各数値は、レイアウトグループテーブル60に記憶されている各数値と完全に一致する必要はなく、所定の範囲内にあればよいものとする。
例えば、読取ったバーコード501の幅XW62がxw_1、高さYW63がyw_1、帳票50の左端からバーコード501の左端までの距離XL64がxl_1、帳票50の右端からバーコード501の右端までの距離XR65がxr_1、帳票50の上端からバーコード501の上端までの距離YT66がyt_1、帳票50の下端からバーコード501の下端までの距離YB67がyb_1であった場合、帳票種別68は「帳票A」および「帳票C」が抽出される。
本実施例では、抽出した枠構造の特徴と枠構造参照テーブルの「帳票A」または「帳票C」の枠構造の特徴とを照合し、「帳票A」または「帳票C」のいずれかであることを識別する。
帳票の種類を識別すると認識領域抽出手段43は、予め記憶部3に記憶された文字の読取り領域を抽出し、その領域の画像情報を帳票イメージメモリ31から読み出して認識領域データメモリ33に記憶させる。
このようにして文字認識装置1は、バーコード501の大きさと位置が共通する帳票を同一のグループとなるように分類したレイアウトグループテーブル60を記憶部3に予め記憶しておき、帳票読取部2で読取った帳票の画像情報からバーコード検出手段41が帳票50のバーコード501の大きさ、位置を算出し、帳票識別手段42がそのバーコード501の大きさ、位置に基づいてレイアウトグループテーブル60を検索してグループ化された帳票種別68を抽出し、その帳票種別から帳票の枠構造の特徴に基づいて帳票の種類を識別してその帳票の文字を認識する処理を行う。
2 帳票読取部
3 記憶部
31 帳票イメージメモリ
32 帳票辞書
33 認識領域データメモリ
4 制御部
41 バーコード検出手段
42 帳票識別手段
43 認識領域抽出手段
44 文字認識手段
50、51、52、53 帳票
501 バーコード
Claims (2)
- 帳票読取部で読取った帳票の画像情報から抽出した特徴に基づいて帳票の種類を特定し、その帳票の種類に応じて決定される領域の文字を認識する文字認識装置において、
帳票のバーコードの大きさおよび帳票におけるバーコードの位置が共通する帳票の種類を同一の帳票群になるように分類し、その帳票群毎にバーコードの大きさ並びに帳票におけるバーコードの位置を示す情報および帳票の種類を示す帳票種別からなる帳票分類情報を予め記憶する記憶部と、
読み取った帳票の画像情報からバーコードの大きさおよび帳票における位置を算出するバーコード検出手段と、
前記バーコード検出手段が算出したバーコードの大きさおよび帳票における位置に基づいて前記記憶部に記憶された帳票分類情報を検索して帳票種別を抽出する帳票識別手段と、
読み取った帳票の画像情報から抽出した特徴を前記帳票識別手段が抽出した帳票種別毎の特徴と照合し、帳票の種類を特定して文字が存在する領域を検出する認識領域抽出手段とを設け、
帳票のバーコードの大きさおよび帳票における位置に基づいて抽出した帳票種別の中から帳票の種類を特定して文字が存在する領域を検出するようにしたことを特徴とする文字認識装置。 - 請求項1の文字認識装置において、
前記バーコードの大きさは、バーコードの幅および高さ、
前記バーコードの帳票における位置は、帳票の左端からバーコードの左端までの距離、帳票の右端からバーコードの右端までの距離、帳票の下端からバーコードの下端までの距離、および帳票の上端からバーコードの上端までの距離としたことを特徴とする文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007021656A JP4853313B2 (ja) | 2007-01-31 | 2007-01-31 | 文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007021656A JP4853313B2 (ja) | 2007-01-31 | 2007-01-31 | 文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2008186399A true JP2008186399A (ja) | 2008-08-14 |
| JP4853313B2 JP4853313B2 (ja) | 2012-01-11 |
Family
ID=39729369
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007021656A Active JP4853313B2 (ja) | 2007-01-31 | 2007-01-31 | 文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4853313B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012240693A (ja) * | 2011-05-18 | 2012-12-10 | Techno Medica Co Ltd | 試験管自動準備装置用ラベル貼付装置 |
| JP2014507037A (ja) * | 2011-02-28 | 2014-03-20 | データロジック・アイピー・テック・エス・エール・エル | 動作中物体の光学的識別方法 |
| US9654661B1 (en) | 2015-12-22 | 2017-05-16 | Fuji Xerox Co., Ltd. | Image scanning device and method, image reading apparatus, and non-transitory computer readable medium that set a scanning area based on a detected location of a code image |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09160997A (ja) * | 1995-12-08 | 1997-06-20 | Toshiba Corp | バーコード検出方法およびバーコード検出装置 |
| JP2002024743A (ja) * | 2000-07-06 | 2002-01-25 | Oki Electric Ind Co Ltd | 画像読取システムおよび画像読取方法 |
| JP2003168073A (ja) * | 2001-11-29 | 2003-06-13 | Toshiba Corp | 帳票識別装置、帳票定義方法および帳票識別方法 |
-
2007
- 2007-01-31 JP JP2007021656A patent/JP4853313B2/ja active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09160997A (ja) * | 1995-12-08 | 1997-06-20 | Toshiba Corp | バーコード検出方法およびバーコード検出装置 |
| JP2002024743A (ja) * | 2000-07-06 | 2002-01-25 | Oki Electric Ind Co Ltd | 画像読取システムおよび画像読取方法 |
| JP2003168073A (ja) * | 2001-11-29 | 2003-06-13 | Toshiba Corp | 帳票識別装置、帳票定義方法および帳票識別方法 |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014507037A (ja) * | 2011-02-28 | 2014-03-20 | データロジック・アイピー・テック・エス・エール・エル | 動作中物体の光学的識別方法 |
| JP2012240693A (ja) * | 2011-05-18 | 2012-12-10 | Techno Medica Co Ltd | 試験管自動準備装置用ラベル貼付装置 |
| US9654661B1 (en) | 2015-12-22 | 2017-05-16 | Fuji Xerox Co., Ltd. | Image scanning device and method, image reading apparatus, and non-transitory computer readable medium that set a scanning area based on a detected location of a code image |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4853313B2 (ja) | 2012-01-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10824801B2 (en) | Interactively predicting fields in a form | |
| US11494573B2 (en) | Self-checkout device to which hybrid product recognition technology is applied | |
| US7120318B2 (en) | Automatic document reading system for technical drawings | |
| US6687401B2 (en) | Pattern recognizing apparatus and method | |
| JP6527410B2 (ja) | 文字認識装置、文字認識方法、及びプログラム | |
| US20070168382A1 (en) | Document analysis system for integration of paper records into a searchable electronic database | |
| JP6458239B1 (ja) | 画像認識システム | |
| JP6831951B2 (ja) | 画像認識システム | |
| KR102211516B1 (ko) | 가상 셀을 이용한 ocr 기반 문서 분석 시스템 및 방법 | |
| US20210073535A1 (en) | Information processing apparatus and information processing method for extracting information from document image | |
| JP6941331B2 (ja) | 画像認識システム | |
| JP2009266190A (ja) | シンボル情報読取装置及びシンボル情報読取方法 | |
| JP2000285190A (ja) | 帳票識別方法および帳票識別装置および記憶媒体 | |
| JPH06501801A (ja) | 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置 | |
| CN114926829A (zh) | 一种证件检测方法、装置、电子设备及存储介质 | |
| JP4853313B2 (ja) | 文字認識装置 | |
| CN114973275A (zh) | 一种基于深度学习技术的图文乱码识别方法 | |
| JP3435374B2 (ja) | 文字読取装置および文字認識方法 | |
| JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
| JP4046941B2 (ja) | 文書書式識別装置および識別方法 | |
| JP4221960B2 (ja) | 帳票識別装置及びその識別方法 | |
| US20250029416A1 (en) | Information processing apparatus and image reading apparatus judging title of read document | |
| JPH0528310A (ja) | フオーム型文書識別装置 | |
| JPH11184965A (ja) | 帳票識別登録装置 | |
| JP2010061449A (ja) | 原画像探索装置及び原画像探索プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091214 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110513 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110517 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110715 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110927 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111010 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141104 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4853313 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |