[go: up one dir, main page]

JP2008176624A - Character recognition result management apparatus and method, and computer program - Google Patents

Character recognition result management apparatus and method, and computer program Download PDF

Info

Publication number
JP2008176624A
JP2008176624A JP2007010291A JP2007010291A JP2008176624A JP 2008176624 A JP2008176624 A JP 2008176624A JP 2007010291 A JP2007010291 A JP 2007010291A JP 2007010291 A JP2007010291 A JP 2007010291A JP 2008176624 A JP2008176624 A JP 2008176624A
Authority
JP
Japan
Prior art keywords
recognition
file name
recognition result
character
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007010291A
Other languages
Japanese (ja)
Inventor
Naoki Kojima
直樹 小島
Sachihiro Oshita
祥弘 大下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2007010291A priority Critical patent/JP2008176624A/en
Publication of JP2008176624A publication Critical patent/JP2008176624A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】操作者の意図する通りに、しかも自由度高くファイル名を作成することができるようにすることにある。
【解決手段】文書の画像データに複数の認識領域を指定して、該認識領域ごとに文字認識を行なうことにより複数の認識結果を得る。その得られた複数の認識結果に基づいて認識結果ファイルを作成する。なお、文字認識により得られた複数の認識結果の中から2以上の認識結果を、操作者からの指示に従って指定し(書式入力用フィールドBF32への書式文字列の入力による)、前記認識結果ファイルの作成を、前記指定された2以上の認識結果に基づいて前記付与用のファイル名を作成することにより行う。
【選択図】図6
An object of the present invention is to make it possible to create a file name with a high degree of freedom as intended by an operator.
A plurality of recognition results are obtained by designating a plurality of recognition areas in image data of a document and performing character recognition for each of the recognition areas. A recognition result file is created based on the obtained plurality of recognition results. It should be noted that two or more recognition results are specified from among a plurality of recognition results obtained by character recognition (by inputting a format character string into the format input field BF32), and the recognition result file Is created by creating the file name for assignment based on the two or more designated recognition results.
[Selection] Figure 6

Description

本発明は、文書の画像を文字認識して得られた認識結果ファイルを管理する技術に関し、特にファイル名を自動的に付与する技術に関するものである。   The present invention relates to a technique for managing a recognition result file obtained by character recognition of a document image, and particularly to a technique for automatically assigning a file name.

従来、スキャナにより文書の画像を読み取って、その画像を光学的に文字認識することにより画像の文字情報を得る技術があった。得られた文字情報は文字認識結果ファイルとしてハードディスクドライブ等のメモリに保存される。この保存の際、文字認識によって得られたプリセット領域の文字列を文字認識結果ファイルのファイル名として設定する技術があった。   Conventionally, there has been a technique for obtaining character information of an image by reading an image of a document with a scanner and optically recognizing the image. The obtained character information is stored in a memory such as a hard disk drive as a character recognition result file. There is a technique for setting a character string in a preset area obtained by character recognition as the file name of a character recognition result file at the time of saving.

特開2005−56315号公報JP 2005-56315 A

しかしながら、前記従来の技術では、プリセット領域から得られた1つの文字列だけからファイル名を作成するものであることから、操作者の思うとおりにファイル名を定めることができなく、また一つの文字列から定まるものであることからファイル名作成の自由度が低いという問題があった。   However, since the conventional technique creates a file name from only one character string obtained from the preset area, the file name cannot be determined as desired by the operator, and a single character is used. There is a problem that the degree of freedom of file name creation is low because it is determined from the column.

本発明の解決しようとする課題は、操作者の意図する通りに、しかも自由度高くファイル名を作成することができるようにすることにある。   The problem to be solved by the present invention is to make it possible to create a file name with a high degree of freedom as intended by the operator.

前述した課題の少なくとも一部を解決するための手段として、以下に示す構成をとった。   As means for solving at least a part of the problems described above, the following configuration is adopted.

本発明の文字認識結果の管理装置は、
1ページの文書の画像データに複数の認識領域を指定して、該認識領域ごとに文字認識を行なうことにより複数の認識結果を得る文字認識手段と、
前記文字認識手段により得られた複数の認識結果に基づいて、ファイル名の付与された認識結果ファイルを作成するファイル作成手段と
を備える文字認識結果の管理装置において、
前記文字認識手段により得られた複数の認識結果の中から2以上の認識結果を、操作者からの指示に従って指定する認識結果指定手段を備え、
前記ファイル作成手段は、
前記指定手段により指定された2以上の認識結果に基づいて前記付与用のファイル名を作成するファイル名作成手段を備えることを特徴としている。
The character recognition result management apparatus according to the present invention includes:
A character recognition means for obtaining a plurality of recognition results by designating a plurality of recognition areas in the image data of one page of document and performing character recognition for each recognition area;
In a character recognition result management device comprising: a file creation means for creating a recognition result file with a file name based on a plurality of recognition results obtained by the character recognition means;
A recognition result specifying means for specifying two or more recognition results among a plurality of recognition results obtained by the character recognition means in accordance with an instruction from an operator;
The file creation means includes:
The present invention is characterized by comprising file name creation means for creating the file name for assignment based on two or more recognition results designated by the designation means.

前記構成の文字認識結果の管理装置によれば、1ページの文書の画像データに指定した複数の認識領域の中から2以上の認識結果を、操作者からの指示に従って指定して、その指定された2以上の認識結果に基づいて付与用のファイル名を作成している。認識結果は操作者からの指示に従って指定されたものであることから、操作者の意図の通りのファイル名とすることができる。また、2以上の認識結果に基づいてファイル名を定めるものであることから、ファイル名作成の自由度が高い。したがって、本願発明の文字認識結果の管理装置によれば、操作者の意図する通りに、しかも自由度高くファイル名を作成することができる。   According to the character recognition result management apparatus having the above-described configuration, two or more recognition results are designated from a plurality of recognition areas designated in the image data of a one-page document in accordance with an instruction from the operator. A file name for assignment is created based on two or more recognition results. Since the recognition result is designated in accordance with an instruction from the operator, the file name can be set as intended by the operator. Further, since the file name is determined based on two or more recognition results, the degree of freedom in creating the file name is high. Therefore, according to the character recognition result management apparatus of the present invention, a file name can be created with a high degree of freedom as intended by the operator.

前記認識結果指定手段は、前記2以上の認識結果と共に該2以上の認識結果の並び順を、前記操作者からの指示に従って指定する構成であり、前記ファイル名作成手段は、前記認識結果指定手段により指定された2以上の認識結果を前記並び順に基づいて組み合わせることにより前記ファイル名の作成を行う構成としてもよい。この構成によれば、指定された2以上の認識結果の並び順を操作者からの指示に従って変えることができることから、ファイル名作成の自由度がより高い。   The recognition result designating unit is configured to designate the order of the two or more recognition results together with the two or more recognition results in accordance with an instruction from the operator, and the file name creating unit is configured to specify the recognition result designating unit. The file name may be created by combining two or more recognition results specified by the above based on the arrangement order. According to this configuration, the arrangement order of the two or more designated recognition results can be changed in accordance with an instruction from the operator, so that the degree of freedom in creating a file name is higher.

前記認識結果指定手段は、前記2以上の認識結果のそれぞれに割り当てられた特殊文字列を備える書式文字列を、前記操作者からの指示に従って入力する書式文字列入力手段を備え、前記ファイル名作成手段は、前記変数に対応する認識結果を前記書式文字列から定まる規則に従って組み合わせて前記ファイル名の作成を行う構成としてもよい。この構成によれば、文字列の入力という簡易な操作によりファイル名を定めることができることから、操作性に優れている。   The recognition result designating unit includes a format character string input unit that inputs a format character string including a special character string assigned to each of the two or more recognition results according to an instruction from the operator. The means may be configured to create the file name by combining recognition results corresponding to the variables according to a rule determined from the format character string. According to this configuration, since the file name can be determined by a simple operation of inputting a character string, the operability is excellent.

前記書式文字列は、特殊記号、文字等の符号を備える構成であり、前記ファイル名作成手段は、前記符号を含むファイル名を作成する構成としてもよい。この構成によれば、ファイル名を特殊記号、文字等の符号が付いたものとすることができることから、ファイル名作成の自由度がより高い。   The format character string may have a configuration including a special symbol, a character, or the like, and the file name creation unit may create a file name including the code. According to this configuration, the file name can be provided with a special symbol, character, or the like, so that the degree of freedom in creating the file name is higher.

本発明の文字認識結果の管理方法は、
1ページの文書の画像データに複数の認識領域を指定して、該認識領域ごとに文字認識を行なうことにより複数の認識結果を得て、
前記得られた複数の認識結果に基づいて、ファイル名の付与された認識結果ファイルを作成する文字認識結果の管理方法において、
前記文字認識により得られた複数の認識結果の中から2以上の認識結果を、操作者からの指示に従って指定するとともに、
前記認識結果ファイルの作成を、前記指定された2以上の認識結果に基づいて前記付与用のファイル名を作成することにより行うことを特徴としている。
The management method of the character recognition result of the present invention is:
A plurality of recognition results are obtained by designating a plurality of recognition areas in the image data of one page of document and performing character recognition for each recognition area,
In the character recognition result management method for creating a recognition result file with a file name based on the plurality of obtained recognition results,
Specifying two or more recognition results among a plurality of recognition results obtained by the character recognition according to an instruction from the operator,
The recognition result file is created by creating the file name for assignment based on the two or more designated recognition results.

本発明のコンピュータプログラムは、
コンピュータプログラムであって、
(a)1ページの文書の画像データに複数の認識領域を指定して、該認識領域ごとに文字認識を行なうことにより複数の認識結果を得る機能と、
(b)前記得られた複数の認識結果に基づいて、ファイル名の付与された認識結果ファイルを作成する機能と
をコンピュータに実現させるとともに、
さらに、
(c)前記機能(a)により得られた複数の認識結果の中から2以上の認識結果を、操作者からの指示に従って指定する機能をコンピュータに実現させるとともに、
前記機能(b)は、
前記機能(c)により指定された2以上の認識結果に基づいて前記付与用のファイル名を作成する機能
を備えることを特徴としている。
The computer program of the present invention is:
A computer program,
(A) a function of obtaining a plurality of recognition results by designating a plurality of recognition areas in the image data of a one-page document and performing character recognition for each recognition area;
(B) Based on the plurality of obtained recognition results, the computer has a function of creating a recognition result file with a file name, and
further,
(C) causing a computer to realize a function of designating two or more recognition results from a plurality of recognition results obtained by the function (a) according to an instruction from an operator;
The function (b) is
And a function of creating the file name for assignment based on two or more recognition results specified by the function (c).

前記文字認識結果の管理方法およびコンピュータプログラムは、本発明の文字認識結果の管理装置と同様に、操作者の意図する通りに、しかも自由度高くファイル名を作成することができるという効果を奏する。   The character recognition result management method and computer program have the effect that a file name can be created with a high degree of freedom as intended by the operator, similarly to the character recognition result management apparatus of the present invention.

なお、本発明は、種々の態様で実現することが可能であり、例えば、本発明のコンピュータプログラムを記録した記録媒体、そのコンピュータプログラムを含み搬送波内に具現化されたデータ信号、等の形態で実現することができる。また、コンピュータプログラムを通信経路を介して供給するプログラム供給装置としての態様で実現することもできる。   Note that the present invention can be realized in various forms, for example, in the form of a recording medium that records the computer program of the present invention, a data signal that includes the computer program and is embodied in a carrier wave, and the like. Can be realized. In addition, the present invention can be realized as a program supply device that supplies a computer program via a communication path.

以下、本発明の実施の形態を実施例に基づいて以下の順序で説明する。
1.第1実施例:
A.ハードウェアの構成:
B.ソフトウェアの構成:
C.作用・効果:
2.第2実施例:
3.他の実施形態:
Hereinafter, embodiments of the present invention will be described in the following order based on examples.
1. First embodiment:
A. Hardware configuration:
B. Software configuration:
C. Action / Effect:
2. Second embodiment:
3. Other embodiments:

A.ハードウェアの構成:
図1は、本発明の第1実施例を適用するコンピュータシステムのハードウェアの概略構成を示すブロック図である。このコンピュータシステムは、いわゆるパーソナルコンピュータ(以下、単にコンピュータと呼ぶ)10を中心に備え、その周辺にディスプレイ12およびイメージスキャナ14を備える。コンピュータ10は、コンピュータ本体16と、入力装置としてのキーボード18およびマウス20を備える。なお、このコンピュータ本体16には、CD−ROMの内容を読み取るCDドライブ22が搭載されている。
A. Hardware configuration:
FIG. 1 is a block diagram showing a schematic configuration of hardware of a computer system to which the first embodiment of the present invention is applied. This computer system includes a so-called personal computer (hereinafter simply referred to as a computer) 10 and a display 12 and an image scanner 14 around it. The computer 10 includes a computer main body 16, a keyboard 18 and a mouse 20 as input devices. The computer main body 16 is equipped with a CD drive 22 for reading the contents of the CD-ROM.

コンピュータ本体16は、中央演算処理装置としてのCPUを中心にバスにより相互に接続されたROM、RAM、表示画像メモリ、マウスインタフェース、キーボードインタフェース等を備える。また、コンピュータ本体16は、内蔵のハードディスクドライブ(以下、HDDと呼ぶ)40を備える。このHDD40には、イメージスキャナ14によって光学的に読み取られた文書の画像データが一旦格納される。   The computer main body 16 includes a ROM, a RAM, a display image memory, a mouse interface, a keyboard interface, and the like connected to each other by a bus around a CPU as a central processing unit. The computer main body 16 includes a built-in hard disk drive (hereinafter referred to as HDD) 40. The HDD 40 temporarily stores image data of a document optically read by the image scanner 14.

コンピュータ本体16は、イメージスキャナ14によって光学的に読み取られた文書の1ページ分の画像データをHDD40から取り込み、その画像データを文字認識する。この文字認識の処理は、コンピュータ本体16にインストールされてHDD40に格納されたソフトウェア(コンピュータプログラム)をCPUが実行することにより実現される。このソフトウェアは、OCR(光学式文字読み取り装置)ソフトウェアであり、CD−ROMによって提供されたものである。   The computer main body 16 takes in image data for one page of the document optically read by the image scanner 14 from the HDD 40, and recognizes the image data as characters. This character recognition process is realized by the CPU executing software (computer program) installed in the computer main body 16 and stored in the HDD 40. This software is OCR (optical character reader) software and is provided by a CD-ROM.

なお、OCRソフトウェアは、CD−ROMに替えて、フレキシブルディスク、光磁気ディスク、ICカード等の他の携帯型記録媒体(可搬型記録媒体)に格納された構成として、これらから提供されたものとすることができる。また、OCRソフトウェアは、外部のネットワークに接続される特定のサーバから、ネットワークを介して提供されたものとすることもできる。上記ネットワークとしては、インターネットであってもよく、特定のホームページからダウンロードして得たコンピュータプログラムであってもよい。あるいは、電子メールの添付ファイルの形態で供給されたコンピュータプログラムであってもよい。   The OCR software is provided as a configuration stored in another portable recording medium (portable recording medium) such as a flexible disk, a magneto-optical disk, and an IC card in place of the CD-ROM. can do. Further, the OCR software may be provided via a network from a specific server connected to an external network. The network may be the Internet or a computer program obtained by downloading from a specific homepage. Alternatively, it may be a computer program supplied in the form of an email attachment.

B.ソフトウェアの構成:
図1では、コンピュータ本体16は、内部で実現される機能のブロックによって示されている。コンピュータ本体16が備えるOCRソフトウェア30は、機能的に、スキャン画像取込部32と文字認識部34とファイル作成部36とを備える。コンピュータ本体16の内部で動作しているOCRソフトウェア30によれば、まず、スキャン画像取込部32によりスキャナドライバ50を動作させてイメージスキャナ14から原稿Pの画像(スキャン画像)を取り込む処理を行なう。次いで、その取り込まれたスキャン画像の画像データから、文字認識部34により文字を認識する処理を行なう。その後、文字認識の処理により得られた複数の文字認識結果に基づいて、ファイル作成部36により認識結果ファイルCFを作成してHDD40に保存する。
B. Software configuration:
In FIG. 1, the computer main body 16 is shown by blocks of functions implemented internally. The OCR software 30 included in the computer main body 16 functionally includes a scanned image capturing unit 32, a character recognition unit 34, and a file creation unit 36. According to the OCR software 30 operating inside the computer main body 16, first, the scanner driver 50 is operated by the scan image capturing unit 32 to perform processing for capturing an image (scanned image) of the document P from the image scanner 14. . Next, the character recognition unit 34 performs a process of recognizing characters from the captured image data of the scanned image. Thereafter, based on a plurality of character recognition results obtained by the character recognition process, the file creation unit 36 creates a recognition result file CF and stores it in the HDD 40.

コンピュータ本体16のCPUでOCRソフトウェア30を実行することで、スキャン画像取込部32、文字認識部34およびファイル作成部36を実現している。ファイル作成部36は、ファイル名作成部36aを備え、このファイル名作成部36aによりファイルのファイル名が作成される。ファイル名作成部36aは、入力装置としてのキーボード18やマウス20からの入力指令を受けて動作する認識結果指定部38により指定された2以上の認識結果に基づいて、付与用のファイル名を作成している。スキャン画像取込部32は、前述した動作を行なう周知のもので、詳しい説明は省略する。文字認識部34、ファイル作成部36および認識結果指定部38については後ほど詳述する。OCRソフトウェア30に従う文字認識部34、ファイル作成部36および認識結果指定部38により本発明の文字認識結果の管理装置が構成される。   By executing the OCR software 30 with the CPU of the computer main body 16, the scanned image capturing unit 32, the character recognition unit 34, and the file creation unit 36 are realized. The file creation unit 36 includes a file name creation unit 36a, and the file name creation unit 36a creates a file name of the file. The file name creation unit 36a creates a file name for assignment based on two or more recognition results designated by the recognition result designation unit 38 that operates in response to an input command from the keyboard 18 or the mouse 20 as an input device. is doing. The scan image capturing unit 32 is a well-known unit that performs the above-described operation, and a detailed description thereof will be omitted. The character recognition unit 34, the file creation unit 36, and the recognition result designation unit 38 will be described in detail later. The character recognition result management apparatus of the present invention is constituted by the character recognition unit 34, the file creation unit 36, and the recognition result designation unit 38 according to the OCR software 30.

図2は、スキャン画像取込部32により取り込まれたスキャン画像の画像データSDの一例をウィンドウWDとともに示す説明図である。このウィンドウWDは、OCRソフトウェア30によってディスプレイ12に表示されるものでメニューバーBR1とツールバーBR2と作業フィールドWFとを備える。ツールバーBR2には、作業手順に従った順にコマンドを実行するための「スキャン」、「領域抽出」、「認識」、「保存」のボタンBT1,BT2,BT3,BT4が設けられている。図示の例は、「スキャン」のボタンBT1がマウス20によってクリックされて、文書の原稿Pがスキャン画像取込部32によりスキャン処理された後の状態である。   FIG. 2 is an explanatory diagram showing an example of the image data SD of the scanned image captured by the scanned image capturing unit 32 together with the window WD. The window WD is displayed on the display 12 by the OCR software 30, and includes a menu bar BR1, a tool bar BR2, and a work field WF. The toolbar BR2 is provided with “scan”, “region extraction”, “recognition”, and “save” buttons BT1, BT2, BT3 and BT4 for executing commands in the order according to the work procedure. The illustrated example is a state after the “scan” button BT1 is clicked by the mouse 20 and the document P of the document is scanned by the scan image capturing unit 32.

図示するように、作業フィールドWFにはスキャン画像の画像データSDが表示されている。このスキャン画像の元となった文書である原稿Pには、伝票番号、宛名、タイトル、本文が記載されている。この原稿Pの画像が画像データSDとして得られる。本実施例では、こうしたフォーマットの原稿Pが複数、順にイメージスキャナ14により読み取られ、複数の画像データSDが得られ、1ページ目の画像データSDが作業フィールドWFに表示されることになる。なお、必ずしも原稿Pは複数枚である必要はなく、1枚であってもかまわない。その後、「領域抽出」のボタンBT2がマウス20によってクリックされて、上記得られた画像データSDのそれぞれに対して複数の認識領域を指定する処理を行う。なお、この複数の領域のレイアウトは画像データSDのそれぞれに対して共通のものである。   As shown in the drawing, image data SD of a scanned image is displayed in the work field WF. The document P, which is the original document of the scanned image, has a slip number, address, title, and text. An image of the original P is obtained as image data SD. In this embodiment, a plurality of documents P in such a format are read in order by the image scanner 14 to obtain a plurality of image data SD, and the first page of image data SD is displayed in the work field WF. Note that the document P does not necessarily have to be plural, and may be one. Thereafter, the “area extraction” button BT2 is clicked by the mouse 20 to perform a process of designating a plurality of recognition areas for each of the obtained image data SD. The layout of the plurality of areas is common to each of the image data SD.

図3は、認識領域L1〜L4の一例を示す説明図である。コンピュータ本体16のCPUは、スキャン画像の画像データSDが表示された作業フィールドWFに対する操作者によるマウス20の操作を受けて、表示画面に操作者によって描かれた矩形の枠体を認識領域として指定する。図示の例では、原稿Pに記載された伝票番号、宛名、タイトル、本文のそれぞれに対応した認識領域L1〜L4が指定されている。なお、認識領域L1〜L4は、「伝票番号」、「御中」という予め用意された規定文字列や、文字の集合からCPUの処理により自動的に指定される構成としてもよい。なお、各認識領域L1〜L4には、連番が付与されており、後述する処理により個別に認識領域L1〜L4を指定可能(本実施例では、後述する書式文字列により指定される)なようにその番号N1〜N4が各認識領域L1〜L4に付帯するように表示されている。   FIG. 3 is an explanatory diagram illustrating an example of the recognition areas L1 to L4. The CPU of the computer main body 16 specifies a rectangular frame drawn by the operator on the display screen as a recognition area in response to the operation of the mouse 20 by the operator on the work field WF on which the image data SD of the scanned image is displayed. To do. In the example shown in the figure, recognition areas L1 to L4 corresponding to the slip number, address, title, and text described on the document P are designated. Note that the recognition areas L1 to L4 may be configured to be automatically designated by a CPU process from a predetermined character string such as “slip number” or “middle” or a set of characters. Note that serial numbers are assigned to the recognition areas L1 to L4, and the recognition areas L1 to L4 can be individually specified by a process described later (in the present embodiment, specified by a format character string described later). In this way, the numbers N1 to N4 are displayed so as to be attached to the respective recognition areas L1 to L4.

図3の状態から、次いで操作者は「認識」のボタンBT3をクリックする。「認識」のボタンBT3がクリックされると、上記指定された認識領域L1〜L4のそれぞれで文字認識を行う。この結果、スキャン画像の画像データSDのそれぞれに対し、認識領域L1〜L4毎の認識結果(テキストデータ)が得られる。「領域抽出」のボタンBT2がクリックされて複数の認識領域を指定する処理および「認識」のボタンBT3がクリックされて認識領域毎の認識結果が得られる処理が、文字認識部34(図1)に対応する。   From the state shown in FIG. 3, the operator then clicks the “recognition” button BT3. When the “recognition” button BT3 is clicked, character recognition is performed in each of the designated recognition areas L1 to L4. As a result, a recognition result (text data) for each of the recognition regions L1 to L4 is obtained for each piece of image data SD of the scanned image. The process of designating a plurality of recognition areas by clicking the “area extraction” button BT2 and the process of obtaining a recognition result for each recognition area by clicking the “recognition” button BT3 are shown in FIG. Corresponding to

その後、操作者により「保存」のボタンBT4がクリックされると、スキャン画像の画像データSDのそれぞれに対応した認識結果ファイルが、認識領域L1〜L4毎の認識結果を集めて作成されてHDD40に保存される。この処理が、ファイル作成部36(図1)に対応する。   Thereafter, when the “Save” button BT4 is clicked by the operator, a recognition result file corresponding to each of the image data SD of the scanned image is created by collecting the recognition results for each of the recognition regions L1 to L4 and stored in the HDD 40. Saved. This process corresponds to the file creation unit 36 (FIG. 1).

図4は、HDD40に保存される認識結果ファイルCFのデータ構造を示す説明図である。図示するように、認識結果ファイルCFは、ファイル名フィールドFd1、内容フィールドFd2等を備える。ファイル名フィールドFd1には、このOCRソフトウェア30により自動的に付与されるファイル名が格納される。なお、このファイル名がどのように作成されるかについては後述する。内容フィールドFd2は、第1ないし第4のデータフィールドFd21〜Fd24によって構成される。第1のデータフィールドFd21には、伝票番号の認識領域L1(図3参照)に記入された認識結果としての伝票番号データが格納されている。第2のデータフィールドFd22には、宛名の認識領域L2(図3参照)に記入された認識結果としての宛名データが格納されている。第3のデータフィールドFd23には、件名の認識領域L3に記入された認識結果としての件名データが格納されている。第4のデータフィールドFd24には、本文の認識領域L4に記入された認識結果としての本文データが格納されている。   FIG. 4 is an explanatory diagram showing the data structure of the recognition result file CF stored in the HDD 40. As shown in the figure, the recognition result file CF includes a file name field Fd1, a content field Fd2, and the like. The file name field Fd1 stores a file name automatically given by the OCR software 30. Note that how the file name is created will be described later. The content field Fd2 is composed of first to fourth data fields Fd21 to Fd24. The first data field Fd21 stores slip number data as a recognition result entered in the slip number recognition area L1 (see FIG. 3). In the second data field Fd22, address data as a recognition result entered in the address recognition area L2 (see FIG. 3) is stored. In the third data field Fd23, subject data as a recognition result entered in the subject recognition area L3 is stored. The fourth data field Fd24 stores text data as a recognition result entered in the text recognition area L4.

本実施例では、上記構成の認識結果ファイルCFの作成に先立ち、その作成のための条件を設定する[OCRファクトリーの設定]のダイアログボックスがディスプレイ12に表示される構成となっている。「保存」のボタンBT4がクリックされたときに、直ちに[OCRファクトリーの設定]のダイアログボックスを表示するようにしてもよいし、OCR作業の前準備としてツールバーBR2に設けられた[OCRファクトリー]のボタンBT0(図2参照)がクリックされたときに[OCRファクトリーの設定]のダイアログボックスを表示する構成としてもよい。   In the present embodiment, prior to the creation of the recognition result file CF having the above-described configuration, a dialog box of [OCR factory setting] for setting conditions for the creation is displayed on the display 12. When the “Save” button BT4 is clicked, the [OCR Factory Settings] dialog box may be displayed immediately, or the [OCR Factory] provided in the toolbar BR2 as a preparation for OCR work. When the button BT0 (see FIG. 2) is clicked, a [OCR factory setting] dialog box may be displayed.

図5は、[OCRファクトリーの設定]のダイアログボックスDB1を示す説明図である。図示するように、[OCRファクトリーの設定]のダイアログボックスDB1には、認識結果ファイルCFの保存先フォルダを指定するフォルダ指定用フィールドBF1と、認識結果ファイルCFのファイル形式を指定するファイル形式指定用フィールドBF2と、認識結果ファイルCFのファイル名(保存ファイル名)を指定するファイル名指定用フィールドBF3とを備える。   FIG. 5 is an explanatory diagram showing a dialog box DB1 of [OCR factory setting]. As shown in the figure, the [OCR factory setting] dialog box DB1 includes a folder designation field BF1 for designating a folder for storing the recognition result file CF, and a file format designation for designating the file format of the recognition result file CF. A field BF2 and a file name designation field BF3 for designating the file name (saved file name) of the recognition result file CF are provided.

操作者は、キーボード18やマウス20を操作して各フィールドBF1〜BF3への入力を行うことで、認識結果ファイルCFについての保存先フォルダ、ファイル形式、ファイル名を指定することができる。この指定に従って、CPUは認識結果ファイルCFを作成してHDD40に保存する作業を行う。   The operator can specify the save destination folder, the file format, and the file name for the recognition result file CF by operating the keyboard 18 and the mouse 20 to input the fields BF1 to BF3. In accordance with this specification, the CPU creates a recognition result file CF and saves it in the HDD 40.

ファイル名指定用フィールドBF3の指定方法について次に詳述する。ファイル名指定用フィールドBF3は、詳細には、認識結果ファイルCFのファイル名のサンプルを表示するファイル名表示フィールドBF31と、[変更]ボタンBT11とを備える。この[変更]ボタンBT11が操作者によりクリックされると、[ファイル名の設定]のダイアログボックスDB2がディスプレイ12に表示される。   A method for specifying the file name specifying field BF3 will be described in detail below. Specifically, the file name designation field BF3 includes a file name display field BF31 for displaying a sample of the file name of the recognition result file CF, and a [Change] button BT11. When the “change” button BT11 is clicked by the operator, a dialog box DB2 of “file name setting” is displayed on the display 12.

図6は、[ファイル名の設定]のダイアログボックスDB2を示す説明図である。[ファイル名の設定]のダイアログボックスDB2は、認識結果ファイルCFのファイル名の書式を編集するためのもので、書式入力用フィールドBF32を備える。書式入力用フィールドBF32には、操作者によるキーボード18を用いた操作によって書式文字列が入力される。書式文字列は、ファイル名の書式を編集するための規則を示すものであり、特殊文字列を1または複数組み合わせた構成である。特殊文字列は、下記の表1に示した複数種類が予め用意されている。   FIG. 6 is an explanatory diagram showing a dialog box DB2 for [File name setting]. [File name setting] dialog box DB2 is for editing the format of the file name of recognition result file CF, and includes a format input field BF32. A format character string is input to the format input field BF32 by an operation using the keyboard 18 by the operator. The format character string indicates a rule for editing the format of the file name, and has a configuration in which one or more special character strings are combined. A plurality of special character strings shown in Table 1 below are prepared in advance.

Figure 2008176624
Figure 2008176624

表中の「%?w」は、ファイル名として用いる認識領域を指定するものである。ここでいう認識領域は、文字認識を行う領域としてスキャン画像の画像データSDに指定された認識領域L1〜L4(図3参照)である。「?」は整数が入り、認識領域L1〜L4に定められた番号を意味している。すなわち、「%1w」は伝票番号の認識領域L1を指定し、「%2w」は宛名の認識領域L2を指定し、「%3w」は件名の認識領域L3を指定し、「%4w」は本文の認識領域L4を指定する。   “%? W” in the table designates a recognition area used as a file name. The recognition areas here are the recognition areas L1 to L4 (see FIG. 3) designated in the image data SD of the scanned image as areas for character recognition. "?" Is an integer and means a number determined in the recognition areas L1 to L4. That is, “% 1w” designates the slip number recognition area L1, “% 2w” designates the address recognition area L2, “% 3w” designates the subject recognition area L3, and “% 4w” A body recognition area L4 is designated.

操作者は、表中のパラメータを1または複数用い、さらに必要に応じて、特殊記号(−,¥,*,“、#,(,)等)や文字(A,a,あ,ア等)等の符号を用いて作成した書式文字列を書式入力用フィールドBF32から入力する。書式文字列の入力例と、その入力例に従って作成されるファイル名の例とを以下の(A)〜(D)に示す。   The operator uses one or more parameters in the table and, if necessary, special symbols (-, \, *, ", #, (,), etc.) and characters (A, a, a, a, etc.) A format character string created using a code such as is input from the format input field BF32.Examples of inputting a format character string and examples of file names created according to the input example are as follows. ).

(A)書式文字列が“%1w-%2w”と入力されたとき、ファイル名は“伝票番号の認識領域L1の認識結果-宛名の認識領域L2の認識結果.txt”となる。図3に例示した画像データSDなら、ファイル名は“1−234-○○○株式会社.txt”となる。txtは、テキスト形式のデータであることを表す拡張子である。 (A) When the format character string is input as “% 1w-% 2w”, the file name is “recognition result of slip number recognition area L1−recognition result of address recognition area L2.txt”. In the case of the image data SD illustrated in FIG. 3, the file name is “1-234-XXX Corporation.txt”. txt is an extension indicating that the data is in text format.

(B)書式文字列が“%2w(%3w)”と入力されたとき、ファイル名は“伝票番号の認識領域L2の認識結果(宛名の認識領域L3の認識結果).txt”となる。図3に例示した画像データSDなら、ファイル名は“○○○株式会社(納品のお知らせ).txt”となる。 (B) When the format character string is input as “% 2w (% 3w)”, the file name is “recognition result of the slip number recognition area L2 (recognition result of the address recognition area L3) .txt”. In the case of the image data SD illustrated in FIG. 3, the file name is “xxx corporation (delivery notice) .txt”.

(C)書式文字列が“A-%1w-%2w”と入力されたとき、ファイル名は“A-伝票番号の認識領域L1の認識結果-宛名の認識領域L2の認識結果.txt”となる。図3に例示した画像データSDなら、ファイル名は“A-1−234-○○○株式会社.txt”となる。 (C) When the format character string is input as “A-% 1w-% 2w”, the file name is “A-slip number recognition area L1 recognition result-address recognition area L2 recognition result.txt”. Become. In the case of the image data SD illustrated in FIG. 3, the file name is “A-1-234-XXX Corporation.txt”.

(D)書式文字列が“%1w-%2w-%001p”と入力されたとき、ファイル名は1件目から順に“伝票番号の認識領域L1の認識結果-宛名の認識領域L2-001p.txt”、“伝票番号の認識領域L1の認識結果-宛名の認識領域L2-002p.txt”、…となる。図3に例示した画像データSDなら、ファイル名は1件目から順に“1−234-○○○株式会社.-001.txt”、“1−234-○○○株式会社.-002.txt”、…となる。 (D) When the format string is input as “% 1w-% 2w-% 001p”, the file name is “recognition result of the slip number recognition area L1−address recognition area L2-001p. txt "," recognition result of slip number recognition area L1-address recognition area L2-002p.txt ", and so on. In the case of the image data SD illustrated in FIG. 3, the file names are “1-234-XXX Corporation.-001.txt” and “1-234-XXX Corporation.-002.txt” in order from the first file. "...

すなわち、書式文字列にファイル名として用いる認識領域を指定する特殊文字列“%?w”が複数(上記(A)〜(D)の例では2であったが、3以上の数でも勿論よい)含まれる場合には、その特殊文字列“%?w”で指定される認識領域L1〜L4から文字認識結果であるデータをそれぞれ抽出し、書式文字列上に並ぶ順序でもってそれら認識結果を組み合わせる。例えば、書式文字列が“%3w-%2w”であれば、認識領域L3の認識結果、認識領域L2の認識結果の順に両者を並べてファイル名を作成する。そうして、書式文字列内に特殊記号や文字等の符号がある場合には、その位置に符号を付加してファイル名を作成する。   That is, there are a plurality of special character strings “%? W” for designating a recognition area to be used as a file name in the format character string (2 in the examples (A) to (D) above, but a number of 3 or more may of course be used. ), If it is included, each character recognition result data is extracted from the recognition areas L1 to L4 specified by the special character string “%? W”, and the recognition results are displayed in the order in which they are arranged on the format character string. combine. For example, if the format character string is “% 3w−% 2w”, the file name is created by arranging both in the order of the recognition result of the recognition area L3 and the recognition result of the recognition area L2. If there is a code such as a special symbol or character in the format character string, the file name is created by adding the code at that position.

なお、[ファイル名の設定]のダイアログボックスDB2の右欄には、ファイル名一覧フィールドBF33が設けられている。ファイル名一覧フィールドBF33には、書式の設定により形成されるファイル名のサンプルが一覧にて表示される。ファイル名一覧フィールドBF33に表示される1件目のファイル名は、[OCRファクトリーの設定]のダイアログボックスDB1のファイル名表示フィールドBF31と一致する。[ファイル名の設定]のダイアログボックスDB2の構成が認識結果指定部38(図1)に対応する。   Note that a file name list field BF33 is provided in the right column of the [File name setting] dialog box DB2. In the file name list field BF33, file name samples formed by setting the format are displayed in a list. The first file name displayed in the file name list field BF33 matches the file name display field BF31 in the dialog box DB1 of [OCR factory setting]. The configuration of the [File name setting] dialog box DB2 corresponds to the recognition result designation unit 38 (FIG. 1).

以下、このファイル名作成を含めた認識結果ファイルの作成・保存処理についてさらに説明する。図7は、コンピュータ本体16のCPUにより実行される認識結果ファイルの作成・保存処理を示すフローチャートである。このフローチャートは、操作者により「保存」のボタンBT4がクリックされ、必要に応じて、[OCRファクトリーの設定]のダイアログボックスDB1、[ファイル名の設定]のダイアログボックスDB2からの入力がなされた後に実行開始される。   Hereinafter, the creation / saving process of the recognition result file including the creation of the file name will be further described. FIG. 7 is a flowchart showing a recognition result file creation / storage process executed by the CPU of the computer main body 16. In this flowchart, after the operator clicks the “Save” button BT4 and inputs data from the [OCR Factory Setting] dialog box DB1 and the [File Name Setting] dialog box DB2 as necessary. Execution starts.

図示するように、処理が開始されると、コンピュータ本体16のCPUは、[OCRファクトリーの設定]のダイアログボックスDB1に備えられたフォルダ指定用フィールドBF1とファイル形式指定用フィールドBF2の入力内容を読み取る処理を行う(ステップS100)。次いで、CPUは、[ファイル名の設定]のダイアログボックスDB2に備えられた書式入力用フィールドBF32に入力された書式文字列を読み取る処理を行う(ステップS110)。なお、[OCRファクトリーの設定]のダイアログボックスDB1、[ファイル名の設定]のダイアログボックスDB2からの入力がなされない場合には、ステップS100およびS110では、前回の設定時の内容が読み取られる。   As shown in the figure, when the process is started, the CPU of the computer main body 16 reads the input contents of the folder designation field BF1 and the file format designation field BF2 provided in the [OCR factory setting] dialog box DB1. Processing is performed (step S100). Next, the CPU performs a process of reading the format character string input in the format input field BF32 provided in the [file name setting] dialog box DB2 (step S110). If no input is made from the dialog box DB1 for [OCR factory setting] and the dialog box DB2 for [file name setting], the contents at the previous setting are read in steps S100 and S110.

次いで、CPUは、前工程である文字認識の処理において得られた、スキャン画像の画像データSDのそれぞれに対する認識領域L1〜L4毎の認識結果(テキストデータ)を1ページの原稿分だけ読み取る(ステップS120)。次いで、CPUは、認識結果ファイルCFに相当するバッファを用意し、そのバッファにおける認識結果ファイルCFの内容フィールドFd2に対応した領域にステップS120で読み取った認識領域L1〜L4毎の認識結果を格納する(ステップS130)。   Next, the CPU reads the recognition result (text data) for each of the recognition regions L1 to L4 with respect to each of the image data SD of the scanned image obtained in the character recognition process which is the previous process, for only one page of document (step). S120). Next, the CPU prepares a buffer corresponding to the recognition result file CF, and stores the recognition results for each of the recognition areas L1 to L4 read in step S120 in an area corresponding to the content field Fd2 of the recognition result file CF in the buffer. (Step S130).

その後、CPUは、ステップS110で読み取った書式文字列の中から認識結果指定用の特殊文字列(%?w)を抽出して、ステップS120で読み取った認識領域L1〜L4毎の認識結果の中から、その抽出された特殊文字列(%?w)で特定される認識領域に対応した認識結果を選択する(ステップS140)。その後、選択された認識結果をステップS110で読み取った書式文字列から定まる規則に従って組み合わせることにより、バッファにおけるファイル名フィールドFd1に対応した領域にファイル名を作成する(ステップS150)。このステップS150の処理は、前述した規則、すなわち、書式文字列上に並ぶ順序でもってそれら認識結果を組み合わせ、書式文字列内に特殊記号や文字等の符号がある場合には、その位置に符号を付加してファイル名を作成する。CPUにより実行されるステップS140およびS150の処理がファイル名作成部36a(図1)に対応する。   Thereafter, the CPU extracts a special character string (%? W) for designating the recognition result from the format character string read in step S110, and among the recognition results for each of the recognition regions L1 to L4 read in step S120. Then, a recognition result corresponding to the recognition area specified by the extracted special character string (%? W) is selected (step S140). Thereafter, the selected recognition result is combined according to a rule determined from the format character string read in step S110, thereby creating a file name in an area corresponding to the file name field Fd1 in the buffer (step S150). The process of step S150 combines the recognition results in the order described above, that is, in the order in which they are arranged on the format character string. If there is a code such as a special symbol or character in the format character string, a code is added at that position. To create a file name. The processing of steps S140 and S150 executed by the CPU corresponds to the file name creation unit 36a (FIG. 1).

その後、バッファの内容を認識結果ファイルCFとしてHDD40に保存する(ステップS160)。保存先は、ステップS100で読み取ったフォルダ指定用フィールドBF1の入力内容に従うフォルダとする。   Thereafter, the contents of the buffer are stored in the HDD 40 as a recognition result file CF (step S160). The storage destination is a folder according to the input content of the folder designation field BF1 read in step S100.

ステップS160の実行後、CPUは、ステップS170に処理を進めて、ステップS120で読み取った認識結果が文字認識の工程から送られてくる最後のページのものであるか否かを判定する。ここで、最後でないと判定されたときには、ステップS120に処理を戻して、次のページ分の認識結果についてのステップS120ないしS170の処理を繰り返し実行する。一方、ステップS170で最後であると判定されると、「リターン」に処理を進めて、この認識結果ファイルの作成・保存処理を終了する。   After execution of step S160, the CPU proceeds to step S170 to determine whether the recognition result read in step S120 is for the last page sent from the character recognition process. Here, when it is determined that it is not the last, the process returns to step S120, and the processes of steps S120 to S170 for the recognition result for the next page are repeatedly executed. On the other hand, if it is determined in step S170 that it is the last, the process proceeds to “return”, and the process of creating and saving the recognition result file is ended.

C.作用・効果:
以上詳述したように、本実施例では、文書の画像データに指定した複数の認識領域L1〜L4の中から2以上の認識結果を、操作者からの指示に従って指定して、その指定された2以上の認識結果に基づいて付与用のファイル名を作成している。認識結果は操作者からの指示に従って指定されたものであることから、操作者の意図の通りのファイル名とすることができる。また、2以上の認識結果に基づいてファイル名を定めるものであることから、ファイル名作成の自由度が高い。したがって、本実施例によれば、操作者の意図する通りに、しかも自由度高くファイル名を作成することができる。
C. Action / Effect:
As described above in detail, in this embodiment, two or more recognition results are designated from among a plurality of recognition areas L1 to L4 designated in the image data of a document in accordance with an instruction from the operator, and the designation is made. A file name for assignment is created based on two or more recognition results. Since the recognition result is designated in accordance with an instruction from the operator, the file name can be set as intended by the operator. Further, since the file name is determined based on two or more recognition results, the degree of freedom in creating the file name is high. Therefore, according to the present embodiment, a file name can be created with a high degree of freedom as intended by the operator.

また、本実施例では、認識結果ファイルCFのファイル名を、書式文字列を入力という簡単な操作により設定することができることから操作性に優れている。   In this embodiment, the file name of the recognition result file CF can be set by a simple operation of inputting a format character string, which is excellent in operability.

2.第2実施例:
本発明の第2実施例について次に説明する。この第2実施例は、第1実施例と比較して、[ファイル名の設定]のダイアログボックスが相違するだけであり、その他のソフトウェア構成およびハードウェア構成については同一である。第1実施例と同一の部分には同一の番号を付けて説明する。
2. Second embodiment:
Next, a second embodiment of the present invention will be described. The second embodiment is different from the first embodiment only in the [File name setting] dialog box, and the other software configuration and hardware configuration are the same. The same parts as those in the first embodiment will be described with the same numbers.

図8は、第2実施例における[ファイル名の設定]のダイアログボックスXDB2を示す説明図である。[ファイル名の設定]のダイアログボックスDBX2は、書式入力用フィールドXBF32とファイル名一覧フィールドXBF33を備える。ファイル名一覧フィールドXBF33は第1実施例のものと同一である。   FIG. 8 is an explanatory diagram showing a [file name setting] dialog box XDB2 in the second embodiment. [File name setting] dialog box DBX2 includes a format input field XBF32 and a file name list field XBF33. The file name list field XBF33 is the same as that in the first embodiment.

第1実施例の書式入力用フィールドBF32は、一つの入力フィールドに文字列を入力するだけのものであったが、これに対して、第2実施例の書式入力用フィールドXBF32は、[認識結果の前に配置する文字列]の入力フィールドIF1と、[認識枠番号]の入力フィールドIF2と、[認識結果の後ろに配置する文字列]の入力フィールドIF3とを備える。書式入力用フィールドBF32の各入力フィールドIF1〜IF3に対する操作者によるキーボード18やマウス20の入力操作を受けることにより、認識結果の指定と共に認識結果の前後にどのような特殊記号や文字等の符号を含ませるかをコンピュータ本体16に指示することができる。また、追加ボタンBT22をクリックすることで各入力フィールドIF1〜IF3の組を増やすことができ、削除ボタンBT21をクリックすることで該当の組を削除することができる。この結果、第2実施例の書式入力用フィールドXBF32のインターフェースによっても、第1実施例の書式入力用フィールドBF32のインターフェースと同一のファイル名の提供が可能となっている。   The format input field BF32 in the first embodiment is merely for inputting a character string into one input field. On the other hand, the format input field XBF32 in the second embodiment is [recognition result]. Input field IF1 for [character string to be placed before], input field IF2 for [recognition frame number], and input field IF3 for [character string to be placed after recognition result]. By receiving an input operation of the keyboard 18 and the mouse 20 by the operator for each of the input fields IF1 to IF3 of the format input field BF32, designation of the recognition result and what special symbols and characters are added before and after the recognition result. It can be instructed to the computer main body 16 to be included. Further, by clicking the add button BT22, the set of the input fields IF1 to IF3 can be increased, and by clicking the delete button BT21, the corresponding set can be deleted. As a result, the same file name as that of the interface of the format input field BF32 of the first embodiment can be provided by the interface of the format input field XBF32 of the second embodiment.

3.他の実施形態:
本発明の他の実施形態について、次に説明する。
3. Other embodiments:
Another embodiment of the present invention will be described next.

(1)前記第1実施例では、一つの入力フィールドに書式文字列を入力することにより、前記第2実施例では、[認識枠番号]の入力フィールドIF2に番号を入力することにより、2以上の認識結果を操作者の指示に従って指定可能としていたが、2以上の認識結果を操作者によって指定可能であればいずれのインターフェースであってもよい。例えば、図3に示した領域指定後の画面表示において、ファイル名として使用する認識領域をダブルクリックする構成としてもよい。この場合には、ダブルクリックした順に対応する認識結果を並べてファイル名を作成してもよいし、番号N1〜N4の値が上位(1に近いもの)ほどファイル名の前側に位置する構成としてもよい。すなわち、認識結果の並び順は必ずしも操作者によって指定可能とする必要はなく、コンピュータが自動的に定める構成としてもよい。 (1) In the first embodiment, by inputting a format character string in one input field, in the second embodiment, by entering a number in the input field IF2 of [recognition frame number], two or more However, any interface may be used as long as two or more recognition results can be designated by the operator. For example, in the screen display after the area designation shown in FIG. 3, a configuration may be adopted in which a recognition area used as a file name is double-clicked. In this case, the file name may be created by arranging the recognition results corresponding to the order of double-clicking, or the higher the number N1 to N4 (those closer to 1), the more upstream the file name may be. Good. That is, the arrangement order of the recognition results does not necessarily need to be specified by the operator, and may be determined automatically by the computer.

(2)前記第1および第2実施例では、2以上の認識結果に基づいてファイル名を作成していたが、認識結果ファイルを格納するフォルダについての名前を2以上の認識結果に基づいて作成する構成としてもよい。フォルダ名は、認識結果ファイルをある程度識別しうる名称であることから、本願発明でいう「ファイル名」に相当する。 (2) In the first and second embodiments, a file name is created based on two or more recognition results. However, a name for a folder storing a recognition result file is created based on two or more recognition results. It is good also as composition to do. Since the folder name is a name that can identify the recognition result file to some extent, it corresponds to the “file name” in the present invention.

(3)前記第1および第2実施例に換えて、認識結果ファイルCFが元の画像データと一体となった文書画像データを作成する構成として、この文書画像データを保存する際のファイル名の設定に本発明を適用する構成としてもよい。 (3) Instead of the first and second embodiments, the recognition result file CF is created as document image data in which the original image data is integrated, and the file name used when saving the document image data is changed. It is good also as a structure which applies this invention to a setting.

(4)前記実施例では、文字認識の対象となる画像データを、イメージスキャナ14によって光学的に読み取った文書の画像データとしたが、これに換えて、予め用意した文書の画像データをHDD、CDーR等の記録媒体から読み出したものであってもよい。また、画像データは、外部のネットワークに接続される特定のサーバから、ネットワークを介して提供されたものとすることもできる。 (4) In the above embodiment, the image data to be character-recognized is the image data of the document optically read by the image scanner 14, but instead of this, the image data of the document prepared in advance is the HDD, It may be read from a recording medium such as a CD-R. Further, the image data may be provided via a network from a specific server connected to an external network.

以上、本発明の一実施例とその変形例を詳述してきたが、本発明は、こうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲において種々なる態様にて実施することができるのは勿論のことである。   As mentioned above, although one Example of this invention and its modification were explained in full detail, this invention is not limited to such an Example at all, and it implements in various aspects in the range which does not deviate from the summary of this invention. Of course you can.

本発明の第1実施例を適用するコンピュータシステムのハードウェアの概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the hardware of the computer system to which 1st Example of this invention is applied. スキャン画像取込部32により取り込まれたスキャン画像の画像データSDの一例をウィンドウWDとともに示す説明図である。It is explanatory drawing which shows an example of the image data SD of the scan image taken in by the scan image taking-in part 32 with the window WD. 認識領域L1〜L4の一例を示す説明図である。It is explanatory drawing which shows an example of recognition area | region L1-L4. HDD40に保存される認識結果ファイルCFのデータ構造を示す説明図である。6 is an explanatory diagram showing a data structure of a recognition result file CF stored in the HDD 40. FIG. [OCRファクトリーの設定]のダイアログボックスDB1を示す説明図である。It is explanatory drawing which shows dialog box DB1 of [OCR factory setting]. [ファイル名の設定]のダイアログボックスDB2を示す説明図である。It is explanatory drawing which shows dialog box DB2 of [file name setting]. コンピュータ本体16のCPUにより実行される認識結果ファイルの作成・保存処理を示すフローチャートである。6 is a flowchart showing a recognition result file creation / storage process executed by a CPU of a computer main body 16; 第2実施例における[ファイル名の設定]のダイアログボックスXDB2を示す説明図である。It is explanatory drawing which shows dialog box XDB2 of [setting of a file name] in 2nd Example.

符号の説明Explanation of symbols

10…コンピュータ
12…ディスプレイ
14…イメージスキャナ
16…コンピュータ本体
18…キーボード
20…マウス
32…スキャン画像取込部
34…文字認識部
36…ファイル作成部
36a…ファイル名作成部
38…認識結果指定部
40…HDD
50…スキャナドライバ
P…原稿
WD…ウィンドウ
WF…作業フィールド
CF…認識結果ファイル
DB1…[OCRファクトリーの設定]のダイアログボックス
DB2…[ファイル名の設定]のダイアログボックス
BF32…書式入力用フィールド
BF33…ファイル名一覧フィールド
XDB2…[ファイル名の設定]のダイアログボックス
XBF32…書式入力用フィールド
IF1〜IF3…入力フィールド
BT21…削除ボタン
BT22…追加ボタン
XBF33…ファイル名一覧フィールド
DESCRIPTION OF SYMBOLS 10 ... Computer 12 ... Display 14 ... Image scanner 16 ... Computer main body 18 ... Keyboard 20 ... Mouse 32 ... Scanned image capturing part 34 ... Character recognition part 36 ... File creation part 36a ... File name creation part 38 ... Recognition result designation part 40 ... HDD
50 ... Scanner driver P ... Original WD ... Window WF ... Work field CF ... Recognition result file DB1 ... [OCR factory setting] dialog box DB2 ... [File name setting] dialog box BF32 ... Format input field BF33 ... File Name list field XDB2 ... [File name setting] dialog box XBF32 ... Format input field IF1-IF3 ... Input field BT21 ... Delete button BT22 ... Add button XBF33 ... File name list field

Claims (6)

1ページの文書の画像データに複数の認識領域を指定して、該認識領域ごとに文字認識を行なうことにより複数の認識結果を得る文字認識手段と、
前記文字認識手段により得られた複数の認識結果に基づいて、ファイル名の付与された認識結果ファイルを作成するファイル作成手段と
を備える文字認識結果の管理装置において、
前記文字認識手段により得られた複数の認識結果の中から2以上の認識結果を、操作者からの指示に従って指定する認識結果指定手段を備え、
前記ファイル作成手段は、
前記指定手段により指定された2以上の認識結果に基づいて前記付与用のファイル名を作成するファイル名作成手段を備えることを特徴とする文字認識結果の管理装置。
A character recognition means for obtaining a plurality of recognition results by designating a plurality of recognition areas in the image data of one page of document and performing character recognition for each recognition area;
In a character recognition result management device comprising: a file creation means for creating a recognition result file with a file name based on a plurality of recognition results obtained by the character recognition means;
A recognition result specifying means for specifying two or more recognition results among a plurality of recognition results obtained by the character recognition means in accordance with an instruction from an operator;
The file creation means includes:
An apparatus for managing character recognition results, comprising: a file name creation means for creating the file name for assignment based on two or more recognition results designated by the designation means.
請求項1に記載の文字認識結果の管理装置であって、
前記認識結果指定手段は、
前記2以上の認識結果と共に該2以上の認識結果の並び順を、前記操作者からの指示に従って指定する構成であり、
前記ファイル名作成手段は、
前記認識結果指定手段により指定された2以上の認識結果を前記並び順に基づいて組み合わせることにより前記ファイル名の作成を行う構成である、文字認識結果の管理装置。
The character recognition result management device according to claim 1,
The recognition result specifying means includes
The arrangement order of the two or more recognition results together with the two or more recognition results is designated according to an instruction from the operator;
The file name creation means
A character recognition result management apparatus configured to create the file name by combining two or more recognition results specified by the recognition result specifying means based on the arrangement order.
請求項2に記載の文字認識結果の管理装置であって、
前記認識結果指定手段は、
前記2以上の認識結果のそれぞれに割り当てられた特殊文字列を備える書式文字列を、前記操作者からの指示に従って入力する書式文字列入力手段を備え、
前記ファイル名作成手段は、
前記変数に対応する認識結果を前記書式文字列から定まる規則に従って組み合わせて前記ファイル名の作成を行う構成である、文字認識結果の管理装置。
The character recognition result management device according to claim 2,
The recognition result specifying means includes
A format character string input means for inputting a format character string including a special character string assigned to each of the two or more recognition results according to an instruction from the operator;
The file name creation means
A character recognition result management apparatus configured to create the file name by combining recognition results corresponding to the variables according to a rule determined from the format character string.
請求項3に記載の文字認識結果の管理装置であって、
前記書式文字列は、特殊記号、文字等の符号を備える構成であり、
前記ファイル名作成手段は、
前記符号を含むファイル名を作成する構成である、文字認識結果の管理装置。
The character recognition result management device according to claim 3,
The format character string is configured to include special symbols, characters, and the like,
The file name creation means
A character recognition result management apparatus configured to create a file name including the code.
1ページの文書の画像データに複数の認識領域を指定して、該認識領域ごとに文字認識を行なうことにより複数の認識結果を得て、
前記得られた複数の認識結果に基づいて、ファイル名の付与された認識結果ファイルを作成する文字認識結果の管理方法において、
前記文字認識により得られた複数の認識結果の中から2以上の認識結果を、操作者からの指示に従って指定するとともに、
前記認識結果ファイルの作成を、前記指定された2以上の認識結果に基づいて前記付与用のファイル名を作成することにより行うことを特徴とする文字認識結果の管理方法。
A plurality of recognition results are obtained by designating a plurality of recognition areas in the image data of one page of document and performing character recognition for each recognition area,
In the character recognition result management method for creating a recognition result file with a file name based on the plurality of obtained recognition results,
Specifying two or more recognition results among a plurality of recognition results obtained by the character recognition according to an instruction from the operator,
A method of managing a character recognition result, wherein the recognition result file is created by creating a file name for assignment based on the two or more designated recognition results.
コンピュータプログラムであって、
(a)1ページの文書の画像データに複数の認識領域を指定して、該認識領域ごとに文字認識を行なうことにより複数の認識結果を得る機能と、
(b)前記得られた複数の認識結果に基づいて、ファイル名の付与された認識結果ファイルを作成する機能と
をコンピュータに実現させるとともに、
さらに、
(c)前記機能(a)により得られた複数の認識結果の中から2以上の認識結果を、操作者からの指示に従って指定する機能をコンピュータに実現させるとともに、
前記機能(b)は、
前記機能(c)により指定された2以上の認識結果に基づいて前記付与用のファイル名を作成する機能
を備える、コンピュータプログラム。
A computer program,
(A) a function of obtaining a plurality of recognition results by designating a plurality of recognition areas in the image data of a one-page document and performing character recognition for each recognition area;
(B) Based on the plurality of obtained recognition results, the computer has a function of creating a recognition result file with a file name, and
further,
(C) causing a computer to realize a function of designating two or more recognition results from a plurality of recognition results obtained by the function (a) according to an instruction from an operator;
The function (b) is
A computer program comprising a function of creating the file name for assignment based on two or more recognition results specified by the function (c).
JP2007010291A 2007-01-19 2007-01-19 Character recognition result management apparatus and method, and computer program Withdrawn JP2008176624A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007010291A JP2008176624A (en) 2007-01-19 2007-01-19 Character recognition result management apparatus and method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007010291A JP2008176624A (en) 2007-01-19 2007-01-19 Character recognition result management apparatus and method, and computer program

Publications (1)

Publication Number Publication Date
JP2008176624A true JP2008176624A (en) 2008-07-31

Family

ID=39703591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007010291A Withdrawn JP2008176624A (en) 2007-01-19 2007-01-19 Character recognition result management apparatus and method, and computer program

Country Status (1)

Country Link
JP (1) JP2008176624A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011065255A (en) * 2009-09-15 2011-03-31 Sharp Corp Data processing apparatus, data name generation method and computer program
JP2012247918A (en) * 2011-05-26 2012-12-13 Konica Minolta Business Technologies Inc File name creating device and file name creating program
US10860785B2 (en) 2017-08-22 2020-12-08 Canon Kabushiki Kaisha Apparatus for setting file name and the like for scan image, control method thereof, and storage medium
JP2024102108A (en) * 2019-04-19 2024-07-30 キヤノン株式会社 Image processing apparatus performing preview display of scan image, method for controlling the same, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011065255A (en) * 2009-09-15 2011-03-31 Sharp Corp Data processing apparatus, data name generation method and computer program
JP2012247918A (en) * 2011-05-26 2012-12-13 Konica Minolta Business Technologies Inc File name creating device and file name creating program
US10860785B2 (en) 2017-08-22 2020-12-08 Canon Kabushiki Kaisha Apparatus for setting file name and the like for scan image, control method thereof, and storage medium
JP2024102108A (en) * 2019-04-19 2024-07-30 キヤノン株式会社 Image processing apparatus performing preview display of scan image, method for controlling the same, and program

Similar Documents

Publication Publication Date Title
JP2009075879A (en) Image processing apparatus, image processing method, and program
WO2020235085A1 (en) Operation log visualization device, operation log visualization method, and operation log visualization program
JP2008176624A (en) Character recognition result management apparatus and method, and computer program
JP3963614B2 (en) Data communication system and server and client computer constituting data communication system
US7505903B2 (en) Speech recognition dictionary creation method and speech recognition dictionary creating device
US7921366B2 (en) Information processing apparatus, assignment method and display method of information processing apparatus, and computer-readable program product
JP2007249613A (en) Thermal analysis measurement system, and method of automatically setting measurement data file name
JP2000076228A (en) Automatic correction of document format
JP4819391B2 (en) Document composition system, document composition method, and program
US8190563B2 (en) Document management apparatus, document management method, and computer-readable encoding medium recorded with a computer program
JP4305325B2 (en) Sticky note information processing method, sticky note information processing system, and sticky note information processing program
JP2002182891A (en) Web page display device, web page display method, and computer-readable recording medium storing a program for causing a computer to execute the web page display method
JP7140507B2 (en) Information processing device that performs redaction processing, its control method, and program
JP2024014169A (en) Image forming apparatus, image forming system, and image forming method
CN114764401A (en) Information processing apparatus and storage medium
CN100501736C (en) History Control
JP2003036130A (en) User operation management processing program, user operation management method, and user operation management device
JP2007323474A (en) Ocr system, ocr format parameter preparation method, its program and program recording medium
JP6235744B1 (en) Web page creation support system
JP2005063043A (en) Image display device, method and program
JP2002278960A (en) Image information processing device
JP3425873B2 (en) Data input method for terminal device connected to host computer
JPH11203282A (en) Data processing apparatus, table of contents data processing method for data processing apparatus, and storage medium storing computer readable program
JP4507227B2 (en) File storage device and storage medium storing file management program
JP4109439B2 (en) Processing device, recording medium, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20111201