[go: up one dir, main page]

JP4791641B2 - Candidate character output device, candidate character output method, program, and computer-readable recording medium - Google Patents

Candidate character output device, candidate character output method, program, and computer-readable recording medium Download PDF

Info

Publication number
JP4791641B2
JP4791641B2 JP2001075108A JP2001075108A JP4791641B2 JP 4791641 B2 JP4791641 B2 JP 4791641B2 JP 2001075108 A JP2001075108 A JP 2001075108A JP 2001075108 A JP2001075108 A JP 2001075108A JP 4791641 B2 JP4791641 B2 JP 4791641B2
Authority
JP
Japan
Prior art keywords
character
candidate
output
order
character type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001075108A
Other languages
Japanese (ja)
Other versions
JP2002279342A (en
Inventor
幸央 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001075108A priority Critical patent/JP4791641B2/en
Publication of JP2002279342A publication Critical patent/JP2002279342A/en
Application granted granted Critical
Publication of JP4791641B2 publication Critical patent/JP4791641B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識処理結果に対する候補文字出力装置、候補文字出力方法、プログラムおよびコンピュータ読み取り可能な記録媒体に関し、特に、文字認識処理によって得られた候補文字の出力順序に関する。
【0002】
【従来の技術】
従来の文字認識は一般に、入力画像パターンから特徴量を抽出し、辞書に登録されている認識対象文字の標準特徴量との間で相違度を求め、相違度が低い順に1位候補、2位候補、…と順位付けを行い、上位の候補を認識結果として出力している。
また、これら候補文字の順位を補正するのにも、正解の可能性が高い文字をより上位に置くという考え方であって、例えば、特開平10−334190号公報で提案されているように、類似文字間で差異の大きい特徴を用いて相違度を補正したのち、補正後の相違度で再ソートしている。
その結果、規則性のあるパターンの認識結果であっても、ユーザーに提示するときには、一律に相違度の小さい順に提示していた。例えば、図11(a)に示したように1位の候補文字が正解であればよいが、図11(b)に示すように、1位候補が正解でなかった場合、ユーザーは提示された候補文字の中から正解を探し、その文字を1位候補とするように指示するのが一般的である。
【0003】
【発明が解決しようとする課題】
しかしながら、従来の候補文字の出力順が相違度順にソートされた並びの表示であるため、ユーザーにとって日常的な感覚とかけ離れており、ランダムな並びにしか見えない。
従って、この雑然と並んだ候補文字の中から所望の文字を探すには、それだけ労力を要することになる。
本発明は、このような問題を解決するためのものであり、文字認識処理において、ユーザーが候補文字の中から正解を探しやすい候補文字出力装置、候補文字出力方法および記録媒体を提供することを目的とする。
【0004】
【課題を解決するための手段】
上記の問題を解決するために、請求項1の発明は、入力画像上の文字画像に対して文字認識し、認識結果の候補文字、この候補文字の文字種および相違度とを出力する文字認識手段と、文字認識結果を出力する出力手段とを備え、上記出力手段は、上記候補文字の文字種が特定の認識対象文字種か否かを判定する判定手段と、上記判定手段によって上記候補文字の文字種が特定の認識対象文字種と判定された場合、上記特定の認識対象文字種に応じて1位の候補は相違度最小の候補文字にし、2位以降の候補は相違度に基づく順序以外の予め定められた順序に従う候補文字にした候補文字の出力順序を設定し、上記判定手段によって上記候補文字の文字種が特定の認識対象文字種ではないと判定された場合、相違度の小さい順に候補文字の出力順序を設定する候補順序設定手段を有することを特徴とする
らに、本発明の請求項は、上記のような候補文字出力装置において、認識対象の文字種を指示する認識文字種指示手段を備え、上記文字認識手段は、入力画像上の文字画像に対して上記認識文字種指示手段で指示された文字種の候補文字を文字認識するようにしたことを特徴とする。
また、本発明の請求項は、上記のような候補文字出力装置において、上記認識結果の候補文字が複数の文字種を含む場合に、各文字種について上記候補順序設定手段による上記候補文字の出力順序の設定を実行する手段を設けたことを特徴とする。
【0005】
さらに、本発明の請求項は、入力画像上の文字画像に対して文字認識し、認識結果の候補文字、この候補文字の文字種および相違度とを出力する文字認識工程と、文字認識結果を出力する出力工程とを有し、上記出力工程は、上記候補文字の文字種が特定の認識対象文字種か否かを判定する判定工程と、上記判定工程によって上記候補文字の文字種が特定の認識対象文字種と判定された場合、上記特定の認識対象文字種に応じて1位の候補は相違度最小の候補文字にし、2位以降の候補は相違度に基づく順序以外の予め定められた順序に従う候補文字にした出力順序を設定し、上記判定工程によって上記候補文字の文字種が特定の認識対象文字種ではないと判定された場合、相違度の小さい順に候補文字の出力順序を設定する候補順序設定工程を含むことを特徴とする
また、本発明の請求項は、上記のような候補文字出力方法において、認識対象の文字種を指示する認識文字種指示工程を含み、上記文字認識工程は、入力画像上の文字画像に対して上記認識文字種指示工程で指示された文字種の候補文字を文字認識する工程を含むことを特徴とする。
さらに、本発明の請求項は、上記のような候補文字出力方法において、上記認識結果の候補文字が複数の文字種を含む場合に、各文字種について上記候補順序設定工程による上記候補文字の出力順序の設定を実行する工程を含むことを特徴とする。
また、本発明の請求項は、コンピュータに、上記のような候補文字出力方法の工程を実行させるためのプログラムである。
さらに、本発明の請求項は、上記のようなプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【0006】
【発明の実施の形態】
以下に、図面を用いて本発明の実施例の構成および動作を詳細に述べる。
<実施例>
(1)構成
図1は、本発明の一実施例である文字認識装置の構成をあらわすブロック図である。
実施例の文字認識装置は、制御手段10、画像入力手段20、認識文字種指示手段30、文字認識手段40、出力手段50、画像格納手段60、認識辞書70、候補格納手段80とから構成されている。
処理制御手段10は、画像を読取り、その画像の文字認識を行って、認識結果を出力するまでの全体を制御する。
画像入力手段20は、スキャナやファイル等から画像を入力する装置により、文字認識処理の対象となる画像を読み込み、2値画像データとして画像格納手段60へ格納する。
認識文字種指示手段30は、入力された画像に現れる文字の種類(例えば、「数字」、「英字」、「ひらかな」、「カタカナ」または「漢字」等の組み合わせ)をユーザーに入力させる。
これは、例えば、新聞や雑誌には数字、英字、漢字など、いろいろな種類の文字が現れるが、配送伝票の届け先氏名の場合には、漢字、ひらがな、カタカナしか現れない。また、商品コードのようなものであれば、数字のみ、または、英数字のみしか現れないことが多々ある。
このように読み取り対象の画像に現れる文字種が予め分かっている場合、ユーザーが文字種を指定し(以下、これを認識対象文字種と呼ぶ。)、その限定された範囲の文字のみから候補を探すようにすれば、よい認識率を得ることができる。(例えば、認識対象文字種に数字を指定すると、「1」を「I」、「し」や「ノ」と間違えるケースを防げる。)
ここで指示された認識対象文字種を一時的に記憶しておき、出力手段50で候補文字を出力するときに使う。
【0007】
文字認識手段40は、画像格納手段60の画像データより個々の文字画像が切り出され、大きさが正規化され、この正規化された文字画像の特徴量を抽出し、この特徴量と認識辞書70との比較を行ない、認識の確からしさとしての相違度が小さい順に一定個数の候補文字を求め、候補文字とその相違度と候補文字の文字種とを認識結果データとして候補格納手段80に格納する。
出力手段50は、候補格納手段80に得られた認識結果データ(例えば、相違度の小さい順に10個の候補文字に対する情報)と画像格納手段60内の画像とを対比させて、プリンタまたはディスプレイのような出力装置へ出力する。
この出力手段50は、さらに、判定手段52と候補順序再設定手段54とを備えて、候補文字を出力するときに、認識文字種指示手段30で指示された認識対象文字種に応じて、予め定められている順序に並び替えて出力する。
先ず、出力手段50は、判定手段52によって認識文字種指示手段30で一時的に記憶した認識対象文字種が特定の文字種であるかを判定する。この判定で特定の認識対象文字種とされた場合に、候補順序再設定手段54によって予め定められた順序に複数の候補文字を並び換える。この候補順序再設定手段54は、1位の候補に相違度の最小の候補文字とし、相違度が2位以下の候補を予め定められた順序に並べなおす。
最後に、出力手段50は、この並び替えられた候補文字と元の入力画像とを対比させて出力させる。例えば、元の入力画像のカーソル位置に対応する相違度が1位の候補文字を出力させ、ユーザーの要望により再設定された候補文字を順次または残りの候補を一度に出力させるようにして、対比させる。
ここで、特定の認識対象文字種を「数字」とし、予め定められた順序を「文字コード順」とするときには、特に、数字の値と同じ順番で出力されるのでユーザーの感覚と一致し、正解を選択しやすくなる。
また、この判定手段52で特定の認識対象文字種でないと判定されたときには、相違度が2位以下の候補文字に対して、「相違度の小さい順」として再設定するようにしてもよい。
【0008】
画像格納手段60は、入力した画像を格納する記憶手段(例えば、磁気ディスクのような記憶装置等)である。この画像は、文字認識手段40の認識対象の画像であり、また、出力手段50における認識結果と対比されて認識結果を修正する時等に使われる。
認識辞書70は、文字認識手段40で使われ、各認識対象の文字に対する標準特徴パターン、文字コード、文字種(数字、英文字、ひらかな、カタカナ、記号、漢字等)、および相違度を計算するための情報等を格納している。
候補格納手段80は、認識対象となった画像上の座標位置とその画像の認識結果である次の情報を、認識対象となったすべての文字画像に対して格納している(図2、4、7参照)。
この1つの文字画像に対して、相違度が小さいものから所定の個数(例えば、10個)を保持し、この1つの候補文字に対して、少なくとも文字コード、相違度、文字種の情報を持っている。
【0009】
このような構成において、実施例の文字認識装置は次のように動作する。
処理制御手段10は、原画像入力手段20を呼び出して、スキャナやファイル等の画像を入力する装置により、ユーザーの指定した文書等の処理対象となる画像を入力させ、この入力された画像はそのまま画像格納手段60へ格納される。
次に、ユーザーが認識対象の文字種を設定したいとの要求によって、制御手段10は、認識文字種指示手段30を呼び出す。また、ここでユーザーが認識対象の文字種を設定しないときには、すべての文字種が認識対象となる。
認識文字種指示手段30は、入力画像の認識対象となる領域に現れる文字の種類をユーザーに入力させる。
ここで指示された認識対象文字種を一時的に記憶しておき、出力手段50で候補文字を出力するときに使う。
次に、制御手段10は、文字認識手段40を呼び出す。
文字認識手段40は、画像格納手段60の画像データより個々の文字画像が切り出され、大きさが正規化され、この正規化された文字画像の特徴量を抽出し、この特徴量と認識辞書70との比較を行ない、認識の確からしさとしての相違度が小さい順に一定個数の候補文字を求め、それらの候補文字、相違度と候補文字の文字種とを認識結果データとして候補格納手段80に格納する。
最後に、制御手段10は出力手段50を呼び出す。
出力手段50は、候補格納手段80に得られた認識結果データ(例えば、相違度の小さい順に10個の候補文字に対する情報)と画像格納手段60内の画像とを対比させて、プリンタまたはディスプレイのような出力装置へ出力する。
先ず、出力手段50は、認識文字種指示手段30で一時的に記憶した認識対象文字種が特定の文字種であるかを判定手段52によって判定し、候補順序再設定手段54によって予め定められた順序に複数の候補文字を並び換える。
この候補順序再設定手段54は、1位の候補に相違度の最小の候補文字とし、相違度が2位以下の候補を予め定められた順序に並べ直す。
最後に、出力手段50は、この並び替えられた候補文字と元の入力画像とを対比させて出力させる。例えば、元の入力画像のカーソル位置に対応する相違度が1位の候補文字を出力させ、ユーザーの要望により再設定された候補文字を順次または残りの候補を一度に出力させるようにして、対比させる。
【0010】
例えば、認識文字種指示手段30で認識対象文字種を「数字」と指定した場合、図2に示すような候補文字が得られ、候補格納手段80に格納されているとする。
さらに、特定の文字種を「数字」とし、予め定められた順序を「文字コード順」とすると、判定手段52は認識対象文字種が特定の文字種であると判定するので、候補順序再設定手段54は、1位の候補文字の「7」をそのままに、2位以下の候補を予め定められた順序(文字コード(例えばJISコード)の順)に設定しなおす。
これにより、図3に示したように、2位候補以下は「012345689」の順に並び、1位の候補と、入力画像とをあわせて出力される。
ユーザーは、並びの先頭にある1位の候補と入力画像とを見比べ、図3(a)のように結果が正しければ、そのまま確定する。
しかし、図3(b)のように誤りであれば修正するのであるが、候補文字が0〜9の順に並んでいるのが明白であるため、正解「9」を探すのが簡単になる。
このように、ユーザーが上位候補から下位候補へ向かって順に「9」を探していくよりも、すばやく正解を見つけることができる。
また、この判定手段52で特定の認識対象文字種でないと判定されたときには、相違度が2位以下の候補文字に対して、「相違度の小さい順」として再設定する。
例えば、認識対象文字種が「記号」の場合、図4に示す候補文字が得られたとする。この場合、特定の認識対象文字種(「数字」)ではないので、候補文字を相違度順のままでユーザーに提示する。
ここで、2位の候補以下をJISコード順に再ソートすれば、候補文字の並びは1位から順に「×?/+=<>%#*」となるが、ユーザーにとって、特に正解を探しやすい手がかりが増えたようには見えないので、相違度順で提示するとしても何の差支えもないと考えられる。
上記のような構成にすることにより、認識結果の候補文字を出力するときに、状況に応じて、ユーザーが直感的にわかりやすい順序で提示できるので、ユーザーが候補文字の中から正解をより早く探し出すことができ、認識結果の編集などを行うのに労力が少なくてすむ。
【0011】
(2)処理の流れ
図5は、本実施例の文字認識装置の処理の流れを説明するためのフローチャートである。
スキャナやファイル等の画像を入力する装置により、ユーザーの指定した文字認識の対象となる画像(多値画像または二値画像)として読み込み、その画像を画像格納手段60へ格納する(ステップS100)。
ユーザーが認識対象文字種を設定するとき、メニュー等からこれを選択する。
このとき、ユーザーは、メニューやダイアログ等から入力画像の認識対象となる領域に現れる文字の種類を入力する。また、ここでユーザーが認識対象の文字種を設定しないときには、すべての文字種が認識対象となる。
ここで指示された認識対象文字種を一時的に記憶しておき、出力手段50で候補文字を出力するときに使う(ステップS110)。
次に、画像格納手段60の画像データに対して文字認識が行われる。
この画像から個々の文字画像が切り出され、大きさが正規化され、この正規化された文字画像の特徴量を抽出し、この特徴量と認識辞書70との比較を行ない、認識の確からしさとしての相違度が小さい順に一定個数の候補文字を求め、それらの候補文字、相違度と候補文字の文字種とを認識結果データ(例えば、相違度の小さい順に10個の候補文字を結果とする。)として候補格納手段80に格納する(ステップS120)。
ユーザーによって指定され、一時的に記憶した認識対象の文字種が特定の文字種であるかを判定する(ステップS130)。
特定の文字種と判定された場合に、ステップS140へ進み、特定の文字種と判定されなかった場合は、ステップS150へ進む。
1位の候補は相違度の最小の候補文字とし、2位以降の候補文字は予め定められた順序(例えば、文字コード順)に並び換え、ステップS160へ進む(ステップS140)。
1位以降の候補文字を相違度の小さい順に並び換え、ステップS160へ進む(ステップS150)。
この並び替えられた候補文字と元の入力画像とを対比させて、プリンタまたはディスプレイのような出力装置へ出力する。
例えば、元の入力画像のカーソル位置に対応する相違度が1位の候補文字を出力させ、ユーザーの要望により再設定された候補文字を順次または残りの候補を一度に出力させるようにして、対比する(ステップS160)。
他の認識文字について出力するものがあるかどうかをユーザーに指定させる。
まだ、表示させる文字があれば、それを出力させるために、入力画像の位置を指定し、それに対応する候補文字を候補格納手段80から取り出し、ステップS130へ戻り、出力の指示がなければ処理を終了する(ステップS170)。
このように、ユーザーが上位候補から下位候補へ向かって順に「9」を探していくよりも、すばやく正解を見つけることができる。
【0012】
<実施例の変形>
上記の実施例の文字認識装置は、認識文字種指示手段30で2種類以上または文字種を指定しないとき、複数の文字種の候補文字が候補格納手段80に結果として格納されることがある。このような場合、2位以降の候補文字の文字種が特定の文字種の時には、その特定の文字種に対しては文字コード順に並び替え、特定の文字種に該当しない文字種の候補文字に対しては、相違度の小さい順に並べ替えるように構成してもよい。
このように構成すると、候補文字が特定の文字種の場合は、特定の順序で上位候補から下位候補へ向かって並べられることにより、ユーザーが直感的にわかりやすい順序で出力されるので、すばやく正解を見つけることができる。
図6は、本実施例の文字認識装置の出力手段50の変形例の処理を説明するためのフローチャートである。
ユーザーによって指定され、一時的に記憶した認識対象の文字種が特定の文字種であるかを判定する(ステップS200)。
特定の文字種と判定された場合に、ステップS210へ進み、特定の文字種と判定されなかった場合は、ステップS220へ進む。
1位の候補は相違度の最小の候補文字とし、2位以降の候補文字で特定の文字種のものを予め定められた順序(例えば、文字コード順)に並び換え、ステップS220へ進む(ステップS210)。
上記ステップS210で処理された候補文字以外の候補文字のなかに特定の文字種以外の文字種を持つものがあるかを判定する(ステップS220)。
特定の文字種以外のものがあると判定された場合に、ステップS230へ進み、特定の文字種と判定されなかった場合は、ステップS240へ進む。
2位以降の候補文字で特定の文字種でないものに対して、相違度の小さい順に並び換え、ステップS240へ進む(ステップS230)。
ここで、相違度の順ではなく、文字コードの順としておいてもかまわない。
この並び替えられた候補文字と元の入力画像とを対比させて、プリンタまたはディスプレイのような出力装置へ出力する(ステップS240)。
【0013】
<実施例の他の変形>
上記の実施例の文字認識装置は、認識文字種指示手段30で2種類以上の認識対象文字種を指定したとき、または認識対象文字種を指定しないとき、複数の文字種の候補文字が候補格納手段80に結果として格納されることがある。このような場合、2位以降の候補文字を文字種でグループ化して、このグループの順序を特定の順序に再設定するように構成してもよい。
例えば、数字、英字、かな等の順序で、グループの中は文字コード順で並び替えて再設定する。
このようにグループ化して出力することにより、特定の文字種が「数字」でなくても、候補文字の文字種が「英字」、「ひらかな」や「カタカナ」であっても、「文字コード」の定義順、即ち、英字、ひらかなやカタカナの時には読み順と同じであり、漢字の時には部首や字角の順番で出力されるのでユーザーの感覚と一致し、正解を選択しやすくなる。
例えば、入力画像「1」に対して、図7(a)のように認識文字の候補が候補格納手段80に求められたとする。
候補順序再設定手段54は、候補格納手段80の出力対象の候補文字について文字種によりグループ化する。例えば、数字、英字、ひらかな、カタカナ、記号、漢字等のグループに分類する。この各グループ内で文字コード順に並び替えると、図7(b)のように並び替えられる。
最後に、この結果を入力画像と対比させて出力する。
【0014】
<コンピュータによる実施例>
さらに、本発明は上記の実施の形態のみに限定されたものではない。例えば、図1の文字認識装置は、図8に示したようなコンピュータ装置の構成によっても実現が可能である。
図8のコンピュータ装置は、入力装置1、出力装置2、CPU(Central Processing Unit;中央処理装置)3、メモリ4、記憶装置5、媒体駆動装置6およびを備え、それらはバス8により互いに接続されている。
入力装置1は、キーボード、マウス、タッチパネル、スキャナ等により構成され、テキストや画像の情報を入力するのに使用される。
出力装置2は、種々の出力情報や入力装置1からの入力された情報などを出力させるものであって、ディスプレイ装置やプリンタ装置である。
CPU3は、種々のプログラムを動作させる。
メモリ4は、プログラム自身を保持し、またそのプログラムがCPU3によって実行されるときに一時的に作成される情報等を保持する。
記憶装置5は、本発明の文字認識装置で扱う画像格納手段60、認識時辞書70、候補格納手段80およびプログラムやプログラム実行時の一時的な情報等を保持する。
媒体駆動装置6は、プログラムやデータ等を記憶した記録媒体を装着してそれらを読み込み、メモリ4または記憶装置5へ格納するのに用いられる。また、直接データの入出力やプログラム実行するのに使ってもよい。
【0015】
尚、記録媒体としては半導体媒体(例えば、ROM、ICメモリカード等)、光媒体(例えば、DVD、MO、MD、CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。
図1に示した文字認識装置を構成する各機能をそれぞれプログラム化し、予めCD−ROM等の記録媒体に書き込んでおき、このCD−ROMをCD−ROMドライブのような媒体駆動装置6を搭載したコンピュータに装着して、これらのプログラムをそれぞれのコンピュータ装置のメモリ4あるいは記憶装置5に格納し、それを実行することによって、上述した実施の形態と同様な機能を実現することができる。
また、ロードしたプログラムを実行することにより前述した実施の形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステム等が実際の処理の一部または全部を行い、その処理によって上述した実施の形態の機能が実現される場合も含まれる。
また、上述した実施の形態を実現するプログラムがROM等のような半導体の記録媒体である場合には、媒体駆動装置6からではなく、直接、メモリ4へロードして実行される。
さらに、上述した実施の形態の機能を実現するプログラムが、機能拡張ボードや機能拡張ユニットに備わるメモリにロードされ、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって、上述した実施の形態の機能が実現される場合も含まれる。
【0016】
<本発明のネットワーク環境での運用>
図9は、本発明をネットワーク接続して運用する形態の構成を示している。
例えば、ユーザーが画像を入力し、結果を出力する端末110と文字認識装置100とを用意する。
この場合、ユーザーの端末110および文字認識装置100は、図8に示した汎用のコンピュータ装置で構成され、ネットワーク9に接続するためのネットワーク接続装置7をそれぞれ備えるようにする。
また、このネットワーク9は、これらのユーザーの端末110と文字認識装置100とを結合するための伝送路であって、一般には、ケーブルで実現され、通信プロトコルにはTCP/IPが使われる。但し、伝送路としてはケーブルだけではなく、それらの間の通信プロトコルが一致するものであれば無線LANや放送波を使ったものであってもよい。
このように構成された、文字認識装置100には文字認識用のプログラム、認識辞書と途中結果を格納する記憶装置を用意し、ユーザーの端末110は、入力した画像を文字認識装置100へ送信し、その処理結果を受信し、出力するように構成する。
さらに、図10に示すようにユーザーの端末110と文字認識プログラムを保持するサーバー120とをネットワーク9で接続する。
ユーザーの端末110は、サーバー120から文字認識プログラムを受信して、画像を入力し、受信した文字認識プログラムを端末110に用意した認識辞書によって文字認識を実行させ、その実行結果を出力するようにする。
このようにすることで、文字認識プログラムが常に最新のものを使え、認識辞書はユーザー固有のものとすることができるという利点がある。
また、図10のようなサーバー120と端末110とをネットワークで接続し、サーバー120の磁気ディスク等の記憶装置に本発明の機能を実現するプログラムを格納しておき、ダウンロード等の形式で頒布することも可能である。
さらに、本発明の機能を実現するプログラムを放送波によって配布することで提供するようにしてもよい。
【0017】
【発明の効果】
以上説明したように、本発明によれば、状況に応じて、ユーザーが直感的にわかりやすい順序で候補文字を提示できるので、ユーザーが候補文字の中から正解をより早く探し出すことができる。
【図面の簡単な説明】
【図1】本発明の一実施例である文字認識装置の構成を示すブロック図である。
【図2】認識文字種を数字とした場合の上位10位までの認識結果を説明するための図である。
【図3】認識文字種を数字とした場合の表示順序を説明するための図である。
【図4】認識文字種を記号とした場合の候補順序を説明するための図である。
【図5】実施例の文字認識装置の処理を説明するためのフローチャートである。
【図6】実施例の出力手段の変形例の処理を説明するためのフローチャートである。
【図7】認識文字種を任意とした場合の候補順序を説明するための図である。
【図8】本発明の画像処理装置をコンピュータで実現するときのハードウェアの構成を示す図である。
【図9】本発明をネットワークで運用する形態の構成を示す図である。
【図10】本発明をネットワークで運用する他の形態の構成を示す図である。
【図11】認識文字種を数字とした場合の従来の表示順序を説明するための図である。
【符号の説明】
1 入力装置
2 出力装置
3 CPU
4 メモリ
5 記憶装置
6 媒体駆動装置
7 ネットワーク接続装置
8 バス
9 ネットワーク
10 制御手段
20 画像入力手段
30 認識文字種指示手段
40 文字認識手段
50 出力手段
52 判定手段
54 候補順序再設定手段
60 画像格納手段
70 認識辞書
80 候補格納手段
100 文字認識装置
110 端末
120 サーバー
[0001]
BACKGROUND OF THE INVENTION
  The present invention relates to a candidate character output device and a candidate character output method for character recognition processing results.,programandComputer readableThe present invention relates to a recording medium, and more particularly to an output order of candidate characters obtained by character recognition processing.
[0002]
[Prior art]
Conventional character recognition generally extracts features from an input image pattern, obtains the degree of difference from the standard feature of the recognition target character registered in the dictionary, and ranks the first candidate and the second place in descending order of difference. The candidates are ranked as... And the top candidates are output as recognition results.
In addition, in order to correct the ranking of these candidate characters, the idea is to place a character with a higher probability of correct answer at a higher rank, for example, as proposed in Japanese Patent Laid-Open No. 10-334190. After correcting the degree of difference using a feature having a large difference between characters, the characters are re-sorted by the degree of difference after correction.
As a result, even if the recognition result of the pattern having regularity is presented to the user, it is presented in the order of small difference. For example, as shown in FIG. 11 (a), the first candidate character may be correct, but as shown in FIG. 11 (b), the user is presented when the first candidate character is not correct. It is common to search for a correct answer from candidate characters and instruct the character to be the first candidate.
[0003]
[Problems to be solved by the invention]
However, since the conventional output order of the candidate characters is a display in which the output order is sorted in order of the degree of difference, it is far from the daily sense for the user, and can only be seen in random order.
Therefore, it takes much labor to search for a desired character from among the candidate characters arranged in a random manner.
The present invention is intended to solve such a problem, and provides a candidate character output device, a candidate character output method, and a recording medium in which a user can easily find a correct answer from candidate characters in character recognition processing. Objective.
[0004]
[Means for Solving the Problems]
  In order to solve the above problem, the invention of claim 1 recognizes characters for a character image on an input image, and outputs a recognition result candidate character, a character type of this candidate character, and a degree of difference. And an output means for outputting a character recognition result, wherein the output means determines whether or not the character type of the candidate character is a specific recognition target character type, and the character type of the candidate character is determined by the determination means. When it is determined as a specific recognition target character type, depending on the specific recognition target character typeThe first candidate is the candidate character with the smallest difference, and the second and subsequent candidates are other than the order based on the difference.In a predetermined orderThe candidate character to followCandidate order setting means for setting the order of output of candidate characters and setting the order of output of candidate characters in ascending order of difference when the determination means determines that the character type of the candidate character is not a specific recognition target character type. It is characterized by having.
TheFurthermore, the claims of the present invention2Comprises a recognized character type indicating means for indicating a character type to be recognized in the candidate character output device as described above, and the character recognizing means comprises:For character images on the input imageCharacter type specified by the recognized character type indicating meansCandidate charactersCharacterized by character recognition.
  Further, the claims of the present invention3In the candidate character output device as described above, when the candidate character of the recognition result includes a plurality of character types, means for executing setting of the output order of the candidate characters by the candidate order setting unit for each character type is provided. It is characterized by that.
[0005]
  Further claims of the present invention4Has a character recognition process for character recognition on a character image on an input image, and outputs a recognition result candidate character, a character type and a degree of difference of the candidate character, and an output step for outputting the character recognition result. The determining step determines whether the character type of the candidate character is a specific recognition target character type, and the determination step determines that the character type of the candidate character is a specific recognition target character type by the determination step. Depending on the character type to be recognizedThe first candidate is the candidate character with the smallest difference, and the second and subsequent candidates are other than the order based on the difference.In a predetermined orderThe candidate character to followIncluding a candidate order setting step of setting an output order and setting the output order of the candidate characters in ascending order of difference when the determination step determines that the character type of the candidate character is not a specific recognition target character type. Characterize.
AlsoAnd claims of the present invention5Includes a recognized character type indicating step of specifying a character type to be recognized in the candidate character output method as described above,For character images on the input imageCharacter type specified in the recognized character type indicating stepCandidate charactersIt includes a step of character recognition.
  furtherAnd claims of the present invention6Includes the step of executing setting of the output order of the candidate characters by the candidate order setting step for each character type when the candidate character of the recognition result includes a plurality of character types in the candidate character output method as described above. It is characterized by that.
  AlsoAnd claims of the present invention7Is a program for causing a computer to execute the steps of the candidate character output method as described above.
  furtherAnd claims of the present invention8Is a computer-readable recording medium on which the above program is recorded.
[0006]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the configuration and operation of the embodiment of the present invention will be described in detail with reference to the drawings.
<Example>
(1) Configuration
FIG. 1 is a block diagram showing a configuration of a character recognition apparatus according to an embodiment of the present invention.
The character recognition apparatus according to the embodiment includes a control means 10, an image input means 20, a recognized character type instruction means 30, a character recognition means 40, an output means 50, an image storage means 60, a recognition dictionary 70, and a candidate storage means 80. Yes.
The process control means 10 reads the image, performs character recognition of the image, and controls the entire process from outputting the recognition result.
The image input unit 20 reads an image to be subjected to character recognition processing by a device that inputs an image from a scanner, a file, or the like, and stores it in the image storage unit 60 as binary image data.
The recognized character type instruction means 30 allows the user to input the type of characters appearing in the input image (for example, a combination of “numeric characters”, “English letters”, “Hiragana”, “Katakana”, “Kanji”, etc.).
For example, various types of characters such as numbers, English letters, and kanji appear in newspapers and magazines, but only the kanji, hiragana, and katakana appear in the name of the delivery address. Moreover, in the case of a product code, there are many cases in which only numbers or only alphanumeric characters appear.
In this way, when the character type appearing in the image to be read is known in advance, the user designates the character type (hereinafter referred to as the recognition target character type), and searches for candidates only from the limited range of characters. Then, a good recognition rate can be obtained. (For example, if a number is designated as the character type to be recognized, it is possible to prevent a case where “1” is mistaken for “I”, “shi” or “no”.
The recognition target character type designated here is temporarily stored and used when the output means 50 outputs candidate characters.
[0007]
The character recognition means 40 cuts out individual character images from the image data of the image storage means 60, normalizes their sizes, extracts the feature quantities of the normalized character images, and extracts the feature quantities and the recognition dictionary 70. Are compared with each other to obtain a certain number of candidate characters in ascending order of the degree of difference as the probability of recognition, and the candidate character, the degree of difference and the character type of the candidate character are stored in the candidate storage means 80 as recognition result data.
The output unit 50 compares the recognition result data obtained in the candidate storage unit 80 (for example, information on 10 candidate characters in ascending order of dissimilarity) and the image in the image storage unit 60 to compare the data of the printer or the display. Output to such an output device.
The output unit 50 further includes a determination unit 52 and a candidate order resetting unit 54, and is predetermined according to the recognition target character type designated by the recognized character type designation unit 30 when outputting the candidate characters. Output in the same order.
First, the output unit 50 determines whether the recognition target character type temporarily stored by the recognized character type instruction unit 30 by the determination unit 52 is a specific character type. When this determination determines that the character type is a specific recognition target character type, the candidate order resetting unit 54 rearranges the plurality of candidate characters in a predetermined order. The candidate order resetting means 54 sets the candidate character with the smallest difference to the first candidate, and rearranges candidates with the second or lower difference in a predetermined order.
Finally, the output means 50 outputs the rearranged candidate characters and the original input image by comparing them. For example, the candidate character with the highest degree of difference corresponding to the cursor position of the original input image is output, and the candidate characters reset according to the user's request are output sequentially or the remaining candidates are output at the same time. Let
Here, when the specific character type to be recognized is “numeric” and the predetermined order is “character code order”, it is output in the same order as the numerical values. It becomes easy to select.
Further, when the determination unit 52 determines that the character type is not a specific recognition target character type, the candidate character having the second or lower dissimilarity may be reset as “in order of decreasing dissimilarity”.
[0008]
The image storage unit 60 is a storage unit (for example, a storage device such as a magnetic disk) that stores an input image. This image is an image to be recognized by the character recognition unit 40, and is used when the recognition result is corrected by comparing with the recognition result in the output unit 50.
The recognition dictionary 70 is used in the character recognition means 40, and calculates standard feature patterns, character codes, character types (numbers, English characters, hiragana, katakana, symbols, kanji, etc.), and dissimilarities for each character to be recognized. For storing information and the like.
The candidate storage unit 80 stores the coordinate information on the image to be recognized and the next information as the recognition result of the image for all the character images to be recognized (FIGS. 2, 4). 7).
For this one character image, a predetermined number (for example, 10) having a small difference is held, and at least information on the character code, the difference, and the character type is held for this one candidate character. Yes.
[0009]
In such a configuration, the character recognition device of the embodiment operates as follows.
The processing control unit 10 calls the original image input unit 20 to input an image to be processed, such as a document designated by the user, using an apparatus for inputting an image such as a scanner or a file, and the input image remains as it is. It is stored in the image storage means 60.
Next, the control unit 10 calls the recognized character type instruction unit 30 in response to a request that the user wants to set the character type to be recognized. When the user does not set the character type to be recognized here, all the character types are to be recognized.
The recognized character type instructing means 30 causes the user to input the type of character that appears in the area to be recognized in the input image.
The recognition target character type designated here is temporarily stored and used when the output means 50 outputs candidate characters.
Next, the control means 10 calls the character recognition means 40.
The character recognition means 40 cuts out individual character images from the image data of the image storage means 60, normalizes their sizes, extracts the feature quantities of the normalized character images, and extracts the feature quantities and the recognition dictionary 70. Are compared, and a certain number of candidate characters are obtained in ascending order of the degree of difference as the probability of recognition, and the candidate character, the degree of difference and the character type of the candidate character are stored in the candidate storage means 80 as recognition result data. .
Finally, the control means 10 calls the output means 50.
The output unit 50 compares the recognition result data obtained in the candidate storage unit 80 (for example, information on 10 candidate characters in ascending order of dissimilarity) and the image in the image storage unit 60 to compare the data of the printer or the display. Output to such an output device.
First, the output unit 50 determines whether the recognition target character type temporarily stored by the recognized character type instruction unit 30 is a specific character type by the determination unit 52, and outputs a plurality of items in a predetermined order by the candidate order resetting unit 54. Sort the candidate characters.
The candidate order resetting means 54 sets the candidate character with the smallest difference to the first candidate, and rearranges the candidates with the second or lower difference in a predetermined order.
Finally, the output means 50 outputs the rearranged candidate characters and the original input image by comparing them. For example, the candidate character with the highest degree of difference corresponding to the cursor position of the original input image is output, and the candidate characters reset according to the user's request are output sequentially or the remaining candidates are output at the same time. Let
[0010]
For example, when the character type to be recognized is designated as “numeric” by the recognized character type instruction unit 30, it is assumed that candidate characters as shown in FIG. 2 are obtained and stored in the candidate storage unit 80.
Further, if the specific character type is “number” and the predetermined order is “character code order”, the determination unit 52 determines that the recognition target character type is the specific character type, so the candidate order resetting unit 54 The first candidate character “7” is left as it is, and the second and lower candidates are reset to a predetermined order (character code (for example, JIS code) order).
As a result, as shown in FIG. 3, the second and lower candidates are arranged in the order of “01245689”, and the first candidate and the input image are output together.
The user compares the first candidate at the top of the line with the input image, and if the result is correct as shown in FIG.
However, if it is an error as shown in FIG. 3B, it is corrected, but since it is clear that the candidate characters are arranged in the order of 0 to 9, it is easy to find the correct answer “9”.
In this way, it is possible to find the correct answer more quickly than when the user searches for “9” in order from the upper candidate to the lower candidate.
Further, when it is determined by the determination means 52 that the character type is not a specific recognition target character type, the candidate character having the second or lower dissimilarity is reset as “in order of decreasing dissimilarity”.
For example, when the recognition target character type is “symbol”, the candidate character shown in FIG. 4 is obtained. In this case, since the character type is not a specific recognition target character type (“number”), the candidate characters are presented to the user in the order of difference.
Here, if the second and lower candidates are re-sorted in order of JIS code, the candidate character sequence will be “x? / + = <>% ##” in order from the first, but it is easy for the user to find the correct answer. Since it does not seem that the clues have increased, it is thought that there is no difference even if presented in order of difference.
With the above configuration, when the candidate character of the recognition result is output, the user can present it in an intuitive and easy-to-understand order according to the situation, so the user searches for the correct answer from the candidate character earlier. Therefore, less effort is required to edit the recognition result.
[0011]
(2) Process flow
FIG. 5 is a flowchart for explaining the flow of processing of the character recognition apparatus of this embodiment.
A device for inputting an image such as a scanner or a file is read as an image (multi-valued image or binary image) that is a character recognition target designated by the user, and the image is stored in the image storage means 60 (step S100).
When the user sets the character type to be recognized, this is selected from a menu or the like.
At this time, the user inputs the type of character appearing in the area to be recognized of the input image from a menu, a dialog, or the like. When the user does not set the character type to be recognized here, all the character types are to be recognized.
The character type to be recognized designated here is temporarily stored and used when the output means 50 outputs candidate characters (step S110).
Next, character recognition is performed on the image data in the image storage means 60.
Each character image is cut out from this image, the size is normalized, the feature amount of the normalized character image is extracted, the feature amount is compared with the recognition dictionary 70, and the probability of recognition is determined. A certain number of candidate characters are obtained in ascending order of the degree of dissimilarity, and the candidate character, the degree of dissimilarity and the character type of the candidate character are recognized as result data (for example, 10 candidate characters are taken as the result in the order of decreasing dissimilarity) Is stored in the candidate storage means 80 (step S120).
It is determined whether the character type to be recognized designated by the user and temporarily stored is a specific character type (step S130).
If the character type is determined to be a specific character type, the process proceeds to step S140. If the character type is not determined to be a specific character type, the process proceeds to step S150.
The first candidate is the candidate character with the smallest degree of difference, and the second and subsequent candidate characters are rearranged in a predetermined order (eg, character code order), and the process proceeds to step S160 (step S140).
The first and subsequent candidate characters are rearranged in ascending order of dissimilarity, and the process proceeds to step S160 (step S150).
The rearranged candidate characters and the original input image are compared and output to an output device such as a printer or a display.
For example, the candidate character with the highest degree of difference corresponding to the cursor position of the original input image is output, and the candidate characters reset according to the user's request are output sequentially or the remaining candidates are output at the same time. (Step S160).
Lets the user specify whether there is output for other recognized characters.
If there is still a character to be displayed, in order to output it, the position of the input image is designated, the corresponding candidate character is taken out from the candidate storage means 80, the process returns to step S130, and if there is no output instruction, the process is performed. The process ends (step S170).
In this way, it is possible to find the correct answer more quickly than when the user searches for “9” in order from the upper candidate to the lower candidate.
[0012]
<Modification of Example>
In the character recognition device of the above embodiment, when two or more types or character types are not designated by the recognized character type instruction unit 30, candidate characters of a plurality of character types may be stored in the candidate storage unit 80 as a result. In such a case, when the character type of the candidate character after the second place is a specific character type, the character type is rearranged in the order of the character code for the specific character type, and the candidate character of the character type not corresponding to the specific character type is different. You may comprise so that it may rearrange in order with a small degree.
With this configuration, when a candidate character is a specific character type, the correct characters are output in an order that is intuitively understandable by the user by arranging them in a specific order from the high-order candidate to the low-order candidate. be able to.
FIG. 6 is a flowchart for explaining the processing of a modification of the output means 50 of the character recognition device of this embodiment.
It is determined whether the character type to be recognized designated by the user and temporarily stored is a specific character type (step S200).
If the character type is determined to be a specific character type, the process proceeds to step S210. If the character type is not determined, the process proceeds to step S220.
The first candidate is the candidate character with the smallest difference, and the second and subsequent candidate characters are rearranged in a predetermined order (eg, character code order), and the process proceeds to step S220 (step S210). ).
It is determined whether there is a character type other than the specific character type among candidate characters other than the candidate character processed in step S210 (step S220).
If it is determined that there is something other than the specific character type, the process proceeds to step S230. If it is not determined that the character type is specific, the process proceeds to step S240.
The candidate characters in the second and subsequent positions that are not specific character types are rearranged in the order of decreasing dissimilarity, and the process proceeds to step S240 (step S230).
Here, the order of character codes may be used instead of the order of differences.
The rearranged candidate characters and the original input image are compared and output to an output device such as a printer or a display (step S240).
[0013]
<Other variations of the embodiment>
In the character recognition device of the above embodiment, when two or more recognition target character types are specified by the recognized character type instruction means 30, or when no recognition target character types are specified, candidate characters of a plurality of character types are returned to the candidate storage means 80 as a result. May be stored as In such a case, the second and subsequent candidate characters may be grouped by character type, and the group order may be reset to a specific order.
For example, the groups are rearranged in the order of character codes in the order of numbers, alphabetic characters, kana, etc., and reset.
By grouping and outputting in this way, even if the specific character type is not “numeric”, even if the candidate character type is “English”, “Hirakana” or “Katakana”, the “character code” In the order of definition, that is, in the case of English letters, hiragana and katakana, it is the same as the reading order.
For example, it is assumed that a candidate for a recognized character is obtained from the candidate storage unit 80 as shown in FIG.
The candidate order resetting unit 54 groups candidate characters to be output from the candidate storage unit 80 according to character type. For example, it is classified into groups such as numbers, English letters, hiragana, katakana, symbols, and kanji. When rearranged in the order of the character codes within each group, rearrangement is performed as shown in FIG.
Finally, this result is output in comparison with the input image.
[0014]
<Example by computer>
Furthermore, the present invention is not limited only to the above-described embodiment. For example, the character recognition device of FIG. 1 can be realized by the configuration of a computer device as shown in FIG.
8 includes an input device 1, an output device 2, a CPU (Central Processing Unit) 3, a memory 4, a storage device 5, and a medium driving device 6, which are connected to each other by a bus 8. ing.
The input device 1 includes a keyboard, a mouse, a touch panel, a scanner, and the like, and is used to input text and image information.
The output device 2 outputs various output information and information input from the input device 1 and is a display device or a printer device.
The CPU 3 operates various programs.
The memory 4 holds the program itself, and holds information that is temporarily created when the program is executed by the CPU 3.
The storage device 5 holds an image storage unit 60, a recognition dictionary 70, a candidate storage unit 80, temporary information at the time of program execution, and the like that are handled by the character recognition device of the present invention.
The medium driving device 6 is used to load a recording medium storing programs, data, and the like, read them, and store them in the memory 4 or the storage device 5. It may also be used for direct data input / output and program execution.
[0015]
As a recording medium, any of a semiconductor medium (for example, ROM, IC memory card, etc.), an optical medium (for example, DVD, MO, MD, CD-R, etc.), and a magnetic medium (for example, magnetic tape, flexible disk, etc.) It may be.
Each function constituting the character recognition device shown in FIG. 1 is programmed and written in a recording medium such as a CD-ROM in advance, and this CD-ROM is equipped with a medium driving device 6 such as a CD-ROM drive. A function similar to that of the above-described embodiment can be realized by mounting the program on the computer, storing these programs in the memory 4 or the storage device 5 of each computer device, and executing them.
Moreover, not only the functions of the above-described embodiments are realized by executing the loaded program, but the operating system or the like performs part or all of the actual processing based on the instructions of the program, The case where the functions of the above-described embodiment are realized is also included.
When the program for realizing the above-described embodiment is a semiconductor recording medium such as a ROM, the program is loaded directly into the memory 4 and executed instead of from the medium driving device 6.
Furthermore, a program for realizing the functions of the above-described embodiment is loaded into a memory provided in the function expansion board or function expansion unit, and the CPU provided in the function expansion board or function expansion unit is actually installed based on the instructions of the program. This includes the case where the functions of the above-described embodiment are realized by performing part or all of the process.
[0016]
<Operation in Network Environment of the Present Invention>
FIG. 9 shows a configuration of a mode in which the present invention is operated by connecting to a network.
For example, a terminal 110 and a character recognition device 100 are prepared for the user to input an image and output the result.
In this case, the user terminal 110 and the character recognition device 100 are configured by the general-purpose computer device shown in FIG. 8, and each includes a network connection device 7 for connecting to the network 9.
The network 9 is a transmission path for connecting the user terminal 110 and the character recognition device 100, and is generally realized by a cable, and TCP / IP is used as a communication protocol. However, the transmission path is not limited to a cable, but may be a wireless LAN or a broadcast wave as long as the communication protocol between them matches.
The character recognition apparatus 100 configured as described above is provided with a character recognition program, a recognition dictionary, and a storage device for storing intermediate results, and the user terminal 110 transmits the input image to the character recognition apparatus 100. The processing result is received and output.
Further, as shown in FIG. 10, a user terminal 110 and a server 120 holding a character recognition program are connected via a network 9.
The user terminal 110 receives a character recognition program from the server 120, inputs an image, causes the received character recognition program to execute character recognition using a recognition dictionary prepared in the terminal 110, and outputs the execution result. To do.
This has the advantage that the latest character recognition program can be used and the recognition dictionary can be user-specific.
Further, the server 120 and the terminal 110 as shown in FIG. 10 are connected via a network, a program for realizing the functions of the present invention is stored in a storage device such as a magnetic disk of the server 120, and distributed in the form of download or the like. It is also possible.
Furthermore, a program that implements the functions of the present invention may be provided by distributing it via broadcast waves.
[0017]
【The invention's effect】
As described above, according to the present invention, candidate characters can be presented in an order that is intuitively understandable by the user according to the situation, so that the user can find a correct answer earlier from the candidate characters.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a character recognition apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram for explaining recognition results up to the top 10 when a recognized character type is a number;
FIG. 3 is a diagram for explaining a display order when a recognized character type is a number.
FIG. 4 is a diagram for explaining a candidate order when a recognized character type is a symbol.
FIG. 5 is a flowchart for explaining processing of the character recognition device according to the embodiment.
FIG. 6 is a flowchart for explaining processing of a modified example of the output means of the embodiment.
FIG. 7 is a diagram for explaining a candidate order when a recognized character type is arbitrary;
FIG. 8 is a diagram illustrating a hardware configuration when the image processing apparatus of the present invention is realized by a computer.
FIG. 9 is a diagram showing a configuration of a mode in which the present invention is operated on a network.
FIG. 10 is a diagram showing a configuration of another embodiment in which the present invention is operated in a network.
FIG. 11 is a diagram for explaining a conventional display order when a recognized character type is a number.
[Explanation of symbols]
1 Input device
2 Output device
3 CPU
4 memory
5 storage devices
6 Medium drive device
7 Network connection device
8 Bus
9 Network
10 Control means
20 Image input means
30 Recognized character type indication means
40 character recognition means
50 Output means
52 judgment means
54 Candidate order resetting means
60 Image storage means
70 recognition dictionary
80 Candidate storage means
100 character recognition device
110 terminals
120 servers

Claims (8)

入力画像上の文字画像に対して文字認識し、認識結果の候補文字、この候補文字の文字種および相違度とを出力する文字認識手段と、
文字認識結果を出力する出力手段とを備え、
前記出力手段は、前記候補文字の文字種が特定の認識対象文字種か否かを判定する判定手段と、前記判定手段によって前記候補文字の文字種が特定の認識対象文字種と判定された場合、前記特定の認識対象文字種に応じて1位の候補は相違度最小の候補文字にし、2位以降の候補は相違度に基づく順序以外の予め定められた順序に従う候補文字にした出力順序を設定し、前記判定手段によって前記候補文字の文字種が特定の認識対象文字種ではないと判定された場合、相違度の小さい順に候補文字の出力順序を設定する候補順序設定手段を有することを特徴とする候補文字出力装置。
Character recognition means for character recognition on the character image on the input image, and outputting the candidate character of the recognition result, the character type and the degree of difference of the candidate character,
Output means for outputting a character recognition result,
The output unit determines whether or not the character type of the candidate character is a specific recognition target character type, and when the determination unit determines that the character type of the candidate character is a specific recognition target character type, the specific unit In accordance with the character type to be recognized, the first candidate is set as the candidate character with the smallest difference, the second and subsequent candidates are set as the candidate characters according to a predetermined order other than the order based on the difference , and the output order is set. A candidate character output device comprising candidate order setting means for setting the output order of candidate characters in ascending order of difference when it is determined by the determining means that the character type of the candidate character is not a specific recognition target character type .
請求項に記載された候補文字出力装置において、
認識対象の文字種を指示する認識文字種指示手段を備え、
前記文字認識手段は、入力画像上の文字画像に対して前記認識文字種指示手段で指示された文字種の候補文字を文字認識するようにしたことを特徴とする候補文字出力装置。
In the candidate character output device according to claim 1 ,
Recognized character type indicating means for specifying the character type to be recognized,
The candidate character output device, wherein the character recognizing unit recognizes a character of a character type designated by the recognized character type indicating unit with respect to a character image on an input image .
請求項1又は2に記載された候補文字出力装置において、
前記認識結果の候補文字が複数の文字種を含む場合に、各文字種について前記候補順序設定手段による前記候補文字の出力順序の設定を実行する手段を設けたことを特徴とする候補文字出力装置。
In the candidate character output device according to claim 1 or 2 ,
A candidate character output device comprising: means for setting the output order of the candidate characters by the candidate order setting means for each character type when the recognition result candidate character includes a plurality of character types.
入力画像上の文字画像に対して文字認識し、認識結果の候補文字、この候補文字の文字種および相違度とを出力する文字認識工程と、文字認識結果を出力する出力工程とを有し、
前記出力工程は、前記候補文字の文字種が特定の認識対象文字種か否かを判定する判定工程と、前記判定工程によって前記候補文字の文字種が特定の認識対象文字種と判定された場合、前記特定の認識対象文字種に応じて1位の候補は相違度最小の候補文字にし、2位以降の候補は相違度に基づく順序以外の予め定められた順序に従う候補文字にした出力順序を設定し、前記判定工程によって前記候補文字の文字種が特定の認識対象文字種ではないと判定された場合、相違度の小さい順に候補文字の出力順序を設定する候補順序設定工程を含むことを特徴とする候補文字出力方法。
Character recognition for a character image on the input image, and a character recognition step for outputting the recognition result candidate character, the character type and the degree of difference of the candidate character, and an output step for outputting the character recognition result,
The output step includes a determination step of determining whether or not the character type of the candidate character is a specific recognition target character type, and when the determination step determines that the character type of the candidate character is a specific recognition target character type, In accordance with the character type to be recognized, the first candidate is set as the candidate character with the smallest difference, the second and subsequent candidates are set as the candidate characters according to a predetermined order other than the order based on the difference , and the output order is set. A candidate character output method comprising a candidate order setting step of setting an output order of candidate characters in ascending order of difference when it is determined by the determining step that the character type of the candidate character is not a specific recognition target character type .
請求項に記載された候補文字出力方法において、
認識対象の文字種を指示する認識文字種指示工程を含み、前記文字認識工程は、入力画像上の文字画像に対して前記認識文字種指示工程で指示された文字種の候補文字を文字認識する工程を含むことを特徴とする候補文字出力方法。
In the candidate character output method according to claim 4 ,
A recognition character type indicating step of indicating a character type to be recognized, wherein the character recognition step includes a step of character recognition of the character candidate characters specified in the recognized character type indicating step with respect to the character image on the input image. A candidate character output method characterized by
請求項4又は5に記載された候補文字出力方法において、
前記認識結果の候補文字が複数の文字種を含む場合に、各文字種について前記候補順序設定工程による前記候補文字の出力順序の設定を実行する工程を含むことを特徴とする候補文字出力方法。
In the candidate character output method according to claim 4 or 5 ,
When the candidate character of the recognition result includes a plurality of character types, the candidate character output method includes a step of setting the output order of the candidate characters by the candidate order setting step for each character type.
コンピュータに、請求項乃至のいずれか一項に記載の候補文字出力方法の工程を実行させるためのプログラム。The program for making a computer perform the process of the candidate character output method as described in any one of Claims 4 thru | or 6 . 請求項に記載されたプログラムを記録したコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium on which the program according to claim 7 is recorded.
JP2001075108A 2001-03-15 2001-03-15 Candidate character output device, candidate character output method, program, and computer-readable recording medium Expired - Fee Related JP4791641B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001075108A JP4791641B2 (en) 2001-03-15 2001-03-15 Candidate character output device, candidate character output method, program, and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001075108A JP4791641B2 (en) 2001-03-15 2001-03-15 Candidate character output device, candidate character output method, program, and computer-readable recording medium

Publications (2)

Publication Number Publication Date
JP2002279342A JP2002279342A (en) 2002-09-27
JP4791641B2 true JP4791641B2 (en) 2011-10-12

Family

ID=18932237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001075108A Expired - Fee Related JP4791641B2 (en) 2001-03-15 2001-03-15 Candidate character output device, candidate character output method, program, and computer-readable recording medium

Country Status (1)

Country Link
JP (1) JP4791641B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6011214B2 (en) * 2012-09-28 2016-10-19 オムロン株式会社 Image processing system and image processing method
JP6102156B2 (en) * 2012-09-28 2017-03-29 オムロン株式会社 Image processing system and image processing method
US10929970B2 (en) * 2018-01-22 2021-02-23 Panasonic Intellectual Property Management Co., Ltd. Component mounting system and trace data acquisition method

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62214486A (en) * 1986-03-17 1987-09-21 Sanyo Electric Co Ltd Character recognizing device
JP3202852B2 (en) * 1993-12-21 2001-08-27 松下電器産業株式会社 Handwritten character recognition device
JP3457376B2 (en) * 1994-02-28 2003-10-14 沖電気工業株式会社 Character correction method in optical reader
JPH07261918A (en) * 1994-03-18 1995-10-13 Pfu Ltd Information input device and handwritten character processing method
JPH10124616A (en) * 1996-10-18 1998-05-15 Brother Ind Ltd Character recognition device
JP3361956B2 (en) * 1997-04-18 2003-01-07 シャープ株式会社 Character recognition processor
JP3452774B2 (en) * 1997-10-16 2003-09-29 富士通株式会社 Character recognition method

Also Published As

Publication number Publication date
JP2002279342A (en) 2002-09-27

Similar Documents

Publication Publication Date Title
US20040095327A1 (en) Alphanumeric data input system and method
US9501297B2 (en) Launching a target application based on characteristics of a string of characters in a source application
JPH0991424A (en) Search device and method
JP6219935B2 (en) Method, controller and apparatus for composing words
CN113127125A (en) Page automatic adaptation method, device, equipment and storage medium
JPH08305821A (en) Data processing method and apparatus
KR101130206B1 (en) Method, apparatus and computer program product for providing an input order independent character input mechanism
US4787059A (en) System for effective spell check in word processing with relocated starting location
US20160269586A1 (en) System, control method, and recording medium
JP4791641B2 (en) Candidate character output device, candidate character output method, program, and computer-readable recording medium
JPWO2000036530A1 (en) Search method, search device, and recording medium
WO2000036530A1 (en) Searching method, searching device, and recorded medium
JP4299977B2 (en) Recognition result correcting apparatus, recognition result correcting method, and recording medium
JP4245820B2 (en) Character recognition device, character recognition method, and recording medium
JP3979288B2 (en) Document search apparatus and document search program
EP2813954A1 (en) Information search apparatus and information search method
US20230334243A1 (en) Document Processing Method And Information Processing Device
JP4490937B2 (en) Input correction method and input correction support system
JP2021196686A (en) Information processing device and information processing method
JP3737269B2 (en) Help processing device
JP2020027453A (en) Facility name search device, facility name search method, and computer program
JP2002099555A (en) Document classification device and document classification method
JP4261831B2 (en) Character recognition processing method, character recognition processing device, character recognition program
JPH0991311A (en) Information storage and retrieval device and control method thereof
JPH08221416A (en) Error checking device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080306

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110719

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110722

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140729

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees