【0001】
【発明の属する技術分野】
本発明は、印刷媒体に記載された活字情報を、パーソナルコンピュータなどで再利用できるよう、自動的に電子データに変換することに関するものであり、特に印刷媒体に記載された活字情報を光学機器を用いて読み込み、電子データとして再利用するのに好適な、データの処理方法に関する。
【0002】
【従来技術】
ユーザが、印刷媒体に記載された活字情報を電子データとして、パーソナルコンピュータなどで再利用しようとした場合、活字情報を一つ一つ、キーボードとマウスで入力しなければならず、印刷媒体に記載された活字情報を一括して入力することはできなかった。
【0003】
【発明が解決しようとする課題】
印刷媒体に記載された活字情報を一括して入力し、入力された活字情報をパーソナルコンピュータなどで利用できる電子データの形式に変換する。
【0004】
【課題を解決するための手段】
上記課題を解決するため、本発明の請求項1に記載の様態によれば、ユーザが、光学機器を用いて活字情報を読込み、電子データに変換して利用する際、正常と判断された入力済みのデータをもとに、変換した電子データの変換誤りを判定し修正するデータ処理の方法が提供される。
本発明の請求項2に記載の様態によれば、正常と判断された入力済みのデータと変換した電子データの類似性を評価する関数を設定し、この関数をもとに、変換したデータに誤りがあるかどうかを判定し、修正するデータ処理の方法が提供される。
本発明の請求項3に記載の様態によれば、変換誤りと判定された電子データの修正候補が、複数存在するとき、または存在しないとき、この内容をデータ処理装置上に表示し、これを見てユーザが修正するデータの処理方法が提供される。
本発明の請求項4に記載の様態によれば、活字情報の記載形式から当該情報の管理元をもとめるデータの処理方法が提供される。
本発明の請求項5に記載の様態によれば、医療関連の処方箋に記載された活字情報を、データ処理装置で利用可能な電子データに変換するデータの処理方法が提供される。
本発明の請求項6に記載の様態によれば、変換誤りと判定された画像データとユーザ自身が修正したデータとを関連付けて蓄積し、この蓄積されたデータをもとに変換誤りと判定された画像データを修正するデータの処理方法が提供される。
【0005】
【発明の実施の形態】
以下、図を参照して、医療関係の処方箋の読込みに本発明のデータ処理の方法を適用した例を用いて、実施形態について説明する。
まず、図1は、本発明を適用したデータ処理システムの構成を示す。ここで、ユーザは、処方箋の活字情報を読込むための光学機器として、スキャナー使用し、接続しているPC(パーソナルコンピュータ)で、読込んだ画像データを解析し、活字情報をPCが使用するWORD、EXCELおよび診療報酬計算などのアプリケーションが認識できる形式の電子データに変換する。
図2は、図1の構成のデータ処理システムのソフト機能を示す。
スキャナーの画像読込み機能により読込まれた画像データは、スキャナーと接続しているパーソナルコンピュータに、画像転送機能により画像データとして転送する。画像解析機能は、画像受付機能が受け取った活字情報の画像データを、アプリケーションが認識できる形式の活字データに変換する。
活字情報を活字データに変換する場合、特に読込んだ漢字の画像認識が難しく、読込み誤りが生じやすい。変換判定用データベースには、処方箋の正しい形式で記載された電子データが、格納されており、読込まれた電子データの誤り判定と修正に利用される。
処方箋は、記載形式が定められており、この形式に従って活字情報が入力される。図3は、処方箋の記載例を示している。この処方箋は、氏名、薬名、服用方法などをどこに記載するかの事前に定められている。この記載形式をもとに、変換された電子データの画像認識誤りを判定することができる。
図4は、本発明を適用した、処方箋の活字認識の実施例を示す。この実施例において、氏名の欄の活字情報が、画像解析の結果、山田あ郎と認識されたとする。判定用データベースの氏名を検索し、同じ文字数で少なくとも1文字以上一致するものを列挙すると、山田太郎、山田次郎、山川三郎が取り出されたとする。ここで、文字列類似性を示す評価関数として、比較する2組の文字列に対して、同じ位置の1文字が一致すると1とし、同じ位置の連続する2文字が一致する場合、40とし、この値をすべて合計したものを、評価関数の値と定める。この設定の方法により、山田あ郎と山田太郎の評価関数の値は、43となり、山田次郎に対しては43、山川三郎に対しては2となる。
この結果、山田あ郎と一致するものが、判定用データベースに存在しないため、画像認識誤り判定機能は、画像認識誤りと判定する。そして山田太郎と山田次郎が、評価関数の値が大きく同じであるため、山田あ郎の修正候補と判断する。
修正候補が、2組存在するため、PCは、自動修正せず、画像認識誤り表示修正入力機能により、この2組のデータをPC上に表示する。
ユーザは、処方箋の名前の欄の活字情報と表示された、山田太郎、山田次郎を比較し、処方箋の名前の欄の活字情報が山田太郎と読めるのであれば、山田太郎を選択し入力する。このようにして、山あ太郎が山田太郎に修正される。
さらに、氏名に生年月日を組み合わせて評価関数を設定すれば、生年月日こみで、山田太郎、山田次郎のどちらが、山田あ郎に近いか評価することができる。この生年月日を組み合わせた評価関数を用いることで、山田太郎の値が、山田次郎の値よりも大きくなったとすると、山田あ郎の修正候補は、山田太郎のひとつだけにしぼることができる。
ここで、評価関数の値に対して、自動修正の閾値を設定し、この閾値よりも大きければ、画像認識誤り自動修正機能が、山田あ郎を山田太郎に自動修正し、この閾値よりも小さければ画像認識誤り表示修正入力機能により、このデータをPC上に表示するものとする。
また、このようにユーザが、PCから入力したデータは、変換判定用データ蓄積機能により、変換誤りと判定された活字データ、画像データおよびユーザ自身が修正した活字データとを関連付けて変換判定用データベースに登録する。従って、別の活字情報を読込んで、また山田太郎の画像データが入力されたとき、変換判定用データベースに登録された情報を検索し、今度は、ユーザの手を借りずに山田太郎と認識することができる。
なお、山田あ郎と再度認識された場合も、山田太郎と修正することができる。
図3に示すように、処方箋には氏名、薬名、服用方法などをどこに記載するか、事前に定められ、記載枠などのも、管理もとの病院により、記載形式が定められている。
図5は、処方箋の記載枠に注目し、処方箋A処方箋Bそれぞれ、記載枠縦軸に対して横軸方向の画素数の分布を表示したものである。処方箋A処方箋Bそれぞれ、記載枠が異なれば画素数の分布も異なる。
処方箋に対して複数の管理元が存在した場合、この複数の管理元の処方線の記載枠の画素数の分布を、あらかじめ取得して格納しておき、新しい処方線が、入力されたとき、この新しい処方箋の記載枠の画素数の分布を計測し、あらかじめ取得しておいた記載枠の画素数の分布の一番近いものを検索し、この管理元をこの新しい処方線の管理元として識別することができる。
【0006】
【発明の効果】
本発明は、以上に説明した構成により次のような効果を奏する。
請求項1に記載されている発明は、既にデータ処理装置に正常に入力されたデータを利用して、画像認識誤りと判定したデータを修正するため、読込んで変換した電子データの誤りを小さくできる効果が得られる。
請求項2に記載されている発明は、読込んで変換したデータの文字列と、各判定用データの文字列の類似性を評価する関数を設定しているため、変換したデータの誤りを数値で評価しPC上で自動的に修正できる効果が得られる。
請求項3に記載されている発明は、画像認識誤りと判定したデータと修正の候補となるデータを、PCに表示するため、ユーザが修正する際の参考となり、ユーザの修正を支援する効果が得られる。また、ユーザが修正したデータは、正常に入力されたデータとして追加蓄積するため、画像認識誤りの判定と修正の精度を向上させる効果が得られる。
請求項4に記載されている発明は、活字情報の記載形式から当該情報の管理元をもとめるため、情報の管理元を記載する必要がないという効果が得られる。
請求項5に記載されている発明は、医療関連の処方箋に記載された情報を活字データに変換し利用することができる。
請求項6に記載されている発明は、読込み誤りと判定された画像データと修正後のデータの組を蓄積して、読込み誤りの判定と修正に利用するため、画像認識誤りの判定と修正の精度が向上する効果が得られる。
【0007】
【図面の簡単な説明】
【図1】本発名を適用したデータ処理システムの構成を示す説明図である。
【図2】本発明を適用したデータ処理システムのソフト機能を説明する各部のブロック図である。
【図3】処方線の記載形式を示す説明図である。
【図4】処方線の活字情報の認識についての説明図である。
【図5】処方線の管理元の識別方法についての説明図である。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to automatically converting type information written on a print medium into electronic data so that the type information can be reused by a personal computer or the like. The present invention relates to a data processing method suitable for reading using and reusing as electronic data.
[0002]
[Prior art]
When a user tries to reuse type information written on a print medium as electronic data on a personal computer or the like, the type information must be input one by one with a keyboard and a mouse, and the type information is written on the print medium. It was not possible to input the type information at once.
[0003]
[Problems to be solved by the invention]
Type information written on a print medium is collectively input, and the input type information is converted into an electronic data format usable by a personal computer or the like.
[0004]
[Means for Solving the Problems]
According to an aspect of the present invention, there is provided an image processing apparatus comprising: a user that reads type information using an optical device, converts the type information into electronic data, and uses the type information; A data processing method is provided for determining and correcting a conversion error of converted electronic data based on already-converted data.
According to the second aspect of the present invention, a function for evaluating the similarity between the input data determined to be normal and the converted electronic data is set, and the converted data is set based on this function. A method of data processing for determining whether there is an error and correcting the error is provided.
According to the aspect of the present invention, when a plurality of correction candidates of electronic data determined to be conversion errors exist or do not exist, the contents are displayed on the data processing device, and the contents are displayed. A method for processing data to be viewed and modified by a user is provided.
According to the fourth aspect of the present invention, there is provided a data processing method for obtaining a management source of the type information from a description format of the type information.
According to the fifth aspect of the present invention, there is provided a data processing method for converting type information described in a medical prescription into electronic data usable by a data processing device.
According to the aspect of the present invention, the image data determined to be a conversion error and the data corrected by the user are stored in association with each other, and the conversion data is determined to be a conversion error based on the stored data. And a data processing method for modifying the image data.
[0005]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, with reference to the drawings, an embodiment will be described using an example in which the data processing method of the present invention is applied to reading a medical prescription.
First, FIG. 1 shows a configuration of a data processing system to which the present invention is applied. Here, the user uses a scanner as an optical device for reading the type information of the prescription, analyzes the read image data with a connected PC (personal computer), and uses a WORD, The data is converted into electronic data in a format recognizable by applications such as EXCEL and medical fee calculation.
FIG. 2 shows software functions of the data processing system having the configuration shown in FIG.
Image data read by the image reading function of the scanner is transferred to a personal computer connected to the scanner as image data by the image transfer function. The image analysis function converts the image data of the print information received by the image reception function into print data in a format that can be recognized by the application.
When converting type information into type data, it is particularly difficult to recognize an image of a read kanji, and reading errors are likely to occur. The conversion determination database stores electronic data described in a correct form of the prescription, and is used for error determination and correction of the read electronic data.
The prescription has a prescribed format, and the type information is input according to this format. FIG. 3 shows a description example of a prescription. This prescription is determined in advance where the name, drug name, taking method, and the like are to be described. An image recognition error of the converted electronic data can be determined based on the description format.
FIG. 4 shows an embodiment of type recognition of a prescription to which the present invention is applied. In this embodiment, it is assumed that the type information in the name column is recognized as Aro Yamada as a result of the image analysis. When the names in the database for determination are searched, and at least one character having the same number of characters matches is listed, it is assumed that Taro Yamada, Jiro Yamada, and Saburo Yamakawa have been extracted. Here, as an evaluation function indicating the character string similarity, it is set to 1 when one character at the same position matches two sets of character strings to be compared, and is set to 40 when two consecutive characters at the same position match, The sum of all these values is defined as the value of the evaluation function. According to this setting method, the value of the evaluation function of Aro Yamada and Taro Yamada is 43, 43 for Jiro Yamada, and 2 for Saburo Yamakawa.
As a result, since there is no match for Aro Yamada in the determination database, the image recognition error determination function determines that an image recognition error has occurred. Since Taro Yamada and Jiro Yamada have the same value of the evaluation function, they are determined to be correction candidates for Aro Yamada.
Since there are two sets of correction candidates, the PC does not perform automatic correction, but displays these two sets of data on the PC by the image recognition error display correction input function.
The user compares Taro Yamada and Jiro Yamada displayed with the type information in the prescription name column, and selects and inputs Taro Yamada if the type information in the prescription name column can be read as Taro Yamada. In this way, Ataro Yama is corrected to Taro Yamada.
Furthermore, if an evaluation function is set by combining a name with a date of birth, it is possible to evaluate which of Taro Yamada and Jiro Yamada is closer to Aro Yamada based on the date of birth. Assuming that the value of Taro Yamada becomes larger than the value of Jiro Yamada by using the evaluation function combining the birth dates, it is possible to narrow down only one of Taro Yamada's correction candidates.
Here, a threshold value for automatic correction is set for the value of the evaluation function. If the threshold value is larger than the threshold value, the image recognition error automatic correction function automatically corrects Yamada Aro to Yamada Taro, and is smaller than this threshold value. For example, this data is displayed on a PC by an image recognition error display correction input function.
In addition, the data input by the user from the PC is converted by the conversion determination data storage function into the conversion determination database by associating the type data, the image data, and the type data corrected by the user himself with the conversion error. Register with. Therefore, when another type information is read and when the image data of Taro Yamada is input, the information registered in the conversion determination database is searched, and this time, it is recognized as Taro Yamada without the help of the user. be able to.
It should be noted that, even if it is recognized again as Yamada Aro, it can be corrected to Taro Yamada.
As shown in FIG. 3, where to write the name, drug name, dosage method, and the like in the prescription is determined in advance, and the description format of the description frame and the like is determined by the managing hospital.
FIG. 5 shows the distribution of the number of pixels in the direction of the horizontal axis with respect to the vertical axis of the prescription A, focusing on the prescription description frame. If the prescription A and the prescription B have different description frames, the distribution of the number of pixels will be different.
When there are a plurality of management sources for the prescription, the distribution of the number of pixels of the description frame of the prescription lines of the plurality of management sources is acquired and stored in advance, and when a new prescription line is input, Measure the distribution of the number of pixels in the description frame of this new prescription, search for the closest distribution of the number of pixels in the description frame obtained in advance, and identify this management source as the management source of this new prescription line can do.
[0006]
【The invention's effect】
The present invention has the following effects by the configuration described above.
According to the first aspect of the present invention, data that has been correctly input to the data processing device is used to correct data determined as an image recognition error, so that errors in read and converted electronic data can be reduced. The effect is obtained.
In the invention described in claim 2, since a function for evaluating the similarity between the character string of the read and converted data and the character string of each determination data is set, the error of the converted data is represented by a numerical value. The effect of being evaluated and being automatically corrected on the PC is obtained.
According to the third aspect of the present invention, since the data determined to be an image recognition error and the candidate data for correction are displayed on the PC, it is helpful for the user to make corrections, and the effect of supporting the user's correction is provided. can get. Further, since the data corrected by the user is additionally stored as data input normally, an effect of improving the accuracy of determination and correction of an image recognition error can be obtained.
According to the invention described in claim 4, since the management source of the information is obtained from the description format of the print information, there is an effect that it is not necessary to describe the management source of the information.
According to the invention described in claim 5, information described in a medical prescription can be converted into print data and used.
According to a sixth aspect of the present invention, a set of image data determined as a reading error and data after correction is accumulated and used for determination and correction of a reading error. The effect of improving accuracy is obtained.
[0007]
[Brief description of the drawings]
FIG. 1 is an explanatory diagram showing a configuration of a data processing system to which a real name is applied.
FIG. 2 is a block diagram of each unit for explaining a software function of the data processing system to which the present invention is applied.
FIG. 3 is an explanatory diagram showing a description format of a prescription line.
FIG. 4 is an explanatory diagram of recognition of type information of a prescription line.
FIG. 5 is an explanatory diagram of a method of identifying a prescription line management source.