JP6609181B2 - 文字属性推定装置、及び文字属性推定プログラム - Google Patents
文字属性推定装置、及び文字属性推定プログラム Download PDFInfo
- Publication number
- JP6609181B2 JP6609181B2 JP2015254409A JP2015254409A JP6609181B2 JP 6609181 B2 JP6609181 B2 JP 6609181B2 JP 2015254409 A JP2015254409 A JP 2015254409A JP 2015254409 A JP2015254409 A JP 2015254409A JP 6609181 B2 JP6609181 B2 JP 6609181B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- region
- attribute estimation
- attribute
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
図1は、本実施形態に係る文字属性推定装置の概要を説明するための図である。図1に示す文字属性推定装置1は、画像(情景画像2)を入力し、当該画像中に写っている1以上の文字の属性を推定する。なお、「文字」には、例えば、漢字、かな、英数字等に限らず、絵文字、記号、図形等、所定の情報を伝達するために記載されている情報を含む。ここで、「文字の属性」とは、例えば、「人名」、「地名」、「会社名(組織名)」等の文字が表す内容を示す情報であるが、上記の例に限定されるものではない。
次に、本実施形態に係る文字属性推定装置の機能構成について、図を用いて説明する。図2は、本実施形態に係る文字属性推定装置の機能構成を示す機能ブロック図である。
図3は、属性推定テーブルの一例を示す図である。属性推定テーブルの項目の一例としては、例えば、「物体の種別」、「文字の位置または範囲」、「他の文字に対する相対的な大きさ」、「文字の数」、「文字の背景の色」、「文字の属性」等があるが、これに限定されるものではない。
次に、図4を参照して、情景画像中の文字の属性を推定する処理について説明する。図4は、情景画像中の文字の属性を推定する処理の一例を示すフローチャートである。
次に、図5を参照して、図4のステップS103の、物体領域検出部13による、文字が記載されている物体の領域である物体領域を検出する物体領域検出処理の詳細について説明する。図5は、物体領域検出処理の一例を示すフローチャートである。
次に、図6を参照して、本実施形態に係る物体領域検出の一例について説明する。図6は、物体領域検出処理を説明する図である。
次に、物体種別判定部14による、物体の種別を判定する処理について説明する。物体種別判定部14は、予め、検出対象の物体の種別に応じた画像群をトレーニングデータとして機械学習しておく。そして、物体種別判定部14は、物体領域検出部13により検出された物体領域の、例えば形状や色の特徴に基づいて一般物体認識または特定物体認識を行うことにより、文字が記載されている物体の種別を判定する。
次に、図7を参照して、属性推定部15による、属性推定処理について説明する。図7は、属性推定処理の一例を示すフローチャートである。
次に、図8を参照して、本実施形態に係る属性推定の一例について説明する。図8は、本実施形態に係る属性推定の一例を説明する図である。
物体領域検出部13は、物体領域を拡張する度に、物体領域の特徴を保存しながら、情景画像全体が物体領域に含まれるまで拡張し、条件に合った領域を検出する構成としてもよい。
本実施形態に係る文字属性推定装置1は、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)等の揮発性の記憶媒体、ROM(Read Only Memory)等の不揮発性の記憶媒体、マウスやキーボード、ポインティングデバイス等の入力装置、画像やデータを表示する表示部、並びに外部と通信するためのインターフェースを備えたコンピュータによって構成してもよい。
上述した実施形態によれば、文字領域の周辺の情報を利用して、文字の属性を推定する。これにより、情景画像中の文字の属性を、高精度で推定できる。文字の属性は、情景画像中の文字の認識精度を向上されるための単語辞書の選択等に利用可能である。文字の属性に応じて、文字認識に用いる辞書を切り替えれば、照合する辞書サイズの減少による認識速度の向上や、文字(単語)の誤認識の低減が可能となる。
11 画像取得部
12 文字領域検出部
13 物体領域検出部
14 物体種別判定部
15 属性推定部
16 辞書選択部
17 文字認識部
Claims (6)
- 画像から文字の領域を検出する文字領域検出部と、
前記文字領域検出部により検出された前記文字の領域に隣接する画素のうちの少なくとも一部の画素値に応じた条件を満たす画素を、前記文字が記載された物体の領域として検出する物体領域検出部と、
前記文字が表す内容の属性に応じた画像群をトレーニングデータとして機械学習し、前記機械学習の結果、及び前記物体領域検出部により検出された前記物体の領域の形状から、前記文字が表す内容の属性を推定する属性推定部と、
を備える文字属性推定装置。 - 画像から文字の領域を検出する文字領域検出部と、
前記文字領域検出部により検出された前記文字の領域に隣接する画素のうちの少なくとも一部の画素値に応じた条件を満たす画素を、前記文字が記載された物体の領域として検出する物体領域検出部と、
物体の種別に応じた画像群をトレーニングデータとして機械学習し、前記機械学習の結果、及び前記物体領域検出部により検出された前記物体の領域の形状から、前記物体の種別を判別する物体種別判定部と、
前記物体種別判定部により判定された前記物体の種別から前記文字が表す内容の属性を推定する属性推定部と、
を備える文字属性推定装置。 - 前記物体領域検出部は、前記文字の領域に隣接する画素のうちの少なくとも一部を前記物体の領域の初期範囲とし、前記物体の領域に隣接し、前記物体の領域の画素値に応じた条件を満たす画素を、順次前記物体の領域に含める、
請求項1または2に記載の文字属性推定装置。 - 前記属性推定部は、前記物体の領域における前記文字の位置、前記文字の範囲、前記文字の他の文字に対する相対的な大きさ、前記文字の数、または前記文字の背景の色に基づいて、前記属性を推定する、
請求項1乃至3のいずれか一項に記載の文字属性推定装置。 - 前記属性推定部により推定された前記属性に応じた辞書を選択する辞書選択部と、
前記辞書選択部により選択された辞書に基づいて、前記文字を認識する文字認識部と、
を備える、請求項1乃至4のいずれか一項に記載の文字属性推定装置。 - コンピュータを、
請求項1乃至5のいずれか一項に記載の文字属性推定装置として機能させるための文字属性推定プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015254409A JP6609181B2 (ja) | 2015-12-25 | 2015-12-25 | 文字属性推定装置、及び文字属性推定プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015254409A JP6609181B2 (ja) | 2015-12-25 | 2015-12-25 | 文字属性推定装置、及び文字属性推定プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017117340A JP2017117340A (ja) | 2017-06-29 |
| JP6609181B2 true JP6609181B2 (ja) | 2019-11-20 |
Family
ID=59234335
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015254409A Active JP6609181B2 (ja) | 2015-12-25 | 2015-12-25 | 文字属性推定装置、及び文字属性推定プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6609181B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6811811B1 (ja) * | 2019-07-04 | 2021-01-13 | Jcc株式会社 | メタデータ生成システム、映像コンテンツ管理システム及びプログラム |
| JPWO2024201819A1 (ja) * | 2023-03-29 | 2024-10-03 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5141969B2 (ja) * | 2007-09-27 | 2013-02-13 | アイシン・エィ・ダブリュ株式会社 | 画像認識装置及び画像認識プログラム、並びにそれを用いた地点情報収集装置及びナビゲーション装置 |
| JP4923134B2 (ja) * | 2010-06-08 | 2012-04-25 | 株式会社スクウェア・エニックス | リアルタイムなカメラ辞書 |
-
2015
- 2015-12-25 JP JP2015254409A patent/JP6609181B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2017117340A (ja) | 2017-06-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10846870B2 (en) | Joint training technique for depth map generation | |
| US9418319B2 (en) | Object detection using cascaded convolutional neural networks | |
| US11138257B2 (en) | Object search in digital images | |
| US10706322B1 (en) | Semantic ordering of image text | |
| CN110276366A (zh) | 使用弱监督模型来检测对象 | |
| US11295495B2 (en) | Automatic positioning of textual content within digital images | |
| US9245357B2 (en) | Image processing apparatus, image processing method, and storage medium | |
| CN114120305B (zh) | 文本分类模型的训练方法、文本内容的识别方法及装置 | |
| CN109697414B (zh) | 一种文本定位方法及装置 | |
| CN111062365A (zh) | 识别混合排版文字的方法、设备、芯片电路和计算机可读存储介质 | |
| US20180089525A1 (en) | Method for line and word segmentation for handwritten text images | |
| CN113887375A (zh) | 一种文本识别方法、装置、设备及存储介质 | |
| US11657511B2 (en) | Heuristics-based detection of image space suitable for overlaying media content | |
| US20170249526A1 (en) | Information processing apparatus, information processing method, and storage medium | |
| US20160283786A1 (en) | Image processor, image processing method, and non-transitory recording medium | |
| US20150139547A1 (en) | Feature calculation device and method and computer program product | |
| JP6609181B2 (ja) | 文字属性推定装置、及び文字属性推定プログラム | |
| CN115004261B (zh) | 文本行检测 | |
| US10360471B2 (en) | Image retrieving device, image retrieving method, and recording medium | |
| CN116386049B (zh) | 公式识别方法、装置、设备及存储介质 | |
| JP7677429B2 (ja) | メディアコンテンツのオーバーレイに適した画像スペースの検出 | |
| US10025766B2 (en) | Relational database for assigning orphan fillable fields of electronic fillable forms with associated captions | |
| US10846878B2 (en) | Multi-axis equal spacing smart guides | |
| US20150142784A1 (en) | Retrieval device and method and computer program product | |
| WO2024013901A1 (ja) | マッチ率算出装置、マッチ率算出方法およびマッチ率算出プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181029 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190829 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191001 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191025 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6609181 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |