JP5027201B2 - テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム - Google Patents
テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム Download PDFInfo
- Publication number
- JP5027201B2 JP5027201B2 JP2009238845A JP2009238845A JP5027201B2 JP 5027201 B2 JP5027201 B2 JP 5027201B2 JP 2009238845 A JP2009238845 A JP 2009238845A JP 2009238845 A JP2009238845 A JP 2009238845A JP 5027201 B2 JP5027201 B2 JP 5027201B2
- Authority
- JP
- Japan
- Prior art keywords
- telop character
- edge
- color
- character area
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Studio Circuits (AREA)
- Image Analysis (AREA)
Description
図3は,本実施の形態によるエッジ検出の例を説明する図である。図3(A)は,垂直方向の色変化のチェックにより,画像から縦エッジを検出する例を示し,図3(B)は,水平方向の色変化のチェックにより,画像から横エッジを検出する例を示す。ここでは,画像上で垂直方向に色が変化する点を縦エッジと呼び,画像上で水平方向に色が変化する点を横エッジと呼ぶものとする。
式(1) に示す縦エッジ検出関数において,Vx (i,j),Vy (i,j),Vz (i,j)は,それぞれ以下の関数から求められる。
+2(cx (i,j−1)−cx (i,j+1))
+cx (i+1,j−1)−cx (i+1,j+1),
Vy (i,j)=cy (i−1,j−1)−cy (i−1,j+1)
+2(cy (i,j−1)−cy (i,j+1))
+cy (i+1,j−1)−cy (i+1,j+1),
Vz (i,j)=cz (i−1,j−1)−cz (i−1,j+1)
+2(cz (i,j−1)−cz (i,j+1))
+cz (i+1,j−1)−cz (i+1,j+1)
なお,x,y,zは,色情報のベクトル↑cの要素を示す。例えば,RGBの表色系においては,cx ,cy ,cz は,それぞれR,G,Bの画素値を示す。
式(2) に示す横エッジ検出関数において,Hx (i,j),Hy (i,j),Hz (i,j)は,それぞれ以下の関数から求められる。
+2(cx (i−1,j)−cx (i+1,j))
+cx (i−1,j+1)−cx (i+1,j+1),
Hy (i,j)=cy (i−1,j−1)−cy (i+1,j−1)
+2(cy (i−1,j)−cy (i+1,j))
+cy (i−1,j+1)−cy (i+1,j+1),
Hz (i,j)=cz (i−1,j−1)−cz (i+1,j−1)
+2(cz (i−1,j)−cz (i+1,j))
+cz (i−1,j+1)−cz (i+1,j+1)
式(2) から得られる評価値H(i,j)が,所定の閾値threshold _edge以上の点を横エッジとみなす。
図4は,本実施の形態によるエッジペア検出の例を説明する図である。図4には,テロップ文字領域の検出対象である画像の一部が示されている。図4の例において,ハッチング部分が,画像上のテロップ文字の一部を示す。図4において,細線の丸はエッジ検出により検出された縦エッジの点を示し,太線の丸はエッジ検出により検出された横エッジの点を示す。
図5は,本実施の形態による高密度エッジ領域抽出の例を説明する図である。ここでは,画像上の座標(i,j)の点が高密度エッジ領域の点であるかを判定する例を説明する。
検出されたすべてのエッジペアに対して,ペアとなる2つのエッジが共に高密度エッジ領域内にある場合に,エッジペアを結ぶ線分上の色の抽出を行う。抽出された色のクラスタリングを行い,文字に使われている色を推定する。
〔参考文献1〕:神嶌敏弘(産業技術総合研究所),データマイニング分野のクラスタリング手法(1),人工知能学会誌18巻1号。
〔参考文献2〕:大田登,色彩工学,東京電機大学出版局。
テロップに用いられている文字色の推定では,同一クラスタに分類された色の数をカウントし,カウントされた色の数が所定の閾値threshold _color _count を超えるクラスタを,文字に用いられている色のクラスタであると判定する。なお,色のカウントでは,エッジペアからの色の抽出において同じ色が複数抽出された場合でも,それぞれ別々にカウントする。前述した色のクラスタリング時において,1つのエッジペアから1つの代表色だけを抽出する場合には,カウント対象となる色とエッジペアとは1対1の関係になる。なお,文字に用いられている色のクラスタとして判定されるクラスタが,複数であってもよい。
テロップの文字領域の検出では,高密度エッジ領域にあり,かつその点での色が文字色と認められた色領域にあるときに,その点を文字領域とする。さらに,テロップ文字領域の検出の精度を上げるために,次のような方法を用いることができる。
以上のテロップ文字領域の検出によって,画像上のテロップ文字領域とそれ以外の領域とを区別することができるので,例えばテロップ文字領域は“1”,それ以外は“0”というような2値化情報を出力する。または,画像上のテロップ文字領域とそれ以外の領域とを区別して表示する。なお,テロップ文字領域を囲む最小の矩形領域を出力または表示するようにしてもよい。
11 画像入力部
12 画像記憶部
13 エッジ検出部
131 エッジペア検出部
14 高密度エッジ領域抽出部
15 色分類部
16 テロップ文字色推定部
17 テロップ文字領域検出部
18 テロップ文字領域表示部
Claims (5)
- 画像からテロップ文字領域を検出するテロップ文字領域検出方法において,
テロップ文字領域の検出対象となる画像を入力し,記憶装置に記憶する過程と,
前記画像からエッジを抽出し,エッジを構成する色の変化点の対をエッジペアとして検出する過程と,
前記画像から前記エッジまたは前記エッジペアの密度が所定の閾値以上である高密度エッジ領域を抽出する過程と,
前記高密度エッジ領域にある前記エッジペアを結ぶ線上の色を抽出して分類する過程と,
同一の分類に属する色の数またはその全色数に対する割合が所定の閾値以上の色を,テロップ文字の色として推定する過程と,
前記推定されたテロップ文字の色から前記画像におけるテロップ文字領域を検出する過程とを有する
ことを特徴とするテロップ文字領域検出方法。 - 請求項1記載のテロップ文字領域検出方法において,
前記テロップ文字領域を検出する過程では,
前記推定されたテロップ文字の色を持つ各エッジペアの周囲における所定の範囲内の領域において前記推定された色と同一の分類に属する色を持つ画素をテロップ文字領域候補として記憶し,前記テロップ文字領域候補が占める面積またはその面積の前記所定の範囲内の領域における割合が所定の閾値以上のテロップ文字領域候補を,テロップ文字領域として検出する
ことを特徴とするテロップ文字領域検出方法。 - 画像からテロップ文字領域を検出するテロップ文字領域検出装置において,
テロップ文字領域の検出対象となる画像を入力し,記憶装置に記憶する手段と,
前記画像からエッジを抽出し,エッジを構成する色の変化点の対をエッジペアとして検出する手段と,
前記画像から前記エッジまたは前記エッジペアの密度が所定の閾値以上である高密度エッジ領域を抽出する手段と,
前記高密度エッジ領域にある前記エッジペアを結ぶ線上の色を抽出して分類する手段と,
同一の分類に属する色の数またはその全色数に対する割合が所定の閾値以上の色を,テロップ文字の色として推定する手段と,
前記推定されたテロップ文字の色から前記画像におけるテロップ文字領域を検出する手段とを備える
ことを特徴とするテロップ文字領域検出装置。 - 請求項3記載のテロップ文字領域検出装置において,
前記テロップ文字領域を検出する手段は,
前記推定されたテロップ文字の色を持つ各エッジペアの周囲における所定の範囲内の領域において前記推定された色と同一の分類に属する色を持つ画素をテロップ文字領域候補として記憶し,前記テロップ文字領域候補が占める面積またはその面積の前記所定の範囲内の領域における割合が所定の閾値以上のテロップ文字領域候補を,テロップ文字領域として検出する
ことを特徴とするテロップ文字領域検出装置。 - 請求項1または請求項2に記載のテロップ文字領域検出方法を,コンピュータに実行させるためのテロップ文字領域検出プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009238845A JP5027201B2 (ja) | 2009-10-16 | 2009-10-16 | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009238845A JP5027201B2 (ja) | 2009-10-16 | 2009-10-16 | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2011087144A JP2011087144A (ja) | 2011-04-28 |
| JP5027201B2 true JP5027201B2 (ja) | 2012-09-19 |
Family
ID=44079767
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009238845A Active JP5027201B2 (ja) | 2009-10-16 | 2009-10-16 | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5027201B2 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5801237B2 (ja) | 2012-03-29 | 2015-10-28 | パナソニック株式会社 | 部位推定装置、部位推定方法、および部位推定プログラム |
| JP5679229B2 (ja) * | 2012-08-24 | 2015-03-04 | 楽天株式会社 | 画像処理装置、画像処理方法、及びプログラム |
| JP5695257B1 (ja) * | 2014-07-25 | 2015-04-01 | 楽天株式会社 | 画像処理装置、画像処理方法、および画像処理プログラム |
| JP6922690B2 (ja) * | 2017-11-22 | 2021-08-18 | 富士通株式会社 | 文字領域抽出プログラム、文字領域抽出装置及び文字領域抽出方法 |
| CN111783807B (zh) * | 2019-04-28 | 2025-02-25 | 北京京东尚科信息技术有限公司 | 图片提取方法、装置和计算机可读存储介质 |
| CN119723551A (zh) * | 2024-12-10 | 2025-03-28 | 浙江大学 | 一种面向无障碍电影制作的基于特性挖掘的字幕提取方法和装置 |
-
2009
- 2009-10-16 JP JP2009238845A patent/JP5027201B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2011087144A (ja) | 2011-04-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10896349B2 (en) | Text detection method and apparatus, and storage medium | |
| US9430704B2 (en) | Image processing system with layout analysis and method of operation thereof | |
| Pun et al. | Multi-scale noise estimation for image splicing forgery detection | |
| US9311533B2 (en) | Device and method for detecting the presence of a logo in a picture | |
| CN104978567B (zh) | 基于场景分类的车辆检测方法 | |
| CN106683073B (zh) | 一种车牌的检测方法及摄像机和服务器 | |
| US10748023B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
| JP5338643B2 (ja) | 画像特徴抽出装置、画像処理装置、及びプログラム | |
| CN104573675B (zh) | 作业图像的展示方法和装置 | |
| US8290277B2 (en) | Method and apparatus for setting a lip region for lip reading | |
| CN104298982A (zh) | 一种文字识别方法及装置 | |
| JP5027201B2 (ja) | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム | |
| US20250209844A1 (en) | Ancient book recognition method and apparatus, storage medium, and device | |
| CN113840135A (zh) | 色偏检测方法、装置、设备及存储介质 | |
| CN111738252A (zh) | 图像中的文本行检测方法、装置及计算机系统 | |
| CN110136174A (zh) | 一种目标对象跟踪方法和装置 | |
| CN111028263B (zh) | 一种基于光流颜色聚类的运动物体分割方法及其系统 | |
| JP2020017136A (ja) | 物体検出認識装置、方法、及びプログラム | |
| CN107368830B (zh) | 文本检测方法和装置以及文本识别系统 | |
| CN110135382B (zh) | 一种人体检测方法和装置 | |
| JP4967045B2 (ja) | 背景判別装置、方法及びプログラム | |
| CN110807792B (zh) | 比对追踪物件的方法及电子装置 | |
| JP2016081472A (ja) | 画像処理装置、画像処理方法及びプログラム | |
| JP5283267B2 (ja) | コンテンツ識別方法及び装置 | |
| CN105930813B (zh) | 一种在任意自然场景下检测行文本的方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120619 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120621 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150629 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5027201 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |