JP6236731B1 - Super-resolution processing apparatus, super-resolution processing method, and computer program - Google Patents
Super-resolution processing apparatus, super-resolution processing method, and computer program Download PDFInfo
- Publication number
- JP6236731B1 JP6236731B1 JP2017046113A JP2017046113A JP6236731B1 JP 6236731 B1 JP6236731 B1 JP 6236731B1 JP 2017046113 A JP2017046113 A JP 2017046113A JP 2017046113 A JP2017046113 A JP 2017046113A JP 6236731 B1 JP6236731 B1 JP 6236731B1
- Authority
- JP
- Japan
- Prior art keywords
- resolution
- image
- super
- learning
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Processing (AREA)
Abstract
【課題】高精度な超解像度画像を高速に作成する。
【解決手段】第2解像度よりも高解像度の第3解像度の画像を含む学習用セットのサブセットである第1階層の複数の学習用サブセットの各々について、第2解像度の画像を第3解像度の画像に超解像度処理するための第1フィルタ、および第2解像度よりも低解像度の第1解像度の画像を第2解像度の画像に超解像度処理するための第2フィルタを取得する第1階層フィルタ取得部と、第2解像度の入力画像から第1解像度の縮小画像を作成する縮小画像作成部と、各第2フィルタを用いて、第1解像度の縮小画像を超解像度処理して第2解像度の候補画像を作成する候補画像作成部と、第2解像度の候補画像と第2解像度の入力画像との差分が最小となる第2フィルタに対応する第1フィルタを用いて、第2解像度の入力画像を超解像度処理する超解像度処理部とを備える。
【選択図】図1A high-precision super-resolution image is created at high speed.
A second resolution image is converted into a third resolution image for each of a plurality of learning subsets in a first hierarchy, which is a subset of a learning set including a third resolution image having a higher resolution than the second resolution. A first filter for super-resolution processing, and a first layer filter acquisition unit for acquiring a second filter for super-resolution processing of a first resolution image having a resolution lower than the second resolution into a second resolution image A reduced image creation unit that creates a reduced image of the first resolution from the input image of the second resolution, and a second resolution candidate image by performing super-resolution processing on the reduced image of the first resolution using each second filter The second resolution input image using the first filter corresponding to the second filter that minimizes the difference between the second resolution candidate image and the second resolution input image. resolution And a super-resolution processing section for management.
[Selection] Figure 1
Description
本発明は、入力画像に超解像度処理を施す超解像度処理装置、超解像度処理方法およびコンピュータプログラムに関する。 The present invention relates to a super resolution processing apparatus, a super resolution processing method, and a computer program for performing super resolution processing on an input image.
近年、入力画像に超解像度処理を施して、高解像度化する超解像度処理の技術が実用化されている(例えば、特許文献1参照)。 In recent years, a super-resolution processing technique for increasing the resolution by performing super-resolution processing on an input image has been put into practical use (see, for example, Patent Document 1).
超解像度処理の一例として、機械学習済みの畳み込みニューラルネットワーク(Convolutional Neural Network:以下、「CNN」という)に入力画像を入力し、当該入力画像に対して超解像度処理を施して、高解像度化された出力画像を出力する方法が知られている。このCNNは、オリジナル画像と、当該オリジナル画像の縮小画像とに基づいて、縮小画像を入力とし、オリジナル画像を出力として各層におけるニューラルネットの重みおよびバイアスを機械学習することにより構成される。 As an example of super-resolution processing, input images are input to a machine-learned convolutional neural network (hereinafter referred to as “CNN”), and the input images are subjected to super-resolution processing to increase the resolution. There is known a method for outputting the output image. The CNN is configured by performing machine learning on the weight and bias of the neural network in each layer, using the reduced image as an input and the original image as an output based on the original image and the reduced image of the original image.
画像には人物写真、風景写真、イラストなど様々な種類が含まれる。例えば、イラストはエッジ成分を多く含むため強い高周波成分を含むのに対し、風景画像はすべての周波数成分を満遍なく含むなど、画像の種類によって特性が異なる。 There are various types of images such as portraits, landscapes, and illustrations. For example, illustrations include many high frequency components because they include many edge components, while landscape images include all frequency components evenly.
しかしながら、これらの画像の特性を無視して、1つのCNNを用いて入力画像を超解像度処理したのでは、満足の行く結果が得られない場合がある。例えば、低周波成分を多く含む画像を多く用いて機械学習したCNNにより、高周波成分を多く含む画像を超解像度処理した場合には、高周波成分の再現性が損なわれることが考えられる。また、高周波成分を多く含む画像を多く用いて機械学習したCNNにより低周波成分を多く含む画像を超解像度処理した場合には、高周波ノイズが発生したりすることが考えられる。 However, if the characteristics of these images are ignored and the input image is super-resolution processed using one CNN, a satisfactory result may not be obtained. For example, it is conceivable that the reproducibility of the high-frequency component is impaired when the super-resolution processing is performed on an image containing a large amount of high-frequency components by CNN that has been machine-learned using many images that include a large amount of low-frequency components. Further, when an image containing a large amount of low-frequency components is subjected to super-resolution processing by machine learning using a large number of images containing a large amount of high-frequency components, high-frequency noise may be generated.
そのうえ、複数のCNNのプリセットの中からユーザが最適なものを選択するのは一般的に困難である。このため、従来は、上述のように多くの種類の学習用画像を利用してCNNを作成せざるを得なかった。多くの種類の学習用画像を利用する場合には、学習用画像の枚数が膨大となるため、機械学習に時間を要し、CNNの構成も複雑なものとなる。 In addition, it is generally difficult for the user to select an optimal one from a plurality of CNN presets. For this reason, conventionally, it has been necessary to create a CNN using many types of learning images as described above. When many types of learning images are used, the number of learning images is enormous, so that time is required for machine learning and the configuration of the CNN is complicated.
本発明はこのような事情に鑑みてなされたものであり、高精度な超解像度画像を高速に作成することのできる超解像度処理装置、超解像度処理方法およびコンピュータプログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, and an object of the present invention is to provide a super-resolution processing apparatus, a super-resolution processing method, and a computer program that can create a high-precision super-resolution image at high speed. .
上記目的を達成するために、本発明のある局面に係る超解像度処理装置は、第2解像度の画像を超解像度処理して、第2解像度よりも高解像度の第3解像度の画像を作成する超解像度処理装置であって、第3解像度の画像を含む学習用セットのサブセットである第1階層の複数の学習用サブセットの各々について、該学習用サブセットを用いて機械学習された、第2解像度の画像を第3解像度の画像に超解像度処理するための第1フィルタ、および第2解像度よりも低解像度の第1解像度の画像を第2解像度の画像に超解像度処理するための第2フィルタを取得する第1階層フィルタ取得部と、第2解像度の入力画像から第1解像度の縮小画像を作成する縮小画像作成部と、前記第1階層フィルタ取得部が取得した各前記第2フィルタを用いて、前記第1解像度の縮小画像を超解像度処理して第2解像度の候補画像を作成する候補画像作成部と、前記候補画像作成部が作成した前記第2解像度の候補画像と前記第2解像度の入力画像との差分が最小となる第2フィルタに対応する第1フィルタを用いて、前記第2解像度の入力画像を超解像度処理することにより、第3解像度の超解像度画像を作成する超解像度処理部とを備える。 In order to achieve the above object, a super-resolution processing apparatus according to an aspect of the present invention performs super-resolution processing on a second resolution image to create a third resolution image having a higher resolution than the second resolution. A resolution processing apparatus, wherein each of a plurality of learning sub-sets of a first hierarchy, which is a sub-set of a learning set including an image of a third resolution, is machine-learned using the learning subset, Obtaining a first filter for super-resolution processing of an image into a third resolution image and a second filter for super-resolution processing of a first resolution image lower than the second resolution into a second resolution image A first layer filter acquisition unit, a reduced image generation unit that generates a reduced image of the first resolution from an input image of the second resolution, and each of the second filters acquired by the first layer filter acquisition unit. A candidate image creation unit that creates a second resolution candidate image by performing super-resolution processing on the reduced image of the first resolution, and the second resolution candidate image created by the candidate image creation unit and the second resolution Super-resolution processing for generating a super-resolution image of the third resolution by performing super-resolution processing of the input image of the second resolution using the first filter corresponding to the second filter that minimizes the difference from the input image. A part.
この構成によると、第2解像度の候補画像と第2解像度の入力画像との差分が最小となる第2フィルタを複数の第2フィルタの中から選択することができる。また、選択した第2フィルタに対応する第1フィルタを用いて、入力画像を超解像度処理することができる。第2フィルタは、第1フィルタと同じ学習用サブセットを用いて機械学習されているため、第1フィルタと同様の性質を有し、かつ、第2フィルタが対象とする入力画像の解像度は第1フィルタが対象とする入力画像の解像度よりも小さい。このため、入力画像に最適な性質を有する第2フィルタを高速に選択することができ、選択した第2フィルタに対応した第1フィルタを用いて入力画像に超解像度処理を実行することで、高精度な超解像度画像を高速に作成することができる。 According to this configuration, the second filter that minimizes the difference between the second resolution candidate image and the second resolution input image can be selected from the plurality of second filters. In addition, the input image can be super-resolution processed using the first filter corresponding to the selected second filter. Since the second filter is machine-learned using the same learning subset as the first filter, it has the same properties as the first filter, and the resolution of the input image targeted by the second filter is the first. The resolution is smaller than the resolution of the input image targeted by the filter. For this reason, the second filter having the optimal property for the input image can be selected at high speed, and by executing the super-resolution processing on the input image using the first filter corresponding to the selected second filter, Accurate super-resolution images can be created at high speed.
好ましくは、上述の超解像度処理装置は、さらに、前記差分が最小となる前記第2フィルタを機械学習するのに用いた前記第1階層の学習用サブセットのサブセットである第2階層の複数の学習用サブセットの各々について、該学習用サブセットを用いて機械学習された第1フィルタおよび第2フィルタを取得する第2階層フィルタ取得部を備え、前記候補画像作成部は、さらに、前記第2階層フィルタ取得部が取得した前記第2階層の各前記第2フィルタを用いて、前記第1解像度の縮小画像を超解像度処理して第2解像度の候補画像を作成し、前記超解像度処理部は、さらに、前記候補画像作成部が前記第2階層の前記第2フィルタを用いて作成した前記第2解像度の候補画像と前記第2解像度の入力画像との差分が最小となる第2フィルタに対応する第1フィルタを用いて、前記第2解像度の入力画像を超解像度処理することにより、前記第3解像度の超解像度画像を作成する。 Preferably, the above-described super-resolution processing apparatus further includes a plurality of learnings in a second hierarchy that is a subset of the learning subset in the first hierarchy used for machine learning of the second filter having the smallest difference. A second hierarchical filter acquisition unit that acquires a first filter and a second filter machine-learned using the learning subset for each of the subsets, and the candidate image creation unit further includes the second hierarchical filter Using each second filter of the second hierarchy acquired by the acquisition unit, the reduced image of the first resolution is subjected to super resolution processing to create a second resolution candidate image, and the super resolution processing unit further includes: The second image in which the difference between the second resolution candidate image created by the candidate image creation unit using the second filter of the second hierarchy and the second resolution input image is minimized. Using a first filter corresponding to the data, the input image of the second resolution by super-resolution processing, to create a super-resolution image of the third resolution.
この構成によると、第1階層において第2フィルタを選択し、選択した第2フィルタに基づいて、さらに、第2階層における第2フィルタを選択することができる。また、選択した第2フィルタに対応する第1フィルタを用いて、入力画像を超解像度処理することができる。このように、第1フィルタおよび第2フィルタを階層構造化することができるため、効率的に第2フィルタおよび該第2フィルタに対応する第1フィルタを選択することができる。これにより、高精度な超解像度画像を高速に作成することができる。 According to this configuration, it is possible to select the second filter in the first hierarchy, and further select the second filter in the second hierarchy based on the selected second filter. In addition, the input image can be super-resolution processed using the first filter corresponding to the selected second filter. Thus, since the first filter and the second filter can be hierarchically structured, the second filter and the first filter corresponding to the second filter can be efficiently selected. Thereby, a highly accurate super-resolution image can be created at high speed.
本発明の他の局面に係る超解像度処理方法は、第2解像度の画像を超解像度処理して、第2解像度よりも高解像度の第3解像度の画像を作成する装置を機能させるための超解像度処理方法であって、第3解像度の画像を含む学習用セットのサブセットである第1階層の複数の学習用サブセットの各々について、該学習用サブセットを用いて機械学習された、第2解像度の画像を第3解像度の画像に超解像度処理するための第1フィルタ、および第2解像度よりも低解像度の第1解像度の画像を第2解像度の画像に超解像度処理するための第2フィルタを取得するステップと、第2解像度の入力画像から第1解像度の縮小画像を作成するステップと、取得された各前記第2フィルタを用いて、前記第1解像度の縮小画像を超解像度処理して第2解像度の候補画像を作成するステップと、作成された前記第2解像度の候補画像と前記第2解像度の入力画像との差分が最小となる第2フィルタに対応する第1フィルタを用いて、前記第2解像度の入力画像を超解像度処理することにより、第3解像度の超解像度画像を作成するステップとを含む。 A super-resolution processing method according to another aspect of the present invention provides a super-resolution for causing a device that creates a third-resolution image having a higher resolution than the second resolution to function by super-resolution processing the second-resolution image. A second resolution image, which is a processing method, machine-learned using each of the plurality of learning subsets in the first hierarchy, which is a subset of the learning set including a third resolution image, using the learning subset. A first filter for super-resolution processing of a first resolution image into a third resolution image, and a second filter for super-resolution processing of a first resolution image lower than the second resolution into a second resolution image A step of creating a reduced image of the first resolution from the input image of the second resolution, and using the acquired second filter, the reduced image of the first resolution is subjected to super-resolution processing and second Using a first filter corresponding to a second filter that minimizes a difference between the created second-resolution candidate image and the second-resolution input image; Creating a third resolution super-resolution image by subjecting the second resolution input image to super-resolution processing.
この構成は、上述した超解像度処理装置が備える処理部に対応するステップを含む。このため、上述した超解像度処理装置と同様の作用および効果を奏することができる。 This configuration includes steps corresponding to the processing unit included in the super-resolution processing apparatus described above. For this reason, the same operation and effect as the above-described super-resolution processing apparatus can be achieved.
本発明の他の局面に係るコンピュータプログラムは、第2解像度の画像を超解像度処理して、第2解像度よりも高解像度の第3解像度の画像を作成するためのコンピュータプログラムであって、コンピュータを、第3解像度の画像を含む学習用セットのサブセットである第1階層の複数の学習用サブセットの各々について、該学習用サブセットを用いて機械学習された、第2解像度の画像を第3解像度の画像に超解像度処理するための第1フィルタ、および第2解像度よりも低解像度の第1解像度の画像を第2解像度の画像に超解像度処理するための第2フィルタを取得する第1階層フィルタ取得部と、第2解像度の入力画像から第1解像度の縮小画像を作成する縮小画像作成部と、前記第1階層フィルタ取得部が取得した各前記第2フィルタを用いて、前記第1解像度の縮小画像を超解像度処理して第2解像度の候補画像を作成する候補画像作成部と、前記候補画像作成部が作成した前記第2解像度の候補画像と前記第2解像度の入力画像との差分が最小となる第2フィルタに対応する第1フィルタを用いて、前記第2解像度の入力画像を超解像度処理することにより、第3解像度の超解像度画像を作成する超解像度処理部として機能させる。 A computer program according to another aspect of the present invention is a computer program for super-resolution processing a second resolution image to create a third resolution image having a higher resolution than the second resolution. , For each of the plurality of learning subsets of the first hierarchy, which is a subset of the learning set including the third resolution image, the second resolution image machine-learned using the learning subset is converted to the third resolution image. First-layer filter acquisition for acquiring a first filter for performing super-resolution processing on an image and a second filter for performing super-resolution processing on an image having a lower resolution than the second resolution to an image having a second resolution A reduced image creation unit that creates a reduced image of the first resolution from the input image of the second resolution, and each of the second filters acquired by the first hierarchical filter acquisition unit , A candidate image creation unit that creates a second resolution candidate image by performing super-resolution processing on the first resolution reduced image, the second resolution candidate image created by the candidate image creation unit, and the second A super-resolution image of the third resolution is created by performing super-resolution processing on the input image of the second resolution using the first filter corresponding to the second filter that minimizes the difference from the input image of the two resolutions. It functions as a super-resolution processor.
この構成によると、コンピュータを、上述した超解像度処理装置として機能させることができる。このため、高精度な超解像度画像を高速に作成することができる。 According to this configuration, the computer can function as the above-described super-resolution processing apparatus. For this reason, a highly accurate super-resolution image can be created at high speed.
なお、本発明に係るコンピュータプログラムを、CD−ROM(Compact Disc-Read Only Memory)等のコンピュータ読取可能な非一時的な記録媒体やインターネット等の通信ネットワークを介して流通させることができるのは、言うまでもない。また、本発明は、超解像度処理装置の一部又は全部を実現する半導体集積回路として実現したり、超解像度処理装置を含むシステムとして実現したりすることもできる。 The computer program according to the present invention can be distributed via a computer-readable non-transitory recording medium such as a CD-ROM (Compact Disc-Read Only Memory) or a communication network such as the Internet. Needless to say. In addition, the present invention can be realized as a semiconductor integrated circuit that realizes part or all of the super-resolution processing apparatus, or can be realized as a system including the super-resolution processing apparatus.
本発明によると、高精度な超解像度画像を高速に作成することができる。 According to the present invention, a highly accurate super-resolution image can be created at high speed.
以下、本発明の実施の形態について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも本発明の好ましい一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、構成要素の配置位置および接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。本発明は、特許請求の範囲によって特定される。よって、以下の実施の形態における構成要素のうち、本発明の最上位概念を示す独立請求項に記載されていない構成要素については、本発明の課題を達成するのに必ずしも必要ではないが、より好ましい形態を構成するものとして説明される。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Each of the embodiments described below shows a preferred specific example of the present invention. Numerical values, shapes, components, arrangement positions and connection forms of components, steps, order of steps, and the like shown in the following embodiments are merely examples, and are not intended to limit the present invention. The invention is specified by the claims. Therefore, among the constituent elements in the following embodiments, constituent elements that are not described in the independent claims indicating the highest concept of the present invention are not necessarily required to achieve the object of the present invention. It will be described as constituting a preferred form.
図1は、本発明の実施の形態に係る超解像度処理装置の構成を示すブロック図である。図2は、本発明の実施の形態で取り扱う画像のサイズおよびフィルタを説明するための図である。 FIG. 1 is a block diagram showing a configuration of a super-resolution processing apparatus according to an embodiment of the present invention. FIG. 2 is a diagram for explaining image sizes and filters handled in the embodiment of the present invention.
図1を参照して、超解像度処理装置1は、入力画像に対して超解像度処理を施し、入力画像よりも解像度の高い画像を作成する装置であり、入力画像取得部10と、縮小画像作成部11と、機械学習部12と、第1階層フィルタ取得部13と、候補画像作成部14と、第2階層フィルタ取得部15と、超解像度処理部16と、記憶装置17とを備える。
Referring to FIG. 1, a
本実施の形態では、2Kサイズ(1920×1080ピクセル)の入力画像に対して超解像度処理を施し、4Kサイズ(3840×2160ピクセル)の画像を作成する例について説明する。ただし、超解像度処理装置1が対象とする画像のサイズはこれらに限定されるものではない。
In this embodiment, an example will be described in which super-resolution processing is performed on an input image of 2K size (1920 × 1080 pixels) to create an image of 4K size (3840 × 2160 pixels). However, the image size targeted by the
入力画像取得部10は、超解像度処理の対象となる入力画像を取得する。例えば、入力画像取得部10は、記憶装置17に記憶されている画像の中からユーザがキーボード等を用いて選択した画像を、記憶装置17から読み出すことにより、当該画像を入力画像として取得してもよい。また、入力画像取得部10は、ネットワーク等を介して画像をダウンロードすることにより、当該画像を入力画像として取得してもよい。
The input
図2に示すように、本実施の形態では、入力画像のサイズ(解像度)は、2Kサイズ(第2解像度)であるものとする。 As shown in FIG. 2, in the present embodiment, the size (resolution) of the input image is assumed to be 2K size (second resolution).
再度図1を参照して、縮小画像作成部11は、入力画像取得部10が取得した入力画像を縮小することにより縮小画像を作成する。
Referring to FIG. 1 again, the reduced image creation unit 11 creates a reduced image by reducing the input image acquired by the input
図2に示すように、本実施の形態では、縮小画像作成部11は、入力画像を縦および横それぞれ1/2に縮小する。縮小画像のサイズ(解像度)は、QHD(Quarter High Definition)サイズ(960×540ピクセル)(第1解像度)であるものとする。 As shown in FIG. 2, in the present embodiment, the reduced image creating unit 11 reduces the input image by 1/2 in both the vertical and horizontal directions. The size (resolution) of the reduced image is assumed to be a QHD (Quarter High Definition) size (960 × 540 pixels) (first resolution).
なお、縮小画像作成部11は、入力画像以外にも、超解像度処理のためのフィルタを機械学習するために用意された学習用画像も縮小する。 In addition to the input image, the reduced image creation unit 11 reduces the learning image prepared for machine learning of a filter for super-resolution processing.
つまり、記憶装置17には、予め4Kサイズの複数の学習用画像を含む学習用セットが記憶されているものとする。また、学習用セットには、人物写真、風景写真、イラストなどの様々な種類の学習用画像が含まれるものとする。縮小画像作成部11は、記憶装置17から学習用セットを読み出し、学習用セットに含まれる各学習用画像を、縦および横それぞれ1/2に縮小した2Kサイズの縮小画像と、縦および横それぞれ1/4に縮小したQHDサイズの縮小画像とを作成する。
That is, it is assumed that a learning set including a plurality of 4K-size learning images is stored in the
以下では、学習用画像から作成した2Kサイズの縮小画像およびQHDサイズの縮小画像のことも学習用画像と言う。また、学習用セットには、複数の4Kサイズの学習用画像のみならず、これらから作成した2Kサイズの学習用画像およびQHDサイズの学習用画像が含まれるものとする。なお、本実施の形態では、入力画像のサイズは、学習用セットに含まれる2Kサイズの学習用画像と同じものとしているが、必ずしも両者のサイズは同じである必要はなく、学習用画像のサイズが入力画像のサイズと異なっていてもよい。 Hereinafter, the 2K size reduced image and the QHD size reduced image created from the learning image are also referred to as the learning image. In addition, the learning set includes not only a plurality of 4K-size learning images but also a 2K-size learning image and a QHD-size learning image created from them. In this embodiment, the size of the input image is the same as that of the 2K-size learning image included in the learning set, but the size of both is not necessarily the same, and the size of the learning image is not necessarily the same. May be different from the size of the input image.
機械学習部12は、学習用セットに含まれる画像を用いて、超解像度処理を行うためのフィルタを機械学習により作成する。なお、機械学習部12は、学習用セットに含まれる画像を階層構造化して、各階層において、フィルタを作成する。
The
図3は、階層構造化された学習用セットおよびフィルタの一例を示す図である。
つまり、機械学習部12は、以下のような手順により、階層構造化された学習用セットおよびフィルタを作成する。
FIG. 3 is a diagram illustrating an example of a learning set and filter having a hierarchical structure.
In other words, the
まず、機械学習部12は、学習用セットに含まれる2Kサイズの学習用画像と、4Kサイズの学習用画像とを用いて、2Kサイズの画像を4Kサイズの画像に超解像度処理するためのCNN(Convolutional Neural Network)を作成する。図2に示すように、2Kサイズの画像を4Kサイズの画像に超解像度処理するCNNを、第1CNNまたは第1フィルタと言う。機械学習部12は、2Kサイズの学習用画像をCNNの入力とし、4Kサイズの学習用画像をCNNの出力として、CNNの各層における重みおよびバイアスを機械学習することで、第1CNNを作成する。学習用セットを用いて作成した第1CNNを、図3に示すように第1CNN0と言う。
First, the
なお、本実施の形態では、機械学習部12は、超解像度処理するためのフィルタとしてCNNを例に説明するが、フィルタはCNNに限定されるものではなく、複数の学習用画像から機械学習されるその他のフィルタに対しても本発明を適用することができる。
In the present embodiment, the
次に、機械学習部12は、第1CNN0を用いて、学習用セットを3つのサブセット(学習用サブセット1〜3)に分類する。例えば、機械学習部12は、第1CNN0により超解像度処理された画像と、学習用画像との差分に基づいて、上記分類を行う。
Next, the
具体的には、機械学習部12は、学習用セットに含まれる2Kサイズの各学習用画像を第1CNN0に入力することにより、4Kサイズの画像を作成する。
Specifically, the
次に、機械学習部12は、第1CNN0が作成した4Kサイズの画像と、上記2Kサイズの学習用画像を作成するのに用いた4Kサイズの学習用画像との差分を算出する。画像間の差分は、例えば、画素値の差分の二乗和または絶対値和により求めることができる。
Next, the
次に、機械学習部12は、算出した差分に基づいて、4Kサイズの学習用画像を3つのサブセットのいずれかに分類する。
Next, the
例えば、機械学習部12は、差分が第1閾値よりも大きい4Kサイズの学習用画像を学習用サブセット1に分類する。また、機械学習部12は、差分が第2閾値(ただし、第2閾値は第1閾値よりも小さい値)よりも大きいく、かつ第1閾値以下の4Kサイズの学習用画像を学習用サブセット2に分類する。また、機械学習部12は、差分が第2閾値以下の4Kサイズの学習用画像を学習用サブセット3に分類する。なお、機械学習部12は、4Kサイズの学習用画像から縮小画像作成部11が作成した2Kサイズの学習用画像およびQHDサイズの学習用画像も、4Kサイズの学習用画像と同じ学習用サブセットに分類する。これにより、図3に示すように、学習用セットが学習用サブセット1〜3に分類される。
For example, the
上記の差分は、超解像度処理された画像の誤差を示しているため、学習用セットが誤差に基づいて、複数の学習用サブセットに分類されることになる。 Since the difference indicates an error of the image subjected to the super-resolution processing, the learning set is classified into a plurality of learning subsets based on the error.
機械学習部12は、学習用サブセット1〜3のそれぞれを用いて、第1CNNと、QHDサイズの画像を2Kサイズの画像に超解像度処理するCNN(第2CNNまたは第2フィルタと言う)を作成する。
The
例えば、機械学習部12は、学習用サブセット1に含まれる2Kサイズの学習用画像をCNNの入力とし、学習用サブセット1に含まれる4Kサイズの学習用画像をCNNの出力として、CNNの各層における重みおよびバイアスを機械学習することで、第1CNNを作成する。
For example, the
また、機械学習部12は、学習用サブセット1に含まれるQHDサイズの学習用画像をCNNの入力とし、学習用サブセット1に含まれる2Kサイズの学習用画像をCNNの出力として、CNNの各層における重みおよびバイアスを機械学習することで、第2CNNを作成する。
Further, the
機械学習部12は、学習用サブセット2および3についても、同様に、第1CNNおよび第2CNNを作成する。
The
学習用サブセットiから作成された第1CNNをおよび第2CNNを、それぞれ、第1CNNiおよび第2CNNiと記載する(i=1〜3)。 The first CNN and the second CNN created from the learning subset i are described as the first CNNi and the second CNNi, respectively (i = 1 to 3).
機械学習部12は、学習用サブセット1〜3のそれぞれを、さらに、3つのサブセットに分類する。
The
例えば、機械学習部12は、第1CNN1を用いて、学習用サブセット1を3つのサブセット(学習用サブセット1−1〜1−3)に分類する。分類方法は、学習用セットの分類方法と分類の対象が異なる以外同様である。このため、その詳細な説明はここでは繰り返さない。
For example, the
また、機械学習部12は、学習用サブセット1−1〜1−3のそれぞれについて、第1CNNおよび第2CNNを作成する。CNNの作成方法は、学習用サブセット1を用いた第1CNNおよび第2CNNの作成方法と、利用する学習用サブセットが異なる以外同様である。このため、その詳細な説明はここでは繰り返さない。
In addition, the
機械学習部12は、学習用サブセット2および3についても、学習用サブセットの分類処理および分類された学習用サブセットを用いたCNNの作成処理を行う。
The
学習用サブセットiを分類することにより得られる学習用サブセットを、学習用サブセットi−jと記載する(i=1〜3,j=1〜3)。また、学習用サブセットi−jから作成された第1CNNおよび第2CNNを、それぞれ、第1CNNi−jおよび第2CNNi−jと記載する。 A learning subset obtained by classifying the learning subset i is referred to as a learning subset i-j (i = 1 to 3, j = 1 to 3). Further, the first CNN and the second CNN created from the learning subset i-j are referred to as a first CNNi-j and a second CNNi-j, respectively.
機械学習部12が実行する処理により、図3に示すような解像構造化された学習用セットおよびCNNの分類木が作成される。学習用セットおよび第1CNN0を第0階層とすると、第1階層には、学習用セットi、第1CNNiおよび第2CNNiが含まれる。また、第2階層には、学習用セットi−j、第1CNNi−jおよび第2CNNi−jが含まれる。
By the processing executed by the
以下に説明する第1階層フィルタ取得部13〜超解像度処理部16は、入力画像を超解像度処理するための処理部である。
The first layer
第1階層フィルタ取得部13は、第1階層の学習用サブセット1〜3のそれぞれについて、第1CNNおよび第2CNNを取得する。
The first hierarchy
候補画像作成部14は、第1階層フィルタ取得部13が取得した第2CNNiを用いて、入力画像を縮小したQHDサイズの縮小画像を超解像度処理し、2Kサイズの画像を作成する。作成した2Kサイズの画像を候補画像と呼ぶ。つまり、候補画像作成部14は、QHDサイズの縮小画像を、第2CNNiに入力することにより、3枚の2Kサイズの候補画像を作成する。
The candidate
第2階層フィルタ取得部15は、第2階層の複数の学習用サブセットi−jの各々について、学習用サブセットi−jを用いて機械学習された第1CNNi−jおよび第2CNNi−jを取得する(i=1〜3,j=1〜3)。
The second hierarchy
候補画像作成部14は、さらに、第2階層フィルタ取得部15が取得した第2CNNi−jを用いて、入力画像を縮小したQHDサイズの縮小画像を超解像度処理し、2Kサイズの画像(以下、「候補画像」という)を作成する。つまり、候補画像作成部14は、QHDサイズの縮小画像を、第2CNNi−jに入力することにより、2Kサイズの候補画像を作成する。
Further, the candidate
超解像度処理部16は、候補画像作成部14が第2CNNiから作成した3枚の2Kサイズの候補画像のそれぞれと、2Kサイズの入力画像との差分を算出する。画像間の差分の算出方法については、上述した通りである。
The
超解像度処理部16は、算出した差分が最小となる候補画像を作成するに用いた第2CNNmを特定し、特定した第2CNNmを機械学習するに用いた学習用サブセットmを特定する。
The
超解像度処理部16は、特定した学習用サブセットmのサブセットである学習用サブセットm−j(j=1〜3)を特定する。例えば、m=1の場合には、学習用サブセット1−1〜1−3が特定される。
The
超解像度処理部16は、さらに、学習用サブセットm−j(j=1〜3)の第2CNNm−jを用いて作成された3枚の候補画像の中から、2Kサイズの入力画像との差分が最小となる候補画像を特定する。
The
超解像度処理部16は、特定した候補画像を作成するのに用いた第2CNNm−nに対応する第1CNNm−nを用いて、2Kサイズの入力画像を超解像度処理することにより、4Kサイズの超解像度画像を作成する。
The
記憶装置17は、画像や各種データを記憶するための記憶装置であり、HDD(Hard Disk Drive)、不揮発性メモリまたは揮発性メモリなどにより構成される。
次に、超解像度処理装置1が実行する処理の手順について説明する。
The
Next, a procedure of processing executed by the super
図4は、本発明の実施の形態に係る超解像度処理装置1が実行するフィルタ作成処理の処理手順を示すフローチャートである。
FIG. 4 is a flowchart showing a processing procedure of filter creation processing executed by the
図4に示すように、縮小画像作成部11は、記憶装置17に記憶されている学習用セットに含まれる4Kサイズの各学習用画像から、当該画像を、縦および横それぞれ1/2に縮小した2Kサイズの学習用画像と、縦および横それぞれ1/4に縮小したQHDサイズの学習用画像とを作成する(S1)。
As shown in FIG. 4, the reduced image creating unit 11 reduces the image from each 4K-size learning image included in the learning set stored in the
機械学習部12は、学習用セットに含まれる4Kサイズの学習用画像と2Kサイズの縮小画像とに基づいて、機械学習により、2Kサイズの画像を4Kサイズの画像に変換するための第1フィルタ(第1CNN0)を作成する(S2)。
The
機械学習部12は、学習用セットに含まれる2Kサイズの各学習用画像を第1CNN0に入力することにより、4Kサイズの画像を作成する。次に、機械学習部12は、第1CNN0が作成した4Kサイズの画像と、上記2Kサイズの学習用画像を作成するのに用いた4Kサイズの学習用画像との差分を算出する。機械学習部12は、算出した差分に基づいて、4Kサイズの学習用画像を3つの学習用サブセット1〜3のいずれかに分類する(S3)。
The
機械学習部12は、学習用サブセットi(i=1〜3)を用いて、第1CNNiと、第2CNNiを作成する(S4)。機械学習部12は、作成したCNNを、記憶装置17に記憶させる。なお、機械学習部12は、学習用サブセットi(i=1〜3)を適宜交換しながら、機械学習を繰り返し実行することにより、各学習用サブセットとの誤差が小さくなるように第1CNNiおよび第2CNNiを作成してもよい。
The
機械学習部12は、学習用サブセット1〜3のそれぞれについて、学習用サブセットi(i=1〜3)に含まれる2Kサイズの各学習用画像を第1CNNiに入力することにより、4Kサイズの画像を作成する。次に、機械学習部12は、第1CNNiが作成した4Kサイズの画像と、上記2Kサイズの学習用画像を作成するのに用いた4Kサイズの学習用画像との差分を算出する。機械学習部12は、算出した差分に基づいて、4Kサイズの学習用画像を3つの学習用サブセットi−j(j=1〜3)のいずれかに分類する(S5)。これにより、学習用サブセット1〜3の各々が、さらに、3つの学習用サブセットに分類される。
For each of the
機械学習部12は、学習用サブセットi−j(i=1〜3,j=1〜3)を用いて、機械学習により、第1CNNi−jと、第2CNNi−jを作成する(S6)。機械学習部12は、作成したCNNを、記憶装置17に記憶させる。なお、機械学習部12は、学習用サブセットi−j(i=1〜3,j=1〜3)を適宜交換しながら、機械学習を繰り返し実行することにより、各学習用サブセットとの誤差が小さくなるように第1CNNi−jおよび第2CNNi−jを作成してもよい。
The
図4に示したフィルタ作成処理により、図3に示したような階層構図化されたCNNが作成される。 By the filter creation process shown in FIG. 4, a hierarchically structured CNN as shown in FIG. 3 is created.
図5は、本発明の実施の形態に係る超解像度処理装置1が実行する入力画像の超解像度処理の処理手順を示すフローチャートである。
FIG. 5 is a flowchart showing the processing procedure of the super-resolution processing of the input image executed by the
図5に示すように、入力画像取得部10は、超解像度処理の対象となる2Kサイズの入力画像を取得する(S11)。
As illustrated in FIG. 5, the input
縮小画像作成部11は、入力画像取得部10が取得した2Kサイズの入力画像を縮小することによりQHDサイズの縮小画像を作成する(S12)。 The reduced image creation unit 11 creates a QHD size reduced image by reducing the 2K size input image acquired by the input image acquisition unit 10 (S12).
第1階層フィルタ取得部13は、図3に示した分類木の第1階層のフィルタを取得する(S13)。つまり、第1階層フィルタ取得部13は、第1CNN1〜3と、第2CNN1〜3とを、記憶装置17から取得する。
The first hierarchy
候補画像作成部14は、第2CNN1〜3に、入力画像を縮小したQHDサイズの縮小画像を入力することにより、3枚の2Kサイズの候補画像を作成する(S14)。
The candidate
超解像度処理部16は、ステップS14で作成された3枚の2Kサイズの候補画像のそれぞれと、2Kサイズの入力画像との差分を算出する(S15)。
The
超解像度処理部16は、ステップS15で算出した差分が最小となる候補画像を作成するに用いた第2CNNmを特定する(S16)。例えば、差分が最小となる候補画像を作成するのに用いが第2CNNが第2CNN1であると特定される。
The
なお、第2CNN1〜3への入力は、QHDサイズの縮小画像に限定されるものではない。例えば、入力画像から切り出した一部の画像を第2CNN1〜3に入力してもよい。例えば、入力画像から、等間隔に小領域を切り出すことにより該一部の画像を作成してもよいし、入力画像の画素を等間隔に間引くことで該一部の画像を作成してもよい。また、入力画像と同様の性質を有するであろうと想定される複数の画像の中から、一部の画像の一部分を切り出すことにより、該一部の画像を作成しても良い。例えば、入力画像が動画像の一部である場合には、入力画像と同じシーンの動画像の中から、一部の画像を取り出し、取り出した一部の画像から一部分を切り出しても良い。
Note that the input to the
また、該一部の画像に基づいて第2CNN1〜3が作成する候補画像と、該一部の画像との差分から、第2CNNmを上記と同様に特定してもよい。このような処理により、第2CNNmを特定するために必要な時間を短縮することができる。
Further, the second CNNm may be specified in the same manner as described above from the difference between the candidate image created by the
第2階層フィルタ取得部15は、ステップS16で特定された第1階層の第2CNNmの下位の階層である第2階層のフィルタを取得する(S17)。つまり、第2階層フィルタ取得部15は、図3に示した分類木における第1CNNm−jと、第2CNNm−jとを、記憶装置17から読み出す(j=1〜3)。例えば、第2階層フィルタ取得部15は、第1CNN1−1〜1−3と、第2CNN1−1〜1−3とを、記憶装置17から読み出す。
The second hierarchy
候補画像作成部14は、第2CNNm−j(j=1〜3)に、入力画像を縮小したQHDサイズの縮小画像を入力することにより、3枚の2Kサイズの候補画像を作成する(S18)。
The candidate
超解像度処理部16は、ステップS18で作成された3枚の2Kサイズの候補画像のそれぞれと、2Kサイズの入力画像との差分を算出する(S19)。
The
超解像度処理部16は、ステップS19で算出した差分が最小となる候補画像を作成するに用いた第2CNNm−nを特定する(S20)。例えば、差分が最小となる候補画像を作成するのに用いた第2CNNが第2CNN1−2であると特定される。
The
なお、第2CNNm−j(j=1〜3)への入力は、QHDサイズの縮小画像に限定されるものではない。例えば、入力画像から切り出した一部の画像を第2CNNm−j(j=1〜3)に入力してもよい。例えば、入力画像から、等間隔に小領域を切り出すことにより該一部の画像を作成してもよいし、入力画像の画素を等間隔に間引くことで該一部の画像を作成してもよい。また、入力画像と同様の性質を有するであろうと想定される複数の画像の中から、一部の画像の一部分を切り出すことにより、該一部の画像を作成しても良い。例えば、入力画像が動画像の一部である場合には、入力画像と同じシーンの動画像の中から、一部の画像を取り出し、取り出した一部の画像から一部分を切り出しても良い。 Note that the input to the second CNNm-j (j = 1 to 3) is not limited to a QHD size reduced image. For example, a part of the image cut out from the input image may be input to the second CNNm-j (j = 1 to 3). For example, the partial image may be created by cutting out a small region at regular intervals from the input image, or the partial image may be created by thinning pixels of the input image at regular intervals. . Further, the partial image may be created by cutting out a part of the partial image from a plurality of images assumed to have the same properties as the input image. For example, when the input image is a part of the moving image, a part of the image may be extracted from the moving image of the same scene as the input image, and a part of the extracted image may be cut out.
また、該一部の画像に基づいて第2CNNm−j(j=1〜3)が作成する候補画像と、該一部の画像との差分から、第2CNNm−nを上記と同様に特定してもよい。このような処理により、第2CNNm−nを特定するために必要な時間を短縮することができる。 Further, the second CNNm-n is identified in the same manner as described above from the difference between the candidate image created by the second CNNm-j (j = 1 to 3) based on the partial image and the partial image. Also good. By such processing, the time required for specifying the second CNNm-n can be shortened.
超解像度処理部16は、ステップS20で特定された第2階層の第2CNNm−nに対応する第1CNNm−nを用いて、2Kサイズの入力画像を超解像度処理することにより、4Kサイズの超解像度画像を作成する(S21)。上記の例では第1CNN1−2を用いて、超解像度処理が行われる。
The
以上説明したように、本発明の実施の形態によると、2Kサイズの入力画像を縮小したQHDサイズの縮小画像を超解像度処理した時の誤差が最小となる第2CNNを、分類木を用いて探索することができる。第2CNNは、第1CNNと同様の性質を有し、かつ第2CNNが対象とする入力画像の解像度は第1CNNが対象とする入力画像の解像度よりも小さい。このため、第2CNNを効率的に探索することができる。また、探索された第2CNNに対応する第1CNNを用いて、入力画像を超解像度処理することにより、誤差の少ない高精度な超解像度画像を作成することができる。 As described above, according to the embodiment of the present invention, the second CNN that minimizes the error when the QHD size reduced image obtained by reducing the 2K size input image is subjected to the super-resolution processing is searched using the classification tree. can do. The second CNN has the same properties as the first CNN, and the resolution of the input image targeted by the second CNN is smaller than the resolution of the input image targeted by the first CNN. For this reason, the second CNN can be searched efficiently. Further, by performing super-resolution processing on the input image using the first CNN corresponding to the searched second CNN, it is possible to create a highly accurate super-resolution image with few errors.
つまり、第1CNNと、該第1CNNとペアをなす第2CNNとは、サイズの異なる同一の学習用画像を用いて機械学習が行われる。このため、第2CNNが精度よく超解像度処理することのできる画像は、該第2CNNとペアをなす第1CNNによっても、精度よく超解像度処理されることが期待できる。これにより、誤差が最小となる第2NNとペアをなす第1CNNを選択し、選択した第1CNNを用いて入力画像を超解像度処理することにより、入力画像を超解像度処理した時の誤差が小さくなると期待できる。 That is, the first CNN and the second CNN paired with the first CNN are subjected to machine learning using the same learning images having different sizes. For this reason, it can be expected that an image that can be subjected to the super-resolution processing with high accuracy by the second CNN is also accurately processed with the first CNN paired with the second CNN. Accordingly, the first CNN paired with the second NN that minimizes the error is selected, and the input image is super-resolution processed using the selected first CNN, so that the error when the input image is super-resolution processed is reduced. I can expect.
また、第2CNNの構成を第1CNNの構成よりも小さくし、第2CNNを選択した後に、選択した第2CNNに対応する第1CNNを選択することとしているため、第1CNNの選択の処理速度を向上させることができる。ただし、第2CNNの構成は必ずしも第1CNNの構成よりも小さくなくてもよい。 In addition, since the configuration of the second CNN is made smaller than that of the first CNN and the second CNN is selected and then the first CNN corresponding to the selected second CNN is selected, the processing speed of the selection of the first CNN is improved. be able to. However, the configuration of the second CNN is not necessarily smaller than the configuration of the first CNN.
なお、上述の実施の形態では、学習用セットおよび学習用サブセットを、それぞれ、3つの学習用サブセットに分類したが、分類する学習用サブセットの個数は3つに限定されるものではなく、2つ以上であればよい。 In the above-described embodiment, the learning set and the learning subset are each classified into three learning subsets. However, the number of learning subsets to be classified is not limited to three, but two. That is all you need.
また、図3に示したように、学習用サブセットの階層は2階層としたが、1階層であってもよいし、3階層以上あってもよい。 Further, as shown in FIG. 3, the learning subset has two hierarchies, but may have one hierarchy or three or more hierarchies.
また、上述の実施の形態では、超解像度処理された画像と学習用画像との差分に基づいて、学習用セットおよび学習用サブセットを分類したが、分類の仕方はこれに限定されるものではない。例えば、画像の種類(イラスト、風景写真、人物写真)をさらに考慮して分類を行ってもよい。 In the above-described embodiment, the learning set and the learning subset are classified based on the difference between the super-resolution processed image and the learning image. However, the classification method is not limited to this. . For example, classification may be performed in consideration of the type of image (illustration, landscape photograph, portrait photograph).
また、上述の実施の形態では、第1CNNおよび第2CNNは、画像の全体領域を入力として受け、超解像度処理を行うものとして説明したが、各CNNは、画像を分割した複数のブロック領域をそれぞれ入力として受け、各ブロック領域を超解像度処理した後にマージする構成であってもよい。また、各ブロック領域は、隣接するブロック領域とオーバーラップしていてもよいし、ブロック領域間でサイズが異なっていてもよい。このように、CNNを構成することにより、学習用画像の全体領域を入力とせずとも、一部の領域だけを利用してCNNの学習を行うことが可能となる。 In the above-described embodiment, the first CNN and the second CNN have been described as receiving the entire area of the image and performing super-resolution processing. However, each CNN has a plurality of block areas obtained by dividing the image, respectively. A configuration may be adopted in which each block area is received as input and merged after super-resolution processing. In addition, each block area may overlap with an adjacent block area, or the size may be different between the block areas. Thus, by configuring the CNN, it is possible to learn the CNN using only a part of the region without inputting the entire region of the learning image.
また、超解像度処理装置1が処理対象とする画像は、イラストや写真等の通常の画像に限定されるものではない。例えば、MRI(Magnetic Resonance Imaging)画像やCT(Computed Tomography)画像などの医療用のスキャンデータのような、測定データの分布図を処理対象としても良い。また、ベクトルの構造体や、ボクセル画像のような3次元構造体など、超解像度処理が提供可能な処理対象であれば、超解像度処理装置1の入力とすることができる。
Further, the image to be processed by the
また、上記の超解像度処理装置1は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクドライブ、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムとして構成されてもよい。RAMまたはハードディスクドライブには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、超解像度処理装置1は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
The
さらに、上記の超解像度処理装置1を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。RAMには、コンピュータプログラムが記憶されている。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、システムLSIは、その機能を達成する。
Further, some or all of the components constituting the
さらにまた、上記の超解像度処理装置1を構成する構成要素の一部または全部は、超解像度処理装置1に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。ICカードまたはモジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。ICカードまたはモジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、ICカードまたはモジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
Furthermore, some or all of the constituent elements constituting the
また、本発明は、上記に示す方法であるとしてもよい。また、本発明は、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。 Further, the present invention may be the method described above. Further, the present invention may be a computer program that realizes these methods by a computer, or may be a digital signal composed of the computer program.
さらに、本発明は、上記コンピュータプログラムまたは上記デジタル信号をコンピュータ読取可能な非一時的な記録媒体、例えば、フレキシブルディスク、ハードディスクドライブ、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray(登録商標) Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの非一時的な記録媒体に記録されている上記デジタル信号であるとしてもよい。 Furthermore, the present invention provides a non-transitory recording medium that can read the computer program or the digital signal, such as a flexible disk, a hard disk drive, a CD-ROM, an MO, a DVD, a DVD-ROM, a DVD-RAM, and a BD. (Blu-ray (registered trademark) Disc), or recorded in a semiconductor memory or the like. Further, the digital signal may be recorded on these non-temporary recording media.
また、本発明は、上記コンピュータプログラムまたは上記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。 In the present invention, the computer program or the digital signal may be transmitted via an electric communication line, a wireless or wired communication line, a network represented by the Internet, a data broadcast, or the like.
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、上記メモリは、上記コンピュータプログラムを記憶しており、上記マイクロプロセッサは、上記コンピュータプログラムに従って動作するとしてもよい。 The present invention may be a computer system including a microprocessor and a memory, wherein the memory stores the computer program, and the microprocessor operates according to the computer program.
また、上記プログラムまたは上記デジタル信号を上記非一時的な記録媒体に記録して移送することにより、または上記プログラムまたは上記デジタル信号を上記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
さらに、上記実施の形態および上記変形例をそれぞれ組み合わせるとしてもよい。
Further, by recording the program or the digital signal on the non-temporary recording medium and transferring it, or transferring the program or the digital signal via the network or the like, another independent computer It may be implemented by the system.
Furthermore, the above embodiment and the above modification examples may be combined.
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。 The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the meanings described above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.
本発明は、入力画像の解像度を高解像度化した画像を作成する超解像度処理装置等に用いると有益である。 The present invention is useful when used in a super-resolution processing apparatus or the like that creates an image in which the resolution of an input image is increased.
1 超解像度処理装置
10 入力画像取得部
11 縮小画像作成部
12 機械学習部
13 第1階層フィルタ取得部
14 候補画像作成部
15 第2階層フィルタ取得部
16 超解像度処理部
17 記憶装置
DESCRIPTION OF
Claims (4)
第3解像度の画像を含む学習用セットのサブセットである第1階層の複数の学習用サブセットの各々について、該学習用サブセットを用いて機械学習された、第2解像度の画像を第3解像度の画像に超解像度処理するための第1フィルタ、および第2解像度よりも低解像度の第1解像度の画像を第2解像度の画像に超解像度処理するための第2フィルタを取得する第1階層フィルタ取得部と、
第2解像度の入力画像から第1解像度の縮小画像を作成する縮小画像作成部と、
前記第1階層フィルタ取得部が取得した各前記第2フィルタを用いて、前記第1解像度の縮小画像を超解像度処理して第2解像度の候補画像を作成する候補画像作成部と、
前記候補画像作成部が作成した前記第2解像度の候補画像と前記第2解像度の入力画像との差分が最小となる第2フィルタに対応する第1フィルタを用いて、前記第2解像度の入力画像を超解像度処理することにより、第3解像度の超解像度画像を作成する超解像度処理部と
を備える超解像度処理装置。 A super-resolution processing device that performs super-resolution processing on a second-resolution image and creates a third-resolution image that is higher in resolution than the second resolution,
For each of the plurality of learning subsets in the first layer, which is a subset of the learning set including the third resolution image, the second resolution image machine-learned using the learning subset is the third resolution image. A first filter for super-resolution processing, and a first layer filter acquisition unit for acquiring a second filter for super-resolution processing of a first resolution image having a resolution lower than the second resolution into a second resolution image When,
A reduced image creation unit that creates a reduced image of the first resolution from an input image of the second resolution;
A candidate image creation unit that creates a second resolution candidate image by performing super-resolution processing on the reduced image of the first resolution using each of the second filters obtained by the first layer filter acquisition unit;
Using the first filter corresponding to the second filter that minimizes the difference between the second resolution candidate image created by the candidate image creation unit and the second resolution input image, the second resolution input image And a super-resolution processing unit that creates a super-resolution image of the third resolution by performing super-resolution processing.
前記差分が最小となる前記第2フィルタを機械学習するのに用いた前記第1階層の学習用サブセットのサブセットである第2階層の複数の学習用サブセットの各々について、該学習用サブセットを用いて機械学習された第1フィルタおよび第2フィルタを取得する第2階層フィルタ取得部を備え、
前記候補画像作成部は、さらに、前記第2階層フィルタ取得部が取得した前記第2階層の各前記第2フィルタを用いて、前記第1解像度の縮小画像を超解像度処理して第2解像度の候補画像を作成し、
前記超解像度処理部は、さらに、前記候補画像作成部が前記第2階層の前記第2フィルタを用いて作成した前記第2解像度の候補画像と前記第2解像度の入力画像との差分が最小となる第2フィルタに対応する第1フィルタを用いて、前記第2解像度の入力画像を超解像度処理することにより、前記第3解像度の超解像度画像を作成する
請求項1に記載の超解像度処理装置。 further,
For each of a plurality of learning subsets in the second hierarchy, which is a subset of the learning subset in the first hierarchy used for machine learning of the second filter with the smallest difference, using the learning subset A second hierarchical filter acquisition unit that acquires the first and second machine-learned filters;
The candidate image creation unit further performs super-resolution processing on the reduced image of the first resolution using each of the second filters of the second layer acquired by the second layer filter acquisition unit. Create a candidate image,
The super-resolution processing unit further has a minimum difference between the second-resolution candidate image created by the candidate-image creating unit using the second filter in the second hierarchy and the second-resolution input image. The super-resolution processing apparatus according to claim 1, wherein a super-resolution image of the third resolution is generated by performing super-resolution processing on the input image of the second resolution using a first filter corresponding to the second filter. .
第3解像度の画像を含む学習用セットのサブセットである第1階層の複数の学習用サブセットの各々について、該学習用サブセットを用いて機械学習された、第2解像度の画像を第3解像度の画像に超解像度処理するための第1フィルタ、および第2解像度よりも低解像度の第1解像度の画像を第2解像度の画像に超解像度処理するための第2フィルタを取得するステップと、
第2解像度の入力画像から第1解像度の縮小画像を作成するステップと、
取得された各前記第2フィルタを用いて、前記第1解像度の縮小画像を超解像度処理して第2解像度の候補画像を作成するステップと、
作成された前記第2解像度の候補画像と前記第2解像度の入力画像との差分が最小となる第2フィルタに対応する第1フィルタを用いて、前記第2解像度の入力画像を超解像度処理することにより、第3解像度の超解像度画像を作成するステップと
を含む超解像度処理方法。 A super-resolution processing method for causing a device that performs super-resolution processing of a second resolution image to generate a third resolution image having a higher resolution than the second resolution,
For each of the plurality of learning subsets in the first layer, which is a subset of the learning set including the third resolution image, the second resolution image machine-learned using the learning subset is the third resolution image. Obtaining a first filter for super-resolution processing and a second filter for super-resolution processing of a first resolution image having a lower resolution than the second resolution into a second resolution image;
Creating a reduced image of the first resolution from the input image of the second resolution;
Using each acquired second filter to create a second resolution candidate image by super-resolution processing the reduced image of the first resolution;
Using the first filter corresponding to the second filter that minimizes the difference between the created candidate image of the second resolution and the input image of the second resolution, the input image of the second resolution is subjected to super-resolution processing. Thereby creating a super-resolution image of the third resolution.
コンピュータを、
第3解像度の画像を含む学習用セットのサブセットである第1階層の複数の学習用サブセットの各々について、該学習用サブセットを用いて機械学習された、第2解像度の画像を第3解像度の画像に超解像度処理するための第1フィルタ、および第2解像度よりも低解像度の第1解像度の画像を第2解像度の画像に超解像度処理するための第2フィルタを取得する第1階層フィルタ取得部と、
第2解像度の入力画像から第1解像度の縮小画像を作成する縮小画像作成部と、
前記第1階層フィルタ取得部が取得した各前記第2フィルタを用いて、前記第1解像度の縮小画像を超解像度処理して第2解像度の候補画像を作成する候補画像作成部と、
前記候補画像作成部が作成した前記第2解像度の候補画像と前記第2解像度の入力画像との差分が最小となる第2フィルタに対応する第1フィルタを用いて、前記第2解像度の入力画像を超解像度処理することにより、第3解像度の超解像度画像を作成する超解像度処理部と
して機能させるためのコンピュータプログラム。 A computer program for super-resolution processing a second resolution image to create a third resolution image having a higher resolution than the second resolution,
Computer
For each of the plurality of learning subsets in the first layer, which is a subset of the learning set including the third resolution image, the second resolution image machine-learned using the learning subset is the third resolution image. A first filter for super-resolution processing, and a first layer filter acquisition unit for acquiring a second filter for super-resolution processing of a first resolution image having a resolution lower than the second resolution into a second resolution image When,
A reduced image creation unit that creates a reduced image of the first resolution from an input image of the second resolution;
A candidate image creation unit that creates a second resolution candidate image by performing super-resolution processing on the reduced image of the first resolution using each of the second filters obtained by the first layer filter acquisition unit;
Using the first filter corresponding to the second filter that minimizes the difference between the second resolution candidate image created by the candidate image creation unit and the second resolution input image, the second resolution input image A computer program for functioning as a super-resolution processing unit that creates a super-resolution image of the third resolution by performing super-resolution processing on the.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017046113A JP6236731B1 (en) | 2017-03-10 | 2017-03-10 | Super-resolution processing apparatus, super-resolution processing method, and computer program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017046113A JP6236731B1 (en) | 2017-03-10 | 2017-03-10 | Super-resolution processing apparatus, super-resolution processing method, and computer program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP6236731B1 true JP6236731B1 (en) | 2017-11-29 |
| JP2018151747A JP2018151747A (en) | 2018-09-27 |
Family
ID=60477075
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017046113A Active JP6236731B1 (en) | 2017-03-10 | 2017-03-10 | Super-resolution processing apparatus, super-resolution processing method, and computer program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6236731B1 (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2022088588A (en) * | 2021-06-09 | 2022-06-14 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Image quality enhancement method, device, instrument and medium |
| US12061257B2 (en) | 2018-12-27 | 2024-08-13 | Exo Imaging, Inc. | Methods to maintain image quality in ultrasound imaging at reduced cost, size, and power |
| US12347066B2 (en) | 2019-11-08 | 2025-07-01 | Olympus Corporation | Information processing system, endoscope system, and information storage medium |
Families Citing this family (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102122065B1 (en) * | 2018-10-23 | 2020-06-11 | 주식회사 아나패스 | Super resolution inference method and apparatus using residual convolutional neural network with interpolated global shortcut connection |
| JP2020135535A (en) * | 2019-02-21 | 2020-08-31 | 株式会社Ye Digital | Vehicle discrimination method, vehicle discrimination device and vehicle discrimination program |
| CN114270799B (en) * | 2019-06-13 | 2024-04-05 | Lg伊诺特有限公司 | Camera device and image generation method for camera device |
| KR102213765B1 (en) * | 2019-08-09 | 2021-02-08 | 엘지이노텍 주식회사 | An Image Sensor, A Camera Module And Optical Device Comprising A Camera Module |
| US12430711B2 (en) | 2019-12-04 | 2025-09-30 | Lg Electronics Inc. | Signal processing device and image display device comprising same |
| JP7450863B2 (en) * | 2020-04-02 | 2024-03-18 | ソニーグループ株式会社 | Super-resolution of block compressed textures for texture mapping applications |
| EP3937120B1 (en) * | 2020-07-08 | 2023-12-20 | Sartorius Stedim Data Analytics AB | Computer-implemented method, computer program product and system for processing images |
| US11445198B2 (en) * | 2020-09-29 | 2022-09-13 | Tencent America LLC | Multi-quality video super resolution with micro-structured masks |
| KR20210018381A (en) * | 2021-02-02 | 2021-02-17 | 엘지이노텍 주식회사 | An Image Sensor, A Camera Module And Optical Device Comprising A Camera Module |
| KR102337412B1 (en) * | 2021-03-17 | 2021-12-09 | 주식회사 에스아이에이 | Method for super resolution imaging based on deep learning |
| KR20220129995A (en) | 2021-03-17 | 2022-09-26 | 주식회사 에스아이에이 | Deep learning-based super-resolution imaging method |
| KR102406287B1 (en) * | 2021-12-31 | 2022-06-08 | 주식회사 에스아이에이 | super resolution imaging method using collaborative learning |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2431889C1 (en) * | 2010-08-06 | 2011-10-20 | Дмитрий Валерьевич Шмунк | Image super-resolution method and nonlinear digital filter for realising said method |
| JP2015129987A (en) * | 2014-01-06 | 2015-07-16 | 国立大学法人三重大学 | System and method of forming medical high-resolution image |
-
2017
- 2017-03-10 JP JP2017046113A patent/JP6236731B1/en active Active
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12061257B2 (en) | 2018-12-27 | 2024-08-13 | Exo Imaging, Inc. | Methods to maintain image quality in ultrasound imaging at reduced cost, size, and power |
| US12347066B2 (en) | 2019-11-08 | 2025-07-01 | Olympus Corporation | Information processing system, endoscope system, and information storage medium |
| JP2022088588A (en) * | 2021-06-09 | 2022-06-14 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Image quality enhancement method, device, instrument and medium |
| JP7389840B2 (en) | 2021-06-09 | 2023-11-30 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | Image quality enhancement methods, devices, equipment and media |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018151747A (en) | 2018-09-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6236731B1 (en) | Super-resolution processing apparatus, super-resolution processing method, and computer program | |
| US10997466B2 (en) | Method and system for image segmentation and identification | |
| KR20220031695A (en) | Image recognition method and related devices and devices | |
| JP6724267B1 (en) | Learning device, inference device, learning model generation method, and inference method | |
| US20190228508A1 (en) | Digital Image Fill | |
| US11886990B2 (en) | Classification device, classification method, and computer program product | |
| CN108986115B (en) | Medical image segmentation method and device and intelligent terminal | |
| US10303446B2 (en) | Program generating method, program generating device, and recording medium | |
| WO2020059446A1 (en) | Learning device and learning method | |
| JPWO2013076930A1 (en) | Medical image compression apparatus, medical image compression method, and prediction knowledge database creation apparatus | |
| CN113487656A (en) | Image registration method and device, training method and device, control method and device | |
| WO2020252256A1 (en) | Deep-learning models for image processing | |
| CN113724185A (en) | Model processing method and device for image classification and storage medium | |
| CN114092463A (en) | Digital breast tomography focus positioning device | |
| CN108876847A (en) | Image position method, device, system and storage medium | |
| CN116894844B (en) | A hip joint image segmentation and key point linkage recognition method and device | |
| JP2018124990A (en) | Model generation apparatus, evaluation apparatus, model generation method, evaluation method, and program | |
| CN113379770B (en) | Construction method of nasopharyngeal carcinoma MR image segmentation network, image segmentation method and device | |
| CN113837192B (en) | Image segmentation method and device, and neural network training method and device | |
| JP2020075063A (en) | Image interpolation/organ extraction device and program thereof | |
| JP6347028B1 (en) | UPSAMPLE DEVICE, COMPUTER PROGRAM, COMPUTER SYSTEM, DEVICE, AND UPSAMPLE METHOD | |
| JP2023062690A (en) | MODEL TRAINING DEVICE, IMAGE PROCESSING DEVICE, AND MODEL TRAINING METHOD | |
| JP7321271B2 (en) | LEARNING IMAGE GENERATION DEVICE, METHOD AND PROGRAM, AND LEARNING METHOD, DEVICE AND PROGRAM | |
| CN117392677A (en) | A semantic segmentation method for spinal tumor MRI images based on multi-attention mechanism | |
| CN116308976A (en) | On-site adaptive training device and on-site adaptive training method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170905 |
|
| RD05 | Notification of revocation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7425 Effective date: 20170905 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171010 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171014 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6236731 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |