JP2019087012A

JP2019087012A - 情報処理装置、情報処理方法、コンピュータプログラム、及び記憶媒体

Info

Publication number: JP2019087012A
Application number: JP2017214625A
Authority: JP
Inventors: 裕一郎飯尾; Yuichiro Iio; 優和真継; Masakazu Matsugi
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2017-11-07
Filing date: 2017-11-07
Publication date: 2019-06-06
Also published as: US10783402B2; US20190138852A1

Abstract

【課題】学習処理に利用できるデータを増やし、生成する推定器の推定精度を向上する情報処理装置を提供する。【解決手段】情報処理装置１０００は、教師ありデータに対して推定処理を行い、教師情報と推定結果の関係性を記憶する。教師なしデータが入力されたときに、情報処理装置１０００は、教師なしデータと推定結果の類似度が高い教師ありデータを探索し、検出された教師ありデータの教師情報と推定結果の関係性に基づいて、教師なしデータの推定結果から教師情報を生成する。【選択図】図１

Description

本発明は、機械学習に用いるデータの教師情報を作成する技術に関し、特に学習データの教師情報を利用して、教師なしデータに疑似的な教師情報を付与する教師情報作成技術に関する。

機械学習を用いた推定器の学習では、高性能な推定器を作成するため、大量の教師ありデータが必要である。しかし、人間が大量のデータに教師情報を付与するのは手間がかかるために現実的ではない。そのために、少量の教師ありデータを利用して学習に用いるデータを増やす手法が知られている。特許文献１は、既存の教師あり画像に対して色空間を変形した新しい画像を作成し、作成した新しい画像に元の教師あり画像の教師情報を関連付けて学習画像セットに追加することにより、学習画像を増やす方法を開示する。この方法は、元の教師あり画像の色空間を変形するために、色情報に応じて教師情報が変動するような評価対象に対しては適用できない。色情報に応じて教師情報が変動する評価対象としては、例えば、非特許文献１に開示する写真の審美度評価が挙げられる。写真の審美度は、写真を見たときに人が感じる美しさや良し悪しの度合いを指す指標である。審美度は、元画像に対する任意の画像処理に応じて容易に変動してしまう可能性がある。

このように既存の教師ありデータから学習データを増やすことが困難なデータセットに対して、教師なしデータを学習に利用する半教師あり学習という手法が知られている。半教師あり学習の一つに、self-trainingとよばれる手法がある。self-trainingは、予め用意された教師ありデータのみを用いて推定モデルを学習し、作成した推定モデルを用いて教師なしデータに対して推定処理を行う。この推定処理の結果の信頼度が一定の閾値を超えている場合、当該推定結果を教師なし画像の教師情報とみなして学習画像セットに追加し、再度学習を行う。

米国特許出願公開第２０１４／０１７７９４７号明細書

Z. Wang. F. Dolcos, D. Beck, S. Chang and T. Huang, "Brain-Inspired Deep Networks for Imge AestheticsAssessment", arXiv:1601.04155, 2016 .

一般に、分類問題を推定する場合、self-trainingの手法を用いるときに教師なしデータに付与される教師情報は、クラスラベルである。そのため、分類問題では、教師なしデータは、付与されるクラスラベルの推定を誤った場合、誤った教師情報で再学習が行われ、付与されるクラスラベルの推定が正しい場合、真値との誤差が生じない。回帰問題を推定する場合、self-trainingの手法を用いるときに教師なしデータに付与される教師情報は、推定結果である連続値となる。連続値の推定結果は、ほとんどの場合において真値との誤差が生じる。そのため再学習時には、誤差が含まれた教師情報を持つ教師なしデータを含む学習データセットを用いて学習が行われ、結果的に、推定モデルの精度劣化を招くことがある。

本発明は、上記課題に鑑みてなされたものであり、学習処理に利用できるデータを増やし、生成する推定器の推定精度を向上する情報処理装置を提供することを目的とする。

本発明の情報処理装置は、所定の評価結果を教師情報として含む複数の学習データを用いて、入力データの評価情報を推定するための第１推定モデルを生成する第１推定モデル生成手段と、前記第１推定モデルを用いて前記複数の学習データの評価情報を推定し、前記推定した評価情報を学習データ毎に関連付けて記憶する学習データ推定処理手段と、前記第１推定モデルを用いて教師なしデータの評価情報を推定する第１教師なしデータ推定処理手段と、前記学習データの評価情報の推定結果と前記教師なしデータの評価情報の推定結果との類似度に基づいて、教師なしデータと学習データとを関連付ける関連付け手段と、前記関連付けされた学習データに基づいて教師なしデータの教師情報を設定する教師情報設定手段と、前記教師情報を含む複数の学習データ及び前記教師情報を設定された教師なしデータを用いて、入力データの評価情報を推定する第２推定モデルを生成する第２推定モデル生成手段と、を備えることを特徴とする。

本発明によれば、教師情報が連続値である場合に、学習処理に利用できるデータを増やして、生成する推定器の推定精度を向上することが可能となる。

情報処理装置の機能構成例示図。推定モデル生成処理を表すフローチャート。推定結果類似教師なしデータの探索処理を表すフローチャート。（ａ）、（ｂ）は、推定結果類似教師なしデータの探索処理の説明図。推定精度の検証処理を表すフローチャート。（ａ）、（ｂ）は、教師なしデータの教師情報を生成する処理の説明図。情報処理装置の機能構成例示図。推定モデル生成処理を表すフローチャート。学習データ分類処理を表すフローチャート。情報処理装置の機能構成例示図。推定モデル生成処理を表すフローチャート。（ａ）、（ｂ）は、推定モデル生成処理の説明図。（ａ）、（ｂ）は、推定モデル生成処理の説明図。（ａ）、（ｂ）は、推定モデル生成処理の説明図。

以下、図面を参照して、実施形態を詳細に説明する。

本実施形態の情報処理装置は、連続値である多値情報を推定する推定器を学習する。情報処理装置は、教師なしデータに自動的に教師情報を付加し、予め用意された学習データセットに追加して学習を行う。ここでは、写真のユーザ満足度指標の推定を行う場合を例として説明する。ユーザ満足度指標とは、写真を見たユーザがその写真をどれくらいいいと思うか、といった満足度を表す指標である。例えばユーザ満足度指標は、写真に写っている被写体やその被写体の配置関係、写真の色合いといった複合的な要素によって判断される総合的な指標であり、審美性もユーザ満足度に関わる一要素である。本実施形態で学習データとして用いられる写真は、予め複数の評価者によって満足度をＸ段階で評価されている。Ｘは整数である。例えばＸが「３」である場合、評価者は、対象の写真を３段階（例えば、良い／普通／悪い）で評価することになる。学習データの教師情報には、複数の評価者によって評価された満足度の評価分布であるＸビンのヒストグラム（評価情報）が用いられる。ヒストグラムは、ビンの合計値が「１」になるように、評価者の人数で予め正規化されている。本実施形態は、推定すべき情報を、ユーザ満足度指標である正規化ヒストグラムとする。

正規化ヒストグラムの各ビンの値は連続値である。そのためにユーザ満足度指標の推定は、ヒストグラムのビン数分の実数値として推定する回帰問題となる。回帰問題の場合、教師なしデータの推定結果である連続値には、ほとんどの場合において真値との誤差が発生する。そのため、教師なしデータを学習に利用する半教師あり学習で教師なしデータの推定結果を教師情報として用いた場合、誤差を含む教師情報を用いて学習することになり、推定モデルの精度劣化につながる。

本実施形態の情報処理装置は、教師情報を持つ学習データについても推定処理を行い、教師情報と誤差を含む推定結果の関係を記憶する。情報処理装置は、教師なしデータと推定結果が類似する学習データを探索し、該学習データの教師情報に基づいて教師なしデータの教師情報を作成する。これにより教師情報における推定処理による誤差の影響が軽減される。情報処理装置は、ＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）、及びＲＡＭ（Random Access Memory）を有するコンピュータシステムである。情報処理装置は、ＲＯＭに格納されるコンピュータプログラムを、ＲＡＭを作業領域に用いて実行することで、本実施形態の各機能を実現する。なお、本発明の技術的範囲はこれらの実施の形態に限定されず、特許請求の範囲に記載された事項とその均等の範囲まで及ぶものである。本実施例においては評価対象である「データ」とは写真のことを指すが、本発明においては「データ」は画像に限らない。

（第１実施形態）
図１は、本実施形態の情報処理装置の機能構成例示図である。情報処理装置１０００は、第１推定モデル生成部１１０、学習データ推定処理部１２０、教師なしデータ推定処理部１３０、推定結果類似教師なしデータ探索部１４０、及び教師情報設定部１５０として機能する。また、情報処理装置１０００は、推定精度検証部１６０、学習データ追加部１７０、及び第２推定モデル生成部１８０として機能する。更に、情報処理装置１０００は、第１推定モデル生成に用いる第１学習データセット２００及び精度検証データセット７００を備える。第１学習データセット２００及び精度検証データセット７００は、所定のストレージに格納される。このような構成の情報処理装置１０００は、１つ以上の教師なしデータから構成される教師なしデータセット４００を格納するストレージが接続される。情報処理装置１０００は、処理結果として第２推定モデル６００を出力する。第２推定モデル６００は所定のストレージに格納される。

第１学習データセット２００は、教師情報を含む複数の学習データから構成されるデータセットである。本実施形態で推定される情報であるユーザ満足度指標は、画像のシーンカテゴリに大きな影響を受けるため、想定される入力画像のシーンカテゴリに応じて、第１学習データセット２００に含まれる学習データが設定される。画像のシーンカテゴリは、撮影の被写体やシチュエーションによる分類結果である。画像のシーンカテゴリは、具体的には、「風景」、「ポートレート」といった抽象的な分類、「花火」、「紅葉」といった撮影対象に着目した分類、「結婚式」、「運動会」といったシチュエーションに着目した分類など、着目する要素に応じて様々に存在する。シーンカテゴリは、１枚の画像に対して複数ラベル付けすることができる。

例えば、学習画像データセットに風景カテゴリの画像しか存在しない場合、ポートレート画像のユーザ満足度指標を推定することは困難である。そのために、任意の入力画像に対応するためには、第１学習データセット２００に複数のカテゴリの学習画像が均等に存在することが望ましい。特定のカテゴリの画像のみを入力として取得するという前提条件がある場合、学習データセットに異なるカテゴリの学習データが含まれていると推定精度の劣化を招く。そのためにこの場合は、対象となるカテゴリの画像のみで第１学習データセット２００が構成される。

精度検証データセット７００は、第１学習データセットに含まれない複数のデータから構成される。精度検証データセット７００に含まれる各データも、第１学習データセット同様に、教師情報を含む。精度検証データセット７００に含まれる画像セットのシーンカテゴリ分布は、第１学習データセット２００に含まれる画像セットのシーンカテゴリ分布と同様であることが望ましい。

第１推定モデル生成部１１０は、第１学習データセット２００を用いて学習を行い、第１推定モデル３００を生成する。第１推定モデル３００は、所定のストレージに格納される。第１学習データセット２００を構成する複数の学習データは、教師情報としてユーザ満足度指標である正規化ヒストグラムを含む。第１推定モデル３００は、入力データとして画像を取得し、推定結果としてユーザ満足度指標である正規化ヒストグラムを出力する。

学習データ推定処理部１２０は、第１学習データセット２００に含まれる全ての学習データに対して、第１推定モデル３００を用いて推定処理を行う。学習データ推定処理部１２０は、推定結果である推定ユーザ満足度指標を、学習データ毎に関連付けて記憶する。

教師なしデータ推定処理部１３０は、１つ以上の教師なしデータから構成される教師なしデータセット４００を入力とする。教師なしデータ推定処理部１３０は、第１推定モデル３００を用いて教師なしデータセット４００に含まれる全ての教師なしデータに対して推定処理を行う。教師なしデータ推定処理部１３０は、推定結果である推定ユーザ満足度指標を教師なしデータ毎に記憶する。

推定結果類似教師なしデータ探索部１４０は、学習データの推定ユーザ満足度指標及び教師なしデータの推定ユーザ満足度指標を用いて、第１学習データセット２００に含まれる学習データと推定結果が類似した教師なしデータを探索する。推定結果類似教師なしデータ探索部１４０は、探索した教師なしデータと、最も推定結果の類似度の高い学習データとを対応付ける。

教師情報設定部１５０は、推定結果類似教師なしデータ探索部１４０で教師なしデータに対応付けられた学習データの教師情報と、推定ユーザ満足度指標との関係に基づいて、教師なしデータの教師情報を導出して設定する。推定精度検証部１６０は、教師情報設定部１５０で教師情報を設定した教師なしデータを第１学習データセットに含まれる学習データに加えて学習を行い、精度検証データセット７００を用いて出力された推定モデルの推定精度を検証する。推定精度検証部１６０は、推定精度が閾値以上である場合に、該教師なしデータを学習データ追加リストに追加する。

学習データ追加部１７０は、推定精度検証部１６０で作成された学習データ追加リストに含まれる教師なしデータと、第１学習データセットに含まれる学習データとを合わせて、第２学習データセット５００を作成する。第２推定モデル生成部１８０は、第２学習データセット５００を用いて学習を行い、第２推定モデル６００を生成する。

図２は、このような構成の情報処理装置１０００による推定モデル生成処理を表すフローチャートである。

第１推定モデル生成部１１０は、予め用意された第１学習データセット２００を用いて学習を行い、第１推定モデル３００を生成する（Ｓ２０１）。第１推定モデル生成部１１０は、既知の手法で学習データからの特徴抽出及び推定モデルの生成を行う。例えば、第１推定モデル生成部１１０は、対象データが画像である場合に、学習手法の一例として深層学習を用いる。

学習データ推定処理部１２０は、第１学習データセット２００に含まれる学習データについて、第１推定モデル３００を用いて推定処理を行う（Ｓ２０２）。学習データ推定処理部１２０は、推定したユーザ満足度指標を選択した学習データ毎に記憶する。学習データ推定処理部１２０は、第１学習データセット２００から、推定ユーザ満足度指標が記憶されていない学習データを検索する（Ｓ２０３）。推定ユーザ満足度指標が含まれていない学習データを検出した場合（Ｓ２０３：Y）、学習データ推定処理部１２０は、Ｓ２０２の処理に戻り、該学習データに対する学習データ推定処理を行う。学習データ推定処理部１２０は、Ｓ２０２、Ｓ２０３の処理により、第１学習データセット２００に含まれる全ての学習データに対して、人間が実際に評価した結果のユーザ満足度指標及び第１推定モデルで推定した推定ユーザ満足度指標を記憶する。

以上のような学習データ推定処理部１２０の処理に並列に、教師なしデータ推定処理部１３０は、予め用意された教師なしデータセット４００に含まれる教師なしデータについて、第１推定モデル３００を用いて推定処理を行う（Ｓ２０４）。教師なしデータ推定処理部１３０は、推定したユーザ満足度指標を、該教師なしデータの推定ユーザ満足度指標として記憶する。教師なしデータ推定処理部１３０は、教師なしデータセット４００から、推定ユーザ満足度指標が記憶されていない教師なしデータを検索する（Ｓ２０５）。推定ユーザ満足度指標が含まれない教師なしデータを検出した場合（Ｓ２０５：Y）、教師なしデータ推定処理部１３０は、Ｓ２０４の処理に戻り、該教師なしデータに対する推定処理を行う。教師なしデータ推定処理部１３０は、Ｓ２０４、Ｓ２０５の処理により、教師なしデータセット４００に含まれる全ての教師なしデータに対して、第１推定モデルで推定した推定ユーザ満足度指標を記憶する。

全ての学習データに対して推定ユーザ満足度指標が算出され（Ｓ２０３：N）、且つ全ての教師なしデータに対して推定ユーザ満足度指標が算出された場合（Ｓ２０５：N）、情報処理装置１０００は、次の処理に移行する。推定結果類似教師なしデータ探索部１４０は、第１学習データセット２００に含まれる学習データに推定結果が類似した教師なしデータを探索し、各教師なしデータを最も推定結果の類似度の高い学習データに対応付ける（Ｓ２０６）。Ｓ２０６の推定結果類似教師なしデータの探索処理の詳細は後述する。

教師情報設定部１５０は、教師なしデータの教師情報として、Ｓ２０６の処理で対応付けられた学習データの教師情報を導出して設定する（Ｓ２０７）。推定精度検証部１６０は、精度検証データセット７００及び教師なしデータを用いて、学習を行った場合の推定モデルの推定精度を検証する（Ｓ２０８）。推定精度検証部１６０は、Ｓ２０８の処理により、教師なしデータを学習データ追加リストに追加する。Ｓ２０８の推定精度の検証処理の詳細は後述する。

学習データ追加部１７０は、学習データ追加リストに記載されている教師なしデータ及び第１学習データセット２００に含まれている学習データに基づいて、第２学習データセット５００を作成する（Ｓ２０９）。第２推定モデル生成部１８０は、第２学習データセット５００を用いて学習を行い、第２推定モデル６００を生成する（Ｓ２１０）。第２推定モデル生成部１８０は、Ｓ２０１の処理で行った学習と同様の学習を行うことで第２推定モデル６００を生成する。第２推定モデル生成部１８０は、生成した第２推定モデル６００を出力する。

なお、Ｓ２０８の処理で学習データ追加リストに１枚も教師なしデータが追加されなかった場合、第２学習データセット５００は第１学習データセット２００と完全に一致する。そのために教師なしデータを学習データに加えることによる推定モデルの精度向上が見込めない。この場合、情報処理装置１０００は、予め用意された教師ありデータのみを学習に用いて生成した推定モデルを第２推定モデル６００として出力することになる。

図３は、Ｓ２０６の推定結果類似教師なしデータの探索処理を表すフローチャートである。図４は、推定結果類似教師なしデータの探索処理の説明図である。

推定結果類似教師なしデータ探索部１４０は、特徴量ベースで学習データに類似する教師なしデータを複数取得する（Ｓ３０１）。類似データ検索に用いる特徴量は、推定すべき情報に応じた特徴量である。例えば画像の場合に用いられる特徴量の一例として、カラーヒストグラムやＳＩＦＴ特徴量が挙げられる。本実施形態の推定対象であるユーザ満足度については、写真の構図や写っているオブジェクト、色合いなどが大きく影響を与える指標であるため、それらの要素を抽出した特徴量を利用することが有効である。

図４（ａ）は、特徴量ベース類似データ探索処理の模式図である。図４（ａ）は、Ｍ枚の教師なしデータＡ１〜Ａｍ及びＮ枚の学習データＬ１〜Ｎｎから特徴量抽出を行い、抽出した特徴量の類似度を算出する様子を表す。特徴量類似度は、０以上１以下の実数値で表される。類似度が「１」の場合、２つの画像は完全に一致する。推定結果類似教師なしデータ探索部１４０は、抽出した特徴量に応じて異なる類似度指標を用いて、特徴量類似度を算出することができる。例えば、カラーヒストグラム特徴量を用いる場合、推定結果類似教師なしデータ探索部１４０は、ヒストグラム同士の類似度指標であるヒストグラムインターセクションを用いて画像間類似度を算出する。ＳＩＦＴ特徴量を用いる場合、推定結果類似教師なしデータ探索部１４０は、Bag of Featuresと呼ばれる手法を利用して画像間類似度を算出する。

推定結果類似教師なしデータ探索部１４０は、算出した画像間類似度が閾値以上である教師なしデータと学習データとのペアを、類似画像ペアとして選択する。図５（ａ）では、閾値が「０．７５」である。学習データと教師なしデータとの類似度が閾値以上のペアとして、学習データＬ１と教師なしデータＡ１、学習データＬ１と教師なしデータＡｍ、学習データＬ２と教師なしデータＡ１、学習データＬｎと教師なしデータＡｍの各ペアが選択される。Ｓ３０１の処理は、データそのものの素性が学習データと類似している教師なしデータを抽出することを目的としている。

推定結果類似教師なしデータ探索部１４０は、Ｓ３０１の処理で取得した学習データと教師なしデータとのペアについて、推定ユーザ満足度指標の類似度を算出する（Ｓ３０２）。本実施形態では、推定ユーザ満足度指標が正規化ヒストグラムとして定義されているため、推定ユーザ満足度指標の類似度は、ヒストグラム間距離で定義される。図４（ｂ）は、推定ユーザ満足度の類似度算出処理の模式図である。図４（ｂ）は、Ｓ３０１の処理で選択された全ての学習データと教師なしデータとのペアにおける推定ユーザ満足度の類似度を算出する様子を表す。例えば、推定結果類似度マトリックスによると、学習データＬｎの推定結果である正規化ヒストグラムと教師なしデータＡｍの推定結果である正規化ヒストグラムとの類似度は、「０．６３」と算出されている。同様に学習データＬ１と教師なしデータＡ１との推定結果（類似度）は「０．８２」である。学習データＬ１と教師なしデータＡｍとの推定結果（類似度）は「０．８５」である。学習データＬ２と教師なしデータＡ１との推定結果（類似度）は「０．９５」である。

推定結果類似教師なしデータ探索部１４０は、各教師なしデータを、Ｓ３０２の処理で算出した推定ユーザ満足度指標の類似度が最も高い（ヒストグラム間距離が最も近い）学習データに対応付ける（Ｓ３０３）。図４（ｂ）の場合、教師なしデータＡ１は、最も推定結果（類似度）が高い学習データＬ２に割り当てられ、教師なしデータＡｍは、学習データＬ１に割り当てられる。教師なしデータＡ２は、類似度の高い学習データが存在しないために割り当ては行われず、学習データとして用いられない。また、このときもＳ３０１の処理と同様に、推定結果類似度が閾値未満の教師なしデータについては割り当てが行われない。例えば、閾値が「０．９０」に設定される場合、最も類似度が高い学習データＬ１と教師なしデータＡｍと（類似度０．８５）についても割り当てが行われない。

Ｓ３０１の処理は、データそのものが学習データと類似している教師なしデータを抽出することで教師情報の精度を高める効果がある。例えば、Ｓ３０２の処理における推定結果による類似データ探索では、一つの教師なしデータに対して推定結果（類似度）の高い学習データが複数存在する場合がある。この場合、推定すべき情報によっては、推定結果が同じくらい似ている場合であればデータの素性も類似したものを選択した方がより誤差の少ない教師情報を付与できることがある。

本実施形態で推定する情報であるユーザ満足度は、画像に写っている被写体の配置や被写体そのもの、色合いといった画像の見た目による影響が大きい。そのために、Ｓ３０１、Ｓ３０２の処理を行うことで、入力された教師なし画像に見た目が似た学習画像を探索し、検出した学習画像の教師情報を用いた方がよりよい教師情報の付与が可能となる。一方、データ自体の類似度と推定すべき情報との関連が低い場合、Ｓ３０１、Ｓ３０２の処理を省略し、全学習データと全教師なしデータとの間で推定結果が類似している学習データの探索を行ってもよい。

図５は、Ｓ２０８の推定精度の検証処理を表すフローチャートである。

推定精度検証部１６０は、教師なしデータを含む学習セットを用いて学習を行い、推定モデルを生成する（Ｓ４０１）。推定精度検証部１６０は、教師なしデータセット４００に含まれる教師なしデータのうち、Ｓ２０６、Ｓ２０７の処理において教師情報が設定されている教師なしデータを選択する。推定精度検証部１６０は、選択した教師なしデータと第１学習データセット２００とにより学習を行い、推定モデルを生成する。

推定精度検証部１６０は、精度検証データセット７００を利用して、Ｓ４０１の処理で生成した推定モデルの推定精度を算出する（Ｓ４０２）。精度検証データセット７００は、第１学習データセット２００に含まれない複数の教師情報を持つデータから構成されている。推定精度は、精度検証データセット７００に含まれるＮ個の精度検証データに対して推定処理を行うことで算出される。具体的には、推定モデルの推定精度ａｃは、下記の式で表される。

ｈ_ｇｔ（ｉ）はデータｉの教師情報である。ｈ_ｅｓｔ（ｉ）はデータｉの推定結果である。Ｄ（ｈ１，ｈ２）はヒストグラムｈ１とヒストグラムｈ２との距離を算出する関数である。全ての精度検証データにおいて推定結果と教師情報とが一致する場合、推定精度ａｃは「１．０」となる。

推定精度検証部１６０は、Ｓ４０１の処理で生成した推定モデルの推定精度が閾値ｔ未満であるか否かを確認する（Ｓ４０３）。閾値ｔの初期値は、例えば精度検証データセット７００に対する第１推定モデル３００の推定精度である。推定精度検証部１６０は、この処理を行うことで、教師なしデータを追加することによって推定精度が劣化する場合に、該教師なしデータを学習から除外することができる。

推定モデルの推定精度が閾値ｔ以上である場合（Ｓ４０３：N）、推定精度検証部１６０は、閾値ｔをＳ４０１の処理で生成した推定モデルの推定制度ａｃに更新する（Ｓ４０４）。推定精度検証部１６０は、学習に用いた教師なしデータを学習データに追加するため、学習データ追加リストに該教師なしデータを追加する（Ｓ４０５）。学習データ追加リストは、新たに学習データとして追加する教師なしデータのリストであり、初期状態は空のリストである。

学習データ追加リストの更新後、或いは推定モデルの推定精度が閾値ｔ未満である場合（Ｓ４０３：Y）、推定精度検証部１６０は、評価を行っていない教師なしデータが存在するか否かを確認する（Ｓ４０６）。教師情報が設定されており、Ｓ４０１〜４０５の処理が行われていない教師なしデータが存在する場合（Ｓ４０６：Y）、推定精度検証部１６０は、Ｓ４０１以降の処理を繰り返し実行する。全ての教師なしデータに対して検証が完了した場合（Ｓ４０６：N）、推定精度検証部１６０は、推定精度検証処理を終了する。

以上説明した本実施形態の情報処理装置１０００は、教師なしデータに教師情報を自動的に付与して学習データとして利用することで、学習データのバリエーションを増やして、高精度な推定器を学習することができる。情報処理装置１０００は、教師なしデータの教師情報として、誤差を含む推定結果ではなく、教師なしデータと類似している学習データの教師情報を用いるために、推定処理による誤差が含まれる前の真値に近い値を用いて学習を行うことが可能である。そのために、教師なしデータを学習に用いることによる学習性能の劣化が軽減される。

（第２実施形態）
本実施形態では、教師なしデータに付与する教師情報の生成精度を向上する構成を説明する。第１実施形態では、教師なしデータの教師情報として、類似する学習データの教師情報を用いている。しかし、教師なしデータは必ずしも学習データと完全に推定結果が一致するとは限らない。そのために、類似学習データの教師情報をそのまま利用することによる誤差の影響が生じる。第１実施形態におけるユーザ満足度指標のような多値データを推定する場合、教師なしデータに既にある学習データと同一の教師情報を付与することで、異なる学習データに対して同一の教師情報が存在することになり、全体の推定精度が劣化する可能性が生じる。そのために本実施形態の情報処理装置は、学習データの教師情報と推定結果との関係に基づいて、教師なしデータの教師情報を生成する。

本実施形態の情報処理装置の構成は、図１に示す第１実施形態の情報処理装置１０００と同様であるため、説明を省略する。推定モデル生成処理は、図２に示す第１実施形態と大まかには同じであるが、Ｓ２０２及びＳ２０７の処理の詳細が異なる。この相違する処理について説明する。図６は、教師なしデータの教師情報を生成する処理の説明図である。

学習データ推定処理部１２０は、Ｓ２０２の処理において、第１実施形態と同様に、第１学習データセット２００に含まれる学習データについて、第１推定モデル３００を用いた推定処理を行う。このとき、本実施形態の学習データ推定処理部１２０は、推定結果に加えて推定結果と教師情報との関係を学習データ毎に記憶する。図６（ａ）の模式図は、学習データＬを第１推定モデル３００に入力することによって推定結果ｅを算出する様子を表す。

ここで学習データ推定処理部１２０は、学習データＬの推定結果ｅから学習データＬに予め含まれる教師情報ｇｔを復元できるように、推定結果ｅと教師情報ｇｔとの関係性を記憶する。例えば、推定すべき情報の形式がビン数３である正規化ヒストグラムである場合、学習データ推定処理部１２０は、教師情報と推定結果とのヒストグラムのビン毎の比率を記憶する。図６（ａ）では、学習データＬの教師情報ｇｔは、ビン１の度数が「０．２」、ビン２の度数が「０．５」、ビン３の度数が「０．３」のヒストグラムである。推定結果ｅは、ビン１の度数が「０．２５」、ビン２の度数が「０．４５」、ビン３の度数が「０．３」のヒストグラムである。学習データ推定処理部１２０は、推定結果ｅと教師情報ｇｔとの関係ｆとして、ビン毎の変換係数であるビン１：０．２０／０．２５＝０．８０、ビン２：０．５０／０．４５＝１．１１、ビン３：０．３０／０．３０＝１．００を記憶する。

教師情報設定部１５０は、Ｓ２０７の処理において、Ｓ２０２の処理で記憶された推定結果と教師情報との関係性ｆに基づいて、Ｓ２０６で設定された教師なしデータに対応する学習データにおける該教師なしデータの教師情報を設定する。図６（ｂ）の模式図は、教師なしデータＡに対して推定結果類似度の高い学習データＬが設定されている様子を表す。学習データＬは、Ｓ２０２の処理により、教師情報ｇｔ、推定結果ｅ、推定結果ｅと教師情報ｇｔとの関係性ｆを含む。教師なしデータＡは、第１推定モデル３００によって推定結果ｅ’が算出されている。Ｓ２０７の処理では、類似学習データに含まれる関係性ｆに応じて、推定結果ｅ’から教師情報ｇｔ’が算出される。

推定結果ｅ’のビン１の度数が「０．２２」、ビン２の度数が「０．４７」、ビン３の度数が「０．３１」のヒストグラムである場合、各ビンの変換係数として記憶された関係性ｆを適用することで、各ビンの度数が以下のようなヒストグラムとなる。ビン１の度数は、０．２２＊０．８０＝０．１７６になる。ビン２の度数は、０．４７＊１．１１＝０．５２２になる。ビン３の度数は、０．３１＊１．００＝０．３１０になる。更に、算出されたヒストグラムが正規化されることで、教師情報ｇｔ’は、ビン１の度数が「０．１７５」、ビン２の度数が「０．５１８」、ビン３の度数が「０．３０７」のヒストグラムとなる。

なお、推定結果ｅ’に関係性ｆを適用する場合、教師なしデータＡの推定結果ｅ’と学習データＬの推定結果ｅとの類似度や、Ｓ２０６（図３のＳ３０１）の処理で算出した特徴量ベース類似度に応じて、変換係数の重みづけが行われてもよい。例えば、教師なしデータＡの推定結果ｅ’と学習データＬの推定結果ｅとの類似度が０．９である場合、ビン毎の変換係数に対して０．９〜１．１の範囲の乱数で重みづけを行ってもよい。

以上のような本実施形態の情報処理装置は、学習データに対して推定結果と教師情報との関係性を記憶しておき、この関係性に基づいて教師なしデータの推定結果から教師情報を算出する。こにれより情報処理装置は、より精度の高い教師なしデータの教師情報を生成することができる。

（第３実施形態）
本実施形態は、学習データをクラスタリングすることで、辞書サイズの軽量化及び処理の高速化を実現する。これにより情報処理装置は、学習データの増大に伴う処理時間の短縮が可能になる。また、学習データ毎に推定結果と教師情報との関係性を記憶することで、学習データの増大に伴い肥大化する処理に必要なメモリサイズを軽量化することができる。

図７は、本実施形態の情報処理装置の機能構成例示図である。情報処理装置３０００は、図１に示す第１実施形態の情報処理装置１０００の構成に、学習データ分類部３３０を追加した構成である。学習データ分類部３３０は、学習データ推定処理部１２０による各学習データの推定結果に基づいて、学習データの分類を行う。

図８は、情報処理装置３０００による推定モデル生成処理を表すフローチャートである。図２の第１実施形態の推定モデル生成処理との比較では、Ｓ８０１〜Ｓ８０３の処理がＳ２０１〜Ｓ２０３の処理と同様である。Ｓ８０５、Ｓ８０６の処理がＳ２０４、Ｓ２０５の処理と同様である。Ｓ８０８〜Ｓ８１１の処理がＳ２０７〜Ｓ２１０の処理と同様である。これら同様の処理については、説明を省略する。

Ｓ８０２、Ｓ８０３の処理により、第１学習データセット２００に含まれる全ての学習データに対して、推定結果と、推定結果及び教師情報の関係と、が記憶される。学習データ分類部３３０は、学習データ分類処理を行う（Ｓ８０４）。図９は、学習データ分類処理を表すフローチャートである。

学習データ分類部３３０は、特徴量ベースで学習データを複数のクラスタに分類する（Ｓ９０１）。分類に用いる特徴量は、第１実施形態のＳ３０１の処理（図３参照）で用いた特徴量と同様に、データの素性そのものの類似度を表現する所定の特徴量である。学習データ分類部３３０は、既知の手法により分類処理を行う。例えば、学習データ分類部３３０は、予め分類するクラスタ数を設定しておき、K-means clusteringにより各学習データを分類する。学習データ分類部３３０は、単純に抽出した特徴量の類似度を比較するのではなく、予め既存の機械学習手法によって学習された辞書を用いて分類を行ってもよい。例えば、学習データ分類部３３０は、画像のシーンカテゴリ分類を行う辞書を用いて学習画像を分類することができる。Ｓ９０１の処理により、第１学習データセット２００に含まれる学習データは、データの素性の類似度に応じた複数のクラスタに分類される。

学習データ分類部３３０は、Ｓ９０１の処理で分類したクラスタ毎に代表特徴量を決定する（Ｓ９０２）。学習データ分類部３３０は、各クラスタに含まれる学習データの特徴量の平均を算出し、算出した平均特徴量を代表特徴量とする。或いは、学習データ分類部３３０は、平均特徴量と最も類似度が高い学習データの特徴量を代表特徴量としてもよい。

学習データ分類部３３０は、学習データを推定結果ベースで複数のクラスタに分類する（Ｓ９０３）。Ｓ８０２、Ｓ８０３の処理により第１学習データセット２００に含まれる全ての学習データには、推定結果が含まれる。Ｓ９０１の処理で分類されたクラスタ毎に、各学習データは、推定結果の類似度に応じて更に複数のクラスタに分類される。

学習データ分類部３３０は、Ｓ９０３の処理で分類したクラスタ毎に代表データを決定する（Ｓ９０４）。学習データ分類部３３０は、クラスタに含まれる全ての学習データから選択された１つの学習データを、代表データに設定する。学習データの選択は、所定の手法が用いられる。例えば、学習データ分類部３３０は、各クラスタに含まれる学習データの推定結果の平均を算出し、算出された平均値と最も近い学習データを代表データとする。Ｓ９０４の処理により、クラスタ毎に１つの学習データが代表データとして選択される。

以上のような学習データ分類処理により、第１学習データセット２００に含まれる全ての学習データは、特徴量ベース及び推定結果ベースで類似度の高い複数のクラスタに分類される。クラスタ毎に教師情報、推定結果、及び推定結果と教師情報との関係を保持する代表データが設定される。代表データとして選択されなかった学習データは、推定結果及び推定結果と教師情報との関係を含む必要はない。そのため、第１実施形態及び第２実施形態と比較して、第３実施形態の情報処理装置３０００は、処理に必要なメモリサイズを軽減することが可能となる。

学習データ分類処置後、且つ全ての教師なしデータに対して推定ユーザ満足度指標が算出された場合（Ｓ８０６：N）、情報処理装置１０００は、次の処理に移行する。推定結果類似教師なしデータ探索部１４０は、学習データに類似した教師なしデータを検索し、類似度の高い学習データと教師なしデータとのペアを設定する（Ｓ８０７）。この処理は、第１実施形態の図３の処理と同様であるが、本実施形態では、推定結果類似教師なしデータ探索部１４０は、類似学習データ探索処理において、Ｓ８０４の処理で選択した代表データのみに対して探索を行う。Ｓ８０７の処理について、図３に示すフローチャートを再度用いて詳細に説明する。

推定結果類似教師なしデータ探索部１４０は、Ｓ９０１の処理で作成された特徴量ベースで学習データを分類した複数のクラスタから、教師なしデータに類似するクラスタを探索する（Ｓ３０１）。探索は、各クラスタに設定された代表特徴量と、教師なしデータから抽出した特徴量とを比較することで行われる。類似度が閾値以上である教師なしデータと特徴量ベースクラスタとが、ペアとして設定される。なお、推定結果類似教師なしデータ探索部１４０は、第１実施形態同様、この処理を省略して推定結果ベースのみで類似学習データの選択を行ってもよい。その場合、Ｓ９０１、Ｓ９０２の処理における学習データの特徴量ベース類似学習データ分類処理が省略されてもよい。

推定結果類似教師なしデータ探索部１４０は、Ｓ３０１の処理で設定された教師なしデータと、教師なしデータが割り当てられたクラスタに含まれる推定結果ベースで分類された全てのクラスタの代表データと、の推定結果類似度を算出する（Ｓ３０２）。推定結果類似教師なしデータ探索部１４０は、Ｓ３０２の処理で算出した推定結果の類似度が最も高い代表データを、教師なしデータに対応付ける（Ｓ３０３）。以上のようなＳ８０７の処理は、第１実施形態の対応する処理（図２のＳ２０６の処理）に比較して、高速な類似学習データの選択を実現する。

以上のような本実施形態の情報処理装置３０００は、学習データを特徴量ベース及び推定結果ベースでクラスタリングすることで、辞書サイズの軽量化及び処理時間の高速化を実現することができる。

（第４実施形態）
本実施形態は、ユーザが所有する大量の画像から、自動的にユーザ満足度の高い画像セットを選択してユーザに提示する場合について説明する。本実施形態におけるユーザ満足度は、写真の良し悪しに関わる指標である。写真を良いと思うかどうかは、ユーザの個人差がある。そのために本実施形態の情報処理装置は、一般化された教師情報だけではなく、ユーザ個人の嗜好を考慮した学習を行う必要がある。

ユーザ満足度の高い画像セットを抽出するための従来手法として、複数の一般ユーザが評価した満足度評価分布を教師情報（評価情報）に持つ学習画像セットを用いて学習を行い、生成した推定モデルを用いてユーザの画像セットを評価する方式がある。しかし、この手法では、予め用意された学習画像セットにユーザが所持する写真とはテーマやカテゴリが異なる画像が含まれる場合、ユーザ満足度の高い選択が精度よくできない可能性がある。

例えば、ポートレート写真の撮影を好むユーザに対して静物写真や風景写真を大量に含む学習データセットで学習を行う場合、ユーザが所持する画像セットに含まれない静物写真や風景写真に特有の情報が学習される。その結果、良いポートレート写真選択の推定精度が劣化する可能性がある。この場合、学習セットとしてポートレート写真のみを大量に集めて学習を行った方がよりよい学習を行うことができる。しかし、予めユーザが所持する画像セットに合わせた教師情報付きの学習画像を大量に用意しておくことは容易ではない。

個人の嗜好を学習に反映させるために、学習データとして予めユーザに自分の持つ写真の満足度を評価してもらい、その画像セットを学習に用いる方法がある。しかし、学習には大量のデータが必要であり、それらの大量のデータをユーザが用意し評価するというのは現実的ではない。
本実施形態では、ユーザが所持する画像セットに合わせた学習を教師なし画像を利用して行うことで、精度よくユーザ満足度の高い画像選択を行う。図１０は、本実施形態の情報処理装置の機能構成例示図である。

情報処理装置４０００は、ユーザ固有学習画像セット作成部４１０、第１推定モデル生成部４２０、学習画像推定処理部４３０、教師なし画像推定処理部４４０、及び推定結果類似教師なし画像選択部４５０として機能する。また、情報処理装置４０００は、教師情報設定部４６０、学習画像追加部４７０、第２推定モデル生成部４８０、及び高評価画像選択部４９０として機能する。更に情報処理装置４０００は、教師情報を持つ複数の学習画像からなるオリジナル学習画像セット４２００を備える。オリジナル学習画像セット４２００は、所定のストレージに格納される。このような構成の情報処理装置４０００は、予めユーザが所持する既存の複数の画像から満足度の高い画像を複数選択したお気に入り画像セット４１００、教師なし画像セット、ユーザ画像セット４８００を格納するストレージが接続される。各画像セットは、異なるストレージに格納されていてもよい。情報処理装置１０００は、処理結果として高評価画像セット４９００を出力する。

ユーザ固有学習画像セット作成部４１０は、お気に入り画像セット４１００とテーマカテゴリが類似する複数の画像を、予め用意されている教師情報を持つオリジナル学習画像セット４２００の中から探索する。ユーザ固有学習画像セット作成部４１０は、検出した複数の学習画像を第１学習画像セット４３００として設定する。ユーザ固有学習画像セット作成部４１０は、ユーザ固有学習データセット作成手段に相当する。

第１推定モデル生成部４２０は、第１学習画像セット４３００を用いて学習を行い、第１推定モデル４４００を生成する。第１学習画像セット４３００は、オリジナル学習画像セット４２００に含まれる画像から構成されている。そのために各学習画像は、実際に複数の評価者により該画像に対する満足度が多段階で評価されており、教師情報として複数の評価者の評価結果の分布である正規化ヒストグラムを持つ。第１推定モデル４４００は、入力として画像を受け取り、推定結果としてユーザ満足度指標である正規化ヒストグラムを出力することができる。

学習画像推定処理部４３０は、第１学習画像セット４３００に含まれる全ての学習画像に対して第１推定モデル４４００を用いて推定処理を行い、出力されたユーザ満足度指標を学習画像毎に関連付けて記憶する。
教師なし画像推定処理部４４０は、複数の教師なし画像から構成される教師なし画像セット４５００に含まれる全ての画像を入力として、第１推定モデル４４００を用いて推定処理を行う。教師なし画像推定処理部４４０は、推定処理の結果として、各教師なし画像の推定ユーザ満足度指標を出力する。
推定結果類似教師なし画像選択部４５０は、教師なし画像セット４５００に含まれる教師なし画像から、第１学習画像セット４３００に含まれる学習画像との推定結果の類似度が閾値以上である教師なし画像を選択する。

教師情報設定部４６０は、推定結果類似教師なし画像選択部４５０で選択された各教師なし画像の推定結果との類似度が最も高い学習画像における、教師情報と推定ユーザ満足度指標との関係に基づいて教師なし画像の推定ユーザ満足度指標を更新する。
学習画像追加部４７０は、教師情報設定部４６０で更新された推定ユーザ満足度指標を各教師なし画像の教師情報とみなして、第２学習画像セット４６００に追加する。
第２推定モデル生成部４８０は、第２学習画像セット４６００を用いて学習を行う。第２推定モデル生成部４８０は、学習の結果として第２推定モデル４７００を生成する。
高評価画像選択部４９０は、第２推定モデル生成部４８０が生成した第２推定モデル４７００を用いて、ユーザが撮影した写真が含まれるユーザ画像セット４８００を評価する。高評価画像選択部４９０は、評価結果として、推定ユーザ満足度が高い写真を高評価画像セット４９００として出力する。ユーザ画像セット４８００は、複数の未知画像データを含む。

図１１は、このような構成の情報処理装置４０００による推定モデル生成処理を表すフローチャートである。図１２〜図１４は、推定モデル生成処理の説明図である。

初期状態では、図１２（ａ）に示すように、オリジナル学習画像セット４２００と、教師なし画像セット４５００と、ユーザが予め所持する画像セットであるユーザのお気に入り画像セット４１００及び未評価なユーザ画像セット４８００と、が存在する。お気に入り画像セット４１００は、ユーザが所持する複数の画像の画像データ（画像データ群）を含む。オリジナル学習画像セット４２００は、予め用意されている教師情報を持つ複数の学習画像から構成される。教師なし画像セット４５００は、予め用意された教師情報を持たない複数の教師なし画像から構成される。

お気に入り画像セット４１００は、ユーザの満足度が高い教師情報を持たない複数の画像から構成される。お気に入り画像セット４１００は、ユーザにより、実際に複数の画像から満足度の高い画像が選択されて作成されてもよい。もしくは、お気に入り画像セット４１００は、ユーザが所持する画像セットから、過去に作成したフォトアルバムに利用された回数や閲覧された回数等のメタ情報に基づいて自動的に作成されてもよい。ユーザ画像セット４８００は、ユーザの評価が行われていない複数の画像から構成される。本実施形態の情報処理装置４０００は、ユーザ画像セット４８００を入力データとしてユーザ満足度の高い画像を推定し、ユーザに提示する。

ユーザ固有学習画像セット作成部４１０は、オリジナル学習画像セット４２００から、評価対象であるユーザ画像セットの評価に適した学習画像を抽出する（Ｓ１１０１）。このとき、ユーザ固有学習画像セット作成部４１０は、ユーザの嗜好の傾向を把握するため、予めユーザによって作成されたお気に入り画像セット４１００を利用する。ユーザ固有学習画像セット作成部４１０は、ユーザ固有の学習画像セットとして、オリジナル学習画像セット４２００からお気に入り画像セット４１００に含まれる画像と、画像のシーンカテゴリが類似した学習画像を抽出する。画像のシーンカテゴリ分類は、機械学習の手法を利用した既知の手法が利用可能である。この処理により、図１２（ｂ）に例示するように、第１学習画像セット４３００として、お気に入り画像セット４１００に含まれる画像と同種のシーンカテゴリである複数の学習画像が選択される。第１推定モデル生成部４２０は、図１３（ａ）に示すように、Ｓ１１０１の処理で作成された第１学習画像セット４３００を用いて、第１推定モデル４４００を生成する（Ｓ１１０２）。

学習画像推定処理部４３０は、第１学習画像セット４３００に含まれる学習画像について、第１推定モデル４４００を用いて推定処理を行う（Ｓ１１０３）。学習画像推定処理部４３０は、推定したユーザ満足度指標を選択した学習画像毎に記憶する。更に、学習画像推定処理部４３０は、第２実施形態と同様に教師情報と推定結果の関係を記憶する。学習画像推定処理部４３０は、第１学習画像セット４３００に含まれる学習データのうち、ユーザ満足度指標を含まない学習画像を検索する（Ｓ１１０４）。ユーザ満足度指標を含まない学習画像を検出した場合（Ｓ１１０４：Y）、学習画像推定処理部４３０は、Ｓ１１０３の処理に戻り、該学習画像に対する推定処理を行う。学習画像推定処理部４３０は、Ｓ１１０３、Ｓ１１０４の処理により、第１学習画像セット４３００に含まれる全ての学習画像に対して、ユーザ満足度指標を算出する。学習画像推定処理部４３０は、第１学習画像セット４３００に含まれる全ての学習画像に複数の評価者による評価結果の分布であるユーザ満足度指標及び第１推定モデル４４００で推定した推定ユーザ満足度指標を含ませる。

教師なし画像推定処理部４４０は、予め用意された教師情報が付与されていない複数の画像から成る教師なし画像セット４５００に含まれる任意の教師なし画像について、第１推定モデル４４００を用いて推定処理を行う（Ｓ１１０５）。教師なし画像推定処理部４４０は、推定したユーザ満足度指標を、選択された教師なし画像毎に記憶する。この処理は、学習画像推定処理部４３０の処理に並列に行われる。教師なし画像推定処理部４４０は、教師なし画像セット４５００に含まれる教師なし画像から、ユーザ満足度指標が含まれない教師なし画像を検索する（Ｓ１１０６）。ユーザ満足度指標が含まれない教師なし画像を検出した場合（Ｓ１１０６：Y）、教師なし画像推定処理部４４０は、Ｓ１１０５の処理に戻り、該教師なし画像に対する推定処理を行う。教師なし画像推定処理部４４０は、Ｓ１１０５、Ｓ１１０６の処理により、全ての教師なし画像に対してユーザ満足度指標を算出する。教師なし画像推定処理部４４０は、教師なし画像セット４５００に含まれる全ての教師なし画像に、第１推定モデル４４００で推定した推定ユーザ満足度指標を含ませる。

全ての学習画像に対してユーザ満足度指標が算出され（Ｓ１１０４：N）、且つ全ての教師なし画像に対して推定ユーザ満足度指標が算出された場合（Ｓ１１０６：N）、情報処理装置４０００は、次の処理に移行する。推定結果類似教師なし画像選択部４５０は、推定結果が学習画像に類似した教師なし画像を選択する（Ｓ１１０７）。この処理は第１実施形態におけるＳ２０６の処理と同様であるため、説明を省略する。ただし、本実施形態では、学習画像とのペアが設定された教師なし画像、すなわち新たに学習画像セットに追加する教師なし画像については、お気に入り画像セット４１００に含まれる全ての画像との類似度も算出する。図１３（ｂ）に示すように、Ｓ１１０３〜Ｓ１１０７の処理で第１学習画像セット４３００及び教師なし画像セット４５００に第１推定モデル４４００を用いて推定処理が行われる。これにより、第１学習画像セット４３００に推定結果が類似した画像セットが、教師なし画像セット４５００から選択される。

教師情報設定部４６０は、Ｓ１１０７で教師なし画像に割り当てられた学習画像の推定結果に基づいて、教師なし画像の教師情報を設定する（Ｓ１１０８）。この処理の詳細は、第２実施形態におけるＳ２０７の処理と同様であるため、詳細な説明は省略する。ただし、本実施形態では、教師情報設定部４６０は、お気に入り画像セット４１００に含まれる画像との類似度が閾値以上である教師なし画像について、教師情報を算出する際に重みづけを行い、ユーザ満足度指標が高くなるよう変換する。

重みづけは、推定対象に応じて任意の設定が可能である。教師情報設定部４６０は、学習データにおける教師情報と推定結果との関係を用いて変換する場合よりもユーザ満足度が高くなるように重みづけを設定する。例えば、教師情報設定部４６０は、ユーザ満足度指標が３ビンのヒストグラムで出力される場合、ビン１（低評価）の変換係数を元の割合の９０％に再設定し、ビン３（高評価）の変換係数を元の割合の１１０％に再設定する。

図６（ｂ）を再度用いて具体的に説明する。図６（ｂ）において教師なしデータＡとお気に入り画像セットに含まれる画像との類似度が閾値以上である場合、ビン１の変換係数が元の割合の９０％である「０．７２」に変更され、ビン３の変換係数が元の割合の１１０％である「１．１０」に変更される。推定結果ｅ’は、ビン１の度数が「０．２２」、ビン２の度数が「０．４７」、ビン３の度数が「０．３１」である。推定結果ｅ’は、変換係数を変更したことで、ビン１の度数が０．２２＊０．７２＝０．１５８、ビン２の度数が０．４７＊１．１１＝０．５２２、ビン３の度数が０．３１＊１．１０＝０．３４１のヒストグラムとなる。更に正規化処理を行うことで、重みづけを行った教師情報のヒストグラムは、ビン１の度数が「０．１５５」、ビン２の度数が「０．５１１」、ビン３の度数が「０．３３４」となる。ユーザ満足度は、ヒストグラムの平均値で表すと「２．１８」となる。図６（ｂ）に示した教師情報ｇｔ’は、ビン１の度数が「０．１７５」、ビン２の度数が「０．５１８」、ビン３の度数が「０．３０７」のヒストグラムであり、平均値は２．１３である。

このように重みづけを行うことで、ユーザが個人的に好む画像に近い教師なし画像のユーザ満足度を高く設定することが可能となる。この処理により、ユーザの満足度が高い画像と似た教師なし画像が存在する場合に、学習データの教師情報と推定結果との関係性に基づいて、算出された教師情報よりも高いユーザ満足度指標を教師情報に設定することができる。そのために、より、ユーザの嗜好に合った選択が可能となる。

学習画像追加部４７０は、Ｓ１１０８の処理で教師情報が設定された教師なしデータ及びＳ１１０１の処理で作成された第１学習画像セット４３００に含まれる全ての画像を合わせて、第２学習画像セット４６００を作成する（Ｓ１１０９）。第２推定モデル生成部４８０は、第２学習画像セット４６００を用いて学習を行い、第２推定モデル４７００を生成する（Ｓ１１１０）。図１４（ａ）に示すように、Ｓ１１０９、Ｓ１１１０の処理により、第１学習画像セット４３００及び教師なし画像セット４５００に含まれる第１画像セットと推定結果が類似する画像セットにより、第２推定モデル４７００が生成される。

高評価画像選択部４９０は、図１４（ｂ）に示すように、評価対象であるユーザ画像セット４８００に含まれる全ての未知画像に対して、第２推定モデル４７００を用いて推定処理を行い、推定ユーザ満足度指標を算出する（Ｓ１１１）。高評価画像選択部４９０は、推定ユーザ満足度指標が高い画像を、出力結果である高評価画像セット４９００として出力する。出力結果である高評価画像セット４９００として選択される画像の数は、ユーザ満足度の高い順に予め設定された一定の枚数でもよいし、ユーザ満足度が閾値以上である全ての画像であってもよい。

以上のような本実施形態の情報処理装置４０００は、予めユーザによって用意されたお気に入り画像セットの情報に基づいて、教師なし画像を含む学習画像セットをユーザ毎に作成する。そのために情報処理装置４０００は、ユーザが入力した新規の画像セットから満足度の高い画像を優先的に提示することが可能となる。

本発明は、上述の各実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

Claims

所定の評価結果を教師情報として含む複数の学習データを用いて、入力データの評価情報を推定するための第１推定モデルを生成する第１推定モデル生成手段と、
前記第１推定モデルを用いて前記複数の学習データの評価情報を推定し、前記推定した評価情報を学習データ毎に関連付けて記憶する学習データ推定処理手段と、
前記第１推定モデルを用いて教師なしデータの評価情報を推定する第１教師なしデータ推定処理手段と、
前記学習データの評価情報の推定結果と前記教師なしデータの評価情報の推定結果との類似度に基づいて、教師なしデータと学習データとを関連付ける関連付け手段と、
前記関連付けされた学習データに基づいて教師なしデータの教師情報を設定する教師情報設定手段と、
前記教師情報を含む複数の学習データ及び前記教師情報を設定された教師なしデータを用いて、入力データの評価情報を推定する第２推定モデルを生成する第２推定モデル生成手段と、を備えることを特徴とする、
情報処理装置。
前記教師情報設定手段は、前記教師なしデータに関連付けられた前記学習データの教師情報を、前記教師なしデータの教師情報に設定することを特徴とする、
請求項１に記載の情報処理装置。
前記教師情報設定手段は、前記教師なしデータに関連付けられた前記学習データの教師情報と前記評価情報の推定結果との関係に基づいて、前記教師なしデータの評価情報の推定結果から教師情報を導出することを特徴とする、
請求項１に記載の情報処理装置。
前記関連付け手段は、学習データと教師なしデータとから抽出された特徴量の類似度に基づいて、教師なしデータと学習データとを関連づけ、
前記教師情報設定手段は、学習データと教師なしデータとの特徴量類似度に基づいて、前記教師なしデータの評価情報の推定結果から教師情報を導出することを特徴とする、
請求項３に記載の情報処理装置。
前記評価情報は、連続値である多値情報であることを特徴とする、
請求項１に記載の情報処理装置。
追加された教師なしデータを用いて学習された推定モデルが前記第１推定モデルより性能が劣化している場合に、該教師なしデータを学習データから除外する推定精度検証手段をさらに備えることを特徴とする、
請求項１〜５のいずれか１項に記載の情報処理装置。
前記学習データの評価情報の推定結果に基づいて複数の学習データを複数のクラスタに分類し、クラスタ毎に前記クラスタに含まれる学習データから代表データを選択する学習データ分類手段をさらに備え、
前記関連付け手段は、各クラスタの代表データのみを学習データとみなして教師なしデータとの関連付けを行うことを特徴とする、
請求項１〜６のいずれか１項に記載の情報処理装置。
前記データは画像データであり、
前記評価情報は画像データに対する複数のユーザの満足度評価分布であり、
ユーザの満足度が高い画像データ群に含まれる画像データのカテゴリが類似する画像データを前記複数の学習データから抽出し、抽出した複数の学習データを学習データとして用いるユーザ固有学習データセット作成手段と、
前記第２推定モデルを用いて、複数の未知画像データからユーザ満足度の高い画像データを抽出しユーザに提示する提示手段と、をさらに備えることを特徴とする、
請求項１〜７のいずれか１項に記載の情報処理装置。
前記教師情報設定手段は、前記教師なしデータと前記ユーザ満足度の高い画像データ群に含まれるいずれかの画像データとの類似度に基づいて、前記教師なしデータの推定結果から教師情報を導出することを特徴とする、
請求項８に記載の情報処理装置。
情報処理装置が、
所定の評価結果を教師情報として含む複数の学習データを用いて、入力データの評価情報を推定するための第１推定モデルを生成し、
前記第１推定モデルを用いて前記複数の学習データの評価情報を推定して、前記推定した評価情報を学習データ毎に関連付けて記憶し、
前記第１推定モデルを用いて教師なしデータの評価情報を推定し、
前記学習データの評価情報の推定結果と前記教師なしデータの評価情報の推定結果との類似度に基づいて、教師なしデータと学習データを関連付けし、
前記関連付けされた学習データに基づいて教師なしデータの教師情報を設定し、
前記教師情報を記憶している複数の学習データ及び前記教師情報を設定された教師なしデータを用いて、入力データの評価情報を推定する第２推定モデルを生成することを特徴とする、
情報処理方法。
コンピュータを、
所定の評価結果を教師情報として含む複数の学習データを用いて、入力データの評価情報を推定するための第１推定モデルを生成する第１推定モデル生成手段、
前記第１推定モデルを用いて前記複数の学習データの評価情報を推定し、前記推定した評価情報を学習データ毎に関連付けて記憶する学習データ推定処理手段、
前記第１推定モデルを用いて教師なしデータの評価情報を推定する第１教師なしデータ推定処理手段、
前記学習データの評価情報の推定結果と前記教師なしデータの評価情報の推定結果との類似度に基づいて、教師なしデータと学習データとを関連付ける関連付け手段、
前記関連付けされた学習データに基づいて教師なしデータの教師情報を設定する教師情報設定手段、
前記教師情報を含む複数の学習データ及び前記教師情報を設定された教師なしデータを用いて、入力データの評価情報を推定する第２推定モデルを生成する第２推定モデル生成手段、
として機能させるコンピュータプログラム。
請求項１１記載のコンピュータプログラムを記憶する、コンピュータにより読み取り可能な記憶媒体。