[go: up one dir, main page]

JP7708031B2 - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム

Info

Publication number
JP7708031B2
JP7708031B2 JP2022129482A JP2022129482A JP7708031B2 JP 7708031 B2 JP7708031 B2 JP 7708031B2 JP 2022129482 A JP2022129482 A JP 2022129482A JP 2022129482 A JP2022129482 A JP 2022129482A JP 7708031 B2 JP7708031 B2 JP 7708031B2
Authority
JP
Japan
Prior art keywords
data
relative distance
rows
prediction
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022129482A
Other languages
English (en)
Other versions
JP2024026931A (ja
Inventor
靖弘 生田
敦史 川本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2022129482A priority Critical patent/JP7708031B2/ja
Publication of JP2024026931A publication Critical patent/JP2024026931A/ja
Application granted granted Critical
Publication of JP7708031B2 publication Critical patent/JP7708031B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Complex Calculations (AREA)

Description

本開示は情報処理装置、情報処理方法、及びプログラムに関し、特に、予測値を算出する情報処理装置、情報処理方法、及びプログラムに関する。
データ間の因果関係を分析する因果分析の技術分野などにおいて、データ間の相対距離に基づいて予測値(推定値)を算出する処理が行なわれることがある。これに関連し、特許文献1に開示された因果関係学習装置は、2つのセンサによって測定された測定値間の相関を判定する相関判定部と、相関が所定の基準よりも低い場合に、結果である測定値から原因である測定値を推定することによって2つのセンサ間の因果関係を判定する推定部とを備える。また、関連する技術として、非特許文献1は、NPMR(Non-Parametric Multiplicative Regression)モデルを用いた因果分析について開示している。
国際公開第2018/198267号
Nicolaou N et al., "A Nonlinear Causality Estimator Based on Non-Parametric Multiplicative Regression", Frontiers in Neuroinformatics, Volume 10, June 2016.
特許文献1で用いられる予測式は、データ間の相対距離に基づく重みの計算式が比較的単純であるため、非線形モデルとしての表現力が乏しい。この問題を解決するためには、例えば、重みの数を増やした予測式を用いたり、予測式における重みの算出において積演算を用いたりすることが考えられる。しかしながら、そのような予測式を用いた場合、重みにかかわる計算量が増加し、多くの計算時間を要することとなってしまう。
本開示は、上記した事情を背景としてなされたものであり、データ間の相対距離の計算を含む予測式を用いた予測処理において、高速な処理を実現することができる情報処理装置、情報処理方法、及びプログラムを提供することを目的とする。
上記目的を達成するための本開示の一態様は、T(ただし、Tは2以上の整数)行m(ただし、mは1以上の整数)列の行列として表される説明変数のデータと、T個の成分を有するベクトルとして表される目的変数のデータを取得するデータ取得部と、前記説明変数のデータのうち注目する行のデータと他のそれぞれの行のデータとの相対距離の計算を含む所定の予測式と、前記データ取得部が取得したデータとを用いて、前記目的変数についての予測値を算出する予測処理部とを有し、前記予測処理部は、前記他のそれぞれの行との前記相対距離がベクトルにより表された前記予測式を用いて、又は、前記他のそれぞれの行のうち前記相対距離が所定の閾値以上である行のデータを間引いて計算することにより、前記予測値を算出する情報処理装置である。
また、上記目的を達成するための本開示の他の一態様は、情報処理装置が、T(ただし、Tは2以上の整数)行m(ただし、mは1以上の整数)列の行列として表される説明変数のデータと、T個の成分を有するベクトルとして表される目的変数のデータを取得し、前記説明変数のデータのうち注目する行のデータと他のそれぞれの行のデータとの相対距離の計算を含む所定の予測式と、取得した前記データとを用いて、前記目的変数についての予測値を算出し、前記予測値を算出するステップでは、前記他のそれぞれの行との前記相対距離がベクトルにより表された前記予測式を用いて、又は、前記他のそれぞれの行のうち前記相対距離が所定の閾値以上である行のデータを間引いて計算することにより、前記予測値を算出する情報処理方法である。
また、上記目的を達成するための本開示の他の一態様は、T(ただし、Tは2以上の整数)行m(ただし、mは1以上の整数)列の行列として表される説明変数のデータと、T個の成分を有するベクトルとして表される目的変数のデータを取得するデータ取得ステップと、前記説明変数のデータのうち注目する行のデータと他のそれぞれの行のデータとの相対距離の計算を含む所定の予測式と、前記データ取得ステップで取得したデータとを用いて、前記目的変数についての予測値を算出する予測処理ステップとをコンピュータに実行させ、前記予測処理ステップでは、前記他のそれぞれの行との前記相対距離がベクトルにより表された前記予測式を用いて、又は、前記他のそれぞれの行のうち前記相対距離が所定の閾値以上である行のデータを間引いて計算することにより、前記予測値を算出するプログラムである。
本開示によれば、データ間の相対距離の計算を含む予測式を用いた予測処理において、高速な処理を実現することができる情報処理装置、情報処理方法、及びプログラムを提供することができる。
実施の形態にかかる情報処理装置の構成の一例を示すブロック図である。 オリジナルのNPMR予測式で示される演算をコンピュータプログラムにより実装する場合のプログラムのソースコードの一例を示す図である。 ベクトル化予測式で示される演算をコンピュータプログラムにより実装する場合のプログラムのソースコードの一例を示す図である。 リカレンスプロットの一例を示す図である。 実施の形態にかかる情報処理装置のハードウェア構成の一例を示すブロック図である。 実施の形態にかかる情報処理装置の動作の一例を示すフローチャートである。 第1の実験における実験結果を示すグラフである。 第2の実験における実験結果を示すグラフである。 第3の実験における実験結果を示すグラフである。
以下、図面を参照して本発明の実施の形態について説明する。
図1は、実施の形態にかかる情報処理装置10の構成の一例を示すブロック図である。情報処理装置10は、例えば説明変数のデータと目的変数のデータとの間の因果関係を分析する因果分析を行なうために、説明変数のデータと目的変数のデータとを用いて目的変数のデータを予測する処理を行なうが、他の任意の目的のために後述する予測処理を行なってもよい。情報処理装置10は、一例として、図1に示すようにデータ取得部101と予測処理部102とを有する。
データ取得部101は、予測処理に用いるデータの入力を受付ける。データ取得部101は、説明変数のデータ系列と、目的変数のデータ系列の入力を受付ける。本実施の形態では、説明変数のデータ及び目的変数のデータは、いずれも時系列データであるが、必ずしもこれらが時系列データでなくてもよい。特に、データ取得部101は、T行m列の行列として表される説明変数のデータと、T個の成分を有するベクトルとして表される目的変数のデータを取得する。
具体的には、データ取得部101は、以下の式(1)で示される説明変数のデータを取得する。
<式(1)>
また、データ取得部101は、以下の式(2)で示される目的変数のデータを取得する。
<式(2)>
ここで、Tは2以上の整数であり、mは1以上の整数である。なお、mは、説明変数として用いられるデータの種類数を表す。すなわち、予測処理のためにm個の予測子が用いられる。また、Tは、各データ系列(各時系列データ)のデータ数である。具体的な一例を挙げると、例えば、Xの第1列のデータ系列は気温の時系列データであり、第2列のデータ系列は降水量の時系列データであり、Yが示すデータ系列は電気使用量の時系列データである。この場合、後述する予測処理部102は、気温の時系列データと降水量の時系列データと電気使用量の時系列データとに基づいて、電気使用量の予測値を算出することとなる。なお、これらは一例に過ぎず、各データ系列の具体的なデータは上述した例に限定されない。
なお、データ取得部101は、入力されたデータ系列から、T行m列の行列として表される説明変数のデータと、T個の成分を有するベクトルとして表される目的変数のデータを設定してもよい。すなわち、データ取得部101は、行列Xの成分であるxi,j(ただし、iは1以上T以下の整数、jは1以上m以下の整数)及びベクトルYの成分であるy(ただし、tは1以上T以下の整数)のそれぞれの値を指定する入力を受付けてもよいし、入力されたデータからこれらの値をユーザの指示に従うなどして設定してもよい。また、データ取得部101は、後述する標準偏差σが所定の値(例えば1)となるように、データを予め規格化してもよい。
予測処理部102は、説明変数のデータのうち注目する行のデータ(t行のデータ)と他のそれぞれの行のデータ(t行以外のそれぞれの行のデータ)との相対距離(差)の計算を含む所定の予測式と、データ取得部101が取得したデータ(X及びY)とを用いて、目的変数についての予測値を算出する。所定の予測式は、より詳細には、上述した相対距離に基づく重み計算を含む予測式である。なお、この所定の予測式では、相対距離が大きいほど、目的変数の値に対する重みが小さくなるよう重みが設定されている。
本実施の形態では、予測処理部102は、上述した所定の予測式として、具体的には、例えば、非特許文献1に開示されているNPMRモデルの予測式に基づく予測式(NPMRモデルの予測式を修正した予測式)を用いて予測値を算出する。ここで、非特許文献1に開示されているNPMRモデルの予測式は、以下の式(3)のように表される。ここで、式(3)の予測式において、目的変数の値に対して適用される重みwi,jは、式(4)により表される。なお、σは、説明変数Xのj列のデータの標準偏差である。また、本開示では、式(3)の左辺などに現われる、予測値を表す変数をy^と表記することがある。
<式(3)>
<式(4)>
このように、NPMRでは、目的変数Yのデータ系列のt番目の成分であるyの予測値y^を、目的変数Yのデータ系列のt番目以外のそれぞれの成分に重み付けをすることにより算出している。上記予測式から明らかなように、NPMRモデルでは、目的変数Yの全ての成分、すなわちyからyがいずれも実データである場合(すなわち、いずれもNull値でない場合)、tの値として1からTを設定することにより、y^からy^を全て算出することができる。このため、実データであるyからyのそれぞれと予測値であるy^からy^のそれぞれとを比較することで説明変数Xを用いた予測の精度がわかる。一方で、予測値y^の算出には、目的変数Yのデータ系列のt番目の成分であるyは用いられない。y^からy^のうちいずれか一つの値(例えば、未知のy)を算出するだけであれば、目的変数YのT個の成分の全てが必ずしも実データでなくてもよい。すなわち、データ取得部101は、Null値(欠損値)である成分を一つ含むベクトルYを目的変数Yのデータ列として取得してもよい。換言すると、データ取得部101が取得するT個の成分を有するベクトルの所定のt番目の成分はNull値であってもよい。
式(4)からわかるように、重みは、説明変数のデータのうち注目する行のデータ(t行のデータ)と他のそれぞれの行のデータ(t行以外のそれぞれの行のデータ)との相対距離(差)を計算することにより算出される。NPMRモデルは、特許文献1などに示されるモデルに比べ十分に非線形性を表現できるものの、重みに関する計算量が多く、予測値の算出にかかる処理時間が長くなってしまう。そこで、本実施の形態では、予測処理部102は、高速な処理を実現するために、相対距離がベクトルにより表された予測式を用い、かつ、相対距離が所定の閾値以上である行のデータを間引いて計算することにより予測値を算出する。すなわち、予測処理部102による予測値の計算は、相対距離のベクトル化という特徴と、データの間引きという特徴とを有する。なお、本実施の形態は、これら両方の特徴を備えるが、予測処理部102は、いずれか一方の特徴だけを採用して予測値の算出を行なってもよい。
まず、相対距離のベクトル化に関して説明する。発明者らは、NPMRモデルの予測式は、相対距離がベクトルにより表された以下の予測式(式(5))に変形することが可能であることを見出した。このような変形が行なわれた予測式を、本開示ではベクトル化予測式と称すこととする。
<式(5)>
ここで、-tの添え字は、t番目(t行目)の成分が取り除かれていることを意味する。例えば、以下の式(6)に示すベクトルyについて、y-tは以下の式(6)のように定義される。
<式(6)>
したがって、式(5)においてベクトルy-tは、T個の成分を有するベクトルとして表される目的変数のデータ列からt番目の成分を除いたT-1個の成分を有するベクトルである。
また、式(5)においてベクトルΔx-tは、説明変数のデータにおけるt行以外の行のデータセットとt行のデータセットとの相対距離を成分とするT-1個の成分を有するベクトルである。つまり、ベクトルΔx-tは、説明変数のデータにおけるi行のデータセットとt行のデータセットとの相対距離をi番目の成分とするT個のベクトルから、t番目の成分を除いて得られるT-1個の成分を有するベクトルである。説明変数のデータにおけるt行以外の行のデータセットとt行のデータセットとの相対距離は、説明変数のデータにおけるt行以外の行であるi行のm個の成分(xi,1,xi,2,・・・,xi,m)で表されるベクトルと、説明変数のデータにおけるt行のm個の成分(xt,1,xt,2,・・・,xt,m)で表されるベクトルとの相対距離とも言える。
簡単な例として、m=1の場合には、ベクトルΔx-tは例えば以下のように示される。
<式(7)>
また、式(5)などの本開示に示される式において、演算子「・」は、内積を示す演算子(内積演算子)であり、演算子「o」は、アダマール積を示す演算子(アダマール積演算子)である。また、式(5)などの本開示に示される式において、関数「exp」は、指数関数であり、関数「Exp」はベクトルの各成分に作用する指数関数である。すなわち、関数「Exp」は、関数「exp」を各成分に対しそれぞれ適用することを意味する。
図2は、オリジナルのNPMR予測式である式(3)で示される演算をコンピュータプログラムにより実装する場合のプログラムのソースコードの一例を示す図である。また、図3は、ベクトル化予測式である式(5)で示される演算をコンピュータプログラムにより実装する場合のプログラムのソースコードの一例を示す図である。図2及び図3で示したソースコードは、プログラミング言語としてJuliaを用いた場合の例を示しているが他のプログラミング言語により予測式の演算が実装されてもよい。図3に示すように、ベクトル化予測式を用いた場合、ベクトル演算を行なうコードによる実装が可能となるため、ベクトル化前の予測式(オリジナルのNPMR予測式)の演算を実装するコードよりもループ処理による計算の実行回数が削減されたコードにより予測値の計算が可能となる。このため、ベクトル化予測式を用いることにより、予測値の予測処理において、高速な処理を実現することができる。なお、ベクトル化予測式を用いた場合の処理の高速化は、後述する図7などに示す結果からも実験的に理解される。
次に、データの間引きに関して説明する。式(3)及び式(4)からもわかるように、NPMR予測式などのように相対距離に基づき重みが計算される予測式においては、説明変数Xのt行のデータとの相対距離が大きい行に対応する目的変数Yの成分は、予測値y^の算出における寄与度合いが低い。そこで、本実施の形態では、予測値の算出処理をさらに高速化するために、予測処理部102は、相対距離が所定の閾値以上である行のデータを間引いて計算することにより、予測値を算出する。具体的には、予測処理部102は、以下の式(8)で示される予測式を用いて予測値y^を算出する。式(8)は、式(5)に示されるベクトル化予測式をさらに変形した予測式である。なお、式(8)により計算される予測値y^は、式(3)や式(5)で示される予測式により算出される予測値の近似値となっている。
<式(8)>
上記式におけるΔx-t recは以下の式(9)により定義され、y-t recは、以下の式(10)により定義される。
<式(9)>
<式(10)>
ここで、R(t)は、説明変数のデータにおけるt行以外の行のデータセットとt行のデータセットとの相対距離に基づいて生成されるT-1個の成分を有するベクトルである。R(t)は、相対距離が所定の閾値未満である成分、すなわち予測値の算出における寄与度合いが所定の基準以上である成分を抽出するためのフィルタとして用いられる。予測処理部102は、相対距離が閾値未満である行のデータを抽出するためのフィルタ、換言すると、予測値の算出における寄与度合いが所定の基準以上である成分を抽出するためのフィルタであるR(t)を相対距離に基づいて生成し、当該フィルタを用いて相対距離が閾値以上である行のデータを間引く。R(t)は、説明変数のデータ間の相対距離を表すリカレンスプロット(図4参照)においてプロットされる点に対応するものであり、以下の式(11)、(12)により定義される。
<式(11)>
<式(12)>
なお、式(12)において、k=1,2,・・・,t-1,t+1,・・・,Tである。すなわちkは、1からTまでの整数のうちtを除く整数である。また、式(12)において、d(x,x)は、説明変数Xのデータにおけるk行のデータセットとt行のデータセットとの相対距離である。また、δは、上述した所定の閾値である。図4に示される、R(t)とリカレンスプロットとの関係性からわかるように、式(11)で示されるR(t)は、時刻tにおけるリカレンスプロットの分布を0と1とで表現するベクトルである。
上述の通り、R(t)の成分は、説明変数Xのデータにおけるt行のデータセットとの相対距離が閾値δ以上である場合に0となり、相対距離が閾値δ未満である場合に1となる。そして、式(9)に示されるように、0又は1の値をとるT-1個の成分を有するR(t)とΔx-tとのアダマール積によりΔx-t recが定義される。つまり、Δxrec -tは、Δx-tの成分の値を変更したベクトルであって、説明変数のデータにおいてt行のデータとの相対距離が閾値以上である行に対応する各成分の値を0に変更したベクトルである。換言すると、Δxrec -tは、Δx-tの成分の値を変更したベクトルであって、Δx-tの成分のうち、相対距離が閾値以上である成分の値を0に変更したベクトルとも言える。同様に、式(10)に示されるように、0又は1の値をとるT-1個の成分を有するR(t)とy-tとのアダマール積によりy-t recが定義される。つまり、y-t recは、y-tの成分の値を変更したベクトルであって、説明変数のデータにおいてt行のデータとの相対距離が閾値以上である行に対応する各成分の値を0に変更したベクトルである。換言すると、y-t recは、y-tの成分の値を変更したベクトルであって、y-tの成分のうち、Δxrec -tにおいて値が0に変更された成分と同じインデックス(要素番号)の成分の値を0に変更したベクトルとも言える。このため、式(5)に示す予測式とは対照的に、式(8)で示した予測式では、Δx-tの各成分のうち相対距離が閾値以上である成分つまり予測値算出に対して実質的に寄与しない成分の値を0に変更したベクトルと、y-tの各成分のうち予測値算出に対して実質的に寄与しない成分の値を0に変更したベクトルとを用いて、予測値の算出が行なわれることとなる。予測処理部102は、このように、相対距離が所定の閾値以上である行のデータを間引いて計算することにより、換言すると、そのようなデータを除外して計算することにより、より少ない計算量で予測値を算出することができ、予測値の予測処理において、高速な処理を実現することができる。また、これにともない、メモリの消費も低減できる。
次に、情報処理装置10のハードウェア構成の一例について説明する。図5は、情報処理装置10のハードウェア構成の一例を示すブロック図である。図5に示すように、情報処理装置10は、入出力インタフェース151、メモリ152、及びプロセッサ153を含む。
入出力インタフェース151は、必要に応じて他の装置(例えば、入力装置又は出力装置など)と通信可能に接続するためのインタフェースである。例えば、入出力インタフェース151は、データ取得部101がデータを取得するために用いられてもよいし、予測処理部102が予測結果を出力するために用いられてもよい。
メモリ152は、例えば、揮発性メモリ及び不揮発性メモリの組み合わせによって構成される。メモリ152は、プロセッサ153により実行される、1以上の命令を含むソフトウェア(コンピュータプログラム)、及び各種処理に用いるデータなどを格納するために使用される。
プロセッサ153は、メモリ152からソフトウェア(コンピュータプログラム)を読み出して実行することで、図1に示した各構成要素の処理を行う。プロセッサ153は、例えば、マイクロプロセッサ、MPU(Micro Processor Unit)、又はCPU(Central Processing Unit)などであってもよい。プロセッサ153は、複数のプロセッサを含んでもよい。
このように、情報処理装置10は、コンピュータとしての機能を備えている。
プログラムは、コンピュータに読み込まれた場合に、実施形態で説明される1又はそれ以上の機能をコンピュータに行わせるための命令群(又はソフトウェアコード)を含む。プログラムは、非一時的なコンピュータ可読媒体又は実体のある記憶媒体に格納されてもよい。限定ではなく例として、コンピュータ可読媒体又は実体のある記憶媒体は、random-access memory(RAM)、read-only memory(ROM)、フラッシュメモリ、solid-state drive(SSD)又はその他のメモリ技術、CD-ROM、digital versatile disc(DVD)、Blu-ray(登録商標)ディスク又はその他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ又はその他の磁気ストレージデバイスを含む。プログラムは、一時的なコンピュータ可読媒体又は通信媒体上で送信されてもよい。限定ではなく例として、一時的なコンピュータ可読媒体又は通信媒体は、電気的、光学的、音響的、またはその他の形式の伝搬信号を含む。
次に、情報処理装置10の処理について、フローチャートを参照しつつ説明する。図6は、本実施の形態にかかる情報処理装置10の動作の一例を示すフローチャートである。
ステップS100において、データ取得部101は、説明変数及び目標変数のデータを設定する。本実施の形態では、具体的には、データ取得部101は、予測値の算出に用いる、T行m列の行列として表される説明変数のデータと、T個の成分を有するベクトルとして表される目的変数のデータを設定する。次に、ステップS101において、予測処理部102は、高速化のための予測式を用いて予測値を算出する。本実施の形態では、予測処理部102は、式(8)に示した予測式のように、データを間引いて計算することを可能になるように変形されたベクトル化予測式を用いて予測値を算出したが、予測処理部102による予測値の計算は、相対距離のベクトル化という特徴と、データの間引きという特徴のいずれか一方の特徴だけを採用して予測値の算出を行なってもよい。次に、ステップS102において、予測処理部102は、ステップS101で算出された予測値、すなわち予測結果を出力する。予測処理部102は、ディスプレイなどの出力装置に出力してもよいし、予測結果を記憶するために記憶装置に出力してもよい。
以上、実施の形態について説明した。情報処理装置10によれば、予測処理部102は、説明変数のデータのうち注目する行のデータと他のそれぞれの行のデータとの相対距離がベクトルにより表された予測式を用いて、又は、当該他のそれぞれの行のうち相対距離が所定の閾値以上である行のデータを間引いて、予測値を算出する。前者の場合、相対距離がベクトルにより表されていない予測式をコンピュータプログラムにより演算する場合に比べて、実行されるループ処理が削減されるため、高速な処理を実現できる。また、後者の場合、予測値の算出に実質的に寄与しないデータを間引いて処理が行なわれるため、高速な処理を実現できる。また、メモリの消費も低減できる。また、特に、予測処理部102は、予測値の算出に用いる予測式として、NPMRモデルの予測式に基づく予測式を用いるため、十分に非線形性を反映した予測処理を高速に実現することができる。
次に、予測処理部102による高速な処理についての実験結果を示す。本実験のために用いた測定環境は以下の通りである。
オペレ-ティングシステム:macOS Catalina
プロセッサ:2.8GHz、クアッドコア、Intel Core i7
メモリ:16GB、2133Mhz、LPDDR3
また、第1の実験では、テストデータとして以下により定義される2つの時系列データを用い、これらの時系列データから説明変数X及び目的変数Yを設定した。なお、式(13)において、e(t)、e(t)は、ホワイトノイズである。式(13)に示すテストデータでは、xからxへの非線形な因果が存在する。
<式(13)>
また、第2の実験では、テストデータとして以下により定義される3つの時系列データを用い、これらの時系列データから説明変数X及び目的変数Yを設定した。なお、式(14)において、e(t)、e(t)、e(t)は、ホワイトノイズである。式(14)に示すテストデータでは、xからxへの非線形な因果と、xからxへの非線形な因果と、xからxへの線形な因果が存在する。
<式(14)>
図7は、第1の実験における実験結果を示すグラフである。また、図8は、第2の実験における実験結果を示すグラフである。図7及び図8では、オリジナルのNPMRを用いて解析する場合の所要時間のグラフ(ラベル「NPMR」が付されたグラフ)と、相対距離のベクトル化がされたNPMRを用いて解析する場合の所要時間のグラフ(ラベル「Fast NPMR-1」が付されたグラフ)と、相対距離のベクトル化とデータの間引きを組み合わせたNPMRを用いて解析する場合の所要時間のグラフ(ラベル「Fast NPMR-2」が付されたグラフ)とを示している。図7及び図8に示されるように、本実施の形態で示される技術が用いられることにより、処理が高速化されることがわかる。特にデータ数が多いほど、また、解析対象が複雑であるほど、高速化が顕著である。
また、第3の実験では、上述した予測式とは別の予測式を用いて、データの間引きによる効果について確認した。ここでは、カーネル法を用いた予測式について検討した。具体的には、予測処理部102は、以下の式(15)で示される予測式を高速に処理するために、以下の式(16)で示される予測式を用いて処理を行なう。
<式(15)>
<式(16)>
式(16)においても、上述したフィルタ、すなわち相対距離が所定の閾値未満である成分(予測値の算出における寄与度合いが所定の基準以上である成分)を抽出するためのフィルタを用いて、計算に用いられるデータが間引かれている。ここで、式(16)におけるR(t)は、以下のように定義され、相対距離が閾値δ未満である成分を示すインデックス(行番号)の集合を表す。なお、式(17)において、D(t)は、データ取得部101が設定した説明変数Xのi行のデータを示し、D(t)は、説明変数Xのt行のデータD(t)との相対距離が算出され、閾値と比較される。
<式(17)>
予測処理部102は、R(t)を生成し、式(16)に示される予測式の演算を実行する。図9は、第3の実験における実験結果を示すグラフである。なお、第3の実験において用いたテストデータは、第1の実験と同様である。図9では、相対距離に基づくデータの間引きを行なわないで解析する場合の所要時間のグラフ(ラベル「通常版」が付されたグラフ)と、相対距離に基づくデータの間引きを行なって解析する場合の所要時間のグラフ(ラベル「高速版」が付されたグラフ)とを示している。図9に示されるように、フィルタを用いたデータの間引きが行なわれることにより、処理が高速化されることがわかる。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上記実施の形態では、情報処理装置10が、データ取得部101及び予測処理部102の機能を有したが、これらの一部又は全ての機能が、他の装置(例えば、サーバなど)により実装されてもよい。すなわち、1以上の装置から構成されるシステムにより、上記実施の形態で説明された処理が実現されてもよい。
10 情報処理装置
101 データ取得部
102 予測処理部
151 入出力インタフェース
152 メモリ
153 プロセッサ

Claims (7)

  1. T(ただし、Tは2以上の整数)行m(ただし、mは1以上の整数)列の行列として表される説明変数のデータと、T個の成分を有するベクトルとして表される目的変数のデータを取得するデータ取得部と、
    前記説明変数のデータのうち注目する行のデータと他のそれぞれの行のデータとの相対距離の計算を含む所定の予測式と、前記データ取得部が取得したデータとを用いて、前記目的変数についての予測値を算出する予測処理部と
    を有し、
    前記予測処理部は、前記他のそれぞれの行との前記相対距離がベクトルにより表された前記予測式を用いて、又は、前記他のそれぞれの行のうち前記相対距離が所定の閾値以上である行のデータを間引いて計算することにより、前記予測値を算出する
    情報処理装置。
  2. 前記予測処理部は、前記相対距離が前記閾値未満である前記行のデータを抽出するためのフィルタを前記相対距離に基づいて生成し、当該フィルタを用いて前記相対距離が前記閾値以上である前記行のデータを間引く
    請求項1に記載の情報処理装置。
  3. 前記所定の予測式は、NPMR(Non-Parametric Multiplicative Regression)モデルの予測式に基づく予測式である
    請求項1又は2に記載の情報処理装置。
  4. 前記予測処理部は、前記予測式として下記の式を用いて、前記予測値を算出する
    請求項3に記載の情報処理装置。
    ただし、
    下記の式において、
    は、前記予測値であり、
    tは、前記注目する行の行番号に対応し、
    Δxrec -tは、前記説明変数のデータにおけるt行以外の行のデータセットとt行のデータセットとの前記相対距離を成分とするT-1個の成分を有するベクトルの成分の値を変更したベクトルであって、前記相対距離が前記閾値以上である前記行に対応する各成分の値が0に変更されたベクトルであり、
    rec -tは、T個の成分を有するベクトルとして表される前記目的変数からt番目の成分を除いたT-1個の成分を有するベクトルの成分の値を変更したベクトルであって、前記相対距離が前記閾値以上である前記行に対応する各成分の値が0に変更されたベクトルであり、
    expは、指数関数であり、
    Expは、ベクトルの各成分に作用する指数関数である。
  5. 前記説明変数のデータ及び前記目的変数のデータは、時系列データである
    請求項1に記載の情報処理装置。
  6. 情報処理装置が、
    T(ただし、Tは2以上の整数)行m(ただし、mは1以上の整数)列の行列として表される説明変数のデータと、T個の成分を有するベクトルとして表される目的変数のデータを取得し、
    前記説明変数のデータのうち注目する行のデータと他のそれぞれの行のデータとの相対距離の計算を含む所定の予測式と、取得した前記データとを用いて、前記目的変数についての予測値を算出し、
    前記予測値を算出するステップでは、前記他のそれぞれの行との前記相対距離がベクトルにより表された前記予測式を用いて、又は、前記他のそれぞれの行のうち前記相対距離が所定の閾値以上である行のデータを間引いて計算することにより、前記予測値を算出する
    情報処理方法。
  7. T(ただし、Tは2以上の整数)行m(ただし、mは1以上の整数)列の行列として表される説明変数のデータと、T個の成分を有するベクトルとして表される目的変数のデータを取得するデータ取得ステップと、
    前記説明変数のデータのうち注目する行のデータと他のそれぞれの行のデータとの相対距離の計算を含む所定の予測式と、前記データ取得ステップで取得したデータとを用いて、前記目的変数についての予測値を算出する予測処理ステップと
    をコンピュータに実行させ、
    前記予測処理ステップでは、前記他のそれぞれの行との前記相対距離がベクトルにより表された前記予測式を用いて、又は、前記他のそれぞれの行のうち前記相対距離が所定の閾値以上である行のデータを間引いて計算することにより、前記予測値を算出する
    プログラム。
JP2022129482A 2022-08-16 2022-08-16 情報処理装置、情報処理方法、及びプログラム Active JP7708031B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022129482A JP7708031B2 (ja) 2022-08-16 2022-08-16 情報処理装置、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022129482A JP7708031B2 (ja) 2022-08-16 2022-08-16 情報処理装置、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2024026931A JP2024026931A (ja) 2024-02-29
JP7708031B2 true JP7708031B2 (ja) 2025-07-15

Family

ID=90038641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022129482A Active JP7708031B2 (ja) 2022-08-16 2022-08-16 情報処理装置、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7708031B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180093418A1 (en) 2016-09-30 2018-04-05 Velo3D, Inc. Three-dimensional objects and their formation
WO2018198267A1 (ja) 2017-04-27 2018-11-01 日本電気株式会社 因果関係学習方法、プログラム、装置および異常分析システム
US20190365024A1 (en) 2018-05-29 2019-12-05 Matmarket, LLC High performance footbed and method of manufacturing same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180093418A1 (en) 2016-09-30 2018-04-05 Velo3D, Inc. Three-dimensional objects and their formation
WO2018198267A1 (ja) 2017-04-27 2018-11-01 日本電気株式会社 因果関係学習方法、プログラム、装置および異常分析システム
US20190365024A1 (en) 2018-05-29 2019-12-05 Matmarket, LLC High performance footbed and method of manufacturing same
JP2021525637A (ja) 2018-05-29 2021-09-27 マットマーケット エルエルシー 高性能中底およびそれを製造する方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Nicoletta Nicolaou et al.,A Nonlinear Causality Estimator Based on Non-Parametric Multiplicative Regression,Frontiers in Neuroinformatics,vol.10 Article 19,2016年06月14日,pp.1-21,[online],[令和7年5月23日検索],インターネット <URL:https://www.frontiersin.org/journals/neuroinf>

Also Published As

Publication number Publication date
JP2024026931A (ja) 2024-02-29

Similar Documents

Publication Publication Date Title
JP7127120B2 (ja) ビデオ分類の方法、情報処理の方法及びサーバー、並びにコンピュータ可読記憶媒体及びコンピュータプログラム
US10757125B2 (en) Anomaly detection method and recording medium
JP2018129033A (ja) 人工ニューラルネットワークのクラスに基づく枝刈り
US8595155B2 (en) Kernel regression system, method, and program
WO2019114413A1 (zh) 模型训练
US12327191B2 (en) Method and apparatus with neural network pruning
US20170227584A1 (en) Time-series data waveform analysis device, method therefor and non-transitory computer readable medium
US20200334557A1 (en) Chained influence scores for improving synthetic data generation
US20200265307A1 (en) Apparatus and method with multi-task neural network
Contreras-Reyes Mutual information matrix based on Rényi entropy and application
JP7697317B2 (ja) 専門的知識に基づいた交絡バイアスの識別及び定量化
CN114008666B (zh) 动态图像分辨率评估
CN114093435A (zh) 一种基于深度学习的化学分子相关水溶性预测方法
WO2019194105A1 (ja) 因果関係学習装置、因果関係推定装置、因果関係学習方法、因果関係推定方法及びプログラム
US11893079B2 (en) Method, system, and computer program product for determining causality
US20220004908A1 (en) Information processing apparatus, information processing system, information processing method, and non-transitory computer readable medium storing program
JP7708031B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2019095894A (ja) 推定装置、学習装置、学習済みモデル、推定方法、学習方法、及びプログラム
CN109598347A (zh) 用于确定因果关系的方法、系统和计算机程序产品
CN113139466B (zh) 基于单隐层神经网络的图像识别方法及相关设备
KR20190109194A (ko) 불확정성을 모델링할 수 있는 뉴럴네트워크 학습 장치 및 방법
Zhang et al. Multi-task sparse screening for predicting future clinical scores using longitudinal cortical thickness measures
WO2023276255A1 (ja) 情報処理装置、および情報処理方法、並びにプログラム
Yang et al. Efficient matrix profile computation with Euclidean distance using Eigen transformation: Performance evaluation based on beat‐to‐beat interval (BBI) data
EP4451146A1 (en) Computer-implemented method for fast matching of entities from different datasets

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240712

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250530

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250616

R150 Certificate of patent or registration of utility model

Ref document number: 7708031

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150