JP7732591B2

JP7732591B2 - 連合学習システム、モデル学習装置、連合学習方法、モデル学習プログラム

Info

Publication number: JP7732591B2
Application number: JP2024522796A
Authority: JP
Inventors: 匠深見; 一凡張; 健太丹羽
Original assignee: Nippon Telegraph and Telephone Corp; NTT Inc USA
Current assignee: NTT Inc; NTT Inc USA
Priority date: 2022-05-25
Filing date: 2022-05-25
Publication date: 2025-09-02
Anticipated expiration: 2042-05-25
Also published as: CN119156626A; JPWO2023228317A1; WO2023228317A1; US20250363386A1; EP4535244A1

Description

本発明は、複数のモデル学習装置を有し、それぞれのモデル学習装置は他のモデル学習装置のいずれかとネットワークを介して接続される連合学習システム、モデル学習装置、連合学習方法、モデル学習プログラムに関する。

個人端末内のメール，購買履歴，企業内の検討資料，ＩｏＴ情報，病院の診断情報などを活用することで、マッチング，自動制御，ＡＩ診療など多くのメリットが期待できる。しかし、情報セキュリティおよび漏洩への不安に起因して活用できていない。個人情報などの機密情報の漏洩を防ぐ対策として、エンドユーザ端末でデータを解析し、機密情報を出さずにノウハウのみ（例えば、双対変数）を活用可能にする連合学習技術（もしくは、分散学習技術）がある。非特許文献１は、機械学習モデルの分散学習（distributed training of machine learning models）におけるドリフト問題（drift problem）を解決するため、ＥＣＬ（Edge-Consensus Learning）の更新処理において、制約－強度制御パラメータ（constraint-strength control parameter）を最適に選択することでＳＶＲ（Stochastic Variance Reduction）の勾配修正を暗黙に増加させるように再構築している。図１に非特許文献１に示されたアルゴリズム２を示す。非特許文献２は、学習モデル（以下では、単に「モデル」と呼ぶ。）にノイズを加えることで、元データの再現リスクを低減している。図２に非特許文献２に示されたアルゴリズム１と式１３ａ，１３ｂを示す。

Niwa, K., Zhang, G., Kleijn, W.B., Harada, N., Sawada, H., Fujino, A.. (2021). Asynchronous Decentralized Optimization With Implicit Stochastic Variance Reduction. Proceedings of the 38th International Conference on Machine Learning, in Proceedings of Machine Learning Research. ZonghanH, et al. "Differentially Private ADMM for Convex Distributed Learning: Improved Accuracy via Multi-Step Approximation", arXiv:2005.07890.

しかしながら、連合学習は、学習を分散して高速に実施できるが、ユーザが生成したモデルを用いた元データの再現リスクがあった。また、モデルの学習についてもどこまでの情報が送信されているか分からなかった。さらに、連合学習に差分プライバシーを付与する技術は、連合学習におけるユーザが生成したモデルにノイズを加えることで、元データの再現リスクを低減している。加えるノイズは大きいほど漏洩リスクを低減できるが、学習するモデルの精度が下がってしまう。既存の手法では加えるノイズは任意に決める必要があり、漏洩リスク低減と精度向上の両立という課題が残されている。

また、ユーザごとの端末で学習を行う場合、ユーザが保有するデータの分散はさまざまである。例えば、ユーザＡは血圧の情報だけをもち、ユーザＢは心拍数の情報だけを持つ場合などユーザごとに持っているデータの属性（ラベル）が違うこともある。また、ユーザＡは１０人分のデータを保持し、ユーザＢは３人分のデータを保持する場合など保持しているデータ件数が違う場合もある。さらに、ユーザの端末ごとに性能も異なるし、通信環境も異なるので、ユーザ端末の計算・通信性能に大きな差がある場合もある。非特許文献１の技術においても、分散保持されたデータの分散が大きい場合、およびユーザ端末の計算・通信性能の差が大きい場合には、安定した連合学習を行いにくいという問題がある。

連合学習においては、いくつかの問題がある。本発明においては、まず、分散保持されたデータの分散が大きい場合、およびユーザの計算・通信性能の差が大きい場合であっても安定した連合学習を行うことを、課題とする。

本発明の連合学習システムは、複数のモデル学習装置を有し、それぞれのモデル学習装置は他のモデル学習装置のいずれかとネットワークを介して接続される。本発明の連合学習システムでは、モデルのパラメータ、双対変数、ステップサイズ、モデル学習用データ、制約パラメータは、あらかじめ定めた初期値に設定される。それぞれのモデル学習装置は、ミニバッチ抽出部、モデルパラメータ更新部、双対変数算出・送信部、双対変数受信部、双対変数設定部を備える。ミニバッチ抽出部は、モデル学習用データから、あらかじめ定めた量のデータをミニバッチとして抽出する。モデルパラメータ更新部は、双対変数、ステップサイズ、モデル学習用データのミニバッチ、制約パラメータ、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いて学習を行い、モデルのパラメータを更新する。双対変数算出・送信部は、当該モデル学習装置と接続されている他のモデル学習装置ごとに、モデルパラメータ更新部が更新したモデルのパラメータと係数γを用いて双対変数を求め、送信する。双対変数受信部は、当該モデル学習装置と接続されている他のモデル学習装置から、双対変数を受信する。双対変数設定部は、受信した双対変数を、次の学習に用いる双対変数とする。

本発明の連合学習システムによれば、モデル学習装置のモデルパラメータ更新部が、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いて更新する。また、双対変数算出・送信部が、当該モデル学習装置と接続されている他のモデル学習装置ごとに、更新したモデルのパラメータと係数γを用いて双対変数を求め、送信する。係数γによって更新の程度を調整できるので、分散保持されたデータの分散が大きい場合、およびユーザの計算・通信性能の差が大きい場合であっても安定した連合学習を行うことができる。

非特許文献１に示されたアルゴリズム２を示す図。非特許文献２に示されたアルゴリズム１と式１３ａ，１３ｂを示す図。実施例１の連合学習システムの構成例を示す図。本発明のモデル学習装置がリング状に接続された例を示す図。本発明のモデル学習装置がランダムに接続された例を示す図。実施例１の連合学習システムの処理フロー例を示す図。実施例２の連合学習システムの構成例を示す図。実施例２の連合学習システムの処理フロー例を示す図。実施例２の連合学習システム２０のアルゴリズムを、非特許文献１と同様の記載で示した図。コンピュータの機能構成例を示す図。

以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

図３に実施例１の連合学習システムの構成例を示す。図４に本発明のモデル学習装置がリング状に接続された例を、図５に本発明のモデル学習装置がランダムに接続された例を示す。図６は、実施例１の連合学習システムの処理フロー例を示す図である。実施例１の連合学習システム１０は、Ｎ個のモデル学習装置１００_１，…，１００_Ｎを有し、それぞれのモデル学習装置１００_ｉは他のモデル学習装置１００_ｊのいずれかとネットワーク９００を介して接続される。ここで、Ｎは２以上の整数、ｉは１以上Ｎ以下の整数、ｊはｉ以外の１以上Ｎ以下の整数である。それぞれのモデル学習装置１００_ｉは、初期設定部１１０、ミニバッチ抽出部１３０、モデルパラメータ更新部１４０、双対変数算出・送信部１５０、双対変数受信部１６０、双対変数設定部１７０を備える。

それぞれのモデル学習装置１００_１，…，１００_Ｎの初期設定部１１０では、モデルのパラメータｗ_ｉ、双対変数ｚ_ｉ｜ｊ、ステップサイズμ、モデル学習用データｘ_ｉ、制約パラメータＡ_ｉ｜ｊは、あらかじめ定めた初期値に設定される（Ｓ１１０）。例えば、ｗ_１，…，ｗ_Ｎは同じ値に設定され、ｚ_ｉ｜ｊ＝０に設定される。

それぞれのモデル学習装置１００_１，…，１００_Ｎのミニバッチ抽出部１３０は、モデル学習用データｘ_ｉから、あらかじめ定めた量のデータをミニバッチξ_ｉ ^ｒ，ｋとして抽出する（Ｓ１３０）。例えば、学習用データの数が１万個あるときに５００個もしくは１０００個のミニパッチを任意に抽出すればよい。ξの右下のｉはモデル学習装置の番号を示している。ξの右上のｋは、それぞれのモデル学習装置１００_１，…，１００_Ｎで行う繰り返し処理（インナーループ過程）の繰り返し回数を示す整数である。インナーループ過程では、Ｋ回の繰り返し処理を行う。Ｋは２以上の整数であり、ｋは１以上Ｋ以下の整数である。ξの右上のｒは、連合学習システム全体で、インナーループ過程の繰り返し処理（アウターループ過程）の繰り返し回数を示す整数である。アウターループ過程では、Ｒ回の繰り返し処理を行う。Ｒは２以上の整数であり、ｒは１以上Ｒ以下の整数である。以下の説明でも、記号の右下のｉ，ｊはモデル学習装置の番号を示し、記号の右上のｒはアウターループ過程での繰り返し回数、右上のｋはインナーループ過程での繰り返し回数を示す。なお、明細書中のテキストでは、右下の記号と右上の記号は横方向について同じ位置に記載することはできないので、ずらして記載している。一方、明細書中の数式及び図では記載できるので横方向について同じ位置に記載している。

それぞれのモデル学習装置１００_１，…，１００_Ｎのモデルパラメータ更新部１４０は、双対変数、ステップサイズ、モデル学習用データのミニバッチ、制約パラメータ、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いて学習を行い、モデルのパラメータを更新する（Ｓ１４０）。具体的には、モデルパラメータ更新部１４０は、次式のように、モデルのパラメータを更新し、次回の処理で使用するモデルのパラメータｗ_ｉ ^{ｒ，ｋ＋１}を求める。

ただし、ｆ^－はコスト関数もしくはコスト関数と置換可能な関数、ｕは更新前のモデルのパラメータ、ξ_ｉ ^ｒ，ｋはモデル学習用データのミニバッチ、係数γは１＋αη、Ｎは連合学習システムを構成するモデル学習装置の数、Ａ_ｉ｜ｊは制約パラメータ、ｚ_ｉ｜ｊ ^ｒは双対変数である。ｗ_ｉ ^{ｒ，ｋ＋１}はモデルのパラメータであり、インナーループのｋ＋１回目の処理に使用する。なお、“ｆ^－”の“^－”は、本来は“ｆ”の上に配置されるが、明細書でのテキストの記載の制限から、“ｆ^－”のように記載している。

あらかじめ定めた最適値ηは、１／（μＫＥ_ｉ）とすればよい。Ｅ_ｉは、モデル学習装置１００_ｉと接続されている他のモデル学習装置の数である。あらかじめ定めたハイパラメータαは、例えばα＝２などがあるが、これに限られるものではない。連合システムごとに適したαは異なるので、連合学習システムごとに適宜定めればよいパラメータである。コスト関数もしくはコスト関数と置換可能な関数ｆ^－，モデルのパラメータｕ、制約パラメータＡ_ｉ｜ｊなどは、非特許文献１と同じ関数とパラメータを用いればよい。例えば、関数ｆ^－としては、非特許文献１の“4.1 Problem definition”に記載された以下の関数ｑ_ｉ（ｗ_ｉ）を用いればよい。

ただし、ｇ_ｉはコスト関数ｆ_ｉの微分関数である。

それぞれのモデル学習装置１００_１，…，１００_Ｎの双対変数算出・送信部１５０は、当該モデル学習装置１００_ｉと接続されている他のモデル学習装置１００_ｊごとに、モデルパラメータ更新部１４０が更新したモデルのパラメータｗ_ｉ ^{ｒ，ｋ＋１}と係数γを用いて双対変数ｙ_ｉ｜ｊを求め、他のモデル学習装置１００_ｊごとに送信する（Ｓ１５０）。具体的には、双対変数算出・送信部１５０は、次式のように双対変数ｙ_ｉ｜ｊを求める。なお、他のモデル学習装置２００_ｊは、少なくとも１つは存在するが、２つ以上であってもよい。また、式の矢印は、代入を意味している。

それぞれのモデル学習装置１００_１，…，１００_Ｎの双対変数受信部１６０は、当該モデル学習装置１００_ｉと接続されている他のモデル学習装置１００_ｊから、双対変数ｙ_ｊ｜ｉを受信する（Ｓ１６０）。双対変数受信部１６０が受信する双対変数ｙ_ｊ｜ｉは、モデル学習装置１００_ｊの双対変数算出・送信部１５０が算出・送信するので、双対変数算出・送信部１５０が算出・送信する双対変数ｙ_ｉ｜ｊとは“ｊ”と“ｉ”の位置が逆である。

それぞれのモデル学習装置１００_１，…，１００_Ｎの双対変数設定部１７０は、受信した双対変数ｙ_ｊ｜ｉを、次の学習に用いる双対変数ｚ_ｉ｜ｊ ^{ｒ，ｋ＋１}とする（Ｓ１７０）。双対変数設定部１７０は、次式のように受信した双対変数ｙ_ｊ｜ｉを、次の学習に用いる双対変数ｚ_ｉ｜ｊ ^{ｒ，ｋ＋１}とすればよい。

それぞれのモデル学習装置１００_１，…，１００_Ｎは、インナーループ過程の処理が終了したかを確認し、終了していないとき（Ｎｏのとき）は繰り返し処理を続け、終了しているとき（Ｙｅｓのとき）はアウターループ過程の確認に進む（Ｓ１８０）。ステップＳ１８０がＹｅｓのときは、それぞれのモデル学習装置１００_１，…，１００_Ｎは、アウターループ過程の処理が終了したかを確認し、終了していないとき（Ｎｏのとき）は繰り返し処理を続け、終了しているとき（Ｙｅｓのとき）は処理を終了する（Ｓ１９０）。

連合学習システム１０によれば、モデル学習装置１００_１，…，１００_Ｎのモデルパラメータ更新部１４０が、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いてモデルのパラメータｗ_ｉ ^{ｒ，ｋ＋１}を更新する。また、双対変数算出・送信部１５０が、当該モデル学習装置１００_ｉと接続されている他のモデル学習装置１００_ｊごとに、更新したモデルのパラメータと係数γを用いて双対変数を求め、送信する。係数γによって更新の程度を調整できるので、分散保持されたデータの分散が大きい場合、およびユーザの計算・通信性能の差が大きい場合であっても安定した連合学習を行うことができる。

実施例１では、第１の課題である「分散保持されたデータの分散が大きい場合や、ユーザの計算・通信性能の差が大きい場合であっても安定した連合学習を行う」を解決した。第１の課題を解決する手段に限定を付加することで、「漏洩リスク低減と精度向上の両立」という課題も解決可能である。そこで、実施例２では、「漏洩リスク低減と精度向上の両立」を第２の課題とする。

図７に実施例２の連合学習システムの構成例を示す。図４に本発明のモデル学習装置がリング状に接続された例を、図５に本発明のモデル学習装置がランダムに接続された例を示す。図８は、実施例２の連合学習システムの処理フロー例を示す図である。実施例２の連合学習システム２０は、Ｎ個のモデル学習装置２００_１，…，２００_Ｎを有し、それぞれのモデル学習装置２００_ｉは他のモデル学習装置２００_ｊのいずれかとネットワークを介して接続される。それぞれのモデル学習装置２００_ｉは、初期設定部１１０、ノイズ生成部２２０、ミニバッチ抽出部１３０、モデルパラメータ更新部１４０、双対変数算出・送信部２５０、双対変数受信部１６０、双対変数設定部１７０を備える。

それぞれのモデル学習装置２００_１，…，２００_Ｎの初期設定部１１０、ミニバッチ抽出部１３０の処理（Ｓ１３０）は実施例１と同じである。それぞれのモデル学習装置２００_１，…，２００_Ｎのノイズ生成部２２０は、ノイズｎ_ｉを生成する（Ｓ２２０）。具体的には、あらかじめ定めた分散σ^２に基づいてガウスノイズｎ_ｉを生成すればよい。

それぞれのモデル学習装置２００_１，…，２００_Ｎのモデルパラメータ更新部１４０は、双対変数、ステップサイズ、モデル学習用データのミニバッチ、制約パラメータ、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いて学習を行い、モデルのパラメータを更新する（Ｓ１４０）。具体的には、モデルパラメータ更新部１４０は、次式のように、モデルのパラメータを更新し、次回の処理で使用するモデルのパラメータｗ_ｉ ^{ｒ，ｋ＋１}を求める。

ただし、ｆ^－はコスト関数もしくはコスト関数と置換可能な関数、ｕは更新前のモデルのパラメータ、ξ_ｉ ^ｒ，ｋはモデル学習用データのミニバッチ、係数γは１＋αη、Ｎは連合学習システムを構成するモデル学習装置の数、Ａ_ｉ｜ｊは制約パラメータ、ｚ_ｉ｜ｊ ^ｒは双対変数である。ｗ_ｉ ^{ｒ，ｋ＋１}はモデルのパラメータであり、インナーループのｋ＋１回目の処理に使用する。上述のモデルパラメータ更新部１４０の処理は、実施例１と同じである。ただし、後述する双対変数算出・送信部２５０によって双対変数ｚ_ｉ｜ｊ ^ｒにはノイズが付加されているので、γはモデルのパラメータｗ_ｉ ^{ｒ，ｋ＋１}を更新する際のノイズの影響を調整する役割も果たす。

それぞれのモデル学習装置２００_１，…，２００_Ｎの双対変数算出・送信部２５０は、モデル学習装置２００_ｉと接続されている他のモデル学習装置２００_ｊごとに、モデルパラメータ更新部１４０が更新したモデルのパラメータｗ_ｉ ^{ｒ，ｋ＋１}と係数γを用いて、ノイズを付加した双対変数ｙ_ｉ｜ｊを求め、他のモデル学習装置２００_ｊに送信する。なお、他のモデル学習装置２００_ｊは、少なくとも１つは存在するが、２つ以上であってもよい。具体的には、双対変数算出・送信部２５０は、次式のようにノイズが付加された双対変数ｙ_ｉ｜ｊを求める。

ただし、ｎ_ｉはノイズ生成部２２０が生成したノイズである。双対変数算出・送信部２５０のγはノイズの影響を調整する役割と、情報漏洩防止の役割を果たしている。

双対変数受信部１６０の処理（Ｓ１６０）と双対変数設定部１７０の処理（Ｓ１７０）は実施例１と同じである。また、実施例１と同じように、インナーループ過程の確認（Ｓ１８０）とアウターループ過程の確認（Ｓ１９０）を行い、繰り返し処理を実行する。

図９は、上述の実施例２の連合学習システム２０のアルゴリズムを、非特許文献１と同様の記載で示した図である。連合学習システム２０によれば、ξ_ｉ ^ｒ，ｋにはノイズが付加されていないので、ノイズによる学習阻害の影響を低減できるのでモデル学習の精度を向上できる。一方で、他のモデル学習装置２００_ｊに送信する双対変数ｙ_ｉ｜ｊにはノイズを付加しているので、情報漏洩のリスクを低減できる。よって、第１の課題である「分散保持されたデータの分散が大きい場合や、ユーザの計算・通信性能の差が大きい場合であっても安定した連合学習を行う」の解決の他に、漏洩リスク低減と精度向上の両立という課題も解決できる。

［プログラム、記録媒体］
上述の各種の処理は、図１０に示すコンピュータ２０００の記録部２０２０に、上記方法の各ステップを実行させるプログラムを読み込ませ、制御部２０１０、入力部２０３０、出力部２０４０、表示部２０５０などに動作させることで実施できる。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

１０，２０連合学習システム
１００，２００モデル学習装置
１１０初期設定部
１３０ミニバッチ抽出部
１４０モデルパラメータ更新部
１５０，２５０双対変数算出・送信部
１６０双対変数受信部
１７０双対変数設定部
２２０ノイズ生成部

Claims

複数のモデル学習装置を有し、それぞれのモデル学習装置は他のモデル学習装置のいずれかとネットワークを介して接続される連合学習システムであって、
モデルのパラメータ、双対変数、ステップサイズ、モデル学習用データ、制約パラメータは、あらかじめ定めた初期値に設定されており、
それぞれのモデル学習装置は、
前記モデル学習用データから、あらかじめ定めた量のデータをミニバッチとして抽出するミニバッチ抽出部と、
双対変数、ステップサイズ、モデル学習用データのミニバッチ、制約パラメータ、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いて学習を行い、モデルのパラメータを更新するモデルパラメータ更新部と、
当該モデル学習装置と接続されている他のモデル学習装置ごとに、前記モデルパラメータ更新部が更新したモデルのパラメータと係数γを用いて双対変数を求め、送信する双対変数算出・送信部と、
当該モデル学習装置と接続されている他のモデル学習装置から、双対変数を受信する双対変数受信部と、
受信した双対変数を、次の学習に用いる双対変数とする双対変数設定部と、
を備える
ことを特徴とする連合学習システム。
複数のモデル学習装置を有し、それぞれのモデル学習装置は他のモデル学習装置のいずれかとネットワークを介して接続される連合学習システムであって、
モデルのパラメータ、双対変数、ステップサイズ、モデル学習用データ、制約パラメータは、あらかじめ定めた初期値に設定されており、
それぞれのモデル学習装置は、
ノイズを生成するノイズ生成部と、
前記モデル学習用データから、あらかじめ定めた量のデータをミニバッチとして抽出するミニバッチ抽出部と、
双対変数、ステップサイズ、モデル学習用データのミニバッチ、制約パラメータ、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いて学習を行い、モデルのパラメータを更新するモデルパラメータ更新部と、
当該モデル学習装置と接続されている他のモデル学習装置ごとに、前記モデルパラメータ更新部が更新したモデルのパラメータと係数γを用いて、前記ノイズを付加した双対変数を求め、送信する双対変数算出・送信部と、
当該モデル学習装置と接続されている他のモデル学習装置から、双対変数を受信する双対変数受信部と、
受信した双対変数を、次の学習に用いる双対変数とする双対変数設定部と、
を備える
ことを特徴とする連合学習システム。
複数のモデル学習装置を有し、それぞれのモデル学習装置は他のモデル学習装置のいずれかとネットワークを介して接続される連合学習システムを構成する前記モデル学習装置であって、
モデルのパラメータ、双対変数、ステップサイズ、モデル学習用データ、制約パラメータは、あらかじめ定めた初期値に設定されており、
前記モデル学習用データから、あらかじめ定めた量のデータをミニバッチとして抽出するミニバッチ抽出部と、
双対変数、ステップサイズ、モデル学習用データのミニバッチ、制約パラメータ、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いて学習を行い、モデルのパラメータを更新するモデルパラメータ更新部と、
当該モデル学習装置と接続されている他のモデル学習装置ごとに、前記モデルパラメータ更新部が更新したモデルのパラメータと係数γを用いて双対変数を求め、送信する双対変数算出・送信部と、
当該モデル学習装置と接続されている他のモデル学習装置から、双対変数を受信する双対変数受信部と、
受信した双対変数を、次の学習に用いる双対変数とする双対変数設定部と、
を備える
ことを特徴とするモデル学習装置。
請求項３記載のモデル学習装置であって、
前記モデルパラメータ更新部は、

ただし、ｗ_ｉ ^{ｒ，ｋ＋１}はモデルのパラメータ、ｒは連合学習システム全体での学習の繰り返し回数、ｋはモデル学習装置内での学習の繰り返し回数、ｉとｊはモデル学習装置を示す符号、ｆ^－はコスト関数もしくはコスト関数と置換可能な関数、ｕは更新前のモデルのパラメータ、ξ_ｉ ^ｒ，ｋはモデル学習用データのミニバッチ、係数γは１＋αη、Ｎは連合学習システムを構成するモデル学習装置の数、Ａ_ｉ｜ｊは制約パラメータ、ｚ_ｉ｜ｊ ^ｒは双対変数
のように、モデルのパラメータｗ_ｉ ^{ｒ，ｋ＋１}を更新し、
前記双対変数算出・送信部は、

ただし、ｙ_ｉ｜ｊは双対変数
のように双対変数を求める
ことを特徴とするモデル学習装置。
複数のモデル学習装置を有し、それぞれのモデル学習装置は他のモデル学習装置のいずれかとネットワークを介して接続される連合学習システムを構成する前記モデル学習装置であって、
モデルのパラメータ、双対変数、ステップサイズ、モデル学習用データ、制約パラメータは、あらかじめ定めた初期値に設定されており、
ノイズを生成するノイズ生成部と、
前記モデル学習用データから、あらかじめ定めた量のデータをミニバッチとして抽出するミニバッチ抽出部と、
双対変数、ステップサイズ、モデル学習用データのミニバッチ、制約パラメータ、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いて学習を行い、モデルのパラメータを更新するモデルパラメータ更新部と、
当該モデル学習装置と接続されている他のモデル学習装置ごとに、前記モデルパラメータ更新部が更新したモデルのパラメータと係数γを用いて、前記ノイズを付加した双対変数を求め、送信する双対変数算出・送信部と、
当該モデル学習装置と接続されている他のモデル学習装置から、双対変数を受信する双対変数受信部と、
受信した双対変数を、次の学習に用いる双対変数とする双対変数設定部と、
を備える
ことを特徴とするモデル学習装置。
請求項５記載のモデル学習装置であって、
前記モデルパラメータ更新部は、

ただし、ｗ_ｉ ^{ｒ，ｋ＋１}はモデルのパラメータ、ｒは連合学習システム全体での学習の繰り返し回数、ｋはモデル学習装置内での学習の繰り返し回数、ｉとｊはモデル学習装置を示す符号、ｆ^－はコスト関数もしくはコスト関数と置換可能な関数、ｕは更新前のモデルのパラメータ、ξ_ｉ ^ｒ，ｋはモデル学習用データのミニバッチ、係数γは１＋αη、Ｎは連合学習システムを構成するモデル学習装置の数、Ａ_ｉ｜ｊは制約パラメータ、ｚ_ｉ｜ｊ ^ｒは双対変数
のように、モデルのパラメータｗ_ｉ ^{ｒ，ｋ＋１}を更新し、
前記双対変数算出・送信部は、

ただし、ｙ_ｉ｜ｊはノイズが付加された双対変数、ｎ_ｉは前記ノイズ生成部が生成したノイズ
のようにノイズが付加された双対変数を求める
ことを特徴とするモデル学習装置。
複数のモデル学習装置を有し、それぞれのモデル学習装置は他のモデル学習装置のいずれかとネットワークを介して接続される連合学習システムを用いる連合学習方法であって、
モデルのパラメータ、双対変数、ステップサイズ、モデル学習用データ、制約パラメータは、あらかじめ定めた初期値に設定されており、
それぞれのモデル学習装置が、
双対変数、ステップサイズ、モデル学習用データのミニバッチ、制約パラメータ、あらかじめ定めた最適値ηとあらかじめ定めたハイパラメータαを用いた係数γを用いて学習を行い、モデルのパラメータを更新するモデルパラメータ更新ステップと、
当該モデル学習装置と接続されている他のモデル学習装置ごとに、前記モデルパラメータ更新ステップが更新したモデルのパラメータと係数γを用いて双対変数を求め、送信する双対変数算出・送信ステップと、
当該モデル学習装置と接続されている他のモデル学習装置から、双対変数を受信する双対変数受信ステップと、
受信した双対変数を、次の学習に用いる双対変数とする双対変数設定ステップと、
を第１所定回数実行するインナーループ過程を有し、
前記インナーループ過程を第２所定回数実行するアウターループ過程を有する
連合学習方法。
請求項３～６のいずれかに記載のモデル学習装置としてコンピュータを機能させるモデル学習プログラム。