TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024178811
公報種別公開特許公報(A)
公開日2024-12-25
出願番号2023097239
出願日2023-06-13
発明の名称情報処理装置、学習方法、及びプログラム
出願人日本電信電話株式会社,国立大学法人東京科学大学
代理人弁理士法人ITOH,個人,個人,個人
主分類G06N 3/098 20230101AFI20241218BHJP(計算;計数)
要約【課題】分散学習において、高速に合意形成に至ることを可能とする技術を提供する。
【解決手段】複数のノードにおけるノード間での情報交換によりモデルの学習を行う分散学習システムにおいて、前記複数のノードの中のあるノードとして使用される情報処理装置であって、正定値行列を用いて表された定常点条件から演算子分割を適用することにより得られた更新ルールに従って更新された変数を、隣接ノードから受信する受信部と、前記変数を用いて、前記モデルのモデルパラメータを更新する更新部とを備える。
【選択図】図4
特許請求の範囲【請求項1】
複数のノードにおけるノード間での情報交換によりモデルの学習を行う分散学習システムにおいて、前記複数のノードの中のあるノードとして使用される情報処理装置であって、
正定値行列を用いて表された定常点条件から演算子分割を適用することにより得られた更新ルールに従って更新された変数を、隣接ノードから受信する受信部と、
前記変数を用いて、前記モデルのモデルパラメータを更新する更新部と
を備える情報処理装置。
続きを表示(約 900 文字)【請求項2】
前記ノードをi番目のノードとし、前記隣接ノードをj番目のノードとし、前記ノードにおける正定値行列をG
i|j
と表し、前記隣接ノードにおける正定値行列をG
j|i
と表した場合に、G
i|j
=G
j|i
を満たす
請求項1に記載の情報処理装置。
【請求項3】
前記更新ルールに従って前記更新部により更新した変数を前記隣接ノードに送信する送信部
を更に備える請求項1に記載の情報処理装置。
【請求項4】
前記モデルパラメータの更新のための更新ルールは、モデルパラメータを、平均化された正定値行列の逆行列を勾配に乗算した項を含む式で更新するルールである
請求項1に記載の情報処理装置。
【請求項5】
前記更新部は、K-FAC(Kronecker Factored Approximate Curvature)により近似されたガウス・ニュートン行列を用いて前記正定値行列を更新する
請求項1に記載の情報処理装置。
【請求項6】
前記更新部は、前記モデルの確率的勾配の計算を前記モデルのレイヤーごとに行う、又は、前記正定値行列の更新を前記モデルのレイヤーごとに行う
請求項5に記載の情報処理装置。
【請求項7】
複数のノードにおけるノード間での情報交換によりモデルの学習を行う分散学習システムにおいて、前記複数のノードの中のあるノードとして使用される情報処理装置が実行する学習方法であって、
正定値行列を用いて表された定常点条件から演算子分割を適用することにより得られた更新ルールに従って更新された変数を、隣接ノードから受信する受信ステップと、
前記変数を用いて、前記モデルのモデルパラメータを更新する更新ステップと
を備える学習方法。
【請求項8】
コンピュータを、請求項1ないし6のうちいずれか1項に記載の情報処理装置における各部として機能させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、分散学習に関連するものである。
続きを表示(約 1,800 文字)【背景技術】
【0002】
近年、ニューラルネットワーク等のモデルは画像処理や自然言語処理など様々な分野で大きな注目を集めている。モデルを学習するためには、通常、大量の学習データを収集する必要がある。
【0003】
しかし、プライバシーの問題等のために、個人情報を含む学習データを単一のサーバ(ノード)上に収集することは困難である。このようなケースを考慮して、任意にネットワーク接続できる複数のノードにデータを分散させて蓄積し、全データを高い認識率で識別できるようなモデル(例えばニューラルネットワークのモデル)の学習を実現することが検討されている(例えば非特許文献1)。上記の学習は分散学習(Decentralized learning)と呼ばれる。
【0004】
分散学習においては、複数のノード間でどのような合意形成をしながら学習をしたらよいかのアルゴリズムを構築することが研究の主題となっている。合意形成に至るまでに、ノード間の通信回数や通信する情報量が少なく、高速に合意形成に至るような分散学習のアルゴリズムとして性能が良いと言える。
【0005】
非特許文献1には、エッジコンセンサス学習(ECL:Edge-consensus learning)と呼ばれる分散学習の技術が開示されている。
【0006】
ECLのメリットは、ノードに蓄積されるデータサブセットの統計的な偏り(heterogeneity、不均一性)に対してロバストに学習できる点である。これは、ノード間のモデルが一致するという合意形成型の制約下でコスト最小化問題を解いていることに起因する。
【先行技術文献】
【非特許文献】
【0007】
Niwa, K., Harada, N., Zhang, G., and Kleijn, W. B. Edge-consensus learning: Deep learning on P2P networks with nonhomogeneous data. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, pp. 668-678, 2020.
Martens, J. and Grosse, R. Optimizing neural networks with kronecker-factored approximate curvature. In In-ternational conference on machine learning, pp. 2408-2417. PMLR, 2015
【発明の概要】
【発明が解決しようとする課題】
【0008】
非特許文献1に開示されたECLは一次収束のアルゴリズムである。そのため、合意形成に至り、モデルの学習が完了するまでにノード間の通信回数が大きくなる。またECLでは、1回あたりの通信で、モデルのサイズとおおよそ同等のサイズの情報(具体的には双対変数)をノード間で交換する必要があり、通信量が大きい。分散学習における通信コストが計算量や実行時間の大半を占めており、分散学習の高速化のために、この通信コストを下げる必要がある。なお、このような課題はECLに限らずに、他の分散学習においても生じ得る課題である。
【0009】
本発明は上記の点に鑑みてなされたものであり、分散学習において、高速に合意形成に至ることを可能とする技術を提供することを目的とする。
【課題を解決するための手段】
【0010】
開示の技術によれば、複数のノードにおけるノード間での情報交換によりモデルの学習を行う分散学習システムにおいて、前記複数のノードの中のあるノードとして使用される情報処理装置であって、
正定値行列を用いて表された定常点条件から演算子分割を適用することにより得られた更新ルールに従って更新された変数を、隣接ノードから受信する受信部と、
前記変数を用いて、前記モデルのモデルパラメータを更新する更新部と
を備える情報処理装置が提供される。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

東日本電信電話株式会社
ノイズ源推定装置、ノイズ源推定方法、及びノイズ源推定プログラム
1か月前
個人
裁判のAI化
2か月前
個人
工程設計支援装置
1か月前
個人
フラワーコートA
1か月前
個人
情報処理システム
2か月前
個人
記入設定プラグイン
2か月前
個人
検査システム
2か月前
個人
介護情報提供システム
1か月前
個人
冷凍食品輸出支援構造
12日前
個人
為替ポイント伊達夢貯
12日前
個人
設計支援システム
1か月前
個人
設計支援システム
1か月前
個人
携帯情報端末装置
1か月前
個人
表変換編集支援システム
5日前
個人
結婚相手紹介支援システム
29日前
個人
知財出願支援AIシステム
12日前
株式会社サタケ
籾摺・調製設備
2か月前
キヤノン電子株式会社
携帯装置
2か月前
個人
不動産売買システム
2か月前
個人
行動時間管理システム
7日前
個人
AIによる情報の売買の仲介
14日前
株式会社カクシン
支援装置
1か月前
個人
パスワード管理支援システム
5日前
株式会社アジラ
進入判定装置
18日前
個人
アンケート支援システム
1か月前
個人
パスポートレス入出国システム
18日前
個人
備蓄品の管理方法
2か月前
個人
AIキャラクター制御システム
5日前
日本精機株式会社
施工管理システム
14日前
個人
SaaS型勤務調整支援システム
5日前
個人
食事受注会計処理システム
19日前
個人
音声対話型帳票生成支援システム
5日前
大阪瓦斯株式会社
住宅設備機器
26日前
株式会社BONNOU
管理装置
2か月前
個人
社会還元・施設向け供給支援構造
5日前
キヤノン株式会社
情報処理装置
2か月前
続きを見る