TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024178811
公報種別公開特許公報(A)
公開日2024-12-25
出願番号2023097239
出願日2023-06-13
発明の名称情報処理装置、学習方法、及びプログラム
出願人日本電信電話株式会社,国立大学法人東京科学大学
代理人弁理士法人ITOH,個人,個人,個人
主分類G06N 3/098 20230101AFI20241218BHJP(計算;計数)
要約【課題】分散学習において、高速に合意形成に至ることを可能とする技術を提供する。
【解決手段】複数のノードにおけるノード間での情報交換によりモデルの学習を行う分散学習システムにおいて、前記複数のノードの中のあるノードとして使用される情報処理装置であって、正定値行列を用いて表された定常点条件から演算子分割を適用することにより得られた更新ルールに従って更新された変数を、隣接ノードから受信する受信部と、前記変数を用いて、前記モデルのモデルパラメータを更新する更新部とを備える。
【選択図】図4
特許請求の範囲【請求項1】
複数のノードにおけるノード間での情報交換によりモデルの学習を行う分散学習システムにおいて、前記複数のノードの中のあるノードとして使用される情報処理装置であって、
正定値行列を用いて表された定常点条件から演算子分割を適用することにより得られた更新ルールに従って更新された変数を、隣接ノードから受信する受信部と、
前記変数を用いて、前記モデルのモデルパラメータを更新する更新部と
を備える情報処理装置。
続きを表示(約 900 文字)【請求項2】
前記ノードをi番目のノードとし、前記隣接ノードをj番目のノードとし、前記ノードにおける正定値行列をG
i|j
と表し、前記隣接ノードにおける正定値行列をG
j|i
と表した場合に、G
i|j
=G
j|i
を満たす
請求項1に記載の情報処理装置。
【請求項3】
前記更新ルールに従って前記更新部により更新した変数を前記隣接ノードに送信する送信部
を更に備える請求項1に記載の情報処理装置。
【請求項4】
前記モデルパラメータの更新のための更新ルールは、モデルパラメータを、平均化された正定値行列の逆行列を勾配に乗算した項を含む式で更新するルールである
請求項1に記載の情報処理装置。
【請求項5】
前記更新部は、K-FAC(Kronecker Factored Approximate Curvature)により近似されたガウス・ニュートン行列を用いて前記正定値行列を更新する
請求項1に記載の情報処理装置。
【請求項6】
前記更新部は、前記モデルの確率的勾配の計算を前記モデルのレイヤーごとに行う、又は、前記正定値行列の更新を前記モデルのレイヤーごとに行う
請求項5に記載の情報処理装置。
【請求項7】
複数のノードにおけるノード間での情報交換によりモデルの学習を行う分散学習システムにおいて、前記複数のノードの中のあるノードとして使用される情報処理装置が実行する学習方法であって、
正定値行列を用いて表された定常点条件から演算子分割を適用することにより得られた更新ルールに従って更新された変数を、隣接ノードから受信する受信ステップと、
前記変数を用いて、前記モデルのモデルパラメータを更新する更新ステップと
を備える学習方法。
【請求項8】
コンピュータを、請求項1ないし6のうちいずれか1項に記載の情報処理装置における各部として機能させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、分散学習に関連するものである。
続きを表示(約 1,800 文字)【背景技術】
【0002】
近年、ニューラルネットワーク等のモデルは画像処理や自然言語処理など様々な分野で大きな注目を集めている。モデルを学習するためには、通常、大量の学習データを収集する必要がある。
【0003】
しかし、プライバシーの問題等のために、個人情報を含む学習データを単一のサーバ(ノード)上に収集することは困難である。このようなケースを考慮して、任意にネットワーク接続できる複数のノードにデータを分散させて蓄積し、全データを高い認識率で識別できるようなモデル(例えばニューラルネットワークのモデル)の学習を実現することが検討されている(例えば非特許文献1)。上記の学習は分散学習(Decentralized learning)と呼ばれる。
【0004】
分散学習においては、複数のノード間でどのような合意形成をしながら学習をしたらよいかのアルゴリズムを構築することが研究の主題となっている。合意形成に至るまでに、ノード間の通信回数や通信する情報量が少なく、高速に合意形成に至るような分散学習のアルゴリズムとして性能が良いと言える。
【0005】
非特許文献1には、エッジコンセンサス学習(ECL:Edge-consensus learning)と呼ばれる分散学習の技術が開示されている。
【0006】
ECLのメリットは、ノードに蓄積されるデータサブセットの統計的な偏り(heterogeneity、不均一性)に対してロバストに学習できる点である。これは、ノード間のモデルが一致するという合意形成型の制約下でコスト最小化問題を解いていることに起因する。
【先行技術文献】
【非特許文献】
【0007】
Niwa, K., Harada, N., Zhang, G., and Kleijn, W. B. Edge-consensus learning: Deep learning on P2P networks with nonhomogeneous data. In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, pp. 668-678, 2020.
Martens, J. and Grosse, R. Optimizing neural networks with kronecker-factored approximate curvature. In In-ternational conference on machine learning, pp. 2408-2417. PMLR, 2015
【発明の概要】
【発明が解決しようとする課題】
【0008】
非特許文献1に開示されたECLは一次収束のアルゴリズムである。そのため、合意形成に至り、モデルの学習が完了するまでにノード間の通信回数が大きくなる。またECLでは、1回あたりの通信で、モデルのサイズとおおよそ同等のサイズの情報(具体的には双対変数)をノード間で交換する必要があり、通信量が大きい。分散学習における通信コストが計算量や実行時間の大半を占めており、分散学習の高速化のために、この通信コストを下げる必要がある。なお、このような課題はECLに限らずに、他の分散学習においても生じ得る課題である。
【0009】
本発明は上記の点に鑑みてなされたものであり、分散学習において、高速に合意形成に至ることを可能とする技術を提供することを目的とする。
【課題を解決するための手段】
【0010】
開示の技術によれば、複数のノードにおけるノード間での情報交換によりモデルの学習を行う分散学習システムにおいて、前記複数のノードの中のあるノードとして使用される情報処理装置であって、
正定値行列を用いて表された定常点条件から演算子分割を適用することにより得られた更新ルールに従って更新された変数を、隣接ノードから受信する受信部と、
前記変数を用いて、前記モデルのモデルパラメータを更新する更新部と
を備える情報処理装置が提供される。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

日本電信電話株式会社
図形配置装置、図形配置方法及びプログラム
1日前
日本電信電話株式会社
学習方法、推論方法、学習装置、推論装置及びプログラム
3日前
日本電信電話株式会社
参照画像キャッシュメモリ、プリフェッチ用データ要求方法、及びプリフェッチ用データ要求プログラム
1日前
個人
プログラム
1か月前
株式会社理研
演算装置
1か月前
個人
情報検索システム
10日前
個人
日本語入力支援システム
1か月前
個人
確率場データ同化演算手法
22日前
個人
AI旅行最適化プラグイン
1か月前
キヤノン株式会社
電子機器
9日前
個人
技術実行管理システム
24日前
個人
納骨堂システム
29日前
キヤノン株式会社
電子機器
9日前
キヤノン株式会社
電子機器
9日前
シャープ株式会社
電子機器
23日前
キヤノン電子株式会社
通信システム
2日前
株式会社イノベイト
広告装置
12日前
個人
不動産情報提供システム
19日前
キヤノン株式会社
情報処理装置
1か月前
合同会社IPマネジメント
内部不正対策
17日前
個人
ネイルスキルテストシステム
23日前
トヨタ自動車株式会社
作業評価装置
2日前
トヨタ自動車株式会社
管理システム
4日前
株式会社TIMEWELL
情報処理システム
1か月前
株式会社NURSY
再就職の支援装置
3日前
TDK株式会社
等価回路
4日前
ローム株式会社
半導体集積回路
1か月前
西松建設株式会社
計測システム
8日前
個人
生成AI向けデータ保管及び活用システム
1か月前
トヨタ自動車株式会社
電池評価システム
29日前
個人
公益寄付インタラクティブシステム
2日前
個人
外国為替証拠金取引定期自動売買システム
15日前
個人
収納装置および収納システム
1か月前
キヤノン株式会社
ワークフロー制御装置
29日前
株式会社サマデイ
メンタリングシステム
24日前
株式会社ヒニアラタ
障害者支援システム
17日前
続きを見る