TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025033301
公報種別公開特許公報(A)
公開日2025-03-13
出願番号2023138931
出願日2023-08-29
発明の名称情報処理プログラム,情報処理装置および情報処理方法
出願人富士通株式会社
代理人弁理士法人真田特許事務所,個人
主分類G06F 9/50 20060101AFI20250306BHJP(計算;計数)
要約【課題】分散学習を実現する最適な並列数を決定できる。
【解決手段】分散学習に用いるリソースを確保するまでの待ち時間と、分散学習にかかる実行時間とを、ノード数を異にする実行環境毎に求め、実行環境毎に求めた待ち時間と実行時間とに基づいて、実行環境毎にスコアを求め、複数のスコアに基づいて、分散学習に用いるノード数を決定する。
【選択図】図1
特許請求の範囲【請求項1】
複数のノードを用いた分散学習を管理する情報処理装置のプロセッサに、
前記分散学習に用いるリソースを確保するまでの待ち時間と、前記分散学習にかかる実行時間とを、ノード数を異にする実行環境毎に求め、
前記実行環境毎に求めた前記待ち時間と前記実行時間とに基づいて、前記実行環境毎にスコアを求め、
複数の前記スコアに基づいて、前記分散学習に用いるノード数を決定する
処理を実行させることを特徴とする、情報処理プログラム。
続きを表示(約 1,000 文字)【請求項2】
決定された前記分散学習に用いるノード数は、複数の前記スコアのなかで最小値のスコアにかかる前記実行環境に対応するノード数であることを特徴とする請求項1に記載の情報処理プログラム。
【請求項3】
前記スコアが、実行時間に関する第1のスコアとコストに関する第2のスコアとを含む
ことを特徴とする、請求項1に記載の情報処理プログラム。
【請求項4】
前記複数のノードにタンパク質を構成する残基種毎に設けられたNNを処理させることで、タンパク質のポテンシャルエネルギーを算出させる
ことを特徴とする、請求項1~3の何れか一項に記載の情報処理プログラム。
【請求項5】
前記実行時間を求める処理が、
前記複数のノードのうちの一つのノードに前記分散学習にかかる処理を実行させた測定結果に基づき、複数の前記実行環境毎に予測性能向上率を算出し、
実行時間上限値に前記予測性能向上率を反映させることで前記実行時間を算出する
処理を含むことを特徴とする、請求項1~3の何れか一項に記載の情報処理プログラム。
【請求項6】
前記待ち時間を求める処理が、
前記ノードにおける処理状態情報を機械学習モデルに入力することで、前記待ち時間を取得する
処理を含むことを特徴とする、請求項1~3の何れか一項に記載の情報処理プログラム。
【請求項7】
複数のノードを用いた分散学習を管理する情報処理装置であって、
前記分散学習に用いるリソースを確保するまでの待ち時間と、前記分散学習にかかる実行時間とを、ノード数を異にする実行環境毎に求め、
前記実行環境毎に求めた前記待ち時間と前記実行時間とに基づいて、前記実行環境毎にスコアを求め、
複数の前記スコアに基づいて、前記分散学習に用いるノード数を決定する
処理を実行する制御部を備えることを特徴とする情報処理装置。
【請求項8】
複数のノードを用いた分散学習を管理する情報処理装置が、
前記分散学習に用いるリソースを確保するまでの待ち時間と、前記分散学習にかかる実行時間とを、ノード数を異にする実行環境毎に求め、
前記実行環境毎に求めた前記待ち時間と前記実行時間とに基づいて、前記実行環境毎にスコアを求め、
複数の前記スコアに基づいて、前記分散学習に用いるノード数を決定する
処理を実行することを特徴とする情報処理方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理プログラム,情報処理装置および情報処理方法に関する。
続きを表示(約 1,300 文字)【背景技術】
【0002】
近年、複数のNN(Neural Network)を有するMNN(Multiple Neural Network)が知られている。例えば、MNNを用いて粒子系全体のポテンシャルエネルギーを計算するHDNNP(High-Dimensional Neural Network Potential)が知られている。
【0003】
また、このようなMNNの訓練手法として、MNNを構成する複数のNNに対して並列に機械学習(訓練)を行なう分散学習が用いられることがある。MNNの分散学習においては、複数のワーカのそれぞれにNNを割り当て、各ワーカの計算結果(出力)をAllreduce通信により相互に配布する。その後、各ワーカが計算した出力の総和がそれぞれ計算され、勾配の平均等が算出される。
【0004】
ワーカは、計算ノード(以下、単にノードという)に備えられるCPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の演算装置である。なお、ワーカがGPUの場合は、1ワーカ=1GPUであってよい。また、ワーカがCPUの場合には、1ワーカ=1CPUであってよく、また、1ワーカ=1コアであってもよく、適宜変更して実施することができる。また、以下、MNNの訓練において、訓練にかかる処理を実行するノードを実行ノードといってよい。
【先行技術文献】
【特許文献】
【0005】
特開2013-140490号公報
特開2015-118434号公報
米国特許出願公開第2015/0169380号明細書
米国特許出願公開第2014/0075446号明細書
米国特許出願公開第2020/0236060号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
分散学習において、並列数、すなわち使用するワーカ数を多くすることで、各ワーカにおける演算実行時間を短縮することができる。しかしながら、分散学習においては、Allreduce通信を行なうことでワーカ間の通信が発生する。一般的に通信はコストが大きい処理であり、特に実行ノード間で行なう通信のコストは大きい。なお、実行ノード間で行なわれる通信を実行ノード跨ぎといってよい。
【0007】
分散学習においては、実行ノード跨ぎを最小化するワーカ配備を行なうことが望まれている。
【0008】
また、例えば、クラウドコンピューティングシステムやスーパーコンピュータのような実行ノード数に応じて利用料金が増減する場合に、実行ノード数が増加すると利用料金が増加する。
【0009】
さらに、複数のユーザがシステムを共有するマルチテナント環境においては、実行ノード数が多くなるに従って、リソースの確保に要する時間が増加し、ジョブ実行までの待ち時間が増加する。
【0010】
従って、分散学習を行なうに際して、最適な並列数を決定することが求められている。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

富士通株式会社
電源装置
17日前
富士通株式会社
画像生成方法
23日前
富士通株式会社
車線区分装置及び方法
3日前
富士通株式会社
情報処理装置,プログラムおよび制御方法
3日前
富士通株式会社
分子動力学計算プログラム、方法、及び装置
3日前
富士通株式会社
予測プログラム、予測方法及び情報処理装置
18日前
富士通株式会社
方策学習装置、方策学習方法及び通信システム
18日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
23日前
富士通株式会社
医薬品管理装置、医薬品管理方法、医薬品管理プログラム
4日前
富士通株式会社
業務管理プログラム、業務管理方法、および情報処理装置
10日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
4日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
19日前
富士通株式会社
タスク制御プログラム、情報処理装置及びタスク制御方法
3日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理システム
23日前
富士通株式会社
期待値算出システム、期待値算出装置、及び期待値算出方法
19日前
富士通株式会社
歩行訓練支援プログラム、歩行訓練支援方法、および情報処理装置
5日前
富士通株式会社
量子計算支援プログラム、量子計算支援方法、および情報処理装置
11日前
富士通株式会社
エレベータ管理プログラム、エレベータ管理方法、エレベータ管理装置
20日前
富士通株式会社
リソース割当て装置、リソース割当て方法、およびリソース割当てプログラム
17日前
富士通株式会社
基底エネルギー算出プログラム、基底エネルギー算出装置、および基底エネルギー算出方法
12日前
富士通株式会社
サイドリンクリソースの再選択方法及び装置
4日前
富士通株式会社
基地局、移動局、通信システム、及び通信方法
16日前
富士通株式会社
ワイヤーハーネス製造図設計支援プログラム、ワイヤーハーネス製造図設計支援方法、および情報処理装置
3日前
個人
非正規コート
13日前
個人
人物再現システム
10日前
個人
AI飲食最適化プラグイン
3日前
個人
電話管理システム及び管理方法
4日前
有限会社ノア
データ読取装置
11日前
株式会社ザメディア
出席管理システム
18日前
個人
広告提供システムおよびその方法
13日前
個人
日誌作成支援システム
10日前
ミサワホーム株式会社
情報処理装置
17日前
トヨタ自動車株式会社
工程計画装置
18日前
株式会社タクテック
商品取出集品システム
17日前
トヨタ自動車株式会社
作業判定方法
19日前
個人
ポイント還元付き配送システム
11日前
続きを見る