TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024128434
公報種別
公開特許公報(A)
公開日
2024-09-24
出願番号
2023037407
出願日
2023-03-10
発明の名称
学習装置、データ拡張システム、推定装置、学習方法、およびプログラム
出願人
日本電気株式会社
代理人
個人
,
個人
主分類
G06N
3/098 20230101AFI20240913BHJP(計算;計数)
要約
【課題】大規模な分散学習環境化において、GAN(Generative Adversarial Network)の少数ショット学習を高速化できる学習装置等を提供する。
【解決手段】複数の教師データを含むデータセットを取得するデータ取得部と、擬似データを出力する生成モデルを有する生成部と、教師データおよび擬似データのいずれかのデータの入力に応じて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する判別モデルを有する判別部と、予め設定されたハイパーパラメータに基づいて、判別モデルの更新に用いられる第1ハイパーパラメータと、生成モデルの更新に用いられる第2ハイパーパラメータとを設定する管理部と、第1ハイパーパラメータを用いて判別モデルを更新し、第2ハイパーパラメータを用いて生成モデルを更新する学習処理部と、を備える学習装置とする。
【選択図】 図1
特許請求の範囲
【請求項1】
複数の教師データを含むデータセットを取得し、複数の前記教師データを複数のサブセットに分割するデータ取得手段と、
擬似データを出力する生成モデルを有する生成手段と、
前記教師データおよび前記擬似データのいずれかのデータの入力に応じて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別する判別モデルを有する判別手段と、
予め設定されたハイパーパラメータに基づいて、前記判別モデルの更新に用いられる第1ハイパーパラメータを設定し、分散処理に使われるサーバごとのGPU(Graphics Processing Unit)の数に応じて前記生成モデルの更新に用いられる第2ハイパーパラメータを設定する管理手段と、
前記第1ハイパーパラメータを用いて前記判別モデルを更新し、前記第2ハイパーパラメータを用いて前記生成モデルを更新する学習処理手段と、を備える学習装置。
続きを表示(約 2,300 文字)
【請求項2】
前記判別手段は、
前記判別モデルによる判別の間違いの度合を示す判別ロスを計算し、
前記生成モデルによって生成された前記擬似データが前記判別モデルによって前記擬似データであると見抜かれた度合を示す生成ロスを計算し、
前記学習処理手段は、
前記判別ロスおよび前記第1ハイパーパラメータに基づいて前記判別モデルのパラメータを更新し、
前記生成ロスおよび前記第2ハイパーパラメータに基づいて前記生成モデルのパラメータを更新する請求項1に記載の学習装置。
【請求項3】
前記管理手段は、
予め設定された前記ハイパーパラメータの値を前記第1ハイパーパラメータに設定し、
予め設定された前記ハイパーパラメータと前記GPUの数との積を前記第2ハイパーパラメータに設定する請求項2に記載の学習装置。
【請求項4】
前記管理手段は、
前記判別モデルに対して予め設定された前記ハイパーパラメータの値を前記第1ハイパーパラメータに設定し、
前記生成モデルに対して予め設定された前記ハイパーパラメータと前記GPUの数との積を前記第2ハイパーパラメータに設定する請求項2に記載の学習装置。
【請求項5】
前記管理手段は、
予め設定された前記ハイパーパラメータと、前記GPUの数の入力に応じて単調増加関数から出力された値との積を前記第2ハイパーパラメータに設定する請求項2に記載の学習装置。
【請求項6】
前記ハイパーパラメータは、学習率であり、
前記第2ハイパーパラメータに相当する第2学習率は、前記第1ハイパーパラメータに相当する第1学習率よりも大きい請求項1に記載の学習装置。
【請求項7】
請求項1乃至6のいずれか一項に記載の学習装置によって学習された生成モデルを用いて動作データを拡張するデータ拡張システムであって、
人物の動作に応じて測定された時系列骨格データを取得し、前記時系列骨格データから、前記人物の属性要素に関する体格データ、前記人物が行った動作の時間要素に関するタイミングデータ、および前記人物が行った動作中の姿勢の変化に関する動作データを分離する情報分離装置と、
前記生成モデルを用いて、前記体格データ、前記タイミングデータ、および前記動作データの各々を拡張し、拡張された前記体格データ、前記タイミングデータ、および前記動作データを統合することで前記時系列骨格データを拡張し、拡張された前記時系列骨格データを出力する拡張装置と、を備えるデータ拡張システム。
【請求項8】
請求項7に記載のデータ拡張システムによって拡張された時系列骨格データを用いて学習された推定モデルを用いて、人物の動作を推定する推定装置であって、
前記人物の動作に応じて測定された実データを取得する取得手段と、
前記実データの入力に応じて前記推定モデルから出力される推定データを、前記人物の動作として推定する推定手段と、
推定された前記推定データを出力する出力手段と、を備える推定装置。
【請求項9】
コンピュータが、
複数の教師データを含むデータセットを取得し、
複数の前記教師データを複数のサブセットに分割し、
擬似データを出力する生成モデルを用いて、前記擬似データを生成し、
前記教師データおよび前記擬似データのいずれかのデータの入力に応じて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別する判別モデルを用いて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別し、
予め設定されたハイパーパラメータに基づいて、前記判別モデルの更新に用いられる第1ハイパーパラメータを設定し、
分散処理に使われるサーバごとのGPU(Graphics Processing Unit)の数に応じて、予め設定された前記ハイパーパラメータに基づいて、前記生成モデルの更新に用いられる第2ハイパーパラメータを設定し、
前記第1ハイパーパラメータを用いて前記判別モデルを更新し、
前記第2ハイパーパラメータを用いて前記生成モデルを更新する学習方法。
【請求項10】
複数の教師データを含むデータセットを取得する処理と、
複数の前記教師データを複数のサブセットに分割する処理と、
擬似データを出力する生成モデルを用いて、前記擬似データを生成する処理と、
前記教師データおよび前記擬似データのいずれかのデータの入力に応じて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別する判別モデルを用いて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別する処理と、
予め設定されたハイパーパラメータに基づいて、前記判別モデルの更新に用いられる第1ハイパーパラメータを設定する処理と、
分散処理に使われるサーバごとのGPU(Graphics Processing Unit)の数に応じて、予め設定された前記ハイパーパラメータに基づいて、前記生成モデルの更新に用いられる第2ハイパーパラメータを設定する処理と、
前記第1ハイパーパラメータを用いて前記判別モデルを更新する処理と、
前記第2ハイパーパラメータを用いて前記生成モデルを更新する処理と、をコンピュータに実行させるプログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、分散学習に用いられる学習装置等に関する。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
映像やモーションキャプチャ、ウェアラブルセンサを用いて人物の動きをセンシングし、センシングされた動きに応じて動作や行動を認識する技術へのニーズが高まっている。例えば、機械学習等の手法によって動作データを学習した認識モデルを用いれば、人物の動作や行動を認識できる。より実用的な精度で認識を行うためには、大量の動作データを用いて、認識モデルを訓練する必要がある。例えば、様々な人物の動作に関して、体格や年齢、個人ごとの動きの癖などに関するバリエーションが含まれる訓練データを用いて、認識モデルを訓練する必要がある。動作データの計測には多くの時間と手間が掛かる。そのため、実際に計測された動作データの擬似データ(擬似動作データ)を大量に生成するデータ拡張技術が求められる。
【0003】
GANを用いて高速にモデルを訓練する手法として、複数のGPUや計算ノードで大規模並列処理を行う分散学習がある。分散学習では、複数のGPU(Graphics Processing Unit)で計算処理を分割することによって、計算処理を短縮する。GPUの数がk倍になると、一度に処理できるデータ量(バッチサイズ)がk倍になる(kは自然数)。しかし、実際には、バッチサイズが増えただけでは学習を高速化できない。
【0004】
非特許文献1には、分散学習における学習を効率化する技術が開示されている。非特許文献1の手法では、分散学習の規模に応じて、学習率を調整する技術が開示されている。非特許文献1の手法では、バッチサイズに比例して学習率を大きくする。
【先行技術文献】
【非特許文献】
【0005】
P. Goyal. et al., “Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour,” arXiv:1706.02677, 2018.
【発明の概要】
【発明が解決しようとする課題】
【0006】
非特許文献1の手法によれば、データセットサイズと比べてバッチサイズが十分に小さければ、モデルの訓練を効率化できる。大規模分散学習環境ではバッチサイズがデータセットサイズを上回るため、線形スケーリング則の前提条件が満たされない。そのため、非特許文献1の手法は、大規模分散学習環境には適用できなかった。すなわち、非特許文献1の手法では、GANの少数ショット学習(Few-shot学習)を、大規模並列処理に対応させることはできなかった。
【0007】
本開示の目的は、大規模な分散学習環境化において、GAN(Generative Adversarial Network)の少数ショット学習を高速化できる学習装置等を提供することである。
【課題を解決するための手段】
【0008】
本開示の一態様の学習装置は、複数の教師データを含むデータセットを取得し、複数の教師データを複数のサブセットに分割するデータ取得部と、擬似データを出力する生成モデルを有する生成部と、教師データおよび擬似データのいずれかのデータの入力に応じて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する判別モデルを有する判別部と、予め設定されたハイパーパラメータに基づいて、判別モデルの更新に用いられる第1ハイパーパラメータを設定し、分散処理に使われるサーバごとのGPUの数に応じて生成モデルの更新に用いられる第2ハイパーパラメータを設定する管理部と、第1ハイパーパラメータを用いて判別モデルを更新し、第2ハイパーパラメータを用いて生成モデルを更新する学習処理部と、を備える。
【0009】
本開示の一態様の学習方法においては、複数の教師データを含むデータセットを取得し、複数の教師データを複数のサブセットに分割し、擬似データを出力する生成モデルを用いて、擬似データを生成し、教師データおよび擬似データのいずれかのデータの入力に応じて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する判別モデルを用いて、入力されたデータが教師データおよび擬似データのいずれであるかを判別し、予め設定されたハイパーパラメータに基づいて、判別モデルの更新に用いられる第1ハイパーパラメータを設定し、分散処理に使われるサーバごとのGPUの数に応じて、予め設定されたハイパーパラメータに基づいて、生成モデルの更新に用いられる第2ハイパーパラメータを設定し、第1ハイパーパラメータを用いて判別モデルを更新し、第2ハイパーパラメータを用いて生成モデルを更新する学習方法。
【0010】
本開示の一態様のプログラムは、複数の教師データを含むデータセットを取得する処理と、複数の教師データを複数のサブセットに分割する処理と、擬似データを出力する生成モデルを用いて、擬似データを生成する処理と、教師データおよび擬似データのいずれかのデータの入力に応じて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する判別モデルを用いて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する処理と、予め設定されたハイパーパラメータに基づいて、判別モデルの更新に用いられる第1ハイパーパラメータを設定する処理と、分散処理に使われるサーバごとのGPUの数に応じて、予め設定されたハイパーパラメータに基づいて、生成モデルの更新に用いられる第2ハイパーパラメータを設定する処理と、第1ハイパーパラメータを用いて判別モデルを更新する処理と、第2ハイパーパラメータを用いて生成モデルを更新する処理と、をコンピュータに実行させる。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
日本電気株式会社
光学モジュール
1日前
日本電気株式会社
無線端末、方法、及びプログラム
1日前
日本電気株式会社
管理装置、管理方法、及びプログラム
今日
日本電気株式会社
マルチコアファイバ光増幅器及び光増幅方法
今日
日本電気株式会社
権利管理装置、システム、方法およびプログラム
2日前
日本電気株式会社
サーバ装置、サーバ装置の制御方法及びプログラム
今日
日本電気株式会社
レシピ提案装置、レシピ提案方法、およびプログラム
1日前
日本電気株式会社
情報処理装置、情報処理方法、及び情報処理システム
2日前
日本電気株式会社
情報処理装置、表示制御方法、および表示制御プログラム
1日前
日本電気株式会社
入出場管理装置、入退場管理方法及び入退場管理プログラム
1日前
日本電気株式会社
組合せ最適化問題求解装置および組合せ最適化問題求解方法
2日前
日本電気株式会社
秘匿化装置、推定装置、表示装置、推定システム、秘匿化方法、推定方法およびプログラム
2日前
日本電気株式会社
温室効果ガス排出量評価装置、温室効果ガス排出量評価方法及び温室効果ガス排出量評価プログラム
今日
個人
プログラム
29日前
個人
情報検索システム
9日前
個人
確率場データ同化演算手法
21日前
キヤノン株式会社
電子機器
8日前
キヤノン株式会社
電子機器
8日前
シャープ株式会社
電子機器
22日前
キヤノン株式会社
電子機器
8日前
個人
納骨堂システム
28日前
個人
技術実行管理システム
23日前
個人
不動産情報提供システム
18日前
株式会社イノベイト
広告装置
11日前
キヤノン電子株式会社
通信システム
1日前
合同会社IPマネジメント
内部不正対策
16日前
個人
ネイルスキルテストシステム
22日前
トヨタ自動車株式会社
管理システム
3日前
トヨタ自動車株式会社
作業評価装置
1日前
株式会社TIMEWELL
情報処理システム
29日前
ローム株式会社
半導体集積回路
1か月前
TDK株式会社
等価回路
3日前
株式会社NURSY
再就職の支援装置
2日前
西松建設株式会社
計測システム
7日前
個人
公益寄付インタラクティブシステム
1日前
株式会社JVCケンウッド
情報処理装置
22日前
続きを見る
他の特許を見る