TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024128434
公報種別公開特許公報(A)
公開日2024-09-24
出願番号2023037407
出願日2023-03-10
発明の名称学習装置、データ拡張システム、推定装置、学習方法、およびプログラム
出願人日本電気株式会社
代理人個人,個人
主分類G06N 3/098 20230101AFI20240913BHJP(計算;計数)
要約【課題】大規模な分散学習環境化において、GAN(Generative Adversarial Network)の少数ショット学習を高速化できる学習装置等を提供する。
【解決手段】複数の教師データを含むデータセットを取得するデータ取得部と、擬似データを出力する生成モデルを有する生成部と、教師データおよび擬似データのいずれかのデータの入力に応じて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する判別モデルを有する判別部と、予め設定されたハイパーパラメータに基づいて、判別モデルの更新に用いられる第1ハイパーパラメータと、生成モデルの更新に用いられる第2ハイパーパラメータとを設定する管理部と、第1ハイパーパラメータを用いて判別モデルを更新し、第2ハイパーパラメータを用いて生成モデルを更新する学習処理部と、を備える学習装置とする。
【選択図】 図1
特許請求の範囲【請求項1】
複数の教師データを含むデータセットを取得し、複数の前記教師データを複数のサブセットに分割するデータ取得手段と、
擬似データを出力する生成モデルを有する生成手段と、
前記教師データおよび前記擬似データのいずれかのデータの入力に応じて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別する判別モデルを有する判別手段と、
予め設定されたハイパーパラメータに基づいて、前記判別モデルの更新に用いられる第1ハイパーパラメータを設定し、分散処理に使われるサーバごとのGPU(Graphics Processing Unit)の数に応じて前記生成モデルの更新に用いられる第2ハイパーパラメータを設定する管理手段と、
前記第1ハイパーパラメータを用いて前記判別モデルを更新し、前記第2ハイパーパラメータを用いて前記生成モデルを更新する学習処理手段と、を備える学習装置。
続きを表示(約 2,300 文字)【請求項2】
前記判別手段は、
前記判別モデルによる判別の間違いの度合を示す判別ロスを計算し、
前記生成モデルによって生成された前記擬似データが前記判別モデルによって前記擬似データであると見抜かれた度合を示す生成ロスを計算し、
前記学習処理手段は、
前記判別ロスおよび前記第1ハイパーパラメータに基づいて前記判別モデルのパラメータを更新し、
前記生成ロスおよび前記第2ハイパーパラメータに基づいて前記生成モデルのパラメータを更新する請求項1に記載の学習装置。
【請求項3】
前記管理手段は、
予め設定された前記ハイパーパラメータの値を前記第1ハイパーパラメータに設定し、
予め設定された前記ハイパーパラメータと前記GPUの数との積を前記第2ハイパーパラメータに設定する請求項2に記載の学習装置。
【請求項4】
前記管理手段は、
前記判別モデルに対して予め設定された前記ハイパーパラメータの値を前記第1ハイパーパラメータに設定し、
前記生成モデルに対して予め設定された前記ハイパーパラメータと前記GPUの数との積を前記第2ハイパーパラメータに設定する請求項2に記載の学習装置。
【請求項5】
前記管理手段は、
予め設定された前記ハイパーパラメータと、前記GPUの数の入力に応じて単調増加関数から出力された値との積を前記第2ハイパーパラメータに設定する請求項2に記載の学習装置。
【請求項6】
前記ハイパーパラメータは、学習率であり、
前記第2ハイパーパラメータに相当する第2学習率は、前記第1ハイパーパラメータに相当する第1学習率よりも大きい請求項1に記載の学習装置。
【請求項7】
請求項1乃至6のいずれか一項に記載の学習装置によって学習された生成モデルを用いて動作データを拡張するデータ拡張システムであって、
人物の動作に応じて測定された時系列骨格データを取得し、前記時系列骨格データから、前記人物の属性要素に関する体格データ、前記人物が行った動作の時間要素に関するタイミングデータ、および前記人物が行った動作中の姿勢の変化に関する動作データを分離する情報分離装置と、
前記生成モデルを用いて、前記体格データ、前記タイミングデータ、および前記動作データの各々を拡張し、拡張された前記体格データ、前記タイミングデータ、および前記動作データを統合することで前記時系列骨格データを拡張し、拡張された前記時系列骨格データを出力する拡張装置と、を備えるデータ拡張システム。
【請求項8】
請求項7に記載のデータ拡張システムによって拡張された時系列骨格データを用いて学習された推定モデルを用いて、人物の動作を推定する推定装置であって、
前記人物の動作に応じて測定された実データを取得する取得手段と、
前記実データの入力に応じて前記推定モデルから出力される推定データを、前記人物の動作として推定する推定手段と、
推定された前記推定データを出力する出力手段と、を備える推定装置。
【請求項9】
コンピュータが、
複数の教師データを含むデータセットを取得し、
複数の前記教師データを複数のサブセットに分割し、
擬似データを出力する生成モデルを用いて、前記擬似データを生成し、
前記教師データおよび前記擬似データのいずれかのデータの入力に応じて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別する判別モデルを用いて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別し、
予め設定されたハイパーパラメータに基づいて、前記判別モデルの更新に用いられる第1ハイパーパラメータを設定し、
分散処理に使われるサーバごとのGPU(Graphics Processing Unit)の数に応じて、予め設定された前記ハイパーパラメータに基づいて、前記生成モデルの更新に用いられる第2ハイパーパラメータを設定し、
前記第1ハイパーパラメータを用いて前記判別モデルを更新し、
前記第2ハイパーパラメータを用いて前記生成モデルを更新する学習方法。
【請求項10】
複数の教師データを含むデータセットを取得する処理と、
複数の前記教師データを複数のサブセットに分割する処理と、
擬似データを出力する生成モデルを用いて、前記擬似データを生成する処理と、
前記教師データおよび前記擬似データのいずれかのデータの入力に応じて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別する判別モデルを用いて、入力された前記データが前記教師データおよび前記擬似データのいずれであるかを判別する処理と、
予め設定されたハイパーパラメータに基づいて、前記判別モデルの更新に用いられる第1ハイパーパラメータを設定する処理と、
分散処理に使われるサーバごとのGPU(Graphics Processing Unit)の数に応じて、予め設定された前記ハイパーパラメータに基づいて、前記生成モデルの更新に用いられる第2ハイパーパラメータを設定する処理と、
前記第1ハイパーパラメータを用いて前記判別モデルを更新する処理と、
前記第2ハイパーパラメータを用いて前記生成モデルを更新する処理と、をコンピュータに実行させるプログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、分散学習に用いられる学習装置等に関する。
続きを表示(約 2,400 文字)【背景技術】
【0002】
映像やモーションキャプチャ、ウェアラブルセンサを用いて人物の動きをセンシングし、センシングされた動きに応じて動作や行動を認識する技術へのニーズが高まっている。例えば、機械学習等の手法によって動作データを学習した認識モデルを用いれば、人物の動作や行動を認識できる。より実用的な精度で認識を行うためには、大量の動作データを用いて、認識モデルを訓練する必要がある。例えば、様々な人物の動作に関して、体格や年齢、個人ごとの動きの癖などに関するバリエーションが含まれる訓練データを用いて、認識モデルを訓練する必要がある。動作データの計測には多くの時間と手間が掛かる。そのため、実際に計測された動作データの擬似データ(擬似動作データ)を大量に生成するデータ拡張技術が求められる。
【0003】
GANを用いて高速にモデルを訓練する手法として、複数のGPUや計算ノードで大規模並列処理を行う分散学習がある。分散学習では、複数のGPU(Graphics Processing Unit)で計算処理を分割することによって、計算処理を短縮する。GPUの数がk倍になると、一度に処理できるデータ量(バッチサイズ)がk倍になる(kは自然数)。しかし、実際には、バッチサイズが増えただけでは学習を高速化できない。
【0004】
非特許文献1には、分散学習における学習を効率化する技術が開示されている。非特許文献1の手法では、分散学習の規模に応じて、学習率を調整する技術が開示されている。非特許文献1の手法では、バッチサイズに比例して学習率を大きくする。
【先行技術文献】
【非特許文献】
【0005】
P. Goyal. et al., “Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour,” arXiv:1706.02677, 2018.
【発明の概要】
【発明が解決しようとする課題】
【0006】
非特許文献1の手法によれば、データセットサイズと比べてバッチサイズが十分に小さければ、モデルの訓練を効率化できる。大規模分散学習環境ではバッチサイズがデータセットサイズを上回るため、線形スケーリング則の前提条件が満たされない。そのため、非特許文献1の手法は、大規模分散学習環境には適用できなかった。すなわち、非特許文献1の手法では、GANの少数ショット学習(Few-shot学習)を、大規模並列処理に対応させることはできなかった。
【0007】
本開示の目的は、大規模な分散学習環境化において、GAN(Generative Adversarial Network)の少数ショット学習を高速化できる学習装置等を提供することである。
【課題を解決するための手段】
【0008】
本開示の一態様の学習装置は、複数の教師データを含むデータセットを取得し、複数の教師データを複数のサブセットに分割するデータ取得部と、擬似データを出力する生成モデルを有する生成部と、教師データおよび擬似データのいずれかのデータの入力に応じて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する判別モデルを有する判別部と、予め設定されたハイパーパラメータに基づいて、判別モデルの更新に用いられる第1ハイパーパラメータを設定し、分散処理に使われるサーバごとのGPUの数に応じて生成モデルの更新に用いられる第2ハイパーパラメータを設定する管理部と、第1ハイパーパラメータを用いて判別モデルを更新し、第2ハイパーパラメータを用いて生成モデルを更新する学習処理部と、を備える。
【0009】
本開示の一態様の学習方法においては、複数の教師データを含むデータセットを取得し、複数の教師データを複数のサブセットに分割し、擬似データを出力する生成モデルを用いて、擬似データを生成し、教師データおよび擬似データのいずれかのデータの入力に応じて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する判別モデルを用いて、入力されたデータが教師データおよび擬似データのいずれであるかを判別し、予め設定されたハイパーパラメータに基づいて、判別モデルの更新に用いられる第1ハイパーパラメータを設定し、分散処理に使われるサーバごとのGPUの数に応じて、予め設定されたハイパーパラメータに基づいて、生成モデルの更新に用いられる第2ハイパーパラメータを設定し、第1ハイパーパラメータを用いて判別モデルを更新し、第2ハイパーパラメータを用いて生成モデルを更新する学習方法。
【0010】
本開示の一態様のプログラムは、複数の教師データを含むデータセットを取得する処理と、複数の教師データを複数のサブセットに分割する処理と、擬似データを出力する生成モデルを用いて、擬似データを生成する処理と、教師データおよび擬似データのいずれかのデータの入力に応じて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する判別モデルを用いて、入力されたデータが教師データおよび擬似データのいずれであるかを判別する処理と、予め設定されたハイパーパラメータに基づいて、判別モデルの更新に用いられる第1ハイパーパラメータを設定する処理と、分散処理に使われるサーバごとのGPUの数に応じて、予め設定されたハイパーパラメータに基づいて、生成モデルの更新に用いられる第2ハイパーパラメータを設定する処理と、第1ハイパーパラメータを用いて判別モデルを更新する処理と、第2ハイパーパラメータを用いて生成モデルを更新する処理と、をコンピュータに実行させる。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

日本電気株式会社
情報処理方法および装置
9日前
日本電気株式会社
情報処理方法および装置
9日前
日本電気株式会社
素子、ボロメータ及び素子製造方法
23日前
日本電気株式会社
ボロメータ、及びボロメータ製造方法
9日前
日本電気株式会社
監視システム、監視装置、及び監視方法
10日前
日本電気株式会社
試着室システム、試着方法、プログラム
1か月前
日本電気株式会社
RF測定器、補正方法、及びプログラム
1か月前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
17日前
日本電気株式会社
移行システム、移行方法、及び移行プログラム
9日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
17日前
日本電気株式会社
情報取得装置、情報取得方法、及びプログラム
23日前
日本電気株式会社
動画処理の方法、装置、電子デバイス及び媒体
25日前
日本電気株式会社
受付支援装置、受付支援方法、及びプログラム
24日前
日本電気株式会社
救急支援装置、救急支援方法、及びプログラム
10日前
日本電気株式会社
制御装置、制御方法、及び、コンピュータプログラム
23日前
日本電気株式会社
処理装置、処理システム、処理方法、及びプログラム
9日前
日本電気株式会社
処理装置、処理システム、処理方法、及びプログラム
9日前
日本電気株式会社
制御装置、制御方法、プログラム、及び、通信システム
24日前
日本電気株式会社
清浄度を評価するための方法、装置、電子機器及び媒体
4日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム、及びシステム
1か月前
日本電気株式会社
旅行計画提案装置、旅行計画提案方法、およびプログラム
24日前
日本電気株式会社
監視システム、分析装置の制御方法、及び、制御プログラム
17日前
日本電気株式会社
サーバ装置、システム、サーバ装置の制御方法及びプログラム
1か月前
日本電気株式会社
サーバ装置、システム、サーバ装置の制御方法及びプログラム
19日前
日本電気株式会社
配置及び収納システム、配置及び収納方法、並びにプログラム
10日前
日本電気株式会社
着座率向上装置、着座率向上方法および着座率向上プログラム
24日前
日本電気株式会社
通信システム
25日前
日本電気株式会社
情報処理装置、情報処理システム、情報処理方法及びプログラム
23日前
日本電気株式会社
混雑状況予測装置
17日前
日本電気株式会社
情報処理装置、情報生成システム、情報処理方法、およびプログラム
25日前
日本電気株式会社
食品管理装置、食品管理システム、食品管理方法、およびプログラム
9日前
日本電気株式会社
健康増進支援装置、健康増進支援方法、及び、健康増進支援プログラム
19日前
日本電気株式会社
通信制御装置、通信制御システム、通信制御方法および通信制御プログラム
17日前
日本電気株式会社
意思判定装置、意思判定システム、意思判定方法および意思判定プログラム
17日前
日本電気株式会社
情報処理装置及び制御方法
9日前
日本電気株式会社
光増幅装置および光増幅方法
19日前
続きを見る