TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024117861
公報種別
公開特許公報(A)
公開日
2024-08-30
出願番号
2023023919
出願日
2023-02-20
発明の名称
動作データ生成装置、動作データ生成方法、およびプログラム
出願人
日本電気株式会社
代理人
個人
,
個人
主分類
G06T
7/20 20170101AFI20240823BHJP(計算;計数)
要約
【課題】時間軸方向にデータ拡張された動作データを生成できる動作データ生成装置等を提供する。
【解決手段】データ変換対象である複数の動作データを取得する取得部と、データ拡張の対象動作である動作クラスごとに、複数の動作データをグループ化する変換データ選定部と、動作クラスごとにグループ化された動作データのうち少なくとも1つを基準データに設定し、グループ化された動作データのうち基準データとは異なる少なくとも1つの動作データを変換対象データに設定し、基準データの動作タイミングを基準として変換対象データを同期させた拡張動作データを生成するデータ変換部と、生成された拡張動作データを出力する出力部と、を備える動作データ生成装置とする。
【選択図】 図1
特許請求の範囲
【請求項1】
データ変換対象である複数の動作データを取得する取得部と、
データ拡張の対象動作である動作クラスごとに、複数の前記動作データをグループ化する変換データ選定部と、
前記動作クラスごとにグループ化された前記動作データのうち少なくとも1つを基準データに設定し、グループ化された前記動作データのうち前記基準データとは異なる少なくとも1つの前記動作データを変換対象データに設定し、前記基準データの動作タイミングを基準として前記変換対象データを同期させた拡張動作データを生成するデータ変換部と、
生成された前記拡張動作データを出力する出力部と、を備える動作データ生成装置。
続きを表示(約 2,300 文字)
【請求項2】
前記データ変換部は、
前記動作クラスごとにグループ化された前記動作データの全てを前記基準データに設定し、
グループ化された前記動作データのうち前記基準データとは異なる全ての前記動作データを前記変換対象データに設定し、
全ての前記基準データの動作タイミングを基準として、前記基準データに対して設定された全ての前記変換対象データを同期させた前記拡張動作データを生成する請求項1に記載の動作データ生成装置。
【請求項3】
予め設定された数のサンプルを複数の前記動作データから抽出し、抽出された前記サンプルに関してサンプル間の関係を表す指標値を計算する指標値計算部を備え、
前記変換データ選定部は、
前記指標値計算部によって算出された前記指標値に応じて、変換対象の前記動作データをペアリングし、
前記データ変換部は、
ペアリングされた前記動作データを互いに同期させた前記拡張動作データを生成する請求項1に記載の動作データ生成装置。
【請求項4】
前記指標値計算部は、
前記指標値として、サンプル間の類似度を計算し、
前記変換データ選定部は、
予め設定された類似度閾値よりも類似度が小さい2つの前記動作データをペアリングする請求項3に記載の動作データ生成装置。
【請求項5】
前記指標値計算部は、
前記指標値として、サンプル間の距離を計算し、
前記変換データ選定部は、
予め設定された距離閾値よりも距離が大きい2つの前記動作データをペアリングする請求項3に記載の動作データ生成装置。
【請求項6】
所定のクラスタリング法よって、複数の前記動作データを複数のクラスタにグループ分けするクラスタリング部と、
前記クラスタに含まれる前記動作データの数に応じて、グループ分けされた複数の前記クラスタに含まれる2つの前記クラスタをペアリングするペア選択部と、を備え、
前記変換データ選定部は、
ペアリングされた2つの前記クラスタからの各々から少なくとも1つずつの前記動作データをランダムに抽出し、
2つの前記クラスタからの各々から抽出された前記動作データをペアリングし、
前記データ変換部は、
ペアリングされた前記動作データを互いに同期させた前記拡張動作データを生成する請求項1に記載の動作データ生成装置。
【請求項7】
前記ペア選択部は、
複数の前記クラスタに含まれる前記動作データの数の割合から逆比を計算し、
算出された逆比の値が最大である前記クラスタと、逆比の値が最大ではないいずれかの前記クラスタとをペアリングする請求項6に記載の動作データ生成装置。
【請求項8】
前記データ変換部は、
グラフ畳み込みネットワークを含むエンコーダを有し、対象動作を含む動作データを構成するフレームごとに推定された姿勢データを角度表現に正規化し、角度表現に正規化された前記姿勢データを前記エンコーダに入力して埋め込み空間における特徴量を計算する特徴量計算部と、
前記基準データを構成するフレームごとに算出された特徴量と、同期対象データを構成するフレームごとに算出された特徴量との距離を計算する距離計算部と、
算出された距離に基づいてフレームごとの最適経路を計算し、前記最適経路で結ばれたフレームのタイミングを揃えることによって、前記同期対象データを前記基準データに同期させる同期処理部と、を有し、
前記エンコーダは、
角度表現に正規化された前記姿勢データをグラフ畳み込みによって畳み込み、
埋め込み空間における埋め込みを特徴量として出力し、
前記距離計算部は、
前記基準データを構成するフレームに関する特徴量と、前記同期対象データを構成するフレームに関する特徴量との間の距離を総当たりで計算する請求項1乃至7のいずれか一項に記載の動作データ生成装置。
【請求項9】
コンピュータが、
データ変換対象である複数の動作データを取得し、
データ拡張の対象動作である動作クラスごとに、複数の前記動作データをグループ化し、
前記動作クラスごとにグループ化された前記動作データのうち少なくとも1つを基準データに設定し、
グループ化された前記動作データのうち前記基準データとは異なる少なくとも1つの前記動作データを変換対象データに設定し、
前記基準データの動作タイミングを基準として前記変換対象データを同期させた拡張動作データを生成し、
生成された前記拡張動作データを出力する動作データ生成方法。
【請求項10】
データ変換対象である複数の動作データを取得する処理と、
データ拡張の対象動作である動作クラスごとに、複数の前記動作データをグループ化する処理と、
前記動作クラスごとにグループ化された前記動作データのうち少なくとも1つを基準データに設定する処理と、
グループ化された前記動作データのうち前記基準データとは異なる少なくとも1つの前記動作データを変換対象データに設定する処理と、
前記基準データの動作タイミングを基準として前記変換対象データを同期させた拡張動作データを生成する処理と、
生成された前記拡張動作データを出力する処理と、をコンピュータに実行させるプログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、動作データを生成する動作データ生成装置等に関する。
続きを表示(約 2,100 文字)
【背景技術】
【0002】
人間の動作に関するデジタルツインの技術を用いて動作データを拡張すれば、一般的な学習よりも少量の実測データで、大量のデータを用いた場合と同等以上の精度の動作認識モデルを構築できる。データ拡張で用いられる敵対的生成モデル(GAN:Generative Adversarial Network)の学習を安定させるためには、データを効果的に正規化することが重要である。例えば、動作データに含まれる共通の動作を、異なる動作データとの間で正規化できれば、敵対的生成モデルの学習を安定化できる。すなわち、異なる動作データの間で、動作データに含まれる共通の動作を同期できれば、敵対的生成モデルの学習を安定化できる。
【0003】
非特許文献1には、映像間の時間的整合のタスクに基づく自己教師あり表現学習手法について開示されている。非特許文献1の手法では、時間的サイクル整合性(TCC:Temporal Cycle-Consistency)を用いて、ネットワークを訓練する。非特許文献1の手法では、学習された埋め込み空間における最近傍のフレームを対応付けることによって、異なる動画に含まれる共通の動作を同期させる。
【0004】
非特許文献2には、スケルトンベースのアクション認識問題に対する画像分類ベースのアプローチが開示されている。非特許文献2は、データセットに依存しない変換スケールの不変画像マッピング法を開示している。非特許文献2の不変画像マッピング法では、スケルトン画像と呼ばれるスケルトンビデオをカラー画像に変換する。また、非特許文献2は、マルチスケールの深層畳み込みニューラルネットワークCNN(Convolutional Neural Network)アーキテクチャを開示している。非特許文献2の手法では、データ拡張において、以下の3つを活用している。1つ目は、3次元座標のランダムな回転である。2つ目は、ガウシアンノイズの付加である。3つ目は、一連の動作シーケンスのランダムな位置でのクロップである。
【0005】
特許文献1には、利用者が使用する利用者端末と、この利用者端末に対し通信ネットワークを介して接続可能な運動支援装置と、を具備する運動支援システムについて開示されている。特許文献1には、利用者の運動画像データと、指導者の運動画像データとを時間的に同期させて、ディスプレイに表示させる例が開示されている。
【先行技術文献】
【特許文献】
【0006】
特開2006-302122号公報
【非特許文献】
【0007】
D. Dwibedi, et al., “Temporal Cycle-Consistency Learning”, IEEE Conf. on Computer Vision and Pattern Recognition (2019).
Bo Li, Mingyi He, Xuelian Cheng, Yucheng Chen, Yuchao Dai, “Skeleton Based Action Recognition Using Translation-Scale Invariant Image Mapping And Multi-Scale Deep CNN”, 2017 IEEE International Conference on Multimedia & Expo Workshops (ICMEW), 2017, pp.601-604.
【発明の概要】
【発明が解決しようとする課題】
【0008】
非特許文献1の手法では、動画データに対してエンコーダモデルを学習し、埋め込み空間における最近傍のフレームを対応付けることによって、2つの動画データを同期する。非特許文献1の手法では、2つの動画データを同期する際に、動画に含まれる背景の影響が及ぶ。そのため、非特許文献1の手法では、異なる動画において背景が大きく異なる場合、同期の精度が低下することがあった。また、非特許文献1の手法は、動画形式ではないデータに対しては、適用できなかった。
【0009】
非特許文献2の手法では、座標回転やガウシアンノイズ付与、ランダムクロップなどの空間的なアプローチによって、データを拡張する。このようなアプローチによれば、ノイズやデータ取得環境に左右されにくいモデルの学習を実現できる。しかし、非特許文献2の手法は、時間的なアプローチを含まないため、動作のタイミングや速度が異なるデータの拡張には適用できなかった。特に、非特許文献2の手法は、学習データが数10個程度と少ない場合、多様なテストデータに対応するためのデータ拡張にはなりえなかった。
【0010】
特許文献1の手法では、利用者の運動画像データと、指導者の運動画像データとを時間的に同期させる。特許文献1の手法は、運動画像データの同期には適用できるが、運動画像データの拡張には適用できなかった。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
情報提示方法
5日前
個人
プログラム
4日前
個人
自動精算システム
13日前
個人
RFタグ読取装置
22日前
個人
売買システム
19日前
個人
管理サーバ
1か月前
個人
市場受発注システム
11日前
個人
発想支援方法及びシステム
8日前
日本精機株式会社
車両用表示装置
21日前
個人
分類処理プログラム及び方法
8日前
日本精機株式会社
車両用表示装置
21日前
富士通株式会社
金融システム
5日前
井関農機株式会社
ロボット作業車両
13日前
個人
VRによる人体各部位の立体化
1か月前
トヨタ自動車株式会社
推定装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
作業評価装置
20日前
トヨタ自動車株式会社
画像処理装置
1か月前
トヨタ自動車株式会社
情報通知方法
11日前
トヨタ自動車株式会社
作業評価装置
1か月前
トヨタ自動車株式会社
記号識別方法
1か月前
ブラザー工業株式会社
無線通信装置
11日前
個人
販売支援システム
13日前
トヨタ自動車株式会社
作業管理装置
11日前
村田機械株式会社
人員配置システム
8日前
個人
情報処理装置およびプログラム
1か月前
トヨタ自動車株式会社
習熟度判定装置
1か月前
AICRO株式会社
情報処理システム
11日前
大王製紙株式会社
RFIDタグ
1か月前
NISSHA株式会社
入力装置
8日前
トヨタ自動車株式会社
生成装置
5日前
株式会社mov
情報処理システム
21日前
富士通株式会社
排出の推定と異常
1か月前
株式会社COLORS
戸籍解析システム
1か月前
富士通株式会社
排出の推定と異常
1か月前
グローリー株式会社
汎用制御基板
1か月前
続きを見る
他の特許を見る