発明の詳細な説明【技術分野】 【0001】 本発明は、動作識別学習装置、動作識別装置、学習方法及びプログラムに関する。 続きを表示(約 2,600 文字)【背景技術】 【0002】 近年、モーションキャプチャー装置やウェアラブルデバイスなどのセンサ機器の普及や、画像認識技術の向上に伴って、人物の動作をセンシングすることが容易になってきた。これらのセンサで記録可能なデータとして、スマートフォンやウェアラブルウォッチに搭載された加速度・ジャイロセンサーで記録される多チャンネル時系列信号データや、赤外線センサや身体に取り付けられたマーカーによって記録される人物の骨格時系列データなどが挙げられる。これらのデータを用いた人物の動作識別は、例えば、人物認証やライフログアプリケーション、VR(仮想現実)/AR(拡張現実)アプリケーション、自動監視システムなどの様々な応用先が存在する重要な技術である。 【0003】 センシングされたデータを用いた人物の動作識別には、機械学習を用いた予測モデルにより実現されることが多い。ヒューリスティックな方法と比較して、機械学習を用いた方法は汎用性が高くなる利点がある。一方で、この方法は学習に用いた人物以外のデータに対して動作識別精度が低くなるという問題が存在する。これは、各人物の動作には個人差があり、同一の動作であってもデータのうえでは大きく異なることがあるためである。例えば、歩くという動作を考えてみた場合、歩く速さや腕の振りの大きさなどによってデータが大きく異なることがあり、その結果、別の人物の歩く動作をうまく認識できなくなるということが起こりうる。 【0004】 このような問題を解決すべく、様々な技術が開示されている。例えば、対象人物ごとに予測モデルを個別に用意することにより、個人差による認識劣化問題を回避する技術がある(例えば、非特許文献1参照)。また、蓄積された多数の人物の動作データの中で、対象人物と類似する人物を検出し、その人物のデータで訓練された予測モデルを用いる方法がある(例えば、特許文献1参照)。また、対象人物用の予測モデルの学習に必要なデータが部分的に欠落している場合に、ほかの人物のデータで訓練された生成モデルを用いてデータを補完する技術がある(例えば、非特許文献2参照)。また、能動学習や転移学習によって、予測モデルを学習事例に含まれる人物以外に対して適応させる方法がある(例えば、非特許文献3及び非特許文献4参照)。 【先行技術文献】 【特許文献】 【0005】 特開2012-248017号公報 【非特許文献】 【0006】 Gary M. Weiss and Jeffrey W. Lockhart, "The impact of personalization on smartphone-based activity recognition," In Workshops at the Twenty-Sixth AAAI Conference on Artificial Intelligence. N. Suzuki, Y. Watanabe, and A. Nakazawa. 2020. GAN-based Style Transformation to Improve Gesture-recognition Accuracy. Proc. ACM Interact. Mob. Wearable Ubiquitous Technol. 4, 4, Article 154 (December 2020), 20 pages. R. Fallahzadeh and H. Ghasemzadeh. 2017. Personalization without User Interruption: Boosting Activity Recognition in New Subjects Using Unlabeled Data. In 2017 ACM/IEEE 8th International Conference on Cyber-Physical Systems (ICCPS). 293-302. Seyed Ali Rokni, Marjan Nourollahi, and Hassan Ghasemzadeh. 2018. Personalized Human Activity Recognition Using Convolutional Neural Networks. In Thirty-Second AAAI Conference on Artificial Intelligence. 【発明の概要】 【発明が解決しようとする課題】 【0007】 個人差の影響を受けず、多様な人物に汎化する高精度な動作識別を実現するために、上記様々な技術が提案されてきたが、これらの技術には、必要となる高品質な訓練データセットが必要とされる。 【0008】 まず、特許文献1、非特許文献1、非特許文献3、非特許文献4の技術ではいずれも、訓練データセット中の各人物のデータには、まんべんなくすべての動作クラスのデータが含まれており、データが欠損している動作クラス(以下、「欠損動作クラス」という。)が存在しないことが求められる。 【0009】 非特許文献2は、対象人物の動作識別モデルを学習する際に、対象人物のデータに欠損動作クラスがある場合にも、生成モデルにより欠損動作クラスのデータを生成し補完する技術を開示している。しかしながら、補完するための生成モデルの学習には、対象人物以外の各人物に欠損動作クラスが存在しない訓練データセットを準備する必要がある。 【0010】 以上概観した通り、現在開示されている技術は、高品質な訓練データセットを必要とするものである。ことろが、認識モデルの開発コストなどの制約により、各人物のデータとして、欠損動作クラスが存在するような偏りのある、低品質なデータセットしか用意できない場合も多くある。このような場合、現在開示されている技術では、多様な人物に汎化する高精度な動作識別を実現することはできない。 (【0011】以降は省略されています) この特許をJ-PlatPatで参照する