特許ウォッチ

公開番号2024176483
公報種別公開特許公報(A)
公開日2024-12-19
出願番号2023095038
出願日2023-06-08
発明の名称学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラム
出願人オムロン株式会社
代理人弁理士法人太陽国際特許事務所
主分類G06N 3/094 20230101AFI20241212BHJP(計算;計数)
要約【課題】人間の動作データからロボットの動作データを簡易に生成する。
【解決手段】学習済みモデル生成装置10は、学習用の人間の動作データを含む学習用データを取得する。学習済みモデル生成装置10は、学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する。
【選択図】図5
特許請求の範囲【請求項１】
学習用の人間の動作データを含む学習用データを取得する学習用取得部と、
前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、
を含む学習済みモデル生成装置。
続きを表示（約 2,300 文字）【請求項２】
前記動作データは、前記制御対象ロボットの状態ｙと行動ａとを含んで構成されており、
前記制御対象ロボットの時刻ｔの状態ｙ
ｔ
と前記制御対象ロボットの時刻ｔの行動ａ
ｔ
とが入力されると、前記制御対象ロボットの時刻ｔ＋１の状態ｙ
ｔ＋１
を出力するフォワードダイナミクスモデルＦと、
前記制御対象ロボットの時刻ｔの状態ｙ
ｔ
と前記制御対象ロボットの時刻ｔ＋１の状態ｙ
ｔ＋１
とが入力されると、前記制御対象ロボットが時刻ｔに取った行動ａ
ｔ
が出力されるインバースダイナミクスモデルＦ
－１
とが予め用意されており、
前記学習部は、
前記インバースダイナミクスモデルＦ
－１
に対して、前記ジェネレータから出力された前記制御対象ロボットの時刻ｔの状態ｙ
ｔ
＾と時刻ｔ＋１の状態ｙ
ｔ＋１
＾とを入力することにより、前記制御対象ロボットが時刻ｔに取ったであろう行動ａ
ｔ
～
を計算し、
前記フォワードダイナミクスモデルＦに対して、前記状態ｙ
ｔ
＾と前記行動ａ
ｔ
～
とを入力することにより、前記制御対象ロボットの時刻ｔ＋１の状態ｙ
ｔ＋１
～
を計算し、
前記ジェネレータから出力された前記制御対象ロボットの時刻ｔの状態ｙ
ｔ＋１
＾と、計算された前記制御対象ロボットの時刻ｔ＋１の状態ｙ
ｔ＋１
～
との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項１に記載の学習済みモデル生成装置。
【請求項３】
前記学習用データには、学習用の制御対象ロボットの動作データｘが更に含まれており、
前記学習部は、学習用の制御対象ロボットの動作データｘと、前記ジェネレータから出力された前記制御対象ロボットの状態ｙ＾との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項１又は請求項２に記載の学習済みモデル生成装置。
【請求項４】
前記制御対象ロボットは、少なくとも１つ以上の腕部を備えたロボットである、
請求項１又は請求項２に記載の学習済みモデル生成装置。
【請求項５】
前記制御対象ロボットは、第１腕部と第２腕部とを備える双腕ロボットであり、
前記学習用データは、
前記第１腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、
前記第２腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、を更に含んで構成されている、
請求項４に記載の学習済みモデル生成装置。
【請求項６】
前記学習用データは、
前記制御対象ロボットのランダムな動作を表すランダムデータと、
前記人間のランダムな動作を表すランダムデータと、を更に含んで構成されている、
請求項１又は請求項２に記載の学習済みモデル生成装置。
【請求項７】
前記学習部は、
前記学習済みのジェネレータに対して、対象となる人間の動作を表す対象動作データを入力することにより、前記制御対象ロボットの動作データを生成し、
生成された前記制御対象ロボットの動作データに基づいて、前記制御対象ロボットを制御するための制御用学習済みモデルであって、前記動作データのうちの状態が入力されると、前記動作データのうちの行動を出力するための制御用学習済みモデルを生成する、
請求項１又は請求項２に記載の学習済みモデル生成装置。
【請求項８】
制御対象ロボットの状態を取得する取得部と、
請求項７に記載の学習済みモデル生成装置によって生成された前記制御用学習済みモデルに対して、前記取得部により取得された前記状態を入力することにより、前記状態に応じた前記制御対象ロボットの行動を生成する生成部と、
前記生成部により生成された前記行動を取るように、前記制御対象ロボットを制御する制御部と、
を備えた制御装置。
【請求項９】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータが実行する学習済みモデル生成方法。
【請求項１０】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータに実行させるための学習済みモデル生成プログラム。

発明の詳細な説明【技術分野】
【０００１】
本開示は、学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラムに関する。
続きを表示（約 1,700 文字）【背景技術】
【０００２】
従来、２つの腕部を有する双腕ロボットに対して動作を教示させる技術が知られている（例えば、非特許文献１を参照）。この技術では、双腕ロボットが試行錯誤をすることにより所定の動作を学習する。
【０００３】
また、複数の腕部を有するロボットに対して動作を教示する際に、複数の腕部の各々毎に異なる教示者によって動作を教示する技術が知られている（例えば、非特許文献２を参照）。この技術では、教示者がロボットを遠隔操作することにより、ロボットに対して動作を教示させる。
【先行技術文献】
【非特許文献】
【０００４】
Rohan Chitnis, Shubham Tulsiani, Saurabh Gupta, Abhinav Gupta, "Intrinsic Motivation for Encouraging Synergistic Behavior", ICLR 2020.
Albert Tung, Josiah Wong, Ajay Mandlekar, Roberto Martin, Yuke Zhu, Li Fei-Fei, Silvio Savarese, "Learning Multi-Arm Manipulation Through Collaborative Teleoperation", ICRA, 2021.
【発明の概要】
【発明が解決しようとする課題】
【０００５】
ところで、人間がロボットに対して動作を教示する際には、ロボットの動作に関する物理的な制約も考慮する必要がある。例えば、ロボットの可動域が人間の可動域とは異なる場合には、人間が簡単に行える動作であっても、ロボットはその動作を実行することができない場合もあり得る。また、例えば、双腕ロボットのように、ロボットの可動部位が複数である場合には、その複数の可動部位を協調動作させる必要がある。人間がロボットに対して動作を教示する際に、このような複数の可動部位を協調動作させつつ、動作を教示させることは難しい。
【０００６】
このため、人間がロボットに対して動作を教示することは難しい、という課題がある。
【０００７】
本開示は、上記の点に鑑みてなされたものであり、人間の動作データからロボットの動作データを簡易に生成することを目的とする。
【課題を解決するための手段】
【０００８】
上記目的を達成するために、本開示に係る学習済みモデル生成装置は、学習用の人間の動作データを含む学習用データを取得する学習用取得部と、前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、を含む学習済みモデル生成装置である。
【０００９】
また、本開示の学習済みモデル生成方法は、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータが実行する学習済みモデル生成方法である。
【００１０】
また、本開示の学習済みモデル生成プログラムは、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータに実行させるための学習済みモデル生成プログラムである。
【発明の効果】
（【００１１】以降は省略されています）

関連特許