TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024176483
公報種別
公開特許公報(A)
公開日
2024-12-19
出願番号
2023095038
出願日
2023-06-08
発明の名称
学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラム
出願人
オムロン株式会社
代理人
弁理士法人太陽国際特許事務所
主分類
G06N
3/094 20230101AFI20241212BHJP(計算;計数)
要約
【課題】人間の動作データからロボットの動作データを簡易に生成する。
【解決手段】学習済みモデル生成装置10は、学習用の人間の動作データを含む学習用データを取得する。学習済みモデル生成装置10は、学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する。
【選択図】図5
特許請求の範囲
【請求項1】
学習用の人間の動作データを含む学習用データを取得する学習用取得部と、
前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、
を含む学習済みモデル生成装置。
続きを表示(約 2,300 文字)
【請求項2】
前記動作データは、前記制御対象ロボットの状態yと行動aとを含んで構成されており、
前記制御対象ロボットの時刻tの状態y
t
と前記制御対象ロボットの時刻tの行動a
t
とが入力されると、前記制御対象ロボットの時刻t+1の状態y
t+1
を出力するフォワードダイナミクスモデルFと、
前記制御対象ロボットの時刻tの状態y
t
と前記制御対象ロボットの時刻t+1の状態y
t+1
とが入力されると、前記制御対象ロボットが時刻tに取った行動a
t
が出力されるインバースダイナミクスモデルF
-1
とが予め用意されており、
前記学習部は、
前記インバースダイナミクスモデルF
-1
に対して、前記ジェネレータから出力された前記制御対象ロボットの時刻tの状態y
t
^と時刻t+1の状態y
t+1
^とを入力することにより、前記制御対象ロボットが時刻tに取ったであろう行動a
t
~
を計算し、
前記フォワードダイナミクスモデルFに対して、前記状態y
t
^と前記行動a
t
~
とを入力することにより、前記制御対象ロボットの時刻t+1の状態y
t+1
~
を計算し、
前記ジェネレータから出力された前記制御対象ロボットの時刻tの状態y
t+1
^と、計算された前記制御対象ロボットの時刻t+1の状態y
t+1
~
との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項1に記載の学習済みモデル生成装置。
【請求項3】
前記学習用データには、学習用の制御対象ロボットの動作データxが更に含まれており、
前記学習部は、学習用の制御対象ロボットの動作データxと、前記ジェネレータから出力された前記制御対象ロボットの状態y^との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項4】
前記制御対象ロボットは、少なくとも1つ以上の腕部を備えたロボットである、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項5】
前記制御対象ロボットは、第1腕部と第2腕部とを備える双腕ロボットであり、
前記学習用データは、
前記第1腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、
前記第2腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、を更に含んで構成されている、
請求項4に記載の学習済みモデル生成装置。
【請求項6】
前記学習用データは、
前記制御対象ロボットのランダムな動作を表すランダムデータと、
前記人間のランダムな動作を表すランダムデータと、を更に含んで構成されている、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項7】
前記学習部は、
前記学習済みのジェネレータに対して、対象となる人間の動作を表す対象動作データを入力することにより、前記制御対象ロボットの動作データを生成し、
生成された前記制御対象ロボットの動作データに基づいて、前記制御対象ロボットを制御するための制御用学習済みモデルであって、前記動作データのうちの状態が入力されると、前記動作データのうちの行動を出力するための制御用学習済みモデルを生成する、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項8】
制御対象ロボットの状態を取得する取得部と、
請求項7に記載の学習済みモデル生成装置によって生成された前記制御用学習済みモデルに対して、前記取得部により取得された前記状態を入力することにより、前記状態に応じた前記制御対象ロボットの行動を生成する生成部と、
前記生成部により生成された前記行動を取るように、前記制御対象ロボットを制御する制御部と、
を備えた制御装置。
【請求項9】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータが実行する学習済みモデル生成方法。
【請求項10】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータに実行させるための学習済みモデル生成プログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラムに関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
従来、2つの腕部を有する双腕ロボットに対して動作を教示させる技術が知られている(例えば、非特許文献1を参照)。この技術では、双腕ロボットが試行錯誤をすることにより所定の動作を学習する。
【0003】
また、複数の腕部を有するロボットに対して動作を教示する際に、複数の腕部の各々毎に異なる教示者によって動作を教示する技術が知られている(例えば、非特許文献2を参照)。この技術では、教示者がロボットを遠隔操作することにより、ロボットに対して動作を教示させる。
【先行技術文献】
【非特許文献】
【0004】
Rohan Chitnis, Shubham Tulsiani, Saurabh Gupta, Abhinav Gupta, "Intrinsic Motivation for Encouraging Synergistic Behavior", ICLR 2020.
Albert Tung, Josiah Wong, Ajay Mandlekar, Roberto Martin, Yuke Zhu, Li Fei-Fei, Silvio Savarese, "Learning Multi-Arm Manipulation Through Collaborative Teleoperation", ICRA, 2021.
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、人間がロボットに対して動作を教示する際には、ロボットの動作に関する物理的な制約も考慮する必要がある。例えば、ロボットの可動域が人間の可動域とは異なる場合には、人間が簡単に行える動作であっても、ロボットはその動作を実行することができない場合もあり得る。また、例えば、双腕ロボットのように、ロボットの可動部位が複数である場合には、その複数の可動部位を協調動作させる必要がある。人間がロボットに対して動作を教示する際に、このような複数の可動部位を協調動作させつつ、動作を教示させることは難しい。
【0006】
このため、人間がロボットに対して動作を教示することは難しい、という課題がある。
【0007】
本開示は、上記の点に鑑みてなされたものであり、人間の動作データからロボットの動作データを簡易に生成することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本開示に係る学習済みモデル生成装置は、学習用の人間の動作データを含む学習用データを取得する学習用取得部と、前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、を含む学習済みモデル生成装置である。
【0009】
また、本開示の学習済みモデル生成方法は、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータが実行する学習済みモデル生成方法である。
【0010】
また、本開示の学習済みモデル生成プログラムは、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータに実行させるための学習済みモデル生成プログラムである。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
オムロン株式会社
制御装置
1か月前
オムロン株式会社
電磁継電器
17日前
オムロン株式会社
スイッチ装置
2か月前
オムロン株式会社
無停電電源装置
1か月前
オムロン株式会社
スイッチング装置
1か月前
オムロン株式会社
情報処理システム
1か月前
オムロン株式会社
電気機器ユニット
1か月前
オムロン株式会社
導線折り曲げ治具
21日前
オムロン株式会社
充電システム及びモジュール
2か月前
オムロン株式会社
搬送装置、搬送方法、プログラム
1か月前
オムロン株式会社
回転制御システム及び回転制御方法
21日前
オムロン株式会社
トルク推定方法及びトルク推定装置
1か月前
オムロン株式会社
画像処理システムおよび画像処理方法
27日前
オムロン株式会社
通信装置、通信方法、通信プログラム
1か月前
オムロン株式会社
非接触給電システム及びその制御方法
1か月前
オムロン株式会社
情報処理システム、方法およびプログラム
1か月前
オムロン株式会社
安全監視装置、制御方法およびプログラム
1か月前
オムロン株式会社
情報処理システム、方法およびプログラム
1か月前
オムロン株式会社
充電器、電力開閉モジュール、充電システム
1か月前
オムロン株式会社
情報処理装置、情報処理方法およびプログラム
27日前
オムロン株式会社
外装ケースユニット、外装ケース及び電気設備
1か月前
オムロン株式会社
作業認識装置、作業認識方法およびプログラム
15日前
オムロン株式会社
情報処理システム、情報処理方法及びプログラム
15日前
オムロン株式会社
アンテナ設定方法及びそれを用いた測位システム
1か月前
オムロン株式会社
雨滴検出装置の検査装置、検査用治具、検査方法
1か月前
オムロン株式会社
風計測装置、風計測方法および風計測プログラム
1か月前
オムロン株式会社
整列制御装置、整列制御方法、およびプログラム
1か月前
オムロン株式会社
整流回路、整流回路の制御方法、及び電力システム
1か月前
オムロン株式会社
雨滴検出装置およびその補正方法、補正プログラム
1か月前
オムロン株式会社
センサ装置および対象物検知方法、対象物検知プログラム
1か月前
オムロン株式会社
支援システム、支援装置、支援方法、及び支援プログラム
29日前
オムロン株式会社
充電計画生成装置、電力開閉モジュール及び充電システム
1か月前
オムロン株式会社
センサ、センサの制御方法、プログラム及び安全監視システム
20日前
オムロン株式会社
制御装置、無人飛行体、飛行制御方法、および飛行制御プログラム
1か月前
オムロン株式会社
電力システム、情報処理装置、電力供給計画作成方法及びプログラム
7日前
オムロン株式会社
情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
1か月前
続きを見る
他の特許を見る