TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024176483
公報種別
公開特許公報(A)
公開日
2024-12-19
出願番号
2023095038
出願日
2023-06-08
発明の名称
学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラム
出願人
オムロン株式会社
代理人
弁理士法人太陽国際特許事務所
主分類
G06N
3/094 20230101AFI20241212BHJP(計算;計数)
要約
【課題】人間の動作データからロボットの動作データを簡易に生成する。
【解決手段】学習済みモデル生成装置10は、学習用の人間の動作データを含む学習用データを取得する。学習済みモデル生成装置10は、学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する。
【選択図】図5
特許請求の範囲
【請求項1】
学習用の人間の動作データを含む学習用データを取得する学習用取得部と、
前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、
を含む学習済みモデル生成装置。
続きを表示(約 2,300 文字)
【請求項2】
前記動作データは、前記制御対象ロボットの状態yと行動aとを含んで構成されており、
前記制御対象ロボットの時刻tの状態y
t
と前記制御対象ロボットの時刻tの行動a
t
とが入力されると、前記制御対象ロボットの時刻t+1の状態y
t+1
を出力するフォワードダイナミクスモデルFと、
前記制御対象ロボットの時刻tの状態y
t
と前記制御対象ロボットの時刻t+1の状態y
t+1
とが入力されると、前記制御対象ロボットが時刻tに取った行動a
t
が出力されるインバースダイナミクスモデルF
-1
とが予め用意されており、
前記学習部は、
前記インバースダイナミクスモデルF
-1
に対して、前記ジェネレータから出力された前記制御対象ロボットの時刻tの状態y
t
^と時刻t+1の状態y
t+1
^とを入力することにより、前記制御対象ロボットが時刻tに取ったであろう行動a
t
~
を計算し、
前記フォワードダイナミクスモデルFに対して、前記状態y
t
^と前記行動a
t
~
とを入力することにより、前記制御対象ロボットの時刻t+1の状態y
t+1
~
を計算し、
前記ジェネレータから出力された前記制御対象ロボットの時刻tの状態y
t+1
^と、計算された前記制御対象ロボットの時刻t+1の状態y
t+1
~
との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項1に記載の学習済みモデル生成装置。
【請求項3】
前記学習用データには、学習用の制御対象ロボットの動作データxが更に含まれており、
前記学習部は、学習用の制御対象ロボットの動作データxと、前記ジェネレータから出力された前記制御対象ロボットの状態y^との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項4】
前記制御対象ロボットは、少なくとも1つ以上の腕部を備えたロボットである、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項5】
前記制御対象ロボットは、第1腕部と第2腕部とを備える双腕ロボットであり、
前記学習用データは、
前記第1腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、
前記第2腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、を更に含んで構成されている、
請求項4に記載の学習済みモデル生成装置。
【請求項6】
前記学習用データは、
前記制御対象ロボットのランダムな動作を表すランダムデータと、
前記人間のランダムな動作を表すランダムデータと、を更に含んで構成されている、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項7】
前記学習部は、
前記学習済みのジェネレータに対して、対象となる人間の動作を表す対象動作データを入力することにより、前記制御対象ロボットの動作データを生成し、
生成された前記制御対象ロボットの動作データに基づいて、前記制御対象ロボットを制御するための制御用学習済みモデルであって、前記動作データのうちの状態が入力されると、前記動作データのうちの行動を出力するための制御用学習済みモデルを生成する、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項8】
制御対象ロボットの状態を取得する取得部と、
請求項7に記載の学習済みモデル生成装置によって生成された前記制御用学習済みモデルに対して、前記取得部により取得された前記状態を入力することにより、前記状態に応じた前記制御対象ロボットの行動を生成する生成部と、
前記生成部により生成された前記行動を取るように、前記制御対象ロボットを制御する制御部と、
を備えた制御装置。
【請求項9】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータが実行する学習済みモデル生成方法。
【請求項10】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータに実行させるための学習済みモデル生成プログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラムに関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
従来、2つの腕部を有する双腕ロボットに対して動作を教示させる技術が知られている(例えば、非特許文献1を参照)。この技術では、双腕ロボットが試行錯誤をすることにより所定の動作を学習する。
【0003】
また、複数の腕部を有するロボットに対して動作を教示する際に、複数の腕部の各々毎に異なる教示者によって動作を教示する技術が知られている(例えば、非特許文献2を参照)。この技術では、教示者がロボットを遠隔操作することにより、ロボットに対して動作を教示させる。
【先行技術文献】
【非特許文献】
【0004】
Rohan Chitnis, Shubham Tulsiani, Saurabh Gupta, Abhinav Gupta, "Intrinsic Motivation for Encouraging Synergistic Behavior", ICLR 2020.
Albert Tung, Josiah Wong, Ajay Mandlekar, Roberto Martin, Yuke Zhu, Li Fei-Fei, Silvio Savarese, "Learning Multi-Arm Manipulation Through Collaborative Teleoperation", ICRA, 2021.
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、人間がロボットに対して動作を教示する際には、ロボットの動作に関する物理的な制約も考慮する必要がある。例えば、ロボットの可動域が人間の可動域とは異なる場合には、人間が簡単に行える動作であっても、ロボットはその動作を実行することができない場合もあり得る。また、例えば、双腕ロボットのように、ロボットの可動部位が複数である場合には、その複数の可動部位を協調動作させる必要がある。人間がロボットに対して動作を教示する際に、このような複数の可動部位を協調動作させつつ、動作を教示させることは難しい。
【0006】
このため、人間がロボットに対して動作を教示することは難しい、という課題がある。
【0007】
本開示は、上記の点に鑑みてなされたものであり、人間の動作データからロボットの動作データを簡易に生成することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本開示に係る学習済みモデル生成装置は、学習用の人間の動作データを含む学習用データを取得する学習用取得部と、前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、を含む学習済みモデル生成装置である。
【0009】
また、本開示の学習済みモデル生成方法は、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータが実行する学習済みモデル生成方法である。
【0010】
また、本開示の学習済みモデル生成プログラムは、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータに実行させるための学習済みモデル生成プログラムである。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
オムロン株式会社
光電センサ
16日前
オムロン株式会社
トリガスイッチ
17日前
オムロン株式会社
モバイルロボット
16日前
オムロン株式会社
モバイルロボット
16日前
オムロン株式会社
光干渉測距センサ
9日前
オムロン株式会社
スイッチング素子
17日前
オムロン株式会社
電力変換装置とその制御方法
18日前
オムロン株式会社
信号処理装置、及び信号処理方法
19日前
オムロン株式会社
制御装置、方法、及びプログラム
11日前
オムロン株式会社
情報処理システム、情報処理方法
16日前
オムロン株式会社
モデル生成方法及び推論プログラム
17日前
オムロン株式会社
表示装置およびこれを備えた展示装置
17日前
オムロン株式会社
表示装置およびこれを備えた展示装置
17日前
オムロン株式会社
多関節ロボット、及びモバイルロボット
16日前
オムロン株式会社
スイッチユニットおよびこれを備えた展示装置
17日前
オムロン株式会社
スイッチユニットおよびこれを備えた展示装置
17日前
オムロン株式会社
信号制御システム、およびステップアップ方法
2日前
オムロン株式会社
加熱炉、制御装置、制御プログラム、および制御方法
16日前
オムロン株式会社
状態推定装置、状態推定方法及び状態推定プログラム
16日前
オムロン株式会社
バーコードリーダーにおける画像処理パラメータの決定
16日前
オムロン株式会社
物品包装システム、自律走行ロボット、及びプログラム
16日前
オムロン株式会社
パワーコンディショナ
15日前
オムロン株式会社
スイッチ、スイッチアッセンブリ、操作装置および操作用装置
16日前
個人
非正規コート
12日前
個人
人物再現システム
9日前
個人
AI飲食最適化プラグイン
2日前
個人
電話管理システム及び管理方法
3日前
キヤノン電子株式会社
通信システム
23日前
有限会社ノア
データ読取装置
10日前
個人
広告提供システムおよびその方法
12日前
株式会社ザメディア
出席管理システム
17日前
個人
日誌作成支援システム
9日前
トヨタ自動車株式会社
作業判定方法
18日前
ミサワホーム株式会社
情報処理装置
16日前
トヨタ自動車株式会社
工程計画装置
17日前
トヨタ自動車株式会社
作業評価装置
23日前
続きを見る
他の特許を見る