TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024176483
公報種別
公開特許公報(A)
公開日
2024-12-19
出願番号
2023095038
出願日
2023-06-08
発明の名称
学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラム
出願人
オムロン株式会社
代理人
弁理士法人太陽国際特許事務所
主分類
G06N
3/094 20230101AFI20241212BHJP(計算;計数)
要約
【課題】人間の動作データからロボットの動作データを簡易に生成する。
【解決手段】学習済みモデル生成装置10は、学習用の人間の動作データを含む学習用データを取得する。学習済みモデル生成装置10は、学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する。
【選択図】図5
特許請求の範囲
【請求項1】
学習用の人間の動作データを含む学習用データを取得する学習用取得部と、
前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、
を含む学習済みモデル生成装置。
続きを表示(約 2,300 文字)
【請求項2】
前記動作データは、前記制御対象ロボットの状態yと行動aとを含んで構成されており、
前記制御対象ロボットの時刻tの状態y
t
と前記制御対象ロボットの時刻tの行動a
t
とが入力されると、前記制御対象ロボットの時刻t+1の状態y
t+1
を出力するフォワードダイナミクスモデルFと、
前記制御対象ロボットの時刻tの状態y
t
と前記制御対象ロボットの時刻t+1の状態y
t+1
とが入力されると、前記制御対象ロボットが時刻tに取った行動a
t
が出力されるインバースダイナミクスモデルF
-1
とが予め用意されており、
前記学習部は、
前記インバースダイナミクスモデルF
-1
に対して、前記ジェネレータから出力された前記制御対象ロボットの時刻tの状態y
t
^と時刻t+1の状態y
t+1
^とを入力することにより、前記制御対象ロボットが時刻tに取ったであろう行動a
t
~
を計算し、
前記フォワードダイナミクスモデルFに対して、前記状態y
t
^と前記行動a
t
~
とを入力することにより、前記制御対象ロボットの時刻t+1の状態y
t+1
~
を計算し、
前記ジェネレータから出力された前記制御対象ロボットの時刻tの状態y
t+1
^と、計算された前記制御対象ロボットの時刻t+1の状態y
t+1
~
との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項1に記載の学習済みモデル生成装置。
【請求項3】
前記学習用データには、学習用の制御対象ロボットの動作データxが更に含まれており、
前記学習部は、学習用の制御対象ロボットの動作データxと、前記ジェネレータから出力された前記制御対象ロボットの状態y^との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項4】
前記制御対象ロボットは、少なくとも1つ以上の腕部を備えたロボットである、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項5】
前記制御対象ロボットは、第1腕部と第2腕部とを備える双腕ロボットであり、
前記学習用データは、
前記第1腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、
前記第2腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、を更に含んで構成されている、
請求項4に記載の学習済みモデル生成装置。
【請求項6】
前記学習用データは、
前記制御対象ロボットのランダムな動作を表すランダムデータと、
前記人間のランダムな動作を表すランダムデータと、を更に含んで構成されている、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項7】
前記学習部は、
前記学習済みのジェネレータに対して、対象となる人間の動作を表す対象動作データを入力することにより、前記制御対象ロボットの動作データを生成し、
生成された前記制御対象ロボットの動作データに基づいて、前記制御対象ロボットを制御するための制御用学習済みモデルであって、前記動作データのうちの状態が入力されると、前記動作データのうちの行動を出力するための制御用学習済みモデルを生成する、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項8】
制御対象ロボットの状態を取得する取得部と、
請求項7に記載の学習済みモデル生成装置によって生成された前記制御用学習済みモデルに対して、前記取得部により取得された前記状態を入力することにより、前記状態に応じた前記制御対象ロボットの行動を生成する生成部と、
前記生成部により生成された前記行動を取るように、前記制御対象ロボットを制御する制御部と、
を備えた制御装置。
【請求項9】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータが実行する学習済みモデル生成方法。
【請求項10】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータに実行させるための学習済みモデル生成プログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラムに関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
従来、2つの腕部を有する双腕ロボットに対して動作を教示させる技術が知られている(例えば、非特許文献1を参照)。この技術では、双腕ロボットが試行錯誤をすることにより所定の動作を学習する。
【0003】
また、複数の腕部を有するロボットに対して動作を教示する際に、複数の腕部の各々毎に異なる教示者によって動作を教示する技術が知られている(例えば、非特許文献2を参照)。この技術では、教示者がロボットを遠隔操作することにより、ロボットに対して動作を教示させる。
【先行技術文献】
【非特許文献】
【0004】
Rohan Chitnis, Shubham Tulsiani, Saurabh Gupta, Abhinav Gupta, "Intrinsic Motivation for Encouraging Synergistic Behavior", ICLR 2020.
Albert Tung, Josiah Wong, Ajay Mandlekar, Roberto Martin, Yuke Zhu, Li Fei-Fei, Silvio Savarese, "Learning Multi-Arm Manipulation Through Collaborative Teleoperation", ICRA, 2021.
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、人間がロボットに対して動作を教示する際には、ロボットの動作に関する物理的な制約も考慮する必要がある。例えば、ロボットの可動域が人間の可動域とは異なる場合には、人間が簡単に行える動作であっても、ロボットはその動作を実行することができない場合もあり得る。また、例えば、双腕ロボットのように、ロボットの可動部位が複数である場合には、その複数の可動部位を協調動作させる必要がある。人間がロボットに対して動作を教示する際に、このような複数の可動部位を協調動作させつつ、動作を教示させることは難しい。
【0006】
このため、人間がロボットに対して動作を教示することは難しい、という課題がある。
【0007】
本開示は、上記の点に鑑みてなされたものであり、人間の動作データからロボットの動作データを簡易に生成することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本開示に係る学習済みモデル生成装置は、学習用の人間の動作データを含む学習用データを取得する学習用取得部と、前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、を含む学習済みモデル生成装置である。
【0009】
また、本開示の学習済みモデル生成方法は、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータが実行する学習済みモデル生成方法である。
【0010】
また、本開示の学習済みモデル生成プログラムは、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータに実行させるための学習済みモデル生成プログラムである。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
オムロン株式会社
トリガスイッチ
今日
オムロン株式会社
スイッチング素子
今日
オムロン株式会社
電力変換装置とその制御方法
1日前
オムロン株式会社
信号処理装置、及び信号処理方法
2日前
オムロン株式会社
モデル生成方法及び推論プログラム
今日
オムロン株式会社
表示装置およびこれを備えた展示装置
今日
オムロン株式会社
表示装置およびこれを備えた展示装置
今日
オムロン株式会社
スイッチユニットおよびこれを備えた展示装置
今日
オムロン株式会社
スイッチユニットおよびこれを備えた展示装置
今日
オムロン株式会社
アノテーション支援装置及びアノテーション支援方法
5日前
株式会社ザメディア
出席管理システム
今日
トヨタ自動車株式会社
作業評価装置
6日前
トヨタ自動車株式会社
工程計画装置
今日
トヨタ自動車株式会社
作業判定方法
1日前
トヨタ自動車株式会社
情報処理システム
1日前
個人
公益寄付インタラクティブシステム
6日前
ゼネラル株式会社
RFIDタグ付き物品
2日前
株式会社国際電気
支援システム
2日前
トヨタ自動車株式会社
情報処理方法
1日前
ブラザー工業株式会社
ラベルプリンタ
1日前
富士通株式会社
画像生成方法
5日前
甍エンジニアリング株式会社
屋根材買い取りシステム
5日前
株式会社日立製作所
設計支援装置
今日
日立建機株式会社
潤滑油診断システム
今日
日立建機株式会社
作業機械の管理装置
2日前
トヨタ自動車株式会社
車両用の情報処理装置
1日前
株式会社アイシン
情報提供システム
5日前
アルプスアルパイン株式会社
入力装置
5日前
トヨタ自動車株式会社
車両用の情報処理装置
今日
ブラザー工業株式会社
印刷装置
今日
株式会社カプコン
システム、サーバおよびプログラム
今日
個人
情報処理システム、情報処理方法及びプログラム
5日前
サクサ株式会社
画像処理装置、方法、およびシステム
1日前
キヤノン株式会社
情報処理装置
5日前
日本電気株式会社
管理装置、管理方法、及びプログラム
5日前
株式会社アイシン
投稿感情予測システム
5日前
続きを見る
他の特許を見る