TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024176483
公報種別
公開特許公報(A)
公開日
2024-12-19
出願番号
2023095038
出願日
2023-06-08
発明の名称
学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラム
出願人
オムロン株式会社
代理人
弁理士法人太陽国際特許事務所
主分類
G06N
3/094 20230101AFI20241212BHJP(計算;計数)
要約
【課題】人間の動作データからロボットの動作データを簡易に生成する。
【解決手段】学習済みモデル生成装置10は、学習用の人間の動作データを含む学習用データを取得する。学習済みモデル生成装置10は、学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する。
【選択図】図5
特許請求の範囲
【請求項1】
学習用の人間の動作データを含む学習用データを取得する学習用取得部と、
前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、
を含む学習済みモデル生成装置。
続きを表示(約 2,300 文字)
【請求項2】
前記動作データは、前記制御対象ロボットの状態yと行動aとを含んで構成されており、
前記制御対象ロボットの時刻tの状態y
t
と前記制御対象ロボットの時刻tの行動a
t
とが入力されると、前記制御対象ロボットの時刻t+1の状態y
t+1
を出力するフォワードダイナミクスモデルFと、
前記制御対象ロボットの時刻tの状態y
t
と前記制御対象ロボットの時刻t+1の状態y
t+1
とが入力されると、前記制御対象ロボットが時刻tに取った行動a
t
が出力されるインバースダイナミクスモデルF
-1
とが予め用意されており、
前記学習部は、
前記インバースダイナミクスモデルF
-1
に対して、前記ジェネレータから出力された前記制御対象ロボットの時刻tの状態y
t
^と時刻t+1の状態y
t+1
^とを入力することにより、前記制御対象ロボットが時刻tに取ったであろう行動a
t
~
を計算し、
前記フォワードダイナミクスモデルFに対して、前記状態y
t
^と前記行動a
t
~
とを入力することにより、前記制御対象ロボットの時刻t+1の状態y
t+1
~
を計算し、
前記ジェネレータから出力された前記制御対象ロボットの時刻tの状態y
t+1
^と、計算された前記制御対象ロボットの時刻t+1の状態y
t+1
~
との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項1に記載の学習済みモデル生成装置。
【請求項3】
前記学習用データには、学習用の制御対象ロボットの動作データxが更に含まれており、
前記学習部は、学習用の制御対象ロボットの動作データxと、前記ジェネレータから出力された前記制御対象ロボットの状態y^との間の差分が小さくなるように、前記ジェネレータを学習させることにより、前記学習済みのジェネレータを生成する、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項4】
前記制御対象ロボットは、少なくとも1つ以上の腕部を備えたロボットである、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項5】
前記制御対象ロボットは、第1腕部と第2腕部とを備える双腕ロボットであり、
前記学習用データは、
前記第1腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、
前記第2腕部と前記人間の腕とによる協調動作を表すデモンストレーションデータと、を更に含んで構成されている、
請求項4に記載の学習済みモデル生成装置。
【請求項6】
前記学習用データは、
前記制御対象ロボットのランダムな動作を表すランダムデータと、
前記人間のランダムな動作を表すランダムデータと、を更に含んで構成されている、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項7】
前記学習部は、
前記学習済みのジェネレータに対して、対象となる人間の動作を表す対象動作データを入力することにより、前記制御対象ロボットの動作データを生成し、
生成された前記制御対象ロボットの動作データに基づいて、前記制御対象ロボットを制御するための制御用学習済みモデルであって、前記動作データのうちの状態が入力されると、前記動作データのうちの行動を出力するための制御用学習済みモデルを生成する、
請求項1又は請求項2に記載の学習済みモデル生成装置。
【請求項8】
制御対象ロボットの状態を取得する取得部と、
請求項7に記載の学習済みモデル生成装置によって生成された前記制御用学習済みモデルに対して、前記取得部により取得された前記状態を入力することにより、前記状態に応じた前記制御対象ロボットの行動を生成する生成部と、
前記生成部により生成された前記行動を取るように、前記制御対象ロボットを制御する制御部と、
を備えた制御装置。
【請求項9】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータが実行する学習済みモデル生成方法。
【請求項10】
学習用の人間の動作データを含む学習用データを取得し、
取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、
処理をコンピュータに実行させるための学習済みモデル生成プログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラムに関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
従来、2つの腕部を有する双腕ロボットに対して動作を教示させる技術が知られている(例えば、非特許文献1を参照)。この技術では、双腕ロボットが試行錯誤をすることにより所定の動作を学習する。
【0003】
また、複数の腕部を有するロボットに対して動作を教示する際に、複数の腕部の各々毎に異なる教示者によって動作を教示する技術が知られている(例えば、非特許文献2を参照)。この技術では、教示者がロボットを遠隔操作することにより、ロボットに対して動作を教示させる。
【先行技術文献】
【非特許文献】
【0004】
Rohan Chitnis, Shubham Tulsiani, Saurabh Gupta, Abhinav Gupta, "Intrinsic Motivation for Encouraging Synergistic Behavior", ICLR 2020.
Albert Tung, Josiah Wong, Ajay Mandlekar, Roberto Martin, Yuke Zhu, Li Fei-Fei, Silvio Savarese, "Learning Multi-Arm Manipulation Through Collaborative Teleoperation", ICRA, 2021.
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、人間がロボットに対して動作を教示する際には、ロボットの動作に関する物理的な制約も考慮する必要がある。例えば、ロボットの可動域が人間の可動域とは異なる場合には、人間が簡単に行える動作であっても、ロボットはその動作を実行することができない場合もあり得る。また、例えば、双腕ロボットのように、ロボットの可動部位が複数である場合には、その複数の可動部位を協調動作させる必要がある。人間がロボットに対して動作を教示する際に、このような複数の可動部位を協調動作させつつ、動作を教示させることは難しい。
【0006】
このため、人間がロボットに対して動作を教示することは難しい、という課題がある。
【0007】
本開示は、上記の点に鑑みてなされたものであり、人間の動作データからロボットの動作データを簡易に生成することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本開示に係る学習済みモデル生成装置は、学習用の人間の動作データを含む学習用データを取得する学習用取得部と、前記学習用取得部により取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する学習部と、を含む学習済みモデル生成装置である。
【0009】
また、本開示の学習済みモデル生成方法は、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータが実行する学習済みモデル生成方法である。
【0010】
また、本開示の学習済みモデル生成プログラムは、学習用の人間の動作データを含む学習用データを取得し、取得された学習用データに基づいて、ジェネレータとディスクリミネータとを含む敵対的生成ネットワークモデルを機械学習させることにより、対象となる人間の動作を表す動作データが入力されると制御対象ロボットの動作データが出力される学習済みのジェネレータを生成する、処理をコンピュータに実行させるための学習済みモデル生成プログラムである。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
オムロン株式会社
電子部品
10日前
オムロン株式会社
検査装置、検査方法およびプログラム
4日前
オムロン株式会社
細胞培養計画作成装置及び細胞培養システム
11日前
オムロン株式会社
支援システム、支援方法および支援プログラム
10日前
オムロン株式会社
支援システム、支援方法および支援プログラム
10日前
オムロン株式会社
設計システム、設計プログラムおよび設計方法
10日前
オムロン株式会社
状態診断システム、状態診断システムの制御方法および状態診断システムの制御プログラム
3日前
オムロン株式会社
学習済みモデル生成装置、制御装置、学習済みモデル生成方法、及び学習済みモデル生成プログラム
3日前
オムロン株式会社
血圧計、血圧計測方法、血圧計測プログラム、学習モデルの構築方法及び学習モデルの構築プログラム
3日前
個人
物品
17日前
個人
認証システム
1か月前
個人
自動精算システム
10日前
個人
保証金管理システム
25日前
個人
鑑定証明システム
1か月前
個人
救急搬送システム
17日前
アズビル株式会社
防爆装置
2か月前
個人
人的価値発掘システム
1か月前
個人
業界地図作成システム
1か月前
キヤノン株式会社
印刷装置
10日前
個人
技術マッチングシステム
1か月前
株式会社MRC
集客システム
25日前
株式会社宗建
SNSサーバー
2か月前
キヤノン電子株式会社
情報処理装置
1か月前
個人
生成AIとの常時接続システム
17日前
個人
コンテンツ開示順位判定システム
12日前
株式会社SEKT
文字認識装置
6日前
株式会社COLORS
表示装置
11日前
ミサワホーム株式会社
管理装置
1か月前
キヤノン株式会社
印刷制御装置
1か月前
個人
未来型家系図構築システム
5日前
個人
配送システムおよび同包箱
1か月前
株式会社ネットブリッジ
展示販売装置
1か月前
トヨタ自動車株式会社
分析装置
25日前
トヨタ自動車株式会社
推定装置
3日前
キヤノン株式会社
印刷管理装置
23日前
ミサワホーム株式会社
システム
1か月前
続きを見る
他の特許を見る