TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024071272
公報種別公開特許公報(A)
公開日2024-05-24
出願番号2022182126
出願日2022-11-14
発明の名称情報処理装置
出願人日本電気株式会社
代理人弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
主分類B25J 13/00 20060101AFI20240517BHJP(手工具;可搬型動力工具;手工具用の柄;作業場設備;マニプレータ)
要約【課題】制御対象に対する制御計画の評価として、長期的な影響を考慮した計画列の評価を行うことのできる技術を提供する。
【解決手段】情報処理装置(1)は、制御対象及び環境の少なくともいずれかの状態を示す状態情報と、当該制御対象に対する制御計画の時系列である計画列とを取得する取得部(11)と、前記状態情報と前記計画列とを学習済モデルに入力して得られる出力を用いて、予測される未来の状態を示す状態情報の時系列である状態列を生成する生成部(12)と、前記状態列を用いて前記取得手段が取得した計画列の成功確率を算出する算出部(13)と、を備える。
【選択図】図1
特許請求の範囲【請求項1】
制御対象及び環境の少なくともいずれかの状態を示す状態情報と、当該制御対象に対する制御計画の時系列である計画列とを取得する取得手段と、
前記状態情報と前記計画列とを学習済モデルに入力して得られる出力を用いて、予測される未来の状態を示す状態情報の時系列である状態列を生成する生成手段と、
前記状態列を用いて前記取得手段が取得した計画列の成功確率を算出する算出手段と、
を備える情報処理装置。
続きを表示(約 1,300 文字)【請求項2】
前記算出手段は、前記状態列と機械学習により生成された第2の学習済モデルとを用いて、前記取得手段が取得した計画列の成功確率を算出する、
請求項1に記載の情報処理装置。
【請求項3】
前記算出手段は、前記状態列に含まれる最後尾の状態情報を前記第2の学習済モデルに入力することにより前記成功確率を算出する、
請求項2に記載の情報処理装置。
【請求項4】
前記算出手段は、
前記状態列に含まれる状態情報を、前記第2の学習済モデルに入力することにより前記状態情報のそれぞれの成功確率を算出し、
算出した前記状態情報毎の成功確率の統計結果に基づき、前記計画列の成功確率を算出する、
請求項2に記載の情報処理装置。
【請求項5】
前記算出手段は、
前記状態列に含まれる状態情報である状態ベクトルの平均ベクトルを算出し、
算出した平均ベクトルを第2の学習済モデルに入力することにより前記成功確率を算出する、
請求項2に記載の情報処理装置。
【請求項6】
前記状態情報は、画像から得られる特徴量、ロボットアームの関節角度、並びに画像中の物体の位置及び姿勢、の少なくともいずれかを示す情報を含む、
請求項1又は2に記載の情報処理装置。
【請求項7】
前記制御計画は、複数の行動クラスを含む行動クラス群から選択された行動クラス、及びロボット関節への入力値、の少なくともいずれかを含む、
請求項1又は2に記載の情報処理装置。
【請求項8】
前記制御計画は、前記環境の状態を示す情報を含む、
請求項1又は2に記載の情報処理装置。
【請求項9】
(i)制御対象に対する制御計画の時系列である計画列、並びに、当該計画列に含まれる各制御計画の実行により得られた、当該制御対象及び環境の少なくともいずれかの状態を示す状態情報の列である状態列と、(ii)当該計画列に含まれる各制御計画の実行により当該制御対象によるタスクが成功したか否かを示すラベルと、の組を含む訓練データを取得する取得手段と、
前記訓練データを用いた教師あり学習により、制御対象に対する制御計画の時系列である計画列の成功確率を出力する学習済モデルを生成する生成手段と、
を備える情報処理装置。
【請求項10】
(i)第1の制御対象及び環境の少なくともいずれかの状態を示す第1の状態情報、及び当該第1の制御対象に対する制御計画の時系列である計画列と、(ii)当該計画列に含まれる各制御計画の実行により得られた第2の状態情報と、を含む訓練データを取得する取得手段と、
第2の制御対象に対する制御計画と、当該制御計画が実行される前の当該第2の制御対象及び環境の少なくともいずれかの状態を示す第3の状態情報とを入力とし、当該第3の状態情報の遷移後の状態を示す第4の状態情報であって当該制御計画の時系列である計画列の成功確率の算出処理に用いられる第4の状態情報を出力とする学習済モデルを、前記訓練データを用いた教師あり学習により生成する生成手段と、
を備える情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、制御対象に対する制御計画を生成するための技術に関する。
続きを表示(約 2,300 文字)【背景技術】
【0002】
TAMP(Task and Motion Planning)と最適制御とを用いて、複雑で長期的なタスクをロボットアームで実行する計画を生成する技術が提案されている。このような技術では計画の成功率を高めるために制約条件を人手で設計する必要があるが、必要な制約条件を網羅することは困難であり、また、制約条件の不足により実現不可能な計画を立ててしまう場合もある。そこで、制約条件の設計を行うことなく計画案を生成する技術として、例えば非特許文献1には、ランダムサンプリングしたロボットモーターへの複数の入力値のなかで、初期画像及び現在の画像と共にニューラルネットワークに入力したときに、このニューラルネットワークの出力値(計画の成功確率)が高くなる入力値を採用し、これを繰り返すことで、ロボットの行動を実施することが記載されている。
【先行技術文献】
【非特許文献】
【0003】
Levine, Sergey, et al., "Learning hand-eye coordination for robotic grasping with deep learning and large-scale data collection", The International journal of robotics research 37.4-5 (2018): 421-436
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、非特許文献1に記載の技術では、1時刻分の情報(現在の画像)のみしか考慮しておらず、長期的な影響を考慮できないという問題がある。
【0005】
本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的の一例は、制御対象に対する制御計画の評価として、長期的な影響を考慮した計画列の評価を行うことのできる技術を提供することである。
【課題を解決するための手段】
【0006】
本発明の一態様に係る情報処理装置は、制御対象及び環境の少なくともいずれかの状態を示す状態情報と、当該制御対象に対する制御計画の時系列である計画列とを取得する取得手段と、前記状態情報と前記計画列とを学習済モデルに入力して得られる出力を用いて、予測される未来の状態を示す状態情報の時系列である状態列を生成する生成手段と、前記状態列を用いて前記取得手段が取得した計画列の成功確率を算出する算出手段と、を備える。
【0007】
また、本発明の一態様に係る情報処理装置は、(i)第1の制御対象及び環境の少なくともいずれかの状態を示す第1の状態情報、及び当該第1の制御対象に対する制御計画の時系列である計画列と、(ii)当該計画列に含まれる各制御計画の実行により得られた第2の状態情報と、を含む訓練データを取得する取得手段と、第2の制御対象に対する制御計画と、当該制御計画が実行される前の当該第2の制御対象及び環境の少なくともいずれかの状態を示す第3の状態情報とを入力とし、当該第3の状態情報の遷移後の状態を示す第4の状態情報であって当該制御計画の時系列である計画列の成功確率の算出処理に用いられる第4の状態情報を出力とする学習済モデルを、前記訓練データを用いた教師あり学習により生成する生成手段と、を備える。
【0008】
また、本発明の一態様に係る情報処理装置は、少なくとも1つのプロセッサが、制御対象及び環境の少なくともいずれかの状態を示す状態情報と、当該制御対象に対する制御計画の時系列である計画列とを取得することと、前記状態情報と前記計画列とを学習済モデルに入力して得られる出力を用いて、予測される未来の状態を示す状態情報の時系列である状態列を生成することと、前記状態列を用いて前記計画列の成功確率を算出することと、を含む。
【0009】
また、本発明の一態様に係る情報処理方法は、少なくとも1つのプロセッサが、(i)制御対象に対する制御計画の時系列である計画列、並びに、当該計画列に含まれる各制御計画の実行により得られた、当該制御対象及び環境の少なくともいずれかの状態を示す状態情報の列である状態列と、(ii)当該計画列に含まれる各制御計画の実行により当該制御対象によるタスクが成功したか否かを示すラベルと、の組を含む訓練データを取得することと、前記訓練データを用いた教師あり学習により、制御対象に対する制御計画の時系列である計画列の成功確率を出力する学習済モデルを生成することと、を含む。
【0010】
また、本発明の一態様に係る情報処理方法は、少なくとも1つのプロセッサが、(i)第1の制御対象及び環境の少なくともいずれかの状態を示す第1の状態情報、及び当該第1の制御対象に対する制御計画の時系列である計画列と、(ii)当該計画列に含まれる各制御計画の実行により得られた第2の状態情報と、を含む訓練データを取得することと、
第2の制御対象に対する制御計画と、当該制御計画が実行される前の当該第2の制御対象及び環境の少なくともいずれかの状態を示す第3の状態情報とを入力とし、当該第3の状態情報の遷移後の状態を示す第4の状態情報であって当該制御計画の時系列である計画列の成功確率の算出処理に用いられる第4の状態情報を出力とする学習済モデルを、前記訓練データを用いた教師あり学習により生成することと、を含む。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

日本電気株式会社
プログラム制御装置、プログラム制御方法およびプログラム制御プログラム
今日
個人
ねじ締め装置
6か月前
日東精工株式会社
搬送装置
2か月前
中国電力株式会社
腰袋
22日前
株式会社ツノダ
挟持工具
3か月前
株式会社ツノダ
挟持工具
2か月前
川崎重工業株式会社
ハンド
3か月前
株式会社右川ゴム製造所
把持装置
2か月前
個人
ロボットシステム
6か月前
株式会社不二越
ロボット
5か月前
川崎重工業株式会社
罫書用治具
3日前
学校法人立命館
グリッパ
3か月前
株式会社マキタ
動力工具
17日前
トヨタ自動車株式会社
関節機構
6か月前
学校法人立命館
ロボットハンド
3か月前
トヨタ自動車株式会社
関節機構
6か月前
株式会社ダイヘン
搬送装置
21日前
株式会社ダイヘン
搬送装置
21日前
個人
プーリーキー抜き治具
3か月前
CKD株式会社
電動把持装置
1か月前
東京都公立大学法人
ロボットハンド
1か月前
株式会社不二越
予測システム
3か月前
宮川工機株式会社
板状部品移動装置
27日前
国立大学法人山形大学
二重関節機構
17日前
株式会社ダイヘン
画像生成装置
2か月前
株式会社ダイヘン
情報処理装置
2か月前
工機ホールディングス株式会社
作業機
3か月前
株式会社ダイヘン
画像生成装置
2か月前
個人
スロープバリビス-ビス&-ドライバー
1か月前
工機ホールディングス株式会社
作業機
3か月前
株式会社中村製作所
トルクドライバー
3か月前
株式会社共和製作所
ロボット用アーム
1か月前
工機ホールディングス株式会社
作業機
4か月前
工機ホールディングス株式会社
作業機
3か月前
工機ホールディングス株式会社
作業機
4か月前
工機ホールディングス株式会社
作業機
2日前
続きを見る