TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024124173
公報種別公開特許公報(A)
公開日2024-09-12
出願番号2023032163
出願日2023-03-02
発明の名称制御対象に対するフィードフォワード制御に関する機械学習のための装置、教師データの生成プログラム、および教師データの生成方法
出願人オムロン株式会社
代理人弁理士法人深見特許事務所
主分類G05B 13/02 20060101AFI20240905BHJP(制御;調整)
要約【課題】制御対象に対するフィードフォワード制御の精度を向上させる。
【解決手段】装置100は、複数の第1組合せのうち、誤差eqと第1基準値との比較に基づいて、計測値doと操作量rとを含む複数の第2組合せをそれぞれ特定し、複数の第2組合せにそれぞれ含まれる複数の操作量rにおいて、第1要素dskに対応するための複数の第1成分rfと、第2要素dsuに対応するための複数の第2成分rbとをそれぞれ特定し、複数のタイミングにおける第2組合せにそれぞれ含まれる複数の計測値doに複数の第1成分rfを正解としてそれぞれ対応させた教師データDtを出力する。
【選択図】図1
特許請求の範囲【請求項1】
外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のための装置であって、
前記フィードバック操作量は、目標値と前記制御対象の制御量との誤差に基づいて、前記制御量が前記目標値に近づくように前記制御対象の制御装置のフィードバック制御によって決定され、
前記フィードバック操作量および前記フィードフォワード補償値の和が、操作量として前記制御対象に前記制御装置から出力され、
前記外乱は、第1要素と、第2要素とを含み、
前記予測モデルは、前記第1要素の計測値から前記フィードフォワード補償値を予測し、
前記装置は、学習データ生成部を備え、
前記学習データ生成部は、
複数のタイミングにおいて取得された、前記目標値と、前記目標値に対応する前記操作量と、前記計測値と、前記計測値および前記操作量の両方に対応する前記制御量とを含む複数の第1組合せのうち、前記誤差と第1基準値との比較に基づいて、前記計測値と前記操作量とを含む複数の第2組合せをそれぞれ特定し、
前記複数の第2組合せにそれぞれ含まれる複数の操作量において、前記第1要素に対応するための複数の第1成分と、前記第2要素に対応するための複数の第2成分とをそれぞれ特定し、
前記複数のタイミングにおける第2組合せにそれぞれ含まれる複数の計測値に前記複数の第1成分を正解としてそれぞれ対応させた教師データを出力する、装置。
続きを表示(約 1,700 文字)【請求項2】
前記教師データを用いて前記予測モデルに対して前記機械学習を行う学習部をさらに備え、
前記学習部は、
前記予測モデルによって表現される、前記複数の計測値と前記複数の第1成分との関係を、前記フィードフォワード補償値を目的変数とするとともに、前記計測値を説明変数とする関数として近似し、
前記複数の第1組合せのうち前記計測値の絶対値が第2基準値より大きい第3組合せの数に対する、前記複数の第2組合せのうち前記計測値の絶対値が前記第2基準値より大きい第4組合せの数の割合が第3基準値より大きい場合、前記機械学習を終了する、請求項1に記載の装置。
【請求項3】
前記学習部は、前記機械学習が終了し、かつ、前記割合が前記第3基準値より小さい場合、前記機械学習を再開する、請求項2に記載の装置。
【請求項4】
前記第2要素は、計測されない、請求項1~3のいずれか1項に記載の装置。
【請求項5】
外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のための教師データの生成プログラムであって、
前記フィードバック操作量は、目標値と前記制御対象の制御量との誤差に基づいて、前記制御量が前記目標値に近づくように前記制御対象の制御装置のフィードバック制御によって決定され、
前記フィードバック操作量および前記フィードフォワード補償値の和が、操作量として前記制御対象に前記制御装置から出力され、
前記外乱は、第1要素と、第2要素とを含み、
前記予測モデルは、前記第1要素の計測値から前記フィードフォワード補償値を予測し、
前記教師データの生成プログラムは、プロセッサに実行されることによって、
複数のタイミングにおいて取得された、前記目標値と、前記目標値に対応する前記操作量と、前記計測値と、前記計測値および前記操作量の両方に対応する前記制御量とを含む複数の第1組合せのうち、前記誤差と第1基準値との比較に基づいて、前記計測値と前記操作量とを含む複数の第2組合せをそれぞれ特定し、
前記複数の第2組合せにそれぞれ含まれる複数の操作量において、前記第1要素に対応するための複数の第1成分と、前記第2要素に対応するための複数の第2成分とをそれぞれ特定し、
前記複数のタイミングにおける第2組合せにそれぞれ含まれる複数の計測値に前記複数の第1成分を正解としてそれぞれ対応させた教師データを出力する、教師データの生成プログラム。
【請求項6】
外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のための教師データの生成方法であって、
前記フィードバック操作量は、目標値と前記制御対象の制御量との誤差に基づいて、前記制御量が前記目標値に近づくように前記制御対象の制御装置のフィードバック制御によって決定され、
前記フィードバック操作量および前記フィードフォワード補償値の和が、操作量として前記制御対象に前記制御装置から出力され、
前記外乱は、第1要素と、第2要素とを含み、
前記予測モデルは、前記第1要素の計測値から前記フィードフォワード補償値を予測し、
前記教師データの生成方法は、
複数のタイミングにおいて取得された、前記目標値と、前記目標値に対応する前記操作量と、前記計測値と、前記計測値および前記操作量の両方に対応する前記制御量とを含む複数の第1組合せのうち、前記誤差と第1基準値との比較に基づいて、前記計測値と前記操作量とを含む複数の第2組合せをそれぞれ特定することと、
前記複数の第2組合せにそれぞれ含まれる複数の操作量において、前記第1要素に対応するための複数の第1成分と、前記第2要素に対応するための複数の第2成分とをそれぞれ特定することと、
前記複数のタイミングにおける第2組合せにそれぞれ含まれる複数の計測値に前記複数の第1成分を正解としてそれぞれ対応させた教師データを出力することとを含む、教師データの生成方法。

発明の詳細な説明【技術分野】
【0001】
本開示は、制御対象に対するフィードフォワード制御に関する機械学習のための装置、教師データの生成プログラム、および教師データの生成方法に関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
従来、制御対象に対してフィードフォワード制御を行なう構成が知られている。たとえば、特開平4-326101号公報(特許文献1)には、被制御系に影響を及ぼす外乱を検出しその外乱検出値によってニューラルネットワーク型フィードフォワード補償器の自己学習を制御する外乱発生検知器を備えるニューラルネットワーク制御装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
特開平4-326101号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示されている構成においては、被制御系に影響を及ぼす外乱の検出値がニューラルネットワーク型フィードフォワード補償器の自己学習に使用される。この点、被制御系に影響を及ぼす外乱には、複数の要素が含まれる場合がある。これらをすべて検出することができない場合、外乱の検出値が用いられる自己学習によっては、検出されていない要素を含む外乱とフィードフォワード補償信号との正確な関係性を抽出することができない。その結果、ニューラルネットワーク型フィードフォワード補償器によるフィードフォワード補償信号の予測の精度が低下し得る。
【0005】
本開示は上記のような課題を解決するためになされたものであり、その目的は、制御対象に対するフィードフォワード制御の精度を向上させることである。
【課題を解決するための手段】
【0006】
本開示の一局面に係る装置は、外乱を受ける制御対象へのフィードバック操作量のフィードフォワード補償値を予測する予測モデルに対する機械学習のための装置である。フィードバック操作量は、目標値と制御対象の制御量との誤差に基づいて、制御量が目標値に近づくように制御対象の制御装置のフィードバック制御によって決定される。フィードバック操作量およびフィードフォワード補償値の和が、操作量として制御対象に制御装置から出力される。外乱は、第1要素と、第2要素とを含む。予測モデルは、第1要素の計測値からフィードフォワード補償値を予測する。装置は、学習データ生成部を備える。学習データ生成部は、複数のタイミングにおいて取得された、目標値と、目標値に対応する操作量と、計測値と、計測値および操作量の両方に対応する制御量とを含む複数の第1組合せのうち、誤差と第1基準値との比較に基づいて、計測値と操作量とを含む複数の第2組合せをそれぞれ特定し、複数の第2組合せにそれぞれ含まれる複数の操作量において、第1要素に対応するための複数の第1成分と、第2要素に対応するための複数の第2成分とをそれぞれ特定し、複数のタイミングにおける第2組合せにそれぞれ含まれる複数の計測値に複数の第1成分を正解としてそれぞれ対応させた教師データを出力する。
【0007】
この開示によれば、フィードフォワード制御の結果に含まれる操作量のうち、計測値に対応させるべき正解として、操作量そのものではなく、操作量のうちフィードフォワード制御が必要な計測要素に対応するための第1成分がフィードフォワード補償値として特定される。その結果、教師データにおいて計測値に対して適切な正解が関連付けられる。そのため、この開示によれば、教師データを用いて予測モデルに対して機械学習を行うことにより、制御対象に対するフィードフォワード制御の精度を向上させることができる。
【0008】
上記の開示において、装置は、教師データを用いて予測モデルに対して機械学習を行う学習部をさらに備える。学習部は、予測モデルによって表現される、複数の計測値と複数の第1成分との関係を、フィードフォワード補償値を目的変数とするとともに、計測値を説明変数とする関数として近似し、複数の第1組合せのうち計測値の絶対値が第2基準値より大きい第3組合せの数に対する、複数の第2組合せのうち計測値の絶対値が第2基準値より大きい第4組合せの数の割合が第3基準値より大きい場合、機械学習を終了する。
【0009】
この開示によれば、フィードフォワード制御の結果から教師データが選択されるため、フィードフォワード制御と並行して外乱および制御対象の特性に予測モデルをリアルタイムに適合させることができる。また、この開示によれば、予測モデルの精度が十分に高くなるまで機械学習が継続されるため、制御対象に対するフィードフォワード制御の精度を十分に向上させることができる。
【0010】
上記の開示において、学習部は、機械学習が終了し、かつ、上記割合が第3基準値より小さい場合、機械学習を再開してもよい。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

オムロン株式会社
端子台
7日前
オムロン株式会社
電気機器
今日
オムロン株式会社
ソケット
7日前
オムロン株式会社
検査装置
22日前
オムロン株式会社
電気機器
7日前
オムロン株式会社
電動把持工具
6日前
オムロン株式会社
充放電システム
今日
オムロン株式会社
トリガスイッチ
6日前
オムロン株式会社
自律作業システム
21日前
オムロン株式会社
経路情報提供システム
16日前
オムロン株式会社
検出装置および操作装置
20日前
オムロン株式会社
X線検査装置及びX線検査方法
6日前
オムロン株式会社
装置、温調システムおよび方法
28日前
オムロン株式会社
外観検査装置、及び外観検査方法
今日
オムロン株式会社
制御装置、制御方法及びプログラム
21日前
オムロン株式会社
情報処理装置、方法およびプログラム
17日前
オムロン株式会社
半導体モジュール及びサーボドライバ
23日前
オムロン株式会社
情報処理装置、方法およびプログラム
17日前
オムロン株式会社
電力変換装置及び直流電力供給システム
1か月前
オムロン株式会社
制御装置、制御方法、及び制御プログラム
7日前
オムロン株式会社
生成装置、生成方法、及び生成プログラム
17日前
オムロン株式会社
センサ装置及びセンサ装置を制御する方法
7日前
オムロン株式会社
動力伝達機構、関節機構及び多関節ロボット
7日前
オムロン株式会社
充放電コネクタ用ホルダ及び充放電システム
今日
オムロン株式会社
評価装置、評価方法、および評価プログラム
17日前
オムロン株式会社
コントローラ、制御方法および制御プログラム
24日前
オムロン株式会社
コントローラ、制御方法および制御プログラム
24日前
オムロン株式会社
制御装置、制御システム、方法およびプログラム
1か月前
オムロン株式会社
磁性体コア、コイル部品、及び非接触給電システム
10日前
オムロン株式会社
解析装置、情報処理方法および情報処理プログラム
13日前
オムロン株式会社
情報処理装置、情報処理方法及び情報処理プログラム
1か月前
オムロン株式会社
情報処理装置、情報処理方法及び情報処理プログラム
1か月前
オムロン株式会社
情報処理装置、情報処理方法、及び情報処理プログラム
10日前
オムロン株式会社
情報処理装置、情報処理方法、及び情報処理プログラム
1か月前
オムロン株式会社
情報処理装置、情報処理方法および情報処理プログラム
17日前
オムロン株式会社
硬貨処理装置、硬貨放出方法、および硬貨放出プログラム
22日前
続きを見る