特許ウォッチ

公開番号2024160826
公報種別公開特許公報(A)
公開日2024-11-15
出願番号2023076233
出願日2023-05-02
発明の名称モデル学習装置、制御装置、モデル学習方法、および、コンピュータプログラム
出願人株式会社豊田中央研究所,株式会社豊田自動織機
代理人個人,個人
主分類G05B 13/02 20060101AFI20241108BHJP(制御;調整)
要約【課題】システムにおける入力と出力との関係を表すモデルを学習するモデル学習装置において、システムを安定的に制御可能なモデルを学習することができる技術を提供する。
【解決手段】モデル学習装置は、入力変数vを用いて出力変数yを予測するための非線形の状態方程式の学習に用いられるモデルを記憶するモデル記憶部と、モデル記憶部に記憶されているモデルと、モデルに対する入力変数データと出力変数データの組を複数含んだ入出力データセットと、を用いて状態方程式を学習する学習部と、を備え、モデルは、入力変数vを入力とする全単射な写像Ψと、出力変数yを入力とする全単射な写像Φと、を含む状態方程式であり、写像Ψは、入力変数vの成分の少なくとも1つが0であるとき、出力成分の少なくとも1つが0となり、写像Φは、出力変数yの成分の少なくとも1つが0であるとき、出力成分の少なくとも1つが0となる。
【選択図】図1
特許請求の範囲【請求項１】
システムに入力される入力変数ｖ（ベクトル）と、前記システムから出力される出力変数ｙ（ベクトル）との関係を表すモデルを学習するモデル学習装置であって、
前記入力変数ｖを用いて前記出力変数ｙを予測するための非線形の状態方程式の学習に用いられるモデルを記憶するモデル記憶部と、
前記モデル記憶部に記憶されているモデルと、前記モデルに対する入力変数データと出力変数データの組を複数含んだ入出力データセットと、を用いて前記状態方程式を学習する学習部と、
を備え、
前記モデルは、前記入力変数ｖを入力とする全単射な写像Ψと、前記出力変数ｙを入力とする全単射な写像Φと、を含む状態方程式であり、
前記写像Ψは、前記入力変数ｖの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となり、
前記写像Φは、前記出力変数ｙの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となる、
モデル学習装置。
続きを表示（約 5,000 文字）【請求項２】
請求項１に記載のモデル学習装置であって、
前記モデルは、式（１）によって定義され、
前記写像Ψは、多層ニューラルネットワークを表す式（２）～式（４）によって定義され、
前記写像Φは、多層ニューラルネットワークを表す式（５）～式（７）によって定義される、
モデル学習装置。
TIFF
2024160826000084.tif
14
170
上記式（１）において、
等号の左辺は、前記出力変数ｙを表すｎ（ｎは整数）次元ベクトルの時間微分であり、
等号の右辺のうち、
前記入力変数ｖは、前記出力変数ｙの変化に影響を与える制御可能な入力を示すｎ次元ベクトルであり、
外生入力ｄは、前記出力変数ｙの変化に影響を与える制御不可能な入力を示すｐ（ｐは整数）次元ベクトルであり、
前記写像Ψは、前記入力変数ｖと前記外生入力ｄを入力としてｎ次元のベクトルを返す関数であって、かつ、前記入力変数ｖについて全単射な写像であり、
前記写像Φは、前記出力変数ｙと前記外生入力ｄを入力としてｎ次元のベクトルを返す関数であって、かつ、前記出力変数ｙについて全単射な写像であり、
関数Ａは、前記外生入力ｄを入力として、ｎ×ｎ行列を返す関数であり、
TIFF
2024160826000085.tif
10
170
TIFF
2024160826000086.tif
11
170
TIFF
2024160826000087.tif
9
170
上記式（２）～式（４）において、
添え字ｉは、多層ニューラルネットワークにおける層の番号を表し、
添え字Ｌ
Ψ
は、多層ニューラルネットワークの層数を表し、
重みＷ
Ψ
は、多層ニューラルネットワークにおける前記入力変数ｖの入力次元をｎ次元とする場合、ｎ×ｎ行列で表され、
バイアスｂ
Ψ
は、多層ニューラルネットワークにおける前記入力変数ｖの入力次元をｎ次元とする場合、ｎ次元ベクトルで表され、
活性化関数ψは、第一引数である、Ｗ
Ψ
(i)
（ｄ）ｙ
(i-1)
＋ｂ
Ψ
(i)
（ｄ）、または、ｂ
Ψ
(i)
（ｄ）について同相写像となるものであり、
TIFF
2024160826000088.tif
10
170
TIFF
2024160826000089.tif
12
170
TIFF
2024160826000090.tif
11
170
上記式（５）～式（７）において、
添え字ｉは、多層ニューラルネットワークにおける層の番号を表し、
添え字Ｌ
Φ
は、多層ニューラルネットワークの層数を表し、
重みＷ
Φ
は、多層ニューラルネットワークにおける前記出力変数ｙの入力次元をｎ次元とする場合、ｎ×ｎ行列で表され、
バイアスｂ
Φ
は、多層ニューラルネットワークにおける前記出力変数ｙの入力次元をｎ次元とする場合、ｎ次元ベクトルで表され、
活性化関数φは、第一引数である、Ｗ
Φ
(i)
（ｄ）ｙ
(i-1)
＋ｂ
Φ
(i)
（ｄ）、または、ｂ
Φ
(i)
（ｄ）について同相写像となるものである。
【請求項３】
請求項１に記載のモデル学習装置であって、
前記モデルは、式（１）によって定義され、
前記写像Ψは、中間層が式（９）および式（１０）の少なくとも一方によって表される多層ニューラルネットワークを表す式（８）～式（１１）によって定義され、
前記写像Φは、中間層が式（１３）および式（１４）の少なくとも一方によって表される多層ニューラルネットワークを表す式（１２）～式（１５）によって定義される、
モデル学習装置。
TIFF
2024160826000091.tif
13
170
上記式（１）において、
等号の左辺は、前記出力変数ｙを表すｎ（ｎは整数）次元ベクトルの時間微分であり、
等号の右辺のうち、
前記入力変数ｖは、前記出力変数ｙの変化に影響を与える制御可能な入力を示すｎ次元ベクトルであり、
外生入力ｄは、前記出力変数ｙの変化に影響を与える制御不可能な入力を示すｐ（ｐは整数）次元ベクトルであり、
前記写像Ψは、前記入力変数ｖと前記外生入力ｄを入力としてｎ次元のベクトルを返す関数であって、かつ、前記入力変数ｖについて全単射な写像であり、
前記写像Φは、前記出力変数ｙと前記外生入力ｄを入力としてｎ次元のベクトルを返す関数であって、かつ、前記出力変数ｙについて全単射な写像であり、
関数Ａは、前記外生入力ｄを入力として、ｎ×ｎ行列を返す関数であり、
TIFF
2024160826000092.tif
17
170
TIFF
2024160826000093.tif
21
170
TIFF
2024160826000094.tif
21
170
TIFF
2024160826000095.tif
13
170
上記式（８）～式（１１）において、
添え字ｉは、多層ニューラルネットワークにおける層の番号を表し、
添え字Ｌ
Ψ
は、多層ニューラルネットワークの層数を表し、
前記入力変数ｖをｎ
a
（ｎ
a
は整数）次元の入力変数ｖ
a
とｎ
b
（ｎ
b
は整数）次元の入力変数ｖ
b
とに分割した場合、
重みＷ
Ψa
は、ｎ
a
×ｎ
a
次元行列であり、
バイアスｂ
Ψa
は、ｎ
a
次元ベクトルであり、
重みＷ
Ψb
は、ｎ
a
×ｎ
b
次元行列であり、
バイアスｂ
Ψb
は、ｎ
b
次元ベクトルであり、
活性化関数ψは、第一引数である、Ｗ
Ψa
(i)
（ｄ）ｖ
a
(i-1)
＋ｂ
Ψa
(i)
、ｂ
Ψa
(i)
、または、Ｗ
Ψb
(i)
（ｄ）ｖ
b
(i-1)
＋ｂ
【請求項４】
請求項２または請求項３に記載のモデル学習装置であって、
前記学習部は、前記式（１）において、内部変数ｕを用いた式（１６）で前記写像Ψを定義し、内部変数ｘを用いた式（１７）で前記写像Φを定義することで、式（１８）によって定義される前記状態方程式を学習する、
モデル学習装置。
TIFF
2024160826000100.tif
11
170
TIFF
2024160826000101.tif
9
170
TIFF
2024160826000102.tif
10
170
【請求項５】
請求項４に記載のモデル学習装置であって、
前記学習部は、式（１６）を離散時刻ｋの時間ステップで離散化した式（１９）とし、式（１７）を離散時刻ｋの時間ステップで離散化した式（２０）とすることで、式（１８）を離散時刻ｋの時間ステップで離散化した式（２１）に示す状態方程式を学習する、
モデル学習装置。
TIFF
2024160826000103.tif
9
170
TIFF
2024160826000104.tif
10
170
TIFF
2024160826000105.tif
10
170
上記式（２１）において、関数Ａ´は、前記関数Ａと同次元の行列である。
【請求項６】
請求項２または請求項３に記載のモデル学習装置であって、
前記学習部は、
前記モデルに対して、前記入出力データセットのうちの前記入力変数データのセットを与えて出力を推定し、
推定された出力と、前記入出力データセットのうちの前記出力変数データのセットと、の一致度を評価し、
評価の結果に応じて前記モデルの学習パラメータを更新することで、前記状態方程式を学習する、
モデル学習装置。
【請求項７】
システムを制御する制御装置であって、
請求項１から請求項３のいずれか一項に記載のモデル学習装置と、
前記学習部が学習した前記状態方程式を用いて、前記出力変数ｙの目標値に対応する前記入力変数ｖの目標値を決定する決定部と、
前記決定部によって決定される前記入力変数ｖの目標値を入力することで前記システムを制御する制御部と、を備える、
制御装置。
【請求項８】
システムに入力される入力変数ｖ（ベクトル）と、前記システムから出力される出力変数ｙ（ベクトル）との関係を表すモデルをモデル学習装置によって学習するモデル学習方法であって、
前記入力変数ｖを用いて前記出力変数ｙを予測するための非線形の状態方程式の学習に用いられるモデルを取得する取得工程と、
前記取得工程において取得した前記モデルと、前記モデルに対する入力変数データと出力変数データの組を複数含んだ入出力データセットと、を用いて前記状態方程式を学習する学習工程と、
を備え、
前記モデルは、前記入力変数ｖを入力とする全単射な写像Ψと、前記出力変数ｙを入力とする全単射な写像Φと、を含む状態方程式であり、
前記写像Ψは、前記入力変数ｖの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となり、
前記写像Φは、前記出力変数ｙの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となる、
モデル学習方法。
【請求項９】
システムに入力される入力変数ｖ（ベクトル）と、前記システムから出力される出力変数ｙ（ベクトル）との関係を表すモデルの学習を情報処理装置に実行させるコンピュータプログラムであって、
前記入力変数ｖを用いて前記出力変数ｙを予測するための非線形の状態方程式の学習に用いられるモデルを取得する取得機能と、
前記取得機能によって取得する前記モデルと、前記モデルに対する入力変数データと出力変数データの組を複数含んだ入出力データセットと、を用いて前記状態方程式を学習す
る学習機能と、を前記情報処理装置に実行させ、
前記モデルは、前記入力変数ｖを入力とする全単射な写像Ψと、前記出力変数ｙを入力とする全単射な写像Φと、を含む状態方程式であり、
前記写像Ψは、前記入力変数ｖの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となり、
前記写像Φは、前記出力変数ｙの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となる、
コンピュータプログラム。

発明の詳細な説明【技術分野】
【０００１】
本発明は、モデル学習装置、制御装置、モデル学習方法、および、コンピュータプログラムに関する。
続きを表示（約 5,700 文字）【背景技術】
【０００２】
従来から、システムを制御するための入力と、この入力に対するシステムからの出力との関係を表すモデルを学習するモデル学習装置が知られている。例えば、特許文献１には、出力が所定の領域内におさまるように、入力を変換する全単射な写像を含むモデルを学習する技術が開示されている。特許文献２には、入出力を変換する２つの全単射な写像と線形の動的方程式とを含むモデルを学習するモデル学習装置が開示されている。
【先行技術文献】
【特許文献】
【０００３】
特開２０２２－０１６７０９号公報
特開２０２１－１８９９３４号公報
【発明の概要】
【発明が解決しようとする課題】
【０００４】
しかしながら、上述したような先行技術によっても、モデル学習装置において、システムを安定的に制御可能なモデルを学習する技術については、なお改善の余地があった。例えば、特許文献１と特許文献２とのいずれにも、モデル学習装置が学習するモデルに含まれる全単射な写像が、入力成分が０であったときに対応する出力成分の値が０となることは、記載されていない。このため、特許文献１に記載のモデル学習装置によって学習されるモデル、および、特許文献２に記載のモデル学習装置によって学習されるモデルでは、入力成分が０になっても対応する出力成分が０とならないおそれがある。このようなモデルを用いてシステムを制御すると、システムが不安定になるおそれがある。
【０００５】
本発明は、上述した課題を解決するためになされたものであり、システムにおける入力と出力との関係を表すモデルを学習するモデル学習装置において、システムを安定的に制御可能なモデルを学習することができる技術を提供することを目的とする。
【課題を解決するための手段】
【０００６】
本発明は、上述の課題を解決するためになされたものであり、以下の形態として実現できる。
【０００７】
（１）本発明の一形態によれば、システムに入力される入力変数ｖ（ベクトル）と、前記システムから出力される出力変数ｙ（ベクトル）との関係を表すモデルを学習するモデル学習装置が提供される。このモデル学習装置は、前記入力変数ｖを用いて前記出力変数ｙを予測するための非線形の状態方程式の学習に用いられるモデルを記憶するモデル記憶部と、前記モデル記憶部に記憶されているモデルと、前記モデルに対する入力変数データと出力変数データの組を複数含んだ入出力データセットと、を用いて前記状態方程式を学習する学習部と、を備え、前記モデルは、前記入力変数ｖを入力とする全単射な写像Ψと、前記出力変数ｙを入力とする全単射な写像Φと、を含む状態方程式であり、前記写像Ψは、前記入力変数ｖの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となり、前記写像Φは、前記出力変数ｙの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となる。
【０００８】
この構成によれば、モデルは、システムに入力される入力変数ｖを入力とする全単射な写像Ψと、システムから出力される出力変数ｙを入力とする全単射な写像Φと、を含む状態方程式である。このような状態方程式は、写像Ψ，Φのそれぞれを内部変数とすることで、線形化することができるため、非線形な構造をしているモデルであっても、出力の目標を達成する最適な入力を求める最適制御問題の解が一意であることを保証することができる。また、写像Ψは、入力変数ｖの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となり、写像Φは、出力変数ｙの成分の少なくとも１つが０であるとき、出力成分の少なくとも１つが０となる。これにより、写像Ψ，Φのそれぞれを含む状態方程式は、特定の入力成分が０となったときに、対応する出力成分が０となることが保証される。したがって、モデル学習装置は、システムを安定的に制御可能なモデルを学習することができる。
【０００９】
（２）上記形態のモデル学習装置において、前記モデルは、式（１）によって定義され、前記写像Ψは、多層ニューラルネットワークを表す式（２）～式（４）によって定義され、前記写像Φは、多層ニューラルネットワークを表す式（５）～式（７）によって定義されてもよい。
TIFF
2024160826000002.tif
15
170
上記式（１）において、等号の左辺は、前記出力変数ｙを表すｎ（ｎは整数）次元ベクトルの時間微分であり、等号の右辺のうち、前記入力変数ｖは、前記出力変数ｙの変化に影響を与える制御可能な入力を示すｎ次元ベクトルであり、外生入力ｄは、前記出力変数ｙの変化に影響を与える制御不可能な入力を示すｐ（ｐは整数）次元ベクトルであり、前記写像Ψは、前記入力変数ｖと前記外生入力ｄを入力としてｎ次元のベクトルを返す関数であって、かつ、前記入力変数ｖについて全単射な写像であり、前記写像Φは、前記出力変数ｙと前記外生入力ｄを入力としてｎ次元のベクトルを返す関数であって、かつ、前記出力変数ｙについて全単射な写像であり、関数Ａは、前記外生入力ｄを入力として、ｎ×ｎ行列を返す関数である。
TIFF
2024160826000003.tif
12
170
TIFF
2024160826000004.tif
15
170
TIFF
2024160826000005.tif
11
170
上記式（２）～式（４）において、添え字ｉは、多層ニューラルネットワークにおける層の番号を表し、添え字Ｌ
Ψ
は、多層ニューラルネットワークの層数を表し、重みＷ
Ψ
は、多層ニューラルネットワークにおける前記入力変数ｖの入力次元をｎ次元とする場合、ｎ×ｎ行列で表され、バイアスｂ
Ψ
は、多層ニューラルネットワークにおける前記入力変数ｖの入力次元をｎ次元とする場合、ｎ次元ベクトルで表され、活性化関数ψは、第一引数である、Ｗ
Ψ
(i)
（ｄ）ｙ
(i-1)
＋ｂ
Ψ
(i)
（ｄ）、または、ｂ
Ψ
(i)
（ｄ）について同相写像となるものである。
TIFF
2024160826000006.tif
11
170
TIFF
2024160826000007.tif
14
170
TIFF
2024160826000008.tif
12
170
上記式（５）～式（７）において、添え字ｉは、多層ニューラルネットワークにおける層の番号を表し、添え字Ｌ
Φ
は、多層ニューラルネットワークの層数を表し、重みＷ
Φ
は、多層ニューラルネットワークにおける前記出力変数ｙの入力次元をｎ次元とする場合、ｎ×ｎ行列で表され、バイアスｂ
Φ
は、多層ニューラルネットワークにおける前記出力変数ｙの入力次元をｎ次元とする場合、ｎ次元ベクトルで表され、活性化関数φは、第一引数である、Ｗ
Φ
(i)
（ｄ）ｙ
(i-1)
＋ｂ
Φ
(i)
（ｄ）、または、ｂ
Φ
(i)
（ｄ）について同相写像となるものである。この構成によれば、式（１）のモデルに含まれる写像Ψ、Φのそれぞれには、出力変数ｙの変化に影響を与える制御不可能な入力である外生入力ｄが含まれている。これにより、式（１）のモデルは、制御不可能な外生入力ｄによる影響も考慮した状態方程式となるため、このようなモデルを用いることで、システムの将来の状態を高精度に予測することができる。また、式（２）～式（４）によって定義される多層ニューラルネットワークによって表される写像Ψは、多層ニューラルネットワークの中間層を表す式（３）において、入力変数ｖ
(i-1)
が０になると、入力変数ｖ
(i)
も０となる。すなわち、写像Ψの出力も０となる。また、式（５）～式（７）によって定義される多層ニューラルネットワークによって表される写像Φは、多層ニューラルネットワークの中間層を表す式（６）において、出力変数ｙ
(i-1)
が０になると、出力変数ｙ
(i)
も０となる。すなわち、写像Φの出力も０となる。式（１）のモデルは、式（２）～式（４）によって表される写像Ψと、式（５）～式（７）によって表される写像Φとを含むため、特定の入力変数が０となったときに、対応する出力変数が０となることが保証される。したがって、モデル学習装置は、システムを安定的に制御可能なモデルを学習することができる。
【００１０】
（３）上記形態のモデル学習装置において、前記モデルは、式（１）によって定義され、前記写像Ψは、中間層が式（９）および式（１０）の少なくとも一方によって表される多層ニューラルネットワークを表す式（８）～式（１１）によって定義され、前記写像Φは、中間層が式（１３）および式（１４）の少なくとも一方によって表される多層ニューラルネットワークを表す式（１２）～式（１５）によって定義されてもよい。
TIFF
2024160826000009.tif
14
170
上記式（１）において、等号の左辺は、前記出力変数ｙを表すｎ（ｎは整数）次元ベクトルの時間微分であり、等号の右辺のうち、前記入力変数ｖは、前記出力変数ｙの変化に影響を与える制御可能な入力を示すｎ次元ベクトルであり、外生入力ｄは、前記出力変数ｙの変化に影響を与える制御不可能な入力を示すｐ（ｐは整数）次元ベクトルであり、前記写像Ψは、前記入力変数ｖと前記外生入力ｄを入力としてｎ次元のベクトルを返す関数であって、かつ、前記入力変数ｖについて全単射な写像であり、前記写像Φは、前記出力変数ｙと前記外生入力ｄを入力としてｎ次元のベクトルを返す関数であって、かつ、前記出力変数ｙについて全単射な写像であり、関数Ａは、前記外生入力ｄを入力として、ｎ×
ｎ行列を返す関数である。
TIFF
2024160826000010.tif
17
170
TIFF
2024160826000011.tif
23
170
TIFF
2024160826000012.tif
22
170
TIFF
2024160826000013.tif
14
170
上記式（８）～式（１１）において、添え字ｉは、多層ニューラルネットワークにおける層の番号を表し、添え字Ｌ
Ψ
は、多層ニューラルネットワークの層数を表し、前記入力変数ｖをｎ
a
（ｎ
a
は整数）次元の入力変数ｖ
a
とｎ
b
（ｎ
b
は整数）次元の入力変数ｖ
b
とに分割した場合、重みＷ
Ψa
は、ｎ
a
×ｎ
a
次元行列であり、バイアスｂ
Ψa
は、ｎ
a
次元ベクトルであり、重みＷ
Ψb
は、ｎ
a
×ｎ
b
次元行列であり、バイアスｂ
Ψb
は、ｎ
b
次元ベクトルであり、活性化関数ψは、第一引数である、Ｗ
Ψa
(i)
（ｄ）ｖ
a
(i-1)
＋ｂ
Ψa
(i)
、ｂ
Ψa
(i)
、または、Ｗ
Ψb
(i)
（ｄ）ｖ
b
(i-1)
＋ｂ
Ψb
(i)
について同相写像となるものであり、関数ｆ
Ψ+
は、任意の正値関数（正の値を返す関数）であり、関数ｆ
Ψ
は、任意の関数である。
TIFF
2024160826000014.tif
20
170
TIFF
2024160826000015.tif
22
170
TIFF
2024160826000016.tif
23
170
TIFF
2024160826000017.tif
16
170
上記式（１２）～式（１５）において、添え字ｉは、多層ニューラルネットワークにおける層の番号を表し、添え字Ｌ
Φ
は、多層ニューラルネットワークの層数を表し、前記出力変数ｙをｎ
c
（ｎ
c
は整数）次元の出力変数ｙ
c
とｎ
d
（ｎ
d
は整数）次元の出力変数ｙ
d
とに分割した場合、重みＷ
Φc
は、ｎ
c
×ｎ
c
次元行列であり、バイアスｂ
Φc
は、ｎ
c
（【００１１】以降は省略されています）

関連特許