TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025047148
公報種別
公開特許公報(A)
公開日
2025-04-03
出願番号
2023155467
出願日
2023-09-21
発明の名称
車両制御装置
出願人
株式会社アイシン
代理人
弁理士法人酒井国際特許事務所
主分類
B60W
30/00 20060101AFI20250326BHJP(車両一般)
要約
【課題】学習に多大な時間を要することなく、車両制御状態を人間の感覚に合わせて、確実に最適な車両制御状態に達すること。
【解決手段】車両制御装置は、車両の周辺を撮像した撮像画像と、前記車両の状態の検出値と、に基づいて、前記車両の特性を示す車両特性情報を求める車両特性算出部と、強化学習により最適な車両特性情報を求める学習部と、前記最適な車両特性情報に基づいて、前記車両を制御する制御部と、を備え、前記学習部は、前記撮像画像を入力して路面状況を含む出力値を出力する学習済みモデルである大規模言語モデルの出力値に対する所定の方策に基づいた行動に対して、前記車両の運転者または乗員若しくは第三者の感覚に基づいてフィードバックを行うフィードバック部と、前記フィードバックを反映して前記行動に対する報酬を算出して学習する報酬モデルと、前記最適な車両特性情報として前記報酬が最大となる車両特性情報を決定する決定部と、を備える。
【選択図】図4
特許請求の範囲
【請求項1】
車両の周辺を撮像した撮像画像と、前記車両の状態の検出値と、に基づいて、前記車両の特性を示す車両特性情報を求める車両特性算出部と、
強化学習により最適な車両特性情報を求める学習部と、
前記最適な車両特性情報に基づいて、前記車両を制御する制御部と、を備え、
前記学習部は、
前記撮像画像を入力して路面状況を含む出力値を出力する学習済みモデルである大規模言語モデルの出力値に対する所定の方策に基づいた行動に対して、前記車両の運転者または乗員若しくは第三者の感覚に基づいてフィードバックを行うフィードバック部と、
前記フィードバックを反映して前記行動に対する報酬を算出して学習する報酬モデルと、
前記最適な車両特性情報として前記報酬が最大となる車両特性情報を決定する決定部と、
を備える車両制御装置。
続きを表示(約 900 文字)
【請求項2】
前記フィードバック部は、さらに、前記車両の運転者または乗員若しくは第三者の生体の状態に関する生体情報を取得して、前記生体情報に基づいて、前記フィードバックを行う、
請求項1に記載の車両制御装置。
【請求項3】
前記決定部は、
前記出力値に対する所定の方策に基づいた前記車両特性情報に関する行動を出力するエージェントと、
前記行動を入力して、前記車両特性算出部に前記車両特性情報を算出させ、算出された
車両特性情報を状態として前記エージェントに出力する環境と、を備え、
前記学習部は、
前記フィードバック部からの前記フィードバックと前記エージェントで決定された行動との間の損失を算出する損失算出部、を更に備え、
前記報酬モデルは、前記損失算出部で算出された損失を反映させて前記報酬を算出し、算出した前記報酬を前記エージェントに出力し、
前記エージェントは、前記環境で算出された前記状態と、前記報酬モデルで算出された前記報酬とに基づいて、前記最適な車両特性情報を決定する、
請求項2に記載の車両制御装置。
【請求項4】
前記フィードバック部は、前記運転者または前記乗員若しくは前記第三者から、言葉の入力またはテキスト入力により、前記車両の乗り心地に関する情報を取得する、
請求項3に記載の車両制御装置。
【請求項5】
前記フィードバック部は、前記運転者または前記乗員若しくは前記第三者による所定の入力デバイスに対する操作入力により、前記車両の乗り心地に関する情報を取得する、
請求項3に記載の車両制御装置。
【請求項6】
前記生体情報は、脳波、心拍、脈拍、呼吸、瞬き、発汗の少なく一つに関する情報を含み、
前記フィードバック部は、前記生体情報が脳波を用いる場合に、前記車両の測定中に測定可能な生体情報と前記脳波との予め定めた関係に基づいて、前記脳波に基づく前記フィードバックを行う、
請求項3に記載の車両制御装置。
発明の詳細な説明
【技術分野】
【0001】
本発明は、車両制御装置に関する。
続きを表示(約 2,500 文字)
【背景技術】
【0002】
車両の走行中に、上下加速度センサや車高センサ等の種々の車載センサの検出値に基づいて、車両特性が最適となるように乗心地や操縦安定性等の各種デバイスの制御を行う車両制御装置が従来から知られている。このような車両制御装置では、強化学習を利用して、車両状態を最適に制御する技術が知られている。
【0003】
例えば、特許文献1の技術では、車両状態を最適に制御するために、プランナの行動(方策)を環境へ入力し、環境から得られる状態、報酬をプランナが受取り、次の行動(方策)を見直して、報酬の最適化を行うという強化学習の手法を採用している。また、特許文献2の技術では、乗員の生体信号を利用して強化学習を行って、車両状態を最適に制御するものである。
【先行技術文献】
【特許文献】
【0004】
特許第7048456号公報
特許第7011553号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、このような従来技術では、方策(ポリシー)ベースの強化学習により車両状態の最適化を行っているので、車両制御状態を人間の感覚に合わない場合がある。また、複数の制御デバイスを用いて多数のパラメータを必要とする場合には、データ数量が膨大となり、膨大なデータ量を用いた学習に多大な時間を要してしまう可能性がある。このため、従来技術では、車両状態の最適解に収束せずに、目標が未達成となってしまう場合もある。
【0006】
本発明は、上記に鑑みてなされたものであって、学習に多大な時間を要することなく、車両制御状態を人間の感覚に合わせて、確実に最適な車両制御状態に達することができる車両制御装置を提供することを目的の一つとする。
【課題を解決するための手段】
【0007】
本発明に係る車両制御装置は、車両の周辺を撮像した撮像画像と、前記車両の状態の検出値と、に基づいて、前記車両の特性を示す車両特性情報を求める車両特性算出部と、強化学習により最適な車両特性情報を求める学習部と、前記最適な車両特性情報に基づいて、前記車両を制御する制御部と、を備え、前記学習部は、前記撮像画像を入力して路面状況を含む出力値を出力する学習済みモデルである大規模言語モデルの出力値に対する所定の方策に基づいた行動に対して、前記車両の運転者または乗員若しくは第三者の感覚に基づいてフィードバックを行うフィードバック部と、前記フィードバックを反映して前記行動に対する報酬を算出して学習する報酬モデルと、前記最適な車両特性情報として前記報酬が最大となる車両特性情報を決定する決定部と、を備える。
【発明の効果】
【0008】
本発明に係る車両制御装置によれば、学習に多大な時間を要することなく、車両制御状態を人間の感覚に合わせて、確実に最適な車両制御状態に達することができる。
【図面の簡単な説明】
【0009】
図1は、実施形態にかかる車両制御装置が搭載された車両の上面図である。
図2は、実施形態にかかる車両制御装置が搭載された車両の車室内を上面から見た透視図である。
図3は、実施形態にかかる車両制御システムの全体構成の一例を示すブロック図である。
図4は、実施形態にかかる車両制御装置の機能構成の一例を示すブロック図である。
図5は、実施形態にかかる車両制御装置が、車両に加わる振動と、車両に対する乗員の振動とから、乗員に加わる振動を算出する例を示す図である。
図6は、実施形態にかかるインナカメラの撮像画像から推定可能な乗員の状態の幾つかの例を示す図である。
図7は、実施形態にかかる学習部の機能的構成の一例を示すブロック図である。
図8は、実施形態にかかるエージェントが得られる報酬の一例を示す図である。
図9は、実施形態にかかるヒューマンフィードバックの具体例を示す図である。
図10は、実施形態にかかる操作ボタンの入力によりヒューマンフィードバックを行う場合の画面の一例を示す図である。
図11は、実施形態にかかる操作ボタンの入力によりヒューマンフィードバックを行う場合の画面の他の一例を示す図である。
図12は、実施形態にかかる生体フィードバックの具体例を示す図である。
図13は、実施形態にかかる脳波の例を示す図である。
図14は、実施形態にかかる脳波と、走行中に測定可能な生体情報との関係の一例を示すグラフである。
図15は、実施形態にかかる車両制御処理の手順の一例を示すフローチャートである。
図16は、実施形態にかかる学習処理の手順の一例を示すフローチャートである。
図17は、実施形態にかかる学習処理の流れの具体例を示す図である。
図18は、実施形態における乗心地の指標(パラメータ)と制御電流の関係の一例を示すグラフである。
図19は、実施形態にかかる報酬モデルと方策の一例を示す図である。
図20は、実施形態において修正後のランクおよび確率に基づく報酬モデルと行動決定の方策の一例を示す図である。
図21は、実施形態におけるサスペンション41のばね上加速度の周波数に対する変化を示すグラフである。
【発明を実施するための形態】
【0010】
以下、本発明の例示的な実施形態が開示される。以下に示される実施形態の構成、ならびに当該構成によってもたらされる作用、結果、および効果は、一例である。本発明は、以下の実施形態に開示される構成以外によっても実現可能であるとともに、基本的な構成に基づく種々の効果や、派生的な効果のうち、少なくとも一つを得ることが可能である。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社アイシン
車両
2日前
株式会社アイシン
車両
2日前
株式会社アイシン
車両
1日前
株式会社アイシン
車両
1日前
株式会社アイシン
内燃機関
今日
株式会社アイシン
物体検出装置
5日前
株式会社アイシン
乗員検知装置
2日前
株式会社アイシン
マニホールド
今日
株式会社アイシン
車載充電装置
1日前
株式会社アイシン
車輪支持装置
1日前
株式会社アイシン
車載充電装置
2日前
株式会社アイシン
車両用駆動装置
今日
株式会社アイシン
バッテリケース
1日前
株式会社アイシン
車両用パーキング装置
1日前
株式会社アイシン
アクティブサスペンション
1日前
株式会社アイシン
車両用トルクベクタリング装置
1日前
株式会社アイシン
回転電機及び回転電機の製造方法
今日
トヨタ紡織株式会社
乗物用シート
今日
株式会社豊田中央研究所
位置推定装置、位置推定システム及びプログラム
今日
個人
飛行自動車
1か月前
日本精機株式会社
ケース
1日前
日本精機株式会社
表示装置
8日前
個人
アンチロール制御装置
15日前
日本精機株式会社
表示装置
28日前
日本精機株式会社
表示装置
28日前
井関農機株式会社
作業車両
2か月前
日本精機株式会社
表示装置
27日前
日本精機株式会社
照明装置
27日前
日本精機株式会社
表示装置
28日前
日本精機株式会社
表示装置
8日前
日本精機株式会社
表示装置
2か月前
個人
ブレーキシステム
6日前
株式会社松華
懸架装置
27日前
横浜ゴム株式会社
タイヤ
5日前
個人
自走式立体型洗車場
23日前
個人
ステージカー
27日前
続きを見る
他の特許を見る