TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025167844
公報種別
公開特許公報(A)
公開日
2025-11-07
出願番号
2024072801
出願日
2024-04-26
発明の名称
生産スケジューリング装置、生産スケジューリング方法および生産スケジューリングプログラム
出願人
アズビル株式会社
代理人
弁理士法人酒井国際特許事務所
主分類
G06N
3/092 20230101AFI20251030BHJP(計算;計数)
要約
【課題】強化学習を用いたスケジューリングを効率的に行うことができる。
【解決手段】行動選択モデルに基づき、生産スケジュールを立案する生産スケジューリング装置であって、生産スケジュールにおける行動を選択し、選択された行動が含まれる第1の経験データを、状態遷移を表す木構造情報として記憶する経験記憶部と、報酬関数が変更された場合、報酬関数と過去の経験データとを用いて、報酬を再計算する経験更新部と、経験更新部によって更新された報酬を含む第2の経験データを用いて、行動選択モデルのパラメータを更新する学習部とを備えることを特徴とする。
【選択図】図1
特許請求の範囲
【請求項1】
行動選択モデルに基づき、生産スケジュールを立案する生産スケジューリング装置であって、
前記生産スケジュールにおける行動を選択し、当該選択された行動が含まれる第1の経験データを、状態遷移を表す木構造情報として記憶する経験記憶部と、
報酬関数が変更された場合、当該報酬関数と過去の経験データとを用いて、報酬を再計算する経験更新部と、
前記経験更新部によって更新された報酬を含む第2の経験データを用いて、行動選択モデルのパラメータを更新する学習部と、
を備えることを特徴とする生産スケジューリング装置。
続きを表示(約 980 文字)
【請求項2】
更新前の前記行動選択モデルが前記生産スケジュールにおける行動を選択し、当該選択された行動が含まれる第3の経験データと、前記第2の経験データとを比較し、前記第3の経験データが含まれていない場合に、前記第2の経験データを前記第3の経験データで更新する環境部をさらに有し、
前記経験記憶部は、前記環境部により更新された前記第3の経験データを記憶し、
前記学習部は、前記経験記憶部によって記憶された前記第3の経験データを用いて、前記行動選択モデルのパラメータを更新する
ことを特徴とする請求項1に記載の生産スケジューリング装置。
【請求項3】
前記経験更新部は、エピソード終了状態の報酬と各途中状態の報酬を比較し、所定の条件に基づいて各途中状態の報酬を再計算する
ことを特徴とする請求項1に記載の生産スケジューリング装置。
【請求項4】
行動選択モデルに基づき、生産スケジュールを立案する生産スケジューリング方法であって、
前記生産スケジュールにおける行動を選択し、当該選択された行動が含まれる第1の経験データを、状態遷移を表す木構造情報として記憶する経験記憶工程と、
報酬関数が変更された場合、当該報酬関数と過去の経験データとを用いて、報酬を再計算する経験更新工程と、
前記経験更新工程によって更新された報酬を含む第2の経験データを用いて、行動選択モデルのパラメータを更新する学習工程と、
を含むことを特徴とする生産スケジューリング方法。
【請求項5】
行動選択モデルに基づき、生産スケジュールを立案する生産スケジューリングプログラムであって、
前記生産スケジュールにおける行動を選択し、当該選択された行動が含まれる第1の経験データを、状態遷移で表す木構造情報として記憶する経験記憶ステップと、
報酬関数が変更された場合、当該報酬関数と過去の経験データとを用いて、報酬を再計算する経験更新ステップと、
前記経験更新ステップによって更新された報酬を含む第2の経験データを用いて、行動選択モデルのパラメータを更新する学習ステップと、
をコンピュータに実行させることを特徴とする生産スケジューリングプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、生産スケジューリング装置、生産スケジューリング方法および生産スケジューリングプログラムに関する。
続きを表示(約 1,400 文字)
【背景技術】
【0002】
従来、生産現場のスケジューリングは、納期を厳守しつつ、生産性を高めるために、各機械における各製品の製造順序(以下、スケジュールということもある)を決定するために実行される。
【0003】
このような、生産現場でのスケジューリングは、解となる製造順序の総数が膨大になり、実時間で全通り探索できない場合がある。したがって、一般的には真の最適解を求めるための効率的なアルゴリズムが存在せず、近似的にできるだけ良い解を探索する近似解の探索技術として、メタヒューリスティック手法が利用されている。
【0004】
一方で、メタヒューリスティック手法も、在庫や注文等が変更される度に、別のスケジューリングとして、探索を行う必要があり、スケジューリングの作業効率を低下させている。
【0005】
近年では、生産現場のスケジューリング手法として、強化学習が用いられている(特許文献1)。強化学習は、報酬を示す報酬関数の定義に依存するところ、例えば、製品を生産し終わるまでの時間の最小化などの単目的の最適化を目的に学習をしていた。しかし、実際の生産現場において、強化学習は、製品を生産し終わるまでの時間を最小化するのに加えて労働安全衛生や事業計画などの多目的の最適化を目的に学習をする必要がある。
【先行技術文献】
【特許文献】
【0006】
特開2022-135909号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上記の従来技術では、強化学習を用いたスケジューリングを効率的に行うことが難しい場合がある。
【0008】
一般的に、強化学習は、報酬を示す報酬関数の定義に依存するところ、例えば、製品を生産し終わるまでの時間の最小化などの単目的の最適化を目的に学習をしていた。しかし、実際の生産現場において、強化学習は、製品を生産し終わるまでの時間を最小化するのに加えて労働安全衛生や事業計画などの多目的の最適化を目的に学習をする必要がある。
【0009】
例えば、多目的の最適化を目的に学習をする場合には、報酬を事前に定義することが難しく、人間が強化学習により出力されたスケジュールに基づいて、報酬関数の調整をする必要がある。しかし、従来、報酬関数の値を調整すると、変更された報酬関数以外の、状態、行動、行動後の状態を含めて学習をやり直すため学習に多大な時間を要していた。
【課題を解決するための手段】
【0010】
本発明に係る生産スケジューリング装置は、行動選択モデルに基づき、生産スケジュールを立案する生産スケジューリング装置であって、前記生産スケジュールにおける行動を選択し、当該選択された行動が含まれる第1の経験データを、状態遷移を表す木構造情報として記憶する経験記憶部と、報酬関数が変更された場合、当該報酬関数と過去の経験データとを用いて、報酬を再計算する経験更新部と、前記経験更新部によって更新された報酬を含む第2の経験データを用いて、行動選択モデルのパラメータを更新する学習部と、を備えることを特徴とする。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
アズビル株式会社
回転弁
2か月前
アズビル株式会社
圧力センサ
1か月前
アズビル株式会社
電磁流量計
1か月前
アズビル株式会社
無線式開度計
2か月前
アズビル株式会社
間欠動作制御回路
1か月前
アズビル株式会社
動粘度測定システム
1か月前
アズビル株式会社
位置計測装置および方法
1か月前
アズビル株式会社
制御装置および制御方法
1か月前
アズビル株式会社
熱式流量計および補正方法
1か月前
アズビル株式会社
処理装置及び物理量検出装置
2か月前
アズビル株式会社
情報処理システムおよび方法
1か月前
アズビル株式会社
換気制御装置及び換気制御方法
1か月前
アズビル株式会社
空調制御装置及び空調制御方法
1か月前
アズビル株式会社
ビル管理装置、及び、プログラム
1か月前
アズビル株式会社
情報処理装置および情報処理方法
1日前
アズビル株式会社
制御装置、制御方法及び制御システム
1日前
アズビル株式会社
ディスパッチ計画作成装置および方法
1か月前
アズビル株式会社
処理装置、処理方法、及び、プログラム
1か月前
アズビル株式会社
分割装置、分割方法、および分割プログラム
1か月前
アズビル株式会社
検索装置、検索方法、および検索プログラム
1か月前
アズビル株式会社
管理装置、管理方法、および管理プログラム
2か月前
アズビル株式会社
超音波流量計及び超音波流量計の取り付け方法
1か月前
アズビル株式会社
情報処理装置、情報処理方法及び情報処理プログラム
23日前
アズビル株式会社
電極材料選定装置および方法ならびに電極選定支援装置
1か月前
アズビル株式会社
情報処理装置、情報処理方法および情報処理プログラム
1か月前
アズビル株式会社
通信システム、受信装置、送信装置及び電波環境改善方法
2か月前
アズビル株式会社
直線変位検知システム、バルブポジショナ、バルブ開度計
3日前
アズビル株式会社
情報処理装置、情報処理システム、情報処理方法および情報処理プログラム
2か月前
アズビル株式会社
生産スケジューリング装置、生産スケジューリング方法および生産スケジューリングプログラム
22日前
個人
詐欺保険
1か月前
個人
縁伊達ポイン
1か月前
個人
5掛けポイント
22日前
個人
職業自動販売機
15日前
個人
RFタグシート
1か月前
個人
QRコードの彩色
1か月前
個人
地球保全システム
1か月前
続きを見る
他の特許を見る