TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025170923
公報種別
公開特許公報(A)
公開日
2025-11-20
出願番号
2024075789
出願日
2024-05-08
発明の名称
計算機システム及び機械学習モデルの特徴量の選択方法
出願人
株式会社日立製作所
代理人
藤央弁理士法人
主分類
G06N
20/00 20190101AFI20251113BHJP(計算;計数)
要約
【課題】ユーザの特徴量の選択基準に関する知識を考慮して、機械学習モデルの特徴量を選択する。
【解決手段】計算機システムは、学習データを格納するデータベースを管理する。学習データは、機械学習モデルを適用する系から取得され、特徴量として選択可能な複数の項目の値を含むデータと、機械学習モデルの出力に対応する値とを含む。計算機システムは、ユーザから前記項目の選択基準に関する知識を取得し、学習データを用いて項目の重要度を分析し、項目を特徴量として選択するための指標である優先度を設定し、知識に基づいて、項目の優先度を更新し、項目の優先度に基づいて、所定の数の項目を候補特徴量として選択し、候補特徴量の中から採用する特徴量を探索する。
【選択図】 図1
特許請求の範囲
【請求項1】
機械学習モデルの特徴量を選択する計算機システムであって、
演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続される通信装置を有する計算機を備え、
学習データを格納するデータベースを管理し、
前記学習データは、前記機械学習モデルを適用する系から取得され、前記特徴量として選択可能な複数の項目の値を含むデータと、前記機械学習モデルの出力に対応する値とを含み、
前記演算装置は、
ユーザから前記項目の選択基準に関する知識を取得する第1処理と、
前記学習データを用いて前記複数の項目の重要度を分析し、前記分析の結果に基づいて、前記項目を前記特徴量として選択するための指標である優先度を、前記複数の項目に設定する第2処理と、
前記知識に基づいて、前記複数の項目の前記優先度を更新する第3処理と、
前記複数の項目の前記優先度に基づいて、所定の数の前記項目を候補特徴量として選択する第4処理と、
複数の前記候補特徴量の中から採用する前記特徴量を探索する第5処理と、
を実行することを特徴とする計算機システム。
続きを表示(約 1,800 文字)
【請求項2】
請求項1に記載の計算機システムであって、
前記記憶装置は、前記項目の選択基準の設定理由と、影響度との対応づけを管理するための影響度情報を保持し、
前記知識は、前記項目の選択基準の設定理由を含み、
前記演算装置は、前記第3処理において、
前記知識に含まれる前記項目の選択基準の設定理由に基づいて前記影響度情報を参照して、前記影響度を取得し、
前記影響度を用いた演算処理によって、前記第1処理において設定された前記優先度を更新することを特徴とする計算機システム。
【請求項3】
請求項2に記載の計算機システムであって、
前記演算装置は、前記第5処理において、
複数の前記候補特徴量の中から、所定の数の前記候補特徴量を選択して暫時特徴量集合を生成し、
前記暫時特徴量集合に含まれる複数の前記候補特徴量を入力とする前記機械学習モデルの学習処理を実行し、当該機械学習モデルの予測精度を算出する処理と、複数の前記暫時特徴量の前記優先度及び前記予測精度に基づいて、前記暫時特徴量集合の評価値を算出する処理と、前記評価値に基づいて、前記暫時特徴量集合を更新する処理と、を繰り返し実行することを特徴とする計算機システム。
【請求項4】
請求項3に記載の計算機システムであって、
前記記憶装置は、前記第5処理において探索された前記特徴量の履歴を保持し、
前記演算装置は、前記第3処理において、前記履歴を参照し、前記項目が前回の前記第5処理において探索された前記特徴量である場合、前記優先度を補正することを特徴とする計算機システム。
【請求項5】
請求項3に記載の計算機システムであって、
前記記憶装置は、前記第5処理において探索された前記特徴量の履歴を保持し、
前記演算装置は、前記第5処理において、前記履歴を参照し、前記暫時特徴量集合に含まれる前記候補特徴量と、前回の前記第5処理において探索された前記特徴量との一致数に応じて前記評価値を補正することを特徴とする計算機システム。
【請求項6】
請求項1に記載の計算機システムであって、
前記演算装置は、前記知識を設定するためのインターフェースを提示することを特徴とする計算機システム。
【請求項7】
請求項6に記載の計算機システムであって、
前記記憶装置は、前記第2処理において取得した前記知識の履歴を保存し、
前記演算装置は、前記履歴を参照して、設定候補となる前記知識を前記インターフェースに表示することを特徴とする計算機システム。
【請求項8】
請求項7に記載の計算機システムであって、
前記演算装置は、前記履歴を参照し、前記学習データに含まれる前記複数の項目に関する前記知識を特定し、
特定された前記知識を前記インターフェースに表示することを特徴とする計算機システム。
【請求項9】
計算機システムが実行する機械学習モデルの特徴量の選択方法であって、
前記計算機システムは、
演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続される通信装置を有する計算機を含み、
学習データを格納するデータベースを管理し、
前記学習データは、前記機械学習モデルを適用する系から取得され、前記特徴量として選択可能な複数の項目の値を含むデータと、前記機械学習モデルの出力に対応する値とを含み、
前記機械学習モデルの特徴量の選択方法は、
前記演算装置が、ユーザから前記項目の選択基準に関する知識を取得するステップと、
前記演算装置が、前記学習データを用いて前記複数の項目の重要度を分析し、前記分析の結果に基づいて、前記項目を前記特徴量として選択するための指標である優先度を、前記複数の項目に設定するステップと、
前記演算装置が、前記知識に基づいて、前記複数の項目の前記優先度を更新するステップと、
前記演算装置が、前記複数の項目の前記優先度に基づいて、所定の数の前記項目を候補特徴量として選択するステップと、
前記演算装置が、複数の前記候補特徴量の中から採用する前記特徴量を選択するステップと、
を含むことを特徴とする機械学習モデルの特徴量の選択方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、機械学習モデルの特徴量の選択方法に関する。
続きを表示(約 2,200 文字)
【背景技術】
【0002】
産業プラントの運用/管理において、機械学習モデルを用いて異常を検知することで、不具合の早期発見及びダウンタイム削減が可能になる。機械学習モデルの学習では、プラント担当者の知識に基づいて特徴量を選択することによって、モデルの異常検知精度及び解釈性を向上できる。
【0003】
例えば、特許文献1に記載の技術により、プラント担当者の知識を活用した特徴量選択を行うことができる。この公報には、「対象とする系についてのドメイン知識を、ノードとノード間の関係性を示すエッジにより構成されるグラフにおけるノードまたはエッジの定義として記述するグラフ記述部と、前記対象とする系について、説明変数から目的変数を予測する予測モデルの構築及び学習を行うモデル構築部と、前記グラフにより記述されたドメイン知識を前記予測モデルの構築及び学習に活用する活用アルゴリズムが選択されるアルゴリズム選択部とを有し、前記アルゴリズム選択部で選択可能な活用アルゴリズムとして、前記予測モデルの説明変数として前記グラフから導出される特徴量を使用する第1の活用アルゴリズム、前記予測モデルの説明変数間の関係性に前記グラフのノード間の関係性を適用する第2の活用アルゴリズム、及び前記予測モデルの学習条件に前記グラフのノードの定義を適用する第3の活用アルゴリズムのうち、少なくとも1つ以上を含むことを特徴とするドメイン知識活用システム。」が記載されている。
【先行技術文献】
【特許文献】
【0004】
特開2023-127186号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
プラント運用時に、データ分布が変化するドリフトが発生することによって異常検知精度が劣化した場合、特徴量を選択し直し、機械学習モデルの学習を再度実行する復旧作業を速やかに完了させる必要がある。したがって、特徴量の選択工程において、プラント担当者の知識を自動かつ短時間で反映させることが重要である。
【0006】
特許文献1で開示された発明を用いると、各特徴量の値をノードとするベイジアンネットワークに対して各ノードの種別やノード間の因果関係を指定して学習を行い、学習したベイジアンネットワークを用いて特徴量選択を行うことで、プラント担当者の知識を反映することができる。
【0007】
プラント担当者が有する知識には、ある特徴量を他の特徴量よりも優先して選択するという選択基準に関する知識が存在する。例えば、「センサaの方がセンサbよりも前工程のセンサなので、プラントの異常発生防止対策が容易になるという点からは、制御が容易な前工程のセンサaに対応する特徴量を選択することが望ましい。」という知識、「センサaの方がセンサbよりも安価なセンサなので、異常検知システム導入コスト削減という観点からは、安価なセンサaに対応する特徴量を選択することが望ましい。」という知識がある。これらの知識は、異常検知精度以外の観点から、特徴量Aを特徴量Bよりも優先して選択することを促すが、特徴量Aを選択することで異常検知精度が大幅に低下する場合は、特徴量Aを選択せずに特徴量Bを選択することも許容する。特許文献1等の既存の特徴量選択方法では、特徴量の選択工程に前述した知識を組み込むことはできない。
【0008】
本発明は、ユーザが有する特徴量の選択基準に関する知識を特徴量の選択工程に組み込み、ユーザにとって解釈性の高い特徴量を選択する技術を提供する。
【課題を解決するための手段】
【0009】
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、機械学習モデルの特徴量を選択する計算機システムであって、演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続される通信装置を有する計算機を備え、学習データを格納するデータベースを管理し、前記学習データは、前記機械学習モデルを適用する系から取得され、前記特徴量として選択可能な複数の項目の値を含むデータと、前記機械学習モデルの出力に対応する値とを含み、前記演算装置は、ユーザから前記項目の選択基準に関する知識を取得する第1処理と、前記学習データを用いて前記複数の項目の重要度を分析し、前記分析の結果に基づいて、前記項目を前記特徴量として選択するための指標である優先度を、前記複数の項目に設定する第2処理と、前記知識に基づいて、前記複数の項目の前記優先度を更新する第3処理と、前記複数の項目の前記優先度に基づいて、所定の数の前記項目を候補特徴量として選択する第4処理と、複数の前記候補特徴量の中から採用する前記特徴量を探索する第5処理と、を実行する。
【発明の効果】
【0010】
本発明によれば、ユーザが有する特徴量の選択基準に関する知識を特徴量の選択工程に反映することができため、ユーザにとって解釈性の高い特徴量を選択できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
株式会社日立製作所
放射線モニタ
28日前
株式会社日立製作所
ガス分離システム
1か月前
株式会社日立製作所
電力変換システム
1日前
株式会社日立製作所
システム検証方法
16日前
株式会社日立製作所
鉄道車両用空調装置
15日前
株式会社日立製作所
乗降床及び乗客コンベア
14日前
株式会社日立製作所
施設管理装置および方法
1日前
株式会社日立製作所
生産ライン設計システム
9日前
株式会社日立製作所
店舗管理装置および方法
16日前
株式会社日立製作所
検索システム及び検索方法
16日前
株式会社日立製作所
飲食店提案装置および方法
16日前
株式会社日立製作所
乗りかご及びエレベーター
16日前
株式会社日立製作所
乗りかご及びエレベーター
17日前
株式会社日立製作所
署名照合システム及び方法
22日前
株式会社日立製作所
データ変換装置および方法
29日前
株式会社日立製作所
膜分離設備設計支援システム
1日前
株式会社日立製作所
生体認証装置、生体認証方法
15日前
株式会社日立製作所
ソースコードを生成する方法
9日前
株式会社日立製作所
ソフトエラー率評価システム
2日前
株式会社日立製作所
宇宙機、地上局及びアンテナ
1日前
株式会社日立製作所
物体検出装置および物体検出方法
22日前
株式会社日立製作所
スカートモール及び乗客コンベア
1日前
株式会社日立製作所
ガス分離システムの劣化診断装置
1日前
株式会社日立製作所
立体構造宇宙機及びその制御方法
14日前
株式会社日立製作所
購入関連行動分析装置および方法
15日前
株式会社日立製作所
計算機システム及びデータ送信方法
23日前
株式会社日立製作所
情報処理方法及び情報処理システム
17日前
株式会社日立製作所
テスト支援装置及びテスト支援方法
1日前
株式会社日立製作所
単体テスト装置及び単体テスト方法
17日前
株式会社日立製作所
データ処理装置およびデータ処理方法
14日前
株式会社日立製作所
欠陥検査システム、及び欠陥検査方法
1日前
株式会社日立製作所
計算機システムおよびアクセス検証方法
14日前
株式会社日立製作所
計算機システム及び構想策定の支援方法
1日前
株式会社日立製作所
分析装置、分析システムおよび分析方法
1日前
株式会社日立製作所
対話型時系列分析システムおよびその方法
24日前
株式会社日立製作所
農業経営支援装置および農業経営支援方法
14日前
続きを見る
他の特許を見る