TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025171971
公報種別公開特許公報(A)
公開日2025-11-20
出願番号2025063946
出願日2025-04-08
発明の名称処理装置、処理方法、およびプログラム
出願人日本製鉄株式会社
代理人個人
主分類G06F 18/211 20230101AFI20251113BHJP(計算;計数)
要約【課題】 目的変数に寄与する説明変数を高精度に選択する。
【解決手段】 処理装置100は、複数の第1説明変数候補群310a~310dにおける説明変数の候補の出現頻度320を、説明変数の候補のそれぞれについて算出し、当該出現頻度320に基づいて、複数の第2説明変数候補群340a~340cを作成し、複数の第2説明変数候補群のそれぞれについて、複数の第1学習モデルの候補350a~350cを作成し、複数の第1学習モデルの候補のそれぞれについて、当該第1学習モデルの候補の推定精度を評価する第1評価指標360a~360cを算出し、第1学習モデルの候補に含まれる説明変数の候補の数と、当該第1学習モデルの候補の推定精度を評価する第1評価指標との関係を示す説明変数数-第1評価指標関係情報370を、第1学習モデルにおける説明変数の選択のために用いる情報として算出する。
【選択図】 図3
特許請求の範囲【請求項1】
1つ以上の説明変数と、当該説明変数によって説明される目的変数との関係を示す学習モデルにおける説明変数を選択する処理を行う処理装置であって、
それぞれが、1つの前記説明変数の候補、または、複数の前記説明変数の候補を含む、複数の第1説明変数候補群を取得する第1説明変数候補群取得手段と、
前記複数の第1説明変数候補群における前記説明変数の候補の出現頻度を、前記説明変数の候補のそれぞれについて算出する出現頻度算出手段と、
前記出現頻度に基づいて、それぞれが、1つの前記説明変数の候補、または、複数の前記説明変数の候補を含む、複数の第2説明変数候補群を作成する第2説明変数候補群作成手段と、
前記第2説明変数候補群に含まれる前記説明変数の候補と前記目的変数との関係を示す複数の第1学習モデルの候補を作成することを、前記複数の第2説明変数候補群のそれぞれについて行う第1学習モデル候補作成手段と、
前記第1学習モデルの候補の推定精度を評価する第1評価指標を算出することを、前記複数の第1学習モデルの候補のそれぞれについて行う第1評価指標算出手段と、
前記第1学習モデルの候補に含まれる前記説明変数の候補の数と、当該第1学習モデルの候補の推定精度を評価する第1評価指標との関係を示す説明変数数-第1評価指標関係情報を算出する第1関係算出手段と、を有し、
前記説明変数数-第1評価指標関係情報は、前記第1学習モデルにおける前記説明変数の選択のために使用される、処理装置。
続きを表示(約 1,700 文字)【請求項2】
前記第2説明変数候補群作成手段は、前記出現頻度が相対的に高い前記説明変数の候補が、前記出現頻度が相対的に低い前記説明変数の候補よりも多く含まれることがあるように、前記第2説明変数候補群に含める前記説明変数の候補を選択する、請求項1に記載の処理装置。
【請求項3】
前記第2説明変数候補群作成手段は、前記出現頻度が高いものから順にm個の前記説明変数の候補を選択し、選択したm個の前記説明変数の候補を含む前記第2説明変数候補群を作成することを、Mを2以上の整数として、mが1からMまでのそれぞれの場合について行う、請求項2に記載の処理装置。
【請求項4】
前記第2説明変数候補群作成手段は、前記複数の第2説明変数候補群として、前記第1説明変数候補群に含まれる前記説明変数の候補の一部のみを含む第2説明変数候補群を作成する、請求項1~3のいずれか1項に記載の処理装置。
【請求項5】
前記説明変数数-第1評価指標関係情報に基づいて、前記第1学習モデルにおける前記説明変数を選択する第1説明変数選択手段をさらに有する、請求項1~3のいずれか1項に記載の処理装置。
【請求項6】
前記第1説明変数選択手段は、前記説明変数数-第1評価指標関係情報により示される前記関係において、所定の条件を満たす前記第1評価指標に対応する前記第1学習モデルの候補に含まれる前記第1評価指標の候補を、前記第1学習モデルにおける前記説明変数として選択する、請求項5に記載の処理装置。
【請求項7】
前記所定の条件は、前記説明変数数-第1評価指標関係情報により示される前記関係における前記第1評価指標のピークを用いて表される条件である、請求項6に記載の処理装置。
【請求項8】
前記所定の条件は、前記説明変数数-第1評価指標関係情報により示される前記関係における前記説明変数の数を用いて表される条件である、請求項6に記載の処理装置。
【請求項9】
前記第1説明変数候補群取得手段は、前記説明変数のデータと前記目的変数のデータとを用いて、前記説明変数と前記目的変数との関係を示す回帰式の回帰係数を算出するための回帰分析として、回帰係数を0に縮小可能な罰則付きの回帰分析を行った結果に基づいて、前記複数の第1説明変数候補群を算出し、
前記第1説明変数候補群取得手段は、前記罰則付きの回帰分析に用いられる所定のハイパーパラメータの値として複数の値を用いることにより、前記複数の第1説明変数候補群の組として複数組の複数の第1説明変数候補群の組を算出し、
前記出現頻度算出手段は、前記複数の第1説明変数候補群における前記説明変数の候補の出現頻度を、前記説明変数の候補のそれぞれについて算出することを、前記複数組の複数の第1説明変数候補群の組のそれぞれについて行うことで、複数の前記出現頻度の組として複数組の複数の出現頻度の組を算出し、
前記第2説明変数候補群作成手段は、前記出現頻度に基づいて、それぞれが、1つの前記説明変数の候補、または、複数の前記説明変数の候補を含む、複数の第2説明変数候補群を作成することを、前記複数組の出現頻度の組のそれぞれについて行うことで、複数の第2説明変数候補群の組として、複数組の複数の第2説明変数候補群の組を作成し、
前記第1学習モデル候補作成手段は、前記複数の第1学習モデルの候補を作成することを、前記複数組の複数の第2説明変数候補群のそれぞれについて行うことで、前記複数組の複数の前記第1学習モデルの候補の組を作成し、
前記第1評価指標算出手段は、前記第1評価指標を算出することを、前記複数組の複数の第1学習モデルの候補の組のそれぞれについて行い、
前記第1関係算出手段は、前記説明変数数-第1評価指標関係情報を算出することを前記複数組の複数の第1学習モデルの候補の組ごとに行う、請求項1~3のいずれか1項に記載の処理装置。
【請求項10】
前記目的変数は、カテゴリ変数である、請求項1~3のいずれか1項に記載の処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、処理装置、処理方法、およびプログラムに関する。
続きを表示(約 2,400 文字)【背景技術】
【0002】
各種の分野において、説明変数(独立変数)と、当該説明変数を説明する目的変数(従属変数)との関係を示す学習モデルを用いて、目的変数の値を算出することが行われている。
【0003】
特許文献1には、特定物質の量の変化に関わる微生物群を説明変数として特定することが開示されている。特許文献1に記載の技術では、特定物質および微生物を含む試料に対する測定結果から、特定物質の量の変更速度と、微生物が分類された微生物群の含有量とからなるデータセットを作成し、作成したデータセットから、再標本化により標本として複数組の標本を作成する。そして、微生物群の含有量を説明変数とし、特定物質の量の変化速度を目的変数として、回帰係数を0(零)に縮小可能な罰則付き回帰分析を行うことを、複数組の標本のそれぞれについて行うことにより、微生物群を、複数組の標本のそれぞれについて選出する第1選出工程を行う。そして、第1選出工程で選出した微生物群の、再標本化により作成した標本における選出頻度から信頼度を算出し、算出した信頼度に基づいて微生物群をさらに選出する第2選出工程を行う。微生物群の総数が1000であり、第1選出工程で或る微生物群が500回選出された場合、信頼度は0.5(=500/1000)である。第2選出工程では、このような信頼度が予め定められた基準値(例えば0.6)以上の微生物群を選出する。
【先行技術文献】
【特許文献】
【0004】
特開2020-36579号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載の技術では、選出頻度が高い説明変数であるほど、目的変数への寄与が大きいことを前提している。しかしながら、説明変数の選出頻度と目的変数への寄与度とは必ずしも正比例の関係になるとは限らない。よって、目的変数に寄与する説明変数の選択を高精度に行うことができない虞がある。
【0006】
本発明は、以上のような問題点に鑑みてなされたものであり、目的変数に寄与する説明変数を高精度に選択することを目的とする。
【課題を解決するための手段】
【0007】
本発明の処理装置は、1つ以上の説明変数と、当該説明変数によって説明される目的変数との関係を示す第1学習モデルにおける説明変数を選択する処理を行う処理装置であって、それぞれが、1つの前記説明変数の候補、または、複数の前記説明変数の候補を含む、複数の第1説明変数候補群を取得する第1説明変数候補群取得手段と、前記複数の第1説明変数候補群における前記説明変数の候補の出現頻度を、前記説明変数の候補のそれぞれについて算出する出現頻度算出手段と、前記出現頻度に基づいて、それぞれが、1つの前記説明変数の候補、または、複数の前記説明変数の候補を含む、複数の第2説明変数候補群を作成する第2説明変数候補群作成手段と、前記第2説明変数候補群に含まれる前記説明変数の候補と前記目的変数との関係を示す複数の第1学習モデルの候補を作成することを、前記複数の第2説明変数候補群のそれぞれについて行う第1学習モデル候補作成手段と、前記第1学習モデルの候補の推定精度を評価する第1評価指標を算出することを、前記複数の第1学習モデルの候補のそれぞれについて行う第1評価指標算出手段と、前記第1学習モデルの候補に含まれる前記説明変数の候補の数と、当該第1学習モデルの候補の推定精度を評価する第1評価指標との関係を示す説明変数数-第1評価指標関係情報を算出する第1関係算出手段と、を有し、前記説明変数数-第1評価指標関係情報は、前記第1学習モデルにおける前記説明変数の選択のために使用される。
【0008】
本発明の処理方法は、1つ以上の説明変数と、当該説明変数によって説明される目的変数との関係を示す第1学習モデルにおける説明変数を選択する処理を行う処理方法であって、それぞれが、1つの前記説明変数の候補、または、複数の前記説明変数の候補を含む、複数の第1説明変数候補群を取得する第1説明変数候補群取得工程と、前記複数の第1説明変数候補群における前記説明変数の候補の出現頻度を、前記説明変数の候補のそれぞれについて算出する出現頻度算出工程と、前記出現頻度に基づいて、それぞれが、1つの前記説明変数の候補、または、複数の前記説明変数の候補を含む、複数の第2説明変数候補群を作成する第2説明変数候補群作成工程と、前記第2説明変数候補群に含まれる前記説明変数の候補と前記目的変数との関係を示す複数の第1学習モデルの候補を作成することを、前記複数の第2説明変数候補群のそれぞれについて行う第1学習モデル候補作成工程と、前記第1学習モデルの候補の推定精度を評価する第1評価指標を算出することを、前記複数の第1学習モデルの候補のそれぞれについて行う第1評価指標算出工程と、前記第1学習モデルの候補に含まれる前記説明変数の候補の数と、当該第1学習モデルの候補の推定精度を評価する第1評価指標との関係を示す説明変数数-第1評価指標関係情報を算出する第1関係算出工程と、を有し、前記説明変数数-第1評価指標関係情報は、前記第1学習モデルにおける前記説明変数の選択のために使用される。
【0009】
本発明のプログラムは、前記処理装置の各手段としてコンピュータを機能させる。
【発明の効果】
【0010】
本発明によれば、目的変数に寄与する説明変数を高精度に選択することができる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許