TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025125973
公報種別
公開特許公報(A)
公開日
2025-08-28
出願番号
2024022296
出願日
2024-02-16
発明の名称
欠損データ補完装置及び欠損データ補完方法
出願人
株式会社日立製作所
代理人
弁理士法人サンネクスト国際特許事務所
主分類
G06F
16/215 20190101AFI20250821BHJP(計算;計数)
要約
【課題】
補完すべき欠損データをより少なく抑えつつ欠損データを含む学習データの全体予測精度を高めること。
【解決手段】
特定の列データ項目の各データのうち、補完量調整パラメータによって定義された所定の割合に含まれる少なくとも1つのエントリに補完優先度フラグを付与する補完優先度フラグ付与部と、データテーブルに含まれる各エントリについて補完優先度フラグが付与された各エントリの個数をカウントし、補完優先度フラグの個数が多い順に統合補完優先度順位を決定する優先度順位決定部と、を備える。
【選択図】 図1
特許請求の範囲
【請求項1】
列方向に複数の列データ項目が定義されているとともに、行方向に前記複数の列データ項目の各データで構成される複数のエントリを有し、各前記エントリのうちの一部のエントリにおける特定の列データ項目に欠損データが存在するデータテーブルと、
前記特定の列データ項目のデータに対して補完が必要な割合を調整するのに用いられる補完量調整パラメータを定義するパラメータ定義部と、
前記データテーブルを構成する前記複数のエントリにおける、前記特定の列データ項目以外の他の列データ項目のデータ、及び、前記特定の列データ項目のデータに基づいて、前記特定の列データ項目の前記欠損データを予測する欠損データ予測部と、
前記特定の列データ項目の各データのうち、前記補完量調整パラメータによって定義された所定の割合に含まれる少なくとも1つの前記エントリを抽出する抽出部と、
前記所定の割合に含まれる少なくとも1つの前記エントリに補完優先度フラグを付与する補完優先度フラグ付与部と、
前記データテーブルに含まれる各前記エントリについて前記補完優先度フラグが付与された各前記エントリの個数をカウントし、前記補完優先度フラグの個数が多い順に統合補完優先度順位を決定する優先度順位決定部と、
を備えることを特徴とする欠損データ補完装置。
続きを表示(約 2,000 文字)
【請求項2】
前記欠損データを含むエントリごとに、前記特定の列データ項目ごとのデータ及び前記統合補完優先度順位のリストデータを表示する表示部を備える
ことを特徴とする請求項1に記載の欠損データ補完装置。
【請求項3】
前記補完優先度フラグ付与部は、
前記補完量調整パラメータとして定義された複数の前記所定の割合ごとに前記補完優先度フラグを付与し、
前記表示部は、
前記リストデータに基づくデータ補完測定工数量と、前記欠損データ予測部による前記特定の列データ項目のデータに関する予測精度と、を表示する
ことを特徴とする請求項2に記載の欠損データ補完装置。
【請求項4】
前記欠損データ予測部は、
前記欠損データを含む学習データの全体予測精度が目標精度を満たすように、前記補完量調整パラメータとして定義された複数の前記所定の割合から1つの所定の割合を選択する
ことを特徴とする請求項3に記載の欠損データ補完装置。
【請求項5】
前記欠損データ予測部は、
前記データテーブルを構成する前記複数のエントリにおける、前記特定の列データ項目以外の他の列データ項目のデータを説明変数とするとともに前記特定の列データ項目のデータを目的変数としてモデルを学習し、前記モデルを用いて前記特定の列データ項目の前記欠損データを機械学習によって予測する
ことを特徴とする請求項1に記載の欠損データ補完装置。
【請求項6】
列方向に複数の列データ項目が定義されているとともに、行方向に前記複数の列データ項目の各データで構成される複数のエントリを有し、各前記エントリのうちの一部のエントリにおける特定の列データ項目に欠損データが存在するデータテーブルにおける前記特定の列データ項目のデータに対して補完が必要な割合を調整するのに用いられる補完量調整パラメータをパラメータ定義部に定義するパラメータ定義ステップと、
欠損データ予測部が、前記データテーブルを構成する前記複数のエントリにおける、前記特定の列データ項目以外の他の列データ項目のデータ、及び、前記特定の列データ項目のデータに基づいて、前記特定の列データ項目の前記欠損データを予測する欠損データ予測ステップと、
抽出部が、前記特定の列データ項目の各データのうち、前記補完量調整パラメータによって定義された所定の割合に含まれる少なくとも1つの前記エントリを抽出する抽出ステップと、
補完優先度フラグ付与部が、前記所定の割合に含まれる少なくとも1つの前記エントリに補完優先度フラグを付与する補完優先度フラグ付与ステップと、
優先度順位決定部が、前記データテーブルに含まれる各前記エントリについて前記補完優先度フラグが付与された各前記エントリの個数をカウントし、前記補完優先度フラグの個数が多い順に統合補完優先度順位を決定する優先度順位決定ステップと、
を有することを特徴とする欠損データ補完方法。
【請求項7】
前記欠損データを含むエントリごとに、前記特定の列データ項目ごとのデータ及び前記統合補完優先度順位のリストデータを表示部に表示する表示ステップを有する
ことを特徴とする請求項6に記載の欠損データ補完方法。
【請求項8】
前記補完優先度フラグ付与部は、
前記補完量調整パラメータとして各々設定された複数の値ごとに前記補完優先度フラグを付与し、
前記表示ステップでは、
前記リストデータに基づくデータ補完測定工数量と、前記欠損データ予測部による前記特定の列データ項目のデータに関する予測精度と、を前記表示部に表示する
ことを特徴とする請求項7に記載の欠損データ補完方法。
【請求項9】
前記欠損データ予測ステップでは、
前記欠損データ予測部が、前記欠損データを含む学習データの全体予測精度が目標精度を満たすように、前記補完量調整パラメータとして定義された複数の前記所定の割合から1つの所定の割合を選択する
ことを特徴とする請求項8に記載の欠損データ補完方法。
【請求項10】
前記欠損データ予測ステップでは、
前記欠損データ予測部が、前記データテーブルを構成する前記複数のエントリにおける、前記特定の列データ項目以外の他の列データ項目のデータを説明変数とするとともに前記特定の列データ項目のデータを目的変数としてモデルを学習し、前記モデルを用いて前記特定の列データ項目の前記欠損データを機械学習によって予測する
ことを特徴とする請求項6に記載の欠損データ補完方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、欠損データ補完装置及び欠損データ補完方法に関し、例えば、欠損データを補完する技術に関する欠損データ補完装置に適用して好適なものである。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
近年、人工知能を用いた技術の発達によって学習データを用いた機械学習に関する研究が盛んになされている。このような学習データには、その一部に欠損データを含む場合があり、このような場合でも対応できるよう欠損データの補完に関して様々な研究がなされている。特許文献1には、機械学習の前処理として欠損データの補完を行う技術が開示されている。特許文献1に開示された技術では、欠損データの補完精度を向上することを目的とし、具体的には、まず、相関行列計算部が全学習レコードを用いて属性間の相関行列を計算し、回帰補完部が、欠損属性について、相関値の絶対値が相関閾値より大きい属性がある場合に、相関値の絶対値が相関閾値より大きい属性を用いて回帰補完を行う。
【先行技術文献】
【特許文献】
【0003】
特開2020-154828号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に開示された技術においては、上述したように欠損データについて回帰補完を行うのみであり、どの程度の欠損データを補完すれば欠損データを含む学習データの全体予測精度を高くできるのかについては検討がなされていなかった。
【0005】
本発明は以上の点を考慮してなされたもので、補完すべき欠損データをより少なく抑えつつ欠損データを含む学習データの全体予測精度を高めることができる欠損データ補完装置及び欠損データ補完方法を提案しようとするものである。
【課題を解決するための手段】
【0006】
かかる課題を解決するため本発明においては、列方向に複数の列データ項目が定義されているとともに、行方向に前記複数の列データ項目の各データで構成される複数のエントリを有し、各前記エントリのうちの一部のエントリにおける特定の列データ項目に欠損データが存在するデータテーブルと、前記特定の列データ項目のデータに対して補完が必要な割合を調整するのに用いられる補完量調整パラメータを定義するパラメータ定義部と、前記データテーブルを構成する前記複数のエントリにおける、前記特定の列データ項目以外の他の列データ項目のデータ、及び、前記特定の列データ項目のデータに基づいて、前記特定の列データ項目の前記欠損データを予測する欠損データ予測部と、前記特定の列データ項目の各データのうち、前記補完量調整パラメータによって定義された所定の割合に含まれる少なくとも1つの前記エントリを抽出する抽出部と、前記所定の割合に含まれる少なくとも1つの前記エントリに補完優先度フラグを付与する補完優先度フラグ付与部と、前記データテーブルに含まれる各前記エントリについて前記補完優先度フラグが付与された各前記エントリの個数をカウントし、前記補完優先度フラグの個数が多い順に統合補完優先度順位を決定する優先度順位決定部と、を備えるようにした。
【0007】
また、本発明においては、列方向に複数の列データ項目が定義されているとともに、行方向に前記複数の列データ項目の各データで構成される複数のエントリを有し、各前記エントリのうちの一部のエントリにおける特定の列データ項目に欠損データが存在するデータテーブルにおける前記特定の列データ項目のデータに対して補完が必要な割合を調整するのに用いられる補完量調整パラメータをパラメータ定義部に定義するパラメータ定義ステップと、欠損データ予測部が、前記データテーブルを構成する前記複数のエントリにおける、前記特定の列データ項目以外の他の列データ項目のデータ、及び、前記特定の列データ項目のデータに基づいて、前記特定の列データ項目の前記欠損データを予測する欠損データ予測ステップと、抽出部が、前記特定の列データ項目の各データのうち、前記補完量調整パラメータによって定義された所定の割合に含まれる少なくとも1つの前記エントリを抽出する抽出ステップと、補完優先度フラグ付与部が、前記所定の割合に含まれる少なくとも1つの前記エントリに補完優先度フラグを付与する補完優先度フラグ付与ステップと、優先度順位決定部が、前記データテーブルに含まれる各前記エントリについて前記補完優先度フラグが付与された各前記エントリの個数をカウントし、前記補完優先度フラグの個数が多い順に統合補完優先度順位を決定する優先度順位決定ステップと、を有するようにした。
【発明の効果】
【0008】
本発明によれば、補完すべき欠損データをより少なく抑えつつ欠損データを含む学習データの全体予測精度を高めることができる。
【図面の簡単な説明】
【0009】
第1の実施形態による欠損データ補完装置の構成例を示すシステム構成図である。
欠損データ補完処理の手順の一例を示すフローチャートである。
図2に示す欠損データ処理の手順の一例を示すフローチャートである。
データテーブルの内容の一例を示す図である。
データテーブルの内容の一例を示す図である。
データテーブルの内容の一例を示す図である。
データテーブルの内容の一例を示す図である。
データテーブルの内容の一例を示す図である。
データテーブルの内容の一例を示す図である。
データテーブルの内容の一例を示す図である。
データ補完測定工数量に対する全体予測精度の特性の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面に基づいて、本発明の一実施形態を詳述する。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
株式会社日立製作所
回転電機
25日前
株式会社日立製作所
制御装置
1日前
株式会社日立製作所
回転電機
1か月前
株式会社日立製作所
制御基板
1か月前
株式会社日立製作所
蓄電装置
29日前
株式会社日立製作所
エレベーター
1か月前
株式会社日立製作所
エレベーター
29日前
株式会社日立製作所
電動機制御装置
8日前
株式会社日立製作所
コントローラー
1か月前
株式会社日立製作所
環境評価システム
3日前
株式会社日立製作所
機能割付システム
15日前
株式会社日立製作所
航空機用の推進装置
8日前
株式会社日立製作所
輸送計画装置及び方法
24日前
株式会社日立製作所
沿岸環境監視システム
8日前
株式会社日立製作所
回転子および回転電機
1か月前
株式会社日立製作所
巻上機及びエレベーター
1か月前
株式会社日立製作所
分析システム及び分析方法
1か月前
株式会社日立製作所
現新比較テスト支援システム
1か月前
株式会社日立製作所
療養指導支援装置および方法
29日前
株式会社日立製作所
プログラム検証支援システム
25日前
株式会社日立製作所
エレベーター及び保護カバー
1か月前
株式会社日立製作所
めっき装置及びめっき形成方法
1か月前
株式会社日立製作所
情報提供装置及び情報提供方法
1か月前
株式会社日立製作所
生産計画立案支援装置及び方法
1か月前
株式会社日立製作所
釣合いおもり及びエレベーター
1か月前
株式会社日立製作所
接点浄化装置及び風力発電装置
1か月前
株式会社日立製作所
補修指示装置および補修指示方法
1か月前
株式会社日立製作所
情報処理装置および情報処理方法
29日前
株式会社日立製作所
振動解析装置および振動解析方法
1か月前
株式会社日立製作所
電力融通システム、電力システム
1か月前
株式会社日立製作所
情報処理システム及び情報処理方法
11日前
株式会社日立製作所
情報抽出システム及び情報抽出方法
4日前
株式会社日立製作所
情報処理システム及び情報処理方法
1日前
株式会社日立製作所
契約照会システム及び契約照会方法
24日前
株式会社日立製作所
施策策定方法及び施策策定システム
25日前
株式会社日立製作所
脱レール検出装置及びエレベーター
1か月前
続きを見る
他の特許を見る