TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025063757
公報種別
公開特許公報(A)
公開日
2025-04-16
出願番号
2023173204
出願日
2023-10-04
発明の名称
データ統合方法及びデータ統合システム
出願人
株式会社日立製作所
代理人
弁理士法人サンネクスト国際特許事務所
主分類
G06Q
10/06 20230101AFI20250409BHJP(計算;計数)
要約
【課題】ユーザが明確な選択基準に基づいて統合するデータを選択できるようにする。
【解決手段】データ統合方法では、KPIと、突合処理を実行する際に突合するデータ項目を指定する突合データ項目と、を含んだデータセット検索条件の入力を受付け、突合データ項目に該当するデータ項目を含むデータの中からKPIと関連性を有するデータ項目をデータセットとして抽出する。そして突合データ項目に該当するデータ項目の属性識別子に対応する突合処理方式識別子及び処理工数を取得し、データセットのデータ項目の一覧と共に表示画面に表示する。
【選択図】図7
特許請求の範囲
【請求項1】
複数のデータから該複数のデータの各データ項目からなるデータセットを抽出するデータ統合システムが実行するデータ統合方法であって、
前記データ統合システムは、プロセッサとメモリと記憶部とを有し、
前記記憶部は、
前記データの適用分野を表すドメインを識別するドメイン識別子と、前記データ項目と、該データ項目のデータ属性を識別する属性識別子と、を対応付けて管理するドメイン情報と、
前記複数のデータ間の前記データ項目の突合処理の処理方式を識別する突合処理方式識別子と、前記属性識別子と、該突合処理に際して必要となる必要処理を識別する必要処理識別子と、該突合処理の処理工数と、を対応付けて管理するデータ突合方式情報と、を記憶し、
前記プロセッサが、
KPI(Key Performance Indicator)と、前記データセットに含める前記データ項目である指定データ項目と、前記突合処理を実行する際に突合する前記データ項目を指定する突合データ項目と、を含んだデータセット検索条件の入力を受付け、
前記指定データ項目又は前記突合データ項目に該当する前記データ項目を含む前記データの中から前記KPIと関連性を有する前記データ項目を前記データセットとして抽出し、
前記ドメイン情報を参照し、前記突合データ項目に該当する前記データ項目に対応する前記属性識別子を取得し、
前記データ突合方式情報を参照し、前記ドメイン情報を参照して取得した前記属性識別子に対応する前記突合処理方式識別子及び前記処理工数を取得し、
前記突合処理方式識別子に対応する前記処理方式及び前記処理工数を、前記指定データ項目を含んだ前記データセットのデータ項目の一覧と共に、表示装置に表示する
各処理を有することを特徴とするデータ統合方法。
続きを表示(約 3,100 文字)
【請求項2】
請求項1に記載のデータ統合方法であって、
前記データ突合方式情報及び前記データは、前記ドメイン識別子を対応付けて管理し、
前記プロセッサが、
前記ドメインの指定を含んだ前記データセット検索条件の入力を受付け、
前記データセット検索条件において指定された前記ドメインの前記ドメイン識別子に該当する前記データであって、前記突合データ項目に該当する前記データ項目を含む前記データの中から前記データセットを抽出し、
前記ドメイン情報を参照し、前記データセット検索条件において指定された前記ドメインの前記ドメイン識別子と、前記データセットに該当する前記データ項目と、の組合せに対応する前記属性識別子を取得し、
前記データ突合方式情報を参照し、前記ドメイン情報を参照して取得した前記属性識別子と、前記データセット検索条件において指定された前記ドメインの前記ドメイン識別子と、の組合せに対応する前記突合処理方式識別子及び前記処理工数を取得する
各処理を有することを特徴とするデータ統合方法。
【請求項3】
請求項1又は2に記載のデータ統合方法であって、
前記プロセッサが、
ユーザによる何れかの前記データセットの選択を受付け、
前記ユーザによって選択された前記データセットを抽出し、
前記データセットに含まれる前記突合データ項目の前記突合処理を実行し、
前記データセットを前記データ項目として含んだ統合データを生成し、
前記統合データを前記表示装置に表示する
各処理を有することを特徴とするデータ統合方法。
【請求項4】
請求項3に記載のデータ統合方法であって、
前記データ突合方式情報は、前記突合処理が、人手を介さず実行される自動、処理に関するパラメータの入力が必要な半自動、又は人手を介して実行される手動の何れであるかを示す処理種別を対応付けて管理し、
前記プロセッサが、
前記データ突合方式情報を参照し、前記ドメイン情報を参照して取得した前記属性識別子に対応する前記処理種別を取得し、
前記処理種別が前記半自動である場合には、前記パラメータの入力を受付け、該パラメータに基づいて前記突合処理を実行する
各処理を有することを特徴とするデータ統合方法。
【請求項5】
請求項4に記載のデータ統合方法であって、
前記パラメータは、前記データ項目の値の時間間隔を表す時刻粒度と、該値の欠損の補完方式と、の少なくとも何れかを含む
ことを特徴とするデータ統合方法。
【請求項6】
請求項4に記載のデータ統合方法であって、
前記プロセッサが、
前記処理種別が前記手動である場合には、前記突合処理の実行前の前記複数のデータを前記表示装置に表示する
処理を有することを特徴とするデータ統合方法。
【請求項7】
請求項1に記載のデータ統合方法であって、
前記記憶部は、
前記KPIと、該KPIを含んだ前記データセット検索条件に基づいて抽出された前記データセットと、を対応付けて管理する検索履歴情報を記憶し、
前記プロセッサが、
前記検索履歴情報から、前記データセット検索条件に含まれる前記KPIとの関連を有する前記データセットを抽出する
処理を有することを特徴とするデータ統合方法。
【請求項8】
請求項1に記載のデータ統合方法であって、
前記記憶部は、前記データの信頼度に関連する情報を管理するデータ情報を記憶し、
前記データは、該データを識別するデータ識別子を対応付けて管理し、
前記プロセッサが、
前記データセットに該当する前記データ項目を有する前記データを参照して該データを識別する前記データ識別子を取得し、
前記データ情報を参照し、前記データ識別子で識別される前記データの前記信頼度に関連する前記情報を取得し、
前記情報に基づいて前記信頼度を算出し、
前記信頼度を前記表示装置に表示する
各処理を有することを特徴とするデータ統合方法。
【請求項9】
複数のデータから該複数のデータの各データ項目からなるデータセットを抽出するデータ統合システムであって、
前記データ統合システムは、プロセッサとメモリと記憶部とを有し、
前記記憶部は、
前記データの適用分野を表すドメインを識別するドメイン識別子と、前記データ項目と、該データ項目のデータ属性を識別する属性識別子と、を対応付けて管理するドメイン情報と、
前記複数のデータ間の前記データ項目の突合処理の処理方式を識別する突合処理方式識別子と、前記属性識別子と、該突合処理に際して必要となる必要処理を識別する必要処理識別子と、該突合処理の処理工数と、を対応付けて管理するデータ突合方式情報と、を記憶し、
前記プロセッサは、
KPI(Key Performance Indicator)と、前記データセットに含める前記データ項目である指定データ項目と、前記突合処理を実行する際に突合する前記データ項目を指定する突合データ項目と、を含んだデータセット検索条件の入力を受付け、
前記指定データ項目又は前記突合データ項目に該当する前記データ項目を含む前記データの中から前記KPIと関連性を有する前記データ項目を前記データセットとして抽出し、
前記ドメイン情報を参照し、前記突合データ項目に該当する前記データ項目に対応する前記属性識別子を取得し、
前記データ突合方式情報を参照し、前記ドメイン情報を参照して取得した前記属性識別子に対応する前記突合処理方式識別子及び前記処理工数を取得し、
前記突合処理方式識別子に対応する前記処理方式及び前記処理工数を、前記指定データ項目を含んだ前記データセットのデータ項目の一覧と共に、表示装置に表示する
ことを特徴とするデータ統合システム。
【請求項10】
請求項9に記載のデータ統合システムであって、
前記データ突合方式情報及び前記データは、前記ドメイン識別子を対応付けて管理し、
前記プロセッサは、
前記ドメインの指定を含んだ前記データセット検索条件の入力を受付け、
前記データセット検索条件において指定された前記ドメインの前記ドメイン識別子に該当する前記データであって、前記突合データ項目に該当する前記データ項目を含む前記データの中から前記データセットを抽出し、
前記ドメイン情報を参照し、前記データセット検索条件において指定された前記ドメインの前記ドメイン識別子と、前記データセットに該当する前記データ項目と、の組合せに対応する前記属性識別子を取得し、
前記データ突合方式情報を参照し、前記ドメイン情報を参照して取得した前記属性識別子と、前記データセット検索条件において指定された前記ドメインの前記ドメイン識別子と、の組合せに対応する前記突合処理方式識別子及び前記処理工数を取得する
ことを特徴とするデータ統合システム。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、データ統合方法及びデータ統合システムに関する。
続きを表示(約 2,100 文字)
【背景技術】
【0002】
従来から、異なるデータからそれぞれデータ項目を抽出して一つのデータへ統合することで、ユーザのニーズにマッチしたデータ項目を有するデータを生成するデータ統合技術がある。例えば特許文献1には、複数のデータ項目で構成されたデータであるテーブルを2つ以上組合せて、定義された主キー及び外部キーのデータ項目を用いてテーブルを関連付ける技術が開示されている。
【0003】
またデータ項目の関連付けの際には、キーとなるデータ項目の突合処理が行われる。例えば特許文献2には、文字列を文節に分割し、複数の文字列を突合処理することで、突合の品質を判定・記録する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
国際公開第2023/275945号
特開2017-97719号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、上述の特許文献1及び2の従来技術では、突合処理の方式や工数、突合対象のデータの品質など、統合するデータの選択基準になり得る情報は一切考慮されていなかった。このためユーザは、統合するデータを選択する際に、明確な選択基準に基づくことができず、選択の妥当性が不明であった。
【0006】
本発明は、上述の事情を考慮してなされたものであり、ユーザが明確な選択基準に基づいて統合するデータを選択できるようにすることを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決する一態様として、複数のデータから該複数のデータの各データ項目からなるデータセットを抽出するデータ統合システムが実行するデータ統合方法であって、前記データ統合システムは、プロセッサとメモリと記憶部とを有し、前記記憶部は、前記データの適用分野を表すドメインを識別するドメイン識別子と、前記データ項目と、該データ項目のデータ属性を識別する属性識別子と、を対応付けて管理するドメイン情報と、前記複数のデータ間の前記データ項目の突合処理の処理方式を識別する突合処理方式識別子と、前記属性識別子と、該突合処理に際して必要となる必要処理を識別する必要処理識別子と、該突合処理の処理工数と、を対応付けて管理するデータ突合方式情報と、を記憶し、前記プロセッサが、KPI(Key Performance Indicator)と、前記データセットに含める前記データ項目である指定データ項目と、前記突合処理を実行する際に突合する前記データ項目を指定する突合データ項目と、を含んだデータセット検索条件の入力を受付け、前記指定データ項目又は前記突合データ項目に該当する前記データ項目を含む前記データの中から前記KPIと関連性を有する前記データ項目を前記データセットとして抽出し、前記ドメイン情報を参照し、前記突合データ項目に該当する前記データ項目に対応する前記属性識別子を取得し、前記データ突合方式情報を参照し、前記ドメイン情報を参照して取得した前記属性識別子に対応する前記突合処理方式識別子及び前記処理工数を取得し、前記突合処理方式識別子に対応する前記処理方式及び前記処理工数を、前記指定データ項目を含んだ前記データセットのデータ項目の一覧と共に、表示画面に表示する各処理を有することを特徴とする。
【発明の効果】
【0008】
本発明によれば、ユーザが明確な選択基準に基づいて統合するデータを選択できる。
【図面の簡単な説明】
【0009】
実施形態に係るデータ管理システムの構成を示す図。
実施形態に係る業務データ管理サーバの構成を示す図。
実施形態に係る業務データテーブルの構成を示す図。
実施形態に係る統合データ管理サーバの構成を示す図。
実施形態に係る統合データ管理サーバが有する各種データの構成を示す図。
実施形態に係るデータ管理システムにおける全体処理を示すシーケンス図。
実施形態に係るデータセット検索処理の詳細を示すフローチャート。
実施形態に係る信頼度算出処理の詳細を示すフローチャート。
実施形態に係るデータセット抽出処理の詳細を示すフローチャート。
実施形態に係るデータセット検索条件入力画面の構成を示す図。
実施形態に係るデータセット検索結果出力画面を示す図。
実施形態に係るデータ突合処理パラメータ入力画面の構成を示す図。
実施形態に係るデータセット抽出結果出力画面(自動又は半自動)の構成を示す図。
実施形態に係るデータセット抽出結果出力画面(手動)の構成を示す図。
【発明を実施するための形態】
【0010】
以下、本願開示に係る実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また、実施形態の中で説明されている諸要素及びその組合せの全てが発明の解決手段に必須であるとは限らない。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社日立製作所
電磁波処理システム
5日前
株式会社日立製作所
オーバーホール計画作成装置
2日前
株式会社日立製作所
電力系統監視装置および方法
2日前
株式会社日立製作所
充電管理装置および充電管理方法
4日前
株式会社日立製作所
データ処理装置及びデータ処理方法
5日前
株式会社日立製作所
情報照会システム及び情報照会方法
4日前
株式会社日立製作所
クエリ処理装置及びクエリ処理方法
5日前
株式会社日立製作所
塩基検出用長鎖ssDNAプライマー
3日前
株式会社日立製作所
データ統合方法及びデータ統合システム
3日前
株式会社日立製作所
分析装置、分析方法および分析プログラム
4日前
株式会社日立製作所
活動特徴抽出装置、及び活動特徴抽出方法
4日前
株式会社日立製作所
設定装置、設定方法、および設定プログラム
2日前
株式会社日立製作所
水電解システムの制御方法及び水電解システム
3日前
株式会社日立製作所
取引先選定支援装置、及び取引先選定支援方法
2日前
株式会社日立製作所
エレベーターシステム及びエレベーター制御方法
3日前
株式会社日立製作所
多層樹脂配管、水電解システム、及び水素の移送方法
5日前
株式会社日立製作所
成果評価システム、成果評価方法及び成果評価プログラム
3日前
株式会社日立製作所
量子演算システムおよび量子演算における装置間同期制御方法
5日前
株式会社日立製作所
太陽光パネルのリサイクルシステム、太陽光パネルのリサイクル方法
2日前
株式会社日立製作所
エレベーター及び乗りかご
2日前
株式会社日立製作所
製造オペレーションに関するインサイトを導出するためのクエリベースの方法
4日前
株式会社日立製作所
環境負荷低減支援装置、環境負荷低減支援システム、及び環境負荷低減支援方法
2日前
株式会社日立製作所
バッテリパック処理方法、非一時的コンピュータ可読媒体、およびバッテリパック処理装置
2日前
個人
非正規コート
5日前
個人
人物再現システム
2日前
有限会社ノア
データ読取装置
3日前
個人
広告提供システムおよびその方法
5日前
株式会社ザメディア
出席管理システム
10日前
個人
日誌作成支援システム
2日前
トヨタ自動車株式会社
工程計画装置
10日前
ミサワホーム株式会社
情報処理装置
9日前
個人
ポイント還元付き配送システム
3日前
株式会社タクテック
商品取出集品システム
9日前
トヨタ自動車株式会社
作業判定方法
11日前
オベック実業株式会社
接続構造
2日前
トヨタ自動車株式会社
情報処理システム
11日前
続きを見る
他の特許を見る