TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025135176
公報種別
公開特許公報(A)
公開日
2025-09-18
出願番号
2024032849
出願日
2024-03-05
発明の名称
計算機システム及びデータパイプライン処理の制御方法
出願人
株式会社日立製作所
代理人
藤央弁理士法人
主分類
G06F
9/50 20060101AFI20250910BHJP(計算;計数)
要約
【課題】新たなデータパイプラインを追加する場合、既存のデータパイプラインに変更及び影響を与えず、制約時間内にプロセスを完了できるようにデータパイプラインを制御する。
【解決手段】計算機システムは、データレイクサーバと、データベースサーバと、データパイプライン処理を実行する複数のデータパイプラインサーバとを備える。複数のデータパイプラインサーバは、制御データパイプラインサーバと、非制御データパイプラインサーバとを含む。計算機システムは制御情報生成部を有する。制御情報生成部は、データベースサーバから取得した負荷情報及び制御データパイプラインサーバのデータパイプライン処理の進捗情報に基づいて、データベースサーバの負荷が所定の閾値より小さく、かつ、データパイプライン処理が制約時間内に終了可能な制御パラメータを算出し、制御データパイプラインサーバに送信する。
【選択図】図2
特許請求の範囲
【請求項1】
IoTデータを扱う計算機システムであって、
IoTデータを格納するデータレイクを管理するデータレイクサーバと、
データ処理が行われた前記IoTデータを格納するデータベースを管理するデータベースサーバと、
前記データレイクからの前記IoTデータの取得、前記IoTデータに対する前記データ処理の実行、及び前記データベースへの前記データ処理が行われた前記IoTデータの書込を行うデータパイプライン処理を実行する複数のデータパイプラインサーバと、
を備え、
前記複数のデータパイプラインサーバは、前記データパイプライン処理の制御が可能な制御データパイプラインサーバと、前記データパイプライン処理の制御が不可能な非制御データパイプラインサーバと、を含み、
前記計算機システムは、前記制御データパイプラインサーバの前記データパイプライン処理を制御するための制御パラメータを調整するための制御情報を生成する制御情報生成部を有し、
前記制御情報生成部は、
前記データベースサーバから負荷情報を取得し、
前記制御データパイプラインサーバから前記データパイプライン処理の制約時間及び進捗状況に関する進捗情報を取得し、
前記負荷情報及び前記進捗状況に基づいて、前記データベースサーバの負荷が所定の閾値より小さく、かつ、前記データパイプライン処理が制約時間内に終了可能な前記制御パラメータ又は前記制御パラメータの範囲を算出し、前記制御パラメータ又は前記制御パラメータの範囲を含む前記制御情報を生成し、
前記制御データパイプラインサーバに前記制御情報を送信することを特徴とする計算機システム。
続きを表示(約 2,800 文字)
【請求項2】
請求項1に記載の計算機システムであって、
前記制御情報生成部は、
前記負荷情報に基づいて、前記データベースサーバにかける負荷が所定の閾値より小さくなる前記データパイプライン処理の処理性能を表す第1指標を算出し、
前記進捗状況に基づいて、前記制約時間内に前記データパイプライン処理を終了させるために必要な前記データパイプライン処理の処理性能を表す第2指標を算出し、
前記第1指標及び前記第2指標に基づいて、前記制御パラメータ又は前記制御パラメータの範囲を算出することを特徴とする計算機システム。
【請求項3】
請求項2に記載の計算機システムであって、
複数の前記制御データパイプラインサーバと接続し、前記制御情報生成部を有する制御サーバを含み、
前記制御情報生成部は、
前記負荷情報及び前記複数の制御データパイプラインサーバの各々の前記進捗情報に基づいて、前記複数の制御データパイプラインサーバの各々の前記第2指標を算出し、
前記複数の制御データパイプラインサーバの各々について、前記第1指標及び複数の前記第2指標に基づいて前記制御パラメータ又は前記制御パラメータの範囲を算出することを特徴とする計算機システム。
【請求項4】
請求項2に記載の計算機システムであって、
前記制御情報生成部は、前記制御データパイプラインサーバが有することを特徴とする計算機システム。
【請求項5】
請求項2に記載の計算機システムであって、
前記データパイプライン処理は、
前記データレイクからの前記IoTデータの取得を行う第1タスクと、
前記IoTデータに対する前記データ処理の実行及び前記データベースへの前記データ処理が行われた前記IoTデータの書き込みを行う第2タスクと、
前記第2タスクへ、前記第1タスクによって取得された前記IoTデータを振り分ける第3タスクと、
を含み、
前記制御情報生成部は、前記第1タスク及び前記第3タスクの少なくともいずれかを制御するための前記制御パラメータ又は前記制御パラメータの範囲を算出することを特徴とする計算機システム。
【請求項6】
請求項5に記載の計算機システムであって、
前記制御情報生成部は、前記第2タスクの並列数又は並列数の範囲、及び、前記データ処理が行われた前記IoTデータの書き込みが失敗した場合に前記第2タスクを再度実行するための待ち時間又は待ち時間の範囲の少なくともいずれかを算出することを特徴とする計算機システム。
【請求項7】
IoTデータを扱う計算機システムにおけるデータパイプライン処理の制御方法であって、
前記計算機システムは、
IoTデータを格納するデータレイクを管理するデータレイクサーバと、
データ処理が行われた前記IoTデータを格納するデータベースを管理するデータベースサーバと、
前記データレイクからの前記IoTデータの取得、前記IoTデータに対する前記データ処理の実行、及び前記データベースへの前記データ処理が行われた前記IoTデータの書込を行うデータパイプライン処理を実行する複数のデータパイプラインサーバと、
を含み、
前記複数のデータパイプラインサーバは、前記データパイプライン処理の制御が可能な制御データパイプラインサーバと、前記データパイプライン処理の制御が不可能な非制御データパイプラインサーバと、を含み、
前記計算機システムは、前記制御データパイプラインサーバの前記データパイプライン処理を制御するための制御パラメータを調整するための制御情報を生成する制御情報生成部を有し、
前記データパイプライン処理の制御方法は、
前記制御情報生成部が、前記データベースサーバから負荷情報を取得する第1のステップと、
前記制御情報生成部が、前記制御データパイプラインサーバから前記データパイプライン処理の制約時間及び進捗状況に関する進捗情報を取得する第2のステップと、
前記制御情報生成部が、前記負荷情報及び前記進捗状況に基づいて、前記データベースサーバの負荷が所定の閾値より小さく、かつ、前記データパイプライン処理が制約時間内に終了可能な前記制御パラメータ又は前記制御パラメータの範囲を算出し、前記制御パラメータ又は前記制御パラメータの範囲を含む前記制御情報を生成する第3のステップと、
前記制御情報生成部が、前記制御データパイプラインサーバに前記制御情報を送信する第4のステップと、
を含むことを特徴とするデータパイプライン処理の制御方法。
【請求項8】
請求項7に記載のデータパイプライン処理の制御方法であって、
前記第3のステップは、
前記制御情報生成部が、前記負荷情報に基づいて、前記データベースサーバにかける負荷が所定の閾値より小さくなる前記データパイプライン処理の処理性能を表す第1指標を算出する第5のステップと、
前記制御情報生成部が、前記進捗状況に基づいて、前記制約時間内に前記データパイプライン処理を終了させるために必要な前記データパイプライン処理の処理性能を表す第2指標を算出する第6のステップと、
前記制御情報生成部が、前記第1指標及び前記第2指標に基づいて、前記制御パラメータ又は前記制御パラメータの範囲を算出する第7のステップと、を含むことを特徴とするデータパイプライン処理の制御方法。
【請求項9】
請求項8に記載のデータパイプライン処理の制御方法であって、
複数の前記制御データパイプラインサーバと接続し、前記制御情報生成部を有する制御サーバを含み、
前記第6のステップは、前記制御情報生成部が、前記負荷情報及び前記複数の制御データパイプラインサーバの各々の前記進捗情報に基づいて、前記複数の制御データパイプラインサーバの各々の前記第2指標を算出するステップを含み、
前記第7のステップは、前記制御情報生成部が、前記複数の制御データパイプラインサーバの各々について、前記第1指標及び複数の前記第2指標に基づいて前記制御パラメータ又は前記制御パラメータの範囲を算出するステップを含むことを特徴とするデータパイプライン処理の制御方法。
【請求項10】
請求項8に記載のデータパイプライン処理の制御方法であって、
前記制御情報生成部は、前記制御データパイプラインサーバが有することを特徴とするデータパイプライン処理の制御方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、IoTシステムにおけるデータパイプラインの制御技術に関する。
続きを表示(約 2,300 文字)
【背景技術】
【0002】
IoTデータを取り扱うIoTシステムには、IoTデバイスから取得したデータを格納するデータレイクから、データの抽出及び加工を行い、データベースに格納するデータキュレーションプロセスを実行するデータパイプラインが存在する。
【先行技術文献】
【特許文献】
【0003】
特開2019-139522号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
IoTシステムに新たなデータパイプラインを追加する場合、既存のデータパイプラインに変更及び影響を与えないことが要求される。一方、データパイプラインは、制約時間内にプロセスを完了する必要がある。
【0005】
データパイプラインが、制約時間内にプロエスを完了させるために大量のデータをデータベースへ書き込んだ場合、データベースの負荷が増大し、リトライ及びタイムアウトが発生する。そのため、他のデータパイプラインに影響を与える。一方、データベースの負荷が増大しないようにデータパイプラインによるデータベースへの書込量を制限しすぎると、制約時間内にプロセスを完了できない。したがって、データパイプラインの処理量及びデータベースの負荷を調整する必要がある。
【0006】
システムで実行される処理の調整を行う技術として特許文献1に記載の技術が知られている。特許文献1には、「情報処理装置が、観測部と、予測部と、調整部と、指示部とを有する。観測部は、分散処理システム上に配置された複数のコンポーネントの内、コンポーネント間に依存関係がある変更対象コンポーネントの負荷実測値を観測する。予測部は、変更対象コンポーネントの負荷実測値に基づき、全ての変更対象コンポーネントの変更処理が完了するまでの負荷予測値を算出する。調整部は、負荷予測値が閾値を超えた場合に変更処理前の変更対象コンポーネントに対して、変更処理の開始を指示する変更指示の送信間隔を調整する。指示部は、調整部にて調整された前記送信間隔に基づき、変更処理前の変更対象コンポーネントに対して前記変更指示を指示する。」ことが記載されている。
【0007】
特許文献1に記載の技術では、変更対象コンポーネントの制約が考慮されていないため、特許文献1に記載の技術を用いても前述した課題を解決することは難しい。
【課題を解決するための手段】
【0008】
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、IoTデータを扱う計算機システムであって、IoTデータを格納するデータレイクを管理するデータレイクサーバと、データ処理が行われた前記IoTデータを格納するデータベースを管理するデータベースサーバと、前記データレイクからの前記IoTデータの取得、前記IoTデータに対する前記データ処理の実行、及び前記データベースへの前記データ処理が行われた前記IoTデータの書込を行うデータパイプライン処理を実行する複数のデータパイプラインサーバと、を備え、前記複数のデータパイプラインサーバは、前記データパイプライン処理の制御が可能な制御データパイプラインサーバと、前記データパイプライン処理の制御が不可能な非制御データパイプラインサーバと、を含み、前記計算機システムは、前記制御データパイプラインサーバの前記データパイプライン処理を制御するための制御パラメータを調整するための制御情報を生成する制御情報生成部を有し、前記制御情報生成部は、前記データベースサーバから負荷情報を取得し、前記制御データパイプラインサーバから前記データパイプライン処理の制約時間及び進捗状況に関する進捗情報を取得し、前記負荷情報及び前記進捗状況に基づいて、前記データベースサーバの負荷が所定の閾値より小さく、かつ、前記データパイプライン処理が制約時間内に終了可能な前記制御パラメータ又は前記制御パラメータの範囲を算出し、前記制御パラメータ又は前記制御パラメータの範囲を含む前記制御情報を生成し、前記制御データパイプラインサーバに前記制御情報を送信する。
【発明の効果】
【0009】
本発明によれば、非制御データパイプラインサーバへ影響を与えず、かつ、制約時間内に処理が終了するように、制御データパイプラインサーバのデータパイプライン処理を調整できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
【図面の簡単な説明】
【0010】
実施例1のIoTシステムの構成例を示す図である。
実施例1のIoTシステムの機能構成及び処理の流れを説明する図である。
実施例1のデータパイプラインサーバのハードウェア構成の一例を示す図である。
実施例1の制御データパイプラインサーバにおける処理の流れを説明するシーケンス図である。
実施例1の調整部の制御情報生成部が実行する処理の一例を説明するフローチャートである。
実施例1の負荷情報の一例を示す図である。
実施例1の進捗情報の一例を示す図である。
実施例1の制御パラメータ情報の一例を示す図である。
実施例1の入出力部が提示する画面の一例を示す図である。
実施例2のIoTシステムの機能構成及び処理の流れを説明する図である。
実施例2の調整部の制御情報生成部が実行する処理の一例を説明するフローチャートである。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
株式会社日立製作所
半導体装置
3日前
株式会社日立製作所
レール把持装置
19日前
株式会社日立製作所
欠陥知識循環システム
9日前
株式会社日立製作所
計画装置および計画方法
1日前
株式会社日立製作所
受診支援装置および方法
18日前
株式会社日立製作所
直動接点および巻線切替装置
17日前
株式会社日立製作所
対話システムおよび対話方法
18日前
株式会社日立製作所
搬送制御装置及び搬送制御方法
18日前
株式会社日立製作所
状態検知装置及び状態検知方法
3日前
株式会社日立製作所
人物特性推定システム及び方法
10日前
株式会社日立製作所
電子機器および電子機器制御方法
3日前
株式会社日立製作所
再エネ調達手段選定支援システム
17日前
株式会社日立製作所
情報処理システム、情報処理方法
17日前
株式会社日立製作所
設計支援装置および設計支援方法
19日前
株式会社日立製作所
建物管理システム及び建物管理方法
1日前
株式会社日立製作所
障害対応システム及び障害対応方法
9日前
株式会社日立製作所
ワークフロー作成支援装置及び方法
18日前
株式会社日立製作所
ログ抽出方法及びログ抽出システム
11日前
株式会社日立製作所
異常検知システム及び異常検知方法
1日前
株式会社日立製作所
電力監視システムおよび電力監視方法
1日前
株式会社日立製作所
図面整合システムおよび図面整合方法
12日前
株式会社日立製作所
制御装置、制御方法およびプログラム
3日前
株式会社日立製作所
管理装置、管理方法、及び制御システム
22日前
株式会社日立製作所
鉄道システムおよび鉄道車両の制御方法
11日前
株式会社日立製作所
計算機システム及びタスクの割当制御方法
1日前
株式会社日立製作所
支援装置、支援方法、及び支援プログラム
1日前
株式会社日立製作所
水素製造計画装置および水素製造システム
17日前
株式会社日立製作所
サービス管理システム及びサービス管理方法
1日前
株式会社日立製作所
電力運用管理システム及び電力運用管理方法
1日前
株式会社日立製作所
寸法計測管理システム及び寸法計測管理方法
15日前
株式会社日立製作所
電力需給調整システムおよび電力需給調整方法
1日前
株式会社日立製作所
根本原因分析システム、方法およびプログラム
17日前
株式会社日立製作所
ストレージ装置、電力供給方法、及びプログラム
3日前
株式会社日立製作所
健康施策支援システム、方法、およびプログラム
18日前
株式会社日立製作所
金属表面処理剤、塗装体の製造方法、および車両
2日前
株式会社日立製作所
低次元モデル生成装置および低次元モデル生成方法
10日前
続きを見る
他の特許を見る