TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024168590
公報種別
公開特許公報(A)
公開日
2024-12-05
出願番号
2023085409
出願日
2023-05-24
発明の名称
故障監視装置および故障監視方法
出願人
富士通株式会社
代理人
個人
,
個人
主分類
G06F
11/20 20060101AFI20241128BHJP(計算;計数)
要約
【課題】各装置の動作に対応させて故障の検出動作を実施することで、複数の装置が搭載される場合にも、故障の検出が遅れることを抑制する。
【解決手段】共有メモリと、共有メモリにデータを順次書き込む第1装置と、共有メモリからデータを順次読み出す第2装置と、を有する情報処理装置に搭載される故障監視装置は、第1装置により共有メモリに書き込まれたデータのうち、第2装置により読み出されていない最古のデータを示す最古情報を保持する最古情報保持部と、第2装置により共有メモリから読み出されたデータが第2装置に後続する装置に出力された場合、最古情報保持部に保持された最古情報を更新する最古情報更新部と、第1装置により所定回数のデータが共有メモリに書き込まれても、最古情報保持部に保持された最古情報が更新されない場合、第2装置の故障を検出する第1故障検出部と、を有する。
【選択図】図2
特許請求の範囲
【請求項1】
共有メモリと、前記共有メモリにデータを順次書き込む第1装置と、前記共有メモリからデータを順次読み出す第2装置と、を有する情報処理装置に搭載される故障監視装置であって、
前記第1装置により前記共有メモリに書き込まれたデータのうち、前記第2装置により読み出されていない最古のデータを示す最古情報を保持する最古情報保持部と、
前記第2装置により前記共有メモリから読み出されたデータが前記第2装置に後続する装置に出力された場合、前記最古情報保持部に保持された前記最古情報を更新する最古情報更新部と、
前記第1装置により所定回数のデータが前記共有メモリに書き込まれても、前記最古情報保持部に保持された前記最古情報が更新されない場合、前記第2装置の故障を検出する第1故障検出部と、
を有する故障監視装置。
続きを表示(約 1,800 文字)
【請求項2】
前記第1装置による前記共有メモリへのデータの書き込みと、前記第2装置による前記共有メモリからのデータの読み出しは、互いに同じ周期で繰り返し実施され、
前記共有メモリは、前記第1装置による前記共有メモリへのデータの書き込みに対応して前記最古情報が更新されない場合にカウンタ値が更新される第1カウンタを含み、
前記第1故障検出部は、前記第1カウンタのカウンタ値の増加量が閾値以上になった場合、前記第2装置の故障を検出する、
請求項1に記載の故障監視装置。
【請求項3】
前記第1装置と前記第2装置とをそれぞれ含む複数の運用系と、
前記第1故障検出部を有する第3装置を含む待機系と、を有し、
前記共有メモリは、前記複数の運用系に共通に設けられ、
前記最古情報保持部および前記第1カウンタは、前記複数の運用系毎に前記共有メモリに設けられ、
前記最古情報更新部は、前記複数の運用系の前記第2装置の各々に含まれ、
前記第3装置は、前記第1故障検出部により前記第2装置のいずれかの故障を検出した場合、故障した前記第2装置に代わって運用系に切り替わる、
請求項2に記載の故障監視装置。
【請求項4】
前記第2装置は、前記共有メモリから読み出したデータを処理し、処理後のデータを出力した後、前記共有メモリに保持された処理前のデータを消去する、
請求項1に記載の故障監視装置。
【請求項5】
前記第1装置により前記共有メモリに書き込まれた最新のデータを示す最新情報を保持する最新情報保持部と、
前記第1装置により前記共有メモリにデータが書き込まれた場合、前記最新情報保持部に保持された前記最新情報を更新する最新情報更新部と、
前記第2装置により所定回数のデータが前記共有メモリから読み出されても、前記最新情報保持部に保持された前記最新情報が更新されない場合、前記第1装置の故障を検出する第2故障検出部と、
を有する請求項1に記載の故障監視装置。
【請求項6】
前記第1装置による前記共有メモリへのデータの書き込みと、前記第2装置による前記共有メモリからのデータの読み出しは、互いに同じ周期で繰り返し実施され、
前記共有メモリは、前記第2装置による前記共有メモリからのデータの読み出しに対応して前記最新情報が更新されない場合にカウンタ値が更新される第2カウンタを含み、
前記第2故障検出部は、前記第2カウンタのカウンタ値の増加量が閾値以上になった場合、前記第2装置の故障を検出する、
請求項5に記載の故障監視装置。
【請求項7】
前記第1装置と前記第2装置とをそれぞれ含む複数の運用系と、
前記第2故障検出部を有する第3装置を含む待機系と、を有し、
前記共有メモリは、前記複数の運用系に共通に設けられ、
前記最新情報保持部および前記第2カウンタは、前記複数の運用系毎に前記共有メモリに設けられ、
前記最新情報更新部は、前記複数の運用系の前記第1装置の各々に含まれ、
前記第3装置は、前記第2故障検出部により前記第1装置のいずれかの故障を検出した場合、故障した前記第1装置に代わって運用系に切り替わる、
請求項6に記載の故障監視装置。
【請求項8】
共有メモリと、前記共有メモリにデータを順次書き込む第1装置と、前記共有メモリからデータを順次読み出す第2装置と、を有する情報処理装置に搭載される故障監視装置による故障監視方法であって、
前記情報処理装置が有する最古情報保持部に、前記第1装置により前記共有メモリに書き込まれたデータのうち、前記第2装置により読み出されていない最古のデータを示す最古情報を保持し、
前記情報処理装置が有する最古情報更新部が、前記第2装置により前記共有メモリから読み出されたデータが前記第2装置に後続する装置に出力された場合、前記最古情報保持部に保持された前記最古情報を更新し、
前記情報処理装置が有する第1故障検出部が、前記第1装置により所定回数のデータが前記共有メモリに書き込まれても、前記最古情報保持部に保持された前記最古情報が更新されない場合、前記第2装置の故障を検出する、
故障監視方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、故障監視装置および故障監視方法に関する。
続きを表示(約 2,000 文字)
【背景技術】
【0002】
稼働系装置の障害が検出された場合、稼働系装置のデータが二重化された共有ストレージからデータを取得して待機系装置を動作させ、稼働系装置の機能を待機系装置で継続させる手法が知られている(例えば、特許文献1参照)。現用機の内蔵ディスク装置と同一の内容が書き込まれた共有ディスク装置を有し、現用機に障害が発生した場合、予備機が共有ディスク装置の内容をコピーして現用機の処理を引き継ぐ手法が知られている(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0003】
特開2016-110173号公報
特開平6-175788号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えば、共有メモリを介して接続される複数の運用系装置と、待機系装置とを含む情報処理装置では、上流側の運用系装置は、処理したデータを共有メモリに順次書き込み、下流側の運用系装置は、共有メモリから読み出したデータを順次処理する。例えば、情報処理装置に搭載される管理装置は、複数の運用系装置を監視して故障を検出し、故障した運用系装置を待機系装置に切り替える。しかしながら、運用系装置の数が多いほど、管理装置の負荷は増大し、各運用系装置の故障の監視周期は長くなり、故障の発生時の運用系装置から待機系装置への切り替えは遅くなる。例えば、下流側の運用系装置が故障したときに故障の検出と待機系装置への切り替えとが遅れると、共有メモリがオーバーフローしてデータが失われるおそれがある。
【0005】
1つの側面では、本発明は、各装置の動作に対応させて故障の検出動作を実施することで、複数の装置が搭載される場合にも、故障の検出が遅れることを抑制することを目的とする。
【課題を解決するための手段】
【0006】
一つの観点によれば、故障監視装置は、共有メモリと、前記共有メモリにデータを順次書き込む第1装置と、前記共有メモリからデータを順次読み出す第2装置と、を有する情報処理装置に搭載される故障監視装置であって、前記第1装置により前記共有メモリに書き込まれたデータのうち、前記第2装置により読み出されていない最古のデータを示す最古情報を保持する最古情報保持部と、前記第2装置により前記共有メモリから読み出されたデータが前記第2装置に後続する装置に出力された場合、前記最古情報保持部に保持された前記最古情報を更新する最古情報更新部と、前記第1装置により所定回数のデータが前記共有メモリに書き込まれても、前記最古情報保持部に保持された前記最古情報が更新されない場合、前記第2装置の故障を検出する第1故障検出部と、を有する。
【発明の効果】
【0007】
各装置の動作に対応させて故障の検出動作を実施することで、複数の装置が搭載される場合にも、故障の検出が遅れることを抑制することができる。
【図面の簡単な説明】
【0008】
一実施形態における情報処理装置の一例を示すブロック図である。
図1の情報処理装置の動作の一例を示す説明図である。
図2の続きを示す説明図である。
図1の情報処理装置の動作の別の例を示す説明図である。
図4の続きを示す説明図である。
図2から図5で説明した機能を持たない他の情報処理装置の動作の一例を示す説明図である。
別の実施形態における情報処理装置の一例を示すブロック図である。
図7の共有メモリのデータ構造の一例を示すブロック図である。
図7の情報処理装置の動作の一例を示すシーケンス図である。
図9の続きを示すシーケンス図である。
図10の続きを示すシーケンス図である。
図7の情報処理装置のデータ管理方式の全体動作の一例を示すフロー図である。
【発明を実施するための形態】
【0009】
以下、図面を参照して実施形態が説明される。
【0010】
図1は、一実施形態における情報処理装置の一例を示す。図1に示す情報処理装置100は、CPUと、複数の共有メモリCM(CM1、CM2、CM3)と、複数のカードCD(CD1、CD2、CD3)とを有する。各カードCDは、上流に接続された共有メモリCMからデータを読み出して処理し、処理後のデータを下流に接続された共有メモリCMに書き込む。情報処理装置100は、前段装置210および後段装置220とともにシステム300に含まれる。共有メモリCMにデータを書き込むカードCDは、第1装置の一例であり、共有メモリCMからデータを読み出すカードは、第2装置の一例である。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
光伝送装置
6日前
富士通株式会社
排出の推定と異常
27日前
富士通株式会社
排出の推定と異常
27日前
富士通株式会社
情報処理プログラム
1か月前
富士通株式会社
通信装置及び通信方法
5日前
富士通株式会社
演算器及び情報処理装置
5日前
富士通株式会社
プログラム,装置及び方法
6日前
富士通株式会社
キュービット・マッピング
2日前
富士通株式会社
伝送装置及び伝送システム
13日前
富士通株式会社
光伝送装置及び光伝送方法
1か月前
富士通株式会社
基地局装置及び通信システム
5日前
富士通株式会社
キュービット・ルーティング
2日前
富士通株式会社
制御装置及び制御プログラム
2日前
富士通株式会社
電源ユニット及びその制御方法
5日前
富士通株式会社
バイタルサイン検出装置と方法
15日前
富士通株式会社
電圧検知回路及び情報処理装置
5日前
富士通株式会社
ネットワーク装置及び判定方法
7日前
富士通株式会社
光伝送装置および光伝送システム
1か月前
富士通株式会社
エラー訂正装置及びエラー訂正方法
1か月前
富士通株式会社
光送受信機制御方法および光送受信機
1か月前
富士通株式会社
機械学習プログラム、方法、及び装置
1か月前
富士通株式会社
ラマン増幅装置およびラマン増幅方法
1か月前
富士通株式会社
作業割当方法および作業割当プログラム
5日前
富士通株式会社
OD決定方法およびOD決定プログラム
1か月前
富士通株式会社
病変検出方法および病変検出プログラム
2日前
富士通株式会社
データ生成プログラム、方法、及び装置
1か月前
富士通株式会社
情報処理方法および情報処理プログラム
1か月前
富士通株式会社
データ転送制御装置および情報処理装置
5日前
富士通株式会社
制御プログラム、制御方法及びサーバ装置
5日前
富士通株式会社
制御プログラム、制御装置、及び制御方法
1か月前
富士通株式会社
コンパイルプログラム及びコンパイル方法
2日前
富士通株式会社
キャッシュコントローラ及び演算処理装置
1か月前
富士通株式会社
車両販売支援システム、方法およびプログラム
28日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
27日前
富士通株式会社
遅延制御回路、光送信装置、及び遅延制御方法
15日前
富士通株式会社
特定プログラム、特定方法、および情報処理装置
1か月前
続きを見る
他の特許を見る