[go: up one dir, main page]

JP2013005365A - Monitoring device, monitoring method, and program - Google Patents

Monitoring device, monitoring method, and program Download PDF

Info

Publication number
JP2013005365A
JP2013005365A JP2011137015A JP2011137015A JP2013005365A JP 2013005365 A JP2013005365 A JP 2013005365A JP 2011137015 A JP2011137015 A JP 2011137015A JP 2011137015 A JP2011137015 A JP 2011137015A JP 2013005365 A JP2013005365 A JP 2013005365A
Authority
JP
Japan
Prior art keywords
notification
report
emergency call
unit
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011137015A
Other languages
Japanese (ja)
Other versions
JP5459797B2 (en
Inventor
Tetsuya Mino
哲也 三野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC System Technologies Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC System Technologies Ltd filed Critical NEC System Technologies Ltd
Priority to JP2011137015A priority Critical patent/JP5459797B2/en
Publication of JP2013005365A publication Critical patent/JP2013005365A/en
Application granted granted Critical
Publication of JP5459797B2 publication Critical patent/JP5459797B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Alarm Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

【課題】監視対象となる装置から、重要度の高い通報がなされた場合に、当該通報とこれに関連する通報とを特定し、これらをまとめて提示し得る、監視装置、監視方法、及びプログラムを提供する。
【解決手段】監視装置10は、監視対象となる装置30からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、判断部12と、緊急通報以外の通報のうち、選別条件に合致する通報を特定する、選別部16と、判断部12が該当すると判断した場合に、緊急通報と、選別部16が特定した通報とを、外部に知らせるための専用の画面22を生成する、緊急通報部17と、を備えている。
【選択図】図1
A monitoring device, a monitoring method, and a program capable of specifying a notification and a related notification when a highly important notification is made from a device to be monitored and presenting them together. I will provide a.
A monitoring device determines whether a notification notifying a failure from a device to be monitored corresponds to an emergency notification, and if so, identifies a notification related to the notification A condition is set, the determination unit 12 specifies a notification that matches the selection condition among notifications other than the emergency notification, and when the selection unit 16 and the determination unit 12 determine that it corresponds, the emergency notification and the selection unit And an emergency notification unit 17 that generates a dedicated screen 22 for notifying the outside of the notification identified by 16.
[Selection] Figure 1

Description

本発明は、サーバコンピュータ等の装置を監視するための監視装置及び監視方法に関し、更には、これらを実現するためのプログラムに関する。   The present invention relates to a monitoring device and a monitoring method for monitoring a device such as a server computer, and further relates to a program for realizing them.

従来から、複数のサーバ装置を備えたコンピュータシステムにおいては、各サーバ装置における障害発生を管理するために、監視システムが導入されている。一般に、監視システムでは、各サーバ装置から、障害の発生を通知する通報が、中央の管理装置へと出力される。そして、中央管理装置は、各通報を表示装置の画面に順次表示させるので、監視者は、画面の表示内容に基づいて対処を行なうことになる。   Conventionally, in a computer system including a plurality of server devices, a monitoring system has been introduced to manage the occurrence of a failure in each server device. In general, in the monitoring system, a notification notifying the occurrence of a failure is output from each server device to a central management device. The central management apparatus sequentially displays the notifications on the screen of the display device, so that the supervisor takes action based on the display content of the screen.

但し、このような監視システムでは、管理対象となるサーバ装置の数が増加する程、管理者の負担が増加してしまうため、緊急の対処が必要な障害が見過ごされてしまう可能性がある。このため、例えば、特許文献1は、通報を受けた障害毎に、重要度を2段階で判定し、重要度の高い障害から優先して表示画面に表示する、監視システムを開示している。   However, in such a monitoring system, as the number of server devices to be managed increases, the burden on the administrator increases. Therefore, there is a possibility that a failure requiring urgent action may be overlooked. For this reason, for example, Patent Document 1 discloses a monitoring system in which the importance is determined in two stages for each failure received and displayed on the display screen with priority from the failure having the higher importance.

このような特許文献1に開示された監視システムによれば、監視者は、重要度の高い(緊急性の高い)障害を把握し易いため、緊急の対処が必要な障害が見過ごされてしまう事態は、回避されると考えられる。   According to such a monitoring system disclosed in Patent Literature 1, since it is easy for the monitor to grasp a failure having a high degree of importance (high urgency), a failure that requires urgent action is overlooked. Is considered to be avoided.

特開平8−242230号公報JP-A-8-242230

ところで、現在において、監視対象となるサーバ装置は複雑化しているため、監視システムが監視すべき項目は、性能、リソースの使用状況、ログメッセージ、プロセスの状態等、種々の項目に渡っている。また、これに合わせて、通報の種類も増加している。   By the way, since the server apparatus to be monitored is complicated at present, items to be monitored by the monitoring system are various items such as performance, resource usage status, log message, and process status. Along with this, the types of reports are increasing.

このため、上記特許文献1に開示された監視システムのように、障害を重要度に単に分類しただけでは、監視者において、障害の発生に至る経緯の調査及び確認に時間がかかってしまう。結果、監視員の緊急対応(復旧等)の初動が遅れたり、緊急状態が発生してから対応(復旧等)するまで時間を要する結果となったり、する可能性がある。   For this reason, if the failure is simply classified into the importance as in the monitoring system disclosed in Patent Document 1, it takes time for the monitor to investigate and confirm the circumstances leading to the occurrence of the failure. As a result, there is a possibility that the initial action of the emergency response (recovery, etc.) of the observer is delayed, or that it takes time until the response (recovery, etc.) takes place after an emergency situation occurs.

例えば、あるサーバ装置から、「CPU使用率が警告域です。」という通報がなされており、その後、「スループットが低下している。」という通報がなされるとする。そして、これらは互いに関連しているが、前者の重要度が「低」に設定され、後者の重要度が「高」に設定されている場合、後者の通報は、優先して画面に表示されるが、前者の通報は、後から画面に表示される。この結果、監視者は、スループットが低下している原因の特定に時間がかかってしまうため、迅速に適切な対処をとることが困難となる。   For example, it is assumed that a notification “CPU usage rate is in warning range” is given from a server device, and then a notification “throughput is reduced” is given. These are related to each other, but when the importance level of the former is set to “low” and the importance level of the latter is set to “high”, the latter notification is preferentially displayed on the screen. However, the former notification will be displayed on the screen later. As a result, it takes time for the monitor to identify the cause of the reduced throughput, making it difficult to take appropriate measures quickly.

本発明の目的の一例は、上記問題を解消し、監視対象となる装置から、重要度の高い通報がなされた場合に、当該通報とこれに関連する通報とを特定し、これらをまとめて提示し得る、監視装置、監視方法、及びプログラムを提供することにある。   An example of the object of the present invention is to solve the above problems, and when a highly important report is made from a device to be monitored, the report and a related report are identified and presented together. An object is to provide a monitoring device, a monitoring method, and a program.

上記目的を達成するため、本発明の一側面における監視装置は、監視対象となる装置からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、判断部と、
前記判断部が前記緊急通報に該当すると判断した通報以外の通報のうち、前記選別条件に合致する通報を特定する、選別部と、
前記判断部が該当すると判断した場合に、前記判断部が前記緊急通報に該当すると判断した通報と、前記選別部が特定した通報とを、外部に知らせるための専用の画面を生成する、緊急通報部と、
を備えていることを特徴とする。
In order to achieve the above object, the monitoring device according to one aspect of the present invention determines whether or not a notification of a failure from a device to be monitored corresponds to an emergency notification, and if so, A determination unit that sets screening conditions for identifying related reports;
Among the notifications other than the notification determined by the determination unit to correspond to the emergency call, the selection unit that specifies a notification that matches the selection condition; and
An emergency call that generates a dedicated screen for notifying the outside of the report determined by the determination unit to correspond to the emergency call and the report specified by the selection unit when the determination unit determines that the determination is applicable And
It is characterized by having.

また、上記目的を達成するため、本発明の一側面における監視方法は、
(a)監視対象となる装置からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、ステップと、
(b)前記(a)のステップで前記緊急通報に該当すると判断した通報以外の通報のうち、前記選別条件に合致する通報を特定する、ステップと、
(c)前記(a)のステップで該当すると判断した場合に、前記(a)のステップで前記緊急通報に該当すると判断した通報と、前記(b)のステップで特定した通報とを、外部に知らせるための専用の画面を生成する、ステップと、
を有することを特徴とする。
In order to achieve the above object, a monitoring method according to one aspect of the present invention includes:
(A) determining whether a notification notifying a failure from a device to be monitored corresponds to an emergency call and, if applicable, setting a selection condition for identifying a report related to the notification; and ,
(B) identifying a report that matches the selection condition among reports other than the report determined to correspond to the emergency call in the step (a); and
(C) When it is determined that it corresponds in the step (a), the notification determined to correspond to the emergency call in the step (a) and the notification specified in the step (b) Creating a dedicated screen to inform, steps,
It is characterized by having.

更に、上記目的を達成するため、本発明の一側面におけるプログラムは、
監視対象となる装置に接続された、コンピュータに、
(a)前記監視対象となる装置からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、ステップと、
(b)前記(a)のステップで前記緊急通報に該当すると判断した通報以外の通報のうち、前記選別条件に合致する通報を特定する、ステップと、
(c)前記(a)のステップで該当すると判断した場合に、前記(a)のステップで前記緊急通報に該当すると判断した通報と、前記(b)のステップで特定した通報とを、外部に知らせるための専用の画面を生成する、ステップと、
を実行させることを特徴とする。
Furthermore, in order to achieve the above object, a program according to one aspect of the present invention is provided.
To the computer connected to the device to be monitored,
(A) determining whether or not a report notifying a failure from the device to be monitored corresponds to an emergency call, and if so, setting a selection condition for specifying a report related to the report; When,
(B) identifying a report that matches the selection condition among reports other than the report determined to correspond to the emergency call in the step (a); and
(C) When it is determined that it corresponds in the step (a), the notification determined to correspond to the emergency call in the step (a) and the notification specified in the step (b) Creating a dedicated screen to inform, steps,
Is executed.

以上のように、本発明によれば、監視対象となる装置から、重要度の高い通報がなされた場合に、当該通報とこれに関連する通報とを特定し、これらをまとめて提示することができる。   As described above, according to the present invention, when a highly important report is made from a device to be monitored, it is possible to identify the report and a report related to the report and present them together. it can.

図1は、本発明の実施の形態における監視装置の構成を示すブロック図である。FIG. 1 is a block diagram showing a configuration of a monitoring apparatus according to an embodiment of the present invention. 図2は、本発明の実施の形態における監視装置を構成する通報受信部及び判断部の動作を示すフロー図である。FIG. 2 is a flowchart showing the operations of the report receiving unit and the determining unit that constitute the monitoring device according to the embodiment of the present invention. 図3は、本発明の実施の形態における監視装置を構成する選別部の動作を示すフロー図である。FIG. 3 is a flowchart showing the operation of the selection unit constituting the monitoring apparatus according to the embodiment of the present invention. 図4は、本発明の実施の形態における監視装置を構成する緊急通報部の動作を示すフロー図である。FIG. 4 is a flowchart showing the operation of the emergency call unit constituting the monitoring device according to the embodiment of the present invention. 図5は、本発明の実施の形態における監視装置を実現するコンピュータの一例を示すブロック図である。FIG. 5 is a block diagram illustrating an example of a computer that implements the monitoring device according to the embodiment of the present invention.

(実施の形態)
以下、本発明の実施の形態における、監視装置、監視方法、及びプログラムについて図1〜図5を参照しながら説明する。
(Embodiment)
Hereinafter, a monitoring device, a monitoring method, and a program according to an embodiment of the present invention will be described with reference to FIGS.

[装置構成]
最初に、本発明の実施の形態における監視装置の構成を、図1を用いて説明する。図1は、本発明の実施の形態における監視装置の構成を示すブロック図である。
[Device configuration]
First, the configuration of the monitoring apparatus according to the embodiment of the present invention will be described with reference to FIG. FIG. 1 is a block diagram showing a configuration of a monitoring apparatus according to an embodiment of the present invention.

図1に示すように、本実施の形態における監視装置10は、監視対象となる装置30から、障害を通知する通報を受けると、受けた通報を、液晶ディスプレイ等の表示装置20の画面に表示させる装置である。   As shown in FIG. 1, when the monitoring device 10 according to the present embodiment receives a notification notifying a failure from a device 30 to be monitored, the monitoring device 10 displays the received notification on the screen of the display device 20 such as a liquid crystal display. It is a device to let you.

また、図1に示すように、監視装置10は、判断部12と、選別部16と、緊急通報部17とを備えている。まず、判断部12は、監視対象となる装置30からの障害を通知する通報が、緊急通報に該当するかどうかを判断する。そして、判断部12は、該当すると判定すると、当該通報に関連した通報を特定する選別条件を設定する。   As shown in FIG. 1, the monitoring device 10 includes a determination unit 12, a selection unit 16, and an emergency notification unit 17. First, the determination unit 12 determines whether or not a report that notifies a failure from the device 30 to be monitored corresponds to an emergency call. And if the judgment part 12 determines with it being applicable, it will set the screening condition which specifies the report relevant to the said report.

選別部15は、判断部12が緊急通報に該当すると判断した通報以外の通報のうち、選別条件に合致する通報を特定する。緊急通報部17は、判断部12が該当すると判断した場合に、判断部12が緊急通報に該当すると判断した通報と、選別部15が特定した通報とを、外部に知らせるための、専用の監視画面22を生成する。監視画面22は、緊急通報毎に生成され、表示装置20の画面上に表示される。   The sorting unit 15 identifies a report that matches the sorting condition among reports other than the report that the determination unit 12 determines to be an emergency call. The emergency notification unit 17 is a dedicated monitoring unit for notifying the outside of the notification that the determination unit 12 determines to be an emergency call and the notification that the selection unit 15 has identified when the determination unit 12 determines that the determination is applicable. A screen 22 is generated. The monitoring screen 22 is generated for each emergency call and is displayed on the screen of the display device 20.

このように、監視装置10は、監視対象となる装置30から、重要度の高い緊急通報を受信すると、それを契機に、この緊急通報に関連する通報を特定する。そして、監視装置10は、専用の画面により、この緊急通報と関連する通報とをまとめて表示する。このため、監視装置10の監視者は、障害の発生に至る経緯の調査及び確認を迅速に行なうことができるので、緊急対応(復旧等)の初動を迅速にとることができ、緊急状態が発生してから対応(復旧等)するまでの時間の短縮化が図られる。   As described above, when the monitoring apparatus 10 receives a highly important emergency call from the apparatus 30 to be monitored, the monitoring apparatus 10 specifies a report related to the emergency call. And the monitoring apparatus 10 displays this emergency call and the related report collectively on a dedicated screen. For this reason, the supervisor of the monitoring device 10 can quickly investigate and confirm the circumstances leading to the occurrence of the failure, so that the initial action of emergency response (recovery, etc.) can be taken quickly, and an emergency state occurs. The time until the response (recovery, etc.) is reduced.

ここで、本実施の形態における監視装置10の構成を更に具体的に説明する。図1に示すように、本実施の形態では、監視対象となる装置30は、複数個あり、各装置30は、サーバコンピュータ(以下、「サーバコンピュータ30」と表記する。)である。サーバコンピュータ30は、ネットワーク40を介して、監視装置10に接続されている。   Here, the configuration of the monitoring apparatus 10 in the present embodiment will be described more specifically. As shown in FIG. 1, in this embodiment, there are a plurality of devices 30 to be monitored, and each device 30 is a server computer (hereinafter referred to as “server computer 30”). The server computer 30 is connected to the monitoring device 10 via the network 40.

また、各サーバコンピュータ30には、内部で発生した障害を検知する監視プログラム31が組み込まれており、監視プログラム31によって通報が出力されている。更に、監視プログラム31は、それが組み込まれたサーバコンピュータ30の識別子と、そこで発生した障害の内容とを含む通報を出力する。   Each server computer 30 incorporates a monitoring program 31 for detecting an internal failure, and a report is output by the monitoring program 31. Further, the monitoring program 31 outputs a report including the identifier of the server computer 30 in which the monitoring program 31 is incorporated and the content of the failure that has occurred.

また、図1に示すように、監視装置10は、本実施の形態では、判断部12、選別部16、及び緊急通報部17に加えて、通報受信部11と、通報蓄積部13と、通常通報部14と、通報記憶部15とを備えている。   As shown in FIG. 1, in this embodiment, the monitoring device 10 includes, in addition to the determination unit 12, the selection unit 16, and the emergency notification unit 17, the notification reception unit 11, the notification storage unit 13, A reporting unit 14 and a reporting storage unit 15 are provided.

通信受信部11は、各サーバコンピュータ30からの通報を受信し、受信した通報を判断部12に引き渡す。判断部12は、本実施の形態では、引き渡された通報に対して、上述した緊急通報かどうかの判断を行なう。   The communication receiving unit 11 receives a report from each server computer 30 and delivers the received report to the determination unit 12. In the present embodiment, the determination unit 12 determines whether or not the above-described emergency notification is made with respect to the delivered notification.

また、判断部12は、本実施の形態では、緊急通報条件を含む緊急通報条件情報と、選別条件を含む選別条件情報とを管理している。緊急通報条件は、緊急通報に該当する通報を予め規定した条件であり、判断部12は、緊急通報条件に基づいて、緊急通報に該当するかどうかを判断する。本実施の形態では、緊急通報条件及び選別条件は、いずれかのサーバコンピュータ30の識別子と、発生した障害の内容とで規定されている。   In the present embodiment, the determination unit 12 manages emergency call condition information including emergency call conditions and selection condition information including selection conditions. The emergency call condition is a condition that prescribes a call corresponding to the emergency call in advance, and the determination unit 12 determines whether the call corresponds to the emergency call based on the emergency call condition. In the present embodiment, the emergency notification condition and the selection condition are defined by the identifier of one of the server computers 30 and the content of the failure that has occurred.

更に、判断部12は、本実施の形態では、緊急通報条件に合致する通報(緊急通報)に関連する通報を特定するため、選別条件情報の中から、この緊急通報に対応する選別条件を特定し、これを「有効」に設定する。また、判断部12は、特定の選別条件を「有効」に設定した場合は、この後の緊急通報条件に基づく判断の前に、先ず、この特定の選別条件に通報が合致するかどうかを判断し、合致しない場合に、緊急通報条件に基づく判断を行なう。   Further, in the present embodiment, the determination unit 12 specifies a selection condition corresponding to this emergency call from the selection condition information in order to specify a report related to a report (emergency call) that matches the emergency call condition. And set this to “valid”. In addition, when the specific selection condition is set to “valid”, the determination unit 12 first determines whether or not the notification matches the specific selection condition before making a determination based on the emergency notification condition thereafter. If they do not match, a decision is made based on the emergency call conditions.

また、判断部12は、通報が緊急通報条件に合致すると判断する場合は、選別部16に対して、設定した選別条件を通知し、更に、緊急通報部17と通報蓄積部13とに対して、緊急通報を通知する。   In addition, when the determination unit 12 determines that the notification matches the emergency notification condition, the determination unit 12 notifies the selection unit 16 of the set selection condition, and further notifies the emergency notification unit 17 and the notification storage unit 13. Notify emergency calls.

通報蓄積部12は、判断部12による判断が終了した通報、具体的には、判断部12が選別条件に合致すると判断した通報、及び判断部12が緊急通報かどうかの判断対象とした通報を一時的に蓄積する。また、通報蓄積部12は、一時的に蓄積した通報を、通知された順に通常通報部14に出力すると共に、出力した順に通報を削除する。   The report accumulation unit 12 reports a report that the determination by the determination unit 12 is completed, specifically, a report that the determination unit 12 determines to meet the selection conditions, and a report that is a determination target whether the determination unit 12 is an emergency call. Accumulate temporarily. In addition, the notification storage unit 12 outputs the temporarily stored notifications to the normal notification unit 14 in the notified order, and deletes the notifications in the output order.

通常通報部14は、通報蓄積部13に蓄積された通報を外部に知らせるための監視画面21を生成し、通報蓄積部12に蓄積された通報を通知された順に監視画面21に表示させる。この監視画面21は、上述した通報毎に生成される監視画面22とは異なり、緊急通報の有無に関係なく、一つだけ生成される。また、監視画面21には、通知された通報が全て時系列で表示される。   The normal reporting unit 14 generates a monitoring screen 21 for notifying the reports stored in the report storage unit 13 to the outside, and displays the reports stored in the report storage unit 12 on the monitoring screen 21 in the order of notification. Unlike the monitoring screen 22 generated for each notification described above, only one monitoring screen 21 is generated regardless of whether there is an emergency notification. Moreover, all the notified reports are displayed on the monitoring screen 21 in time series.

選別部16は、本実施の形態では、通報蓄積部13に蓄積されている通報と、通常通報部14が監視画面21に表示させた通報との中から、選別条件に合致する通報を特定する。つまり、選別部16は、既に受信されている処理待ちの通報、及び処理済みの通報等の中から、緊急通報に関連する通報を特定する。   In this embodiment, the sorting unit 16 specifies a report that matches the sorting condition from the reports stored in the report storage unit 13 and the reports displayed on the monitoring screen 21 by the normal report unit 14. . That is, the sorting unit 16 specifies a report related to the emergency call from among the notifications waiting for processing and the already processed notifications.

[装置動作]
次に、本発明の実施の形態における監視装置10の動作について図2〜図4を用いて説明する。また、以下の説明においては、適宜図1を参酌する。更に、本実施の形態では、監視装置10を動作させることによって、監視方法が実施される。よって、本実施の形態における監視方法の説明は、以下の監視装置10の動作説明に代える。
[Device operation]
Next, operation | movement of the monitoring apparatus 10 in embodiment of this invention is demonstrated using FIGS. In the following description, FIG. 1 is taken into consideration as appropriate. Furthermore, in this embodiment, the monitoring method is implemented by operating the monitoring device 10. Therefore, the description of the monitoring method in the present embodiment is replaced with the following description of the operation of the monitoring device 10.

また、以下の説明では、各サーバコンピュータ30は、Webサーバ、アプリケーションサーバ、データベースサーバのいずれかであり、これらの複数のサーバコンピュータが監視対象となっているとする。また、これらの複数のサーバコンピュータは、各種Webサービスを提供する1つのシステムを構成しているとする。   In the following description, each server computer 30 is any one of a Web server, an application server, and a database server, and it is assumed that a plurality of these server computers are monitored. Further, it is assumed that the plurality of server computers constitute one system that provides various Web services.

上記の場合、監視対象となるWebサーバでは、監視プログラム31は、CPU使用率、メモリ使用量、ディスクアクセス率、ネットワーク(入出力パケット数)、及びWebサービスのスループットを監視している。また、アプリケーションサーバでは、監視プログラム31は、CPU使用率、メモリ使用量、ディスクアクセス率、及び起動アプリケーションの状態を監視している。また、データベースサーバでは、監視プログラム31は、CPU使用率、メモリ使用量、及びディスクアクセス率を監視している。   In the above case, in the Web server to be monitored, the monitoring program 31 monitors the CPU usage rate, the memory usage amount, the disk access rate, the network (number of input / output packets), and the Web service throughput. In the application server, the monitoring program 31 monitors the CPU usage rate, the memory usage amount, the disk access rate, and the status of the activated application. In the database server, the monitoring program 31 monitors the CPU usage rate, the memory usage amount, and the disk access rate.

また、各監視プログラム31は、監視項目の状態が、設定されている状態になった場合、例えば、閾値が警告域に達した場合、通常域に復帰した場合等に、監視装置10に通報を出力する。更に、「通報」には、「通報に設定された識別番号(通番)」、「監視項目」、「通報の内容」、「発行サーバ名」、及び「重要度」等の情報が含まれている。   In addition, each monitoring program 31 notifies the monitoring device 10 when the status of the monitoring item is set, for example, when the threshold value reaches the warning range, or when it returns to the normal range. Output. “Notification” includes information such as “identification number (serial number) set for notification”, “monitoring item”, “content of notification”, “issue server name”, and “importance”. Yes.

更に、以下の説明では、例えば、緊急通報条件として、「発行サーバ名」が「Webサーバ」であり、且つ、「通報の内容」が「Webサービスのスループットが低下しています。」である、という条件が用いられる。また、緊急通報条件が上述の場合、緊急通報条件に対する選別条件としては、「発行サーバ名」が「Webサーバ」、「アプリケーションサーバ」、「データベースサーバ」の何れかであり、「通報の内容」が「CPU使用率が警告域です」、「メモリ使用量が警告域です」、「ディスクアクセス率が警告域です」の何れかである、という条件が挙げられる。   Furthermore, in the following description, for example, as an emergency notification condition, “issue server name” is “Web server”, and “contents of notification” is “Web service throughput is decreasing”. The condition is used. Further, when the emergency call condition is as described above, as the selection condition for the emergency call condition, the “issuing server name” is any one of “Web server”, “application server”, and “database server”, and “content of notification” Are “CPU usage rate is warning range”, “Memory usage is warning range”, or “Disk access rate is warning range”.

また、本実施の形態において、選別条件は、監視対象となる全サーバコンピュータ30に対して共通に設定されていても良いし、監視対象となるサーバコンピュータ30毎に異なる条件で設定されていても良い。   In the present embodiment, the selection condition may be set in common for all the server computers 30 to be monitored, or may be set under different conditions for each server computer 30 to be monitored. good.

[装置動作:通報受信部11、判断部12]
最初に、図2を用いて、図1に示した通報受信部11及び判断部12の動作について説明する。図2は、本発明の実施の形態における監視装置を構成する通報受信部及び判断部の動作を示すフロー図である。
[Device Operation: Report Receiving Unit 11, Determination Unit 12]
First, the operations of the notification receiving unit 11 and the determination unit 12 illustrated in FIG. 1 will be described with reference to FIG. FIG. 2 is a flowchart showing the operations of the report receiving unit and the determining unit that constitute the monitoring device according to the embodiment of the present invention.

まず、図2に示すように、通信受信部11が、監視対象となるサーバコンピュータ30の監視プログラム31から通報を受信し、これを判断部12に引き渡す(ステップA1)。例えば、緊急通報条件及び選別条件が、上述のように設定されている条件下において、「Webサービスのスループットが低下しています。」という通報が受信されたとする。   First, as shown in FIG. 2, the communication receiving unit 11 receives a report from the monitoring program 31 of the server computer 30 to be monitored, and hands it over to the determining unit 12 (step A1). For example, it is assumed that a notification “Web service throughput is decreasing” is received under the condition that the emergency notification condition and the selection condition are set as described above.

次に、判断部12は、監視装置10の監視者から停止の指示が入力されているかどうかを判定する(ステップA2)。ステップA2の判定の結果、停止の指示が入力されている場合は、処理を終了する。これにより、監視装置10の動作も停止する。一方、ステップA2の判定の結果、停止の指示が入力されていない場合は、判断部12は、以降のステップA3以降の処理を実行する。   Next, the determination unit 12 determines whether or not a stop instruction is input from the monitor of the monitoring device 10 (step A2). If the result of determination in step A2 is that a stop instruction has been input, the process ends. Thereby, the operation of the monitoring device 10 is also stopped. On the other hand, if the result of determination in step A2 is that a stop instruction has not been input, the determination unit 12 executes the subsequent processing after step A3.

次に、判断部12は、ステップA1で通報受信部11から取得した通報と、後述するステップA6で有効化された選別条件とを照合する(ステップA3)。そして、判断部12は、照合結果に基づいて、通報が、有効化された選別条件に該当するか否かを判定する(ステップA4)。   Next, the determination unit 12 collates the notification acquired from the notification reception unit 11 in Step A1 with the selection condition validated in Step A6 described later (Step A3). Then, the determination unit 12 determines whether the notification corresponds to the validated selection condition based on the collation result (Step A4).

ステップA4の判定の結果、取得した通報が選別条件に該当する場合は、判断部12は、後述するステップA11以降を実行する。一方、ステップA4の判定の結果、取得した通報が選別条件に該当しない場合は、判断部12は、取得した通報と、緊急通報条件とを照合する(ステップA5)。   As a result of the determination in step A4, when the acquired notification corresponds to the selection condition, the determination unit 12 executes step A11 and subsequent steps described later. On the other hand, as a result of the determination in step A4, when the acquired notification does not correspond to the selection condition, the determination unit 12 collates the acquired notification with the emergency notification condition (step A5).

そして、判断部12は、照合結果に基づいて、取得した通報が、予め設定された緊急通報条件に該当するか否かを判定する(ステップA6)。例えば、通報が、「Webサービスのスループットが低下しています。」という通報であるとすると、この通報は上述した緊急通報条件に該当するので、緊急通報であると判断される。   Then, the determination unit 12 determines whether or not the acquired notification satisfies a preset emergency notification condition based on the collation result (step A6). For example, if the notification is a notification that “the throughput of the Web service is decreasing”, this notification corresponds to the above-described emergency notification condition, and therefore, it is determined that the notification is an emergency notification.

ステップA6の判定の結果、取得した通報が緊急通報に合致しない場合は、判断部12は、取得した通報を通報蓄積部13に通知する(ステップA14)。   As a result of the determination in step A6, when the acquired report does not match the emergency call, the determination unit 12 notifies the acquired message to the report storage unit 13 (step A14).

一方、ステップA6の判定の結果、通報が緊急通報条件に合致する場合は、判断部12は、緊急通報部17に、専用の監視画面22の作成を指示し、これを表示装置20の画面上に表示させる(ステップA7)。   On the other hand, if the result of determination in step A6 is that the notification matches the emergency notification condition, the determination unit 12 instructs the emergency notification unit 17 to create a dedicated monitoring screen 22 and displays this on the screen of the display device 20. (Step A7).

次に、判断部12は、選別条件情報の中から、ステップA6で緊急通報であると判定した通報に対応する選別条件を特定し、これを「有効」に設定する(ステップA8)。続いて、判断部12は、「有効」に設定した選別条件を選別部16に通知する(ステップA9)。ステップA8及びA9が実行されると、これ以後に監視プログラム31から出力された通報についての、ステップA4の判断は、上記ステップA8で「有効」に設定された選別条件に基づいて行なわれる。また、ステップA9の実行により、選別部12は、後述の図3に示すステップB1以降を実行する。   Next, the determination unit 12 specifies the selection condition corresponding to the notification determined to be an emergency call in Step A6 from the selection condition information, and sets this to “valid” (Step A8). Subsequently, the determination unit 12 notifies the selection unit 16 of the selection condition set to “valid” (step A9). When Steps A8 and A9 are executed, the determination in Step A4 for subsequent notifications output from the monitoring program 31 is made based on the selection condition set to “valid” in Step A8. Further, by executing step A9, the selection unit 12 executes step B1 and subsequent steps shown in FIG.

次に、判断部12は、緊急通報条件に合致する通報を、緊急通報部17に通知する(ステップA10)。ステップA10の実行により、緊急通報部17は、後述の図4に示すステップC1以降を実行する。また、判断部12は、この緊急通報条件に合致する通報も、通報蓄積部13に通知する(ステップA14)。   Next, the determination unit 12 notifies the emergency notification unit 17 of a notification that matches the emergency notification condition (step A10). By executing Step A10, the emergency call unit 17 executes Step C1 and subsequent steps shown in FIG. The determination unit 12 also notifies the notification storage unit 13 of a notification that matches the emergency notification conditions (step A14).

また、上述のステップA4の判定の結果、取得した通報が選別条件に該当する場合は、判断部12は、取得した通報が、緊急通報に対して出力された復旧通報であるかどうかを確認する(ステップA11)。復旧通報は、緊急通報に対して出力される通報であり、サーバコンピュータ30の監視プログラムは、緊急通報の原因となった障害が復旧した場合に、復旧通報を出力する。   In addition, as a result of the determination in Step A4 described above, when the acquired report satisfies the selection condition, the determination unit 12 confirms whether the acquired report is a recovery report output for the emergency call. (Step A11). The recovery report is a report that is output in response to an emergency call, and the monitoring program of the server computer 30 outputs a recovery report when the failure that caused the emergency call is recovered.

ステップA11の判定の結果、取得した通報が復旧通報である場合は、判断部12は、この復旧通報を、緊急通報部17に通知する(ステップA12)。更に、判断部12は、「有効」に設定している選別条件を「無効」に設定すると共に、選別部16に対して、このことを通知する(ステップA13)。ステップA13が実行されると、選別部16における後述の処理は停止される。次に、判断部12は、ステップA13の実施後、ステップA15を実行する。   If the acquired notification is a recovery notification as a result of the determination in step A11, the determination unit 12 notifies the emergency notification unit 17 of the recovery notification (step A12). Further, the determination unit 12 sets the selection condition set to “valid” to “invalid” and notifies the selection unit 16 of this (step A13). When step A13 is executed, processing described later in the sorting unit 16 is stopped. Next, the determination part 12 performs step A15 after implementation of step A13.

更に、ステップA11の判定の結果、取得した通報が復旧通報でない場合も、判断部12は、この復旧通報以外の通報を、緊急通報部17に通知する(ステップA14)。続いて、判断部12は、この場合も、ステップA15を実行する。   Further, even if the acquired report is not a recovery report as a result of the determination in step A11, the determination unit 12 notifies the emergency report unit 17 of a report other than the recovery report (step A14). Subsequently, the determination unit 12 also executes Step A15 in this case.

そして、ステップA15の実行後、Webサーバ、アプリケーションサーバ、又はデータベースサーバで動作する監視プログラム31が、更に通報を出力すると、判断部12は、再度、ステップA1を実行する。   And after execution of step A15, if the monitoring program 31 which operate | moves with a web server, an application server, or a database server outputs a report further, the judgment part 12 will perform step A1 again.

また、ステップA15の実行後、通報蓄積部12は、判断部12から通知された通報を一時的に蓄積する。また、通報蓄積部12は、一時的に蓄積した通報を、通知された順に通常通報部14に出力すると共に、出力した順に通報を削除する。その後、通常通報部14は、監視画面21上に、通報蓄積部12に蓄積された通報を通知された順に表示させる。これにより、監視画面21には、通知された通報が全て時系列で表示される。   In addition, after the execution of step A15, the report storage unit 12 temporarily stores the report notified from the determination unit 12. In addition, the notification storage unit 12 outputs the temporarily stored notifications to the normal notification unit 14 in the notified order, and deletes the notifications in the output order. Thereafter, the normal reporting unit 14 displays the reports stored in the report storage unit 12 on the monitoring screen 21 in the order of notification. Thereby, all the notified reports are displayed on the monitoring screen 21 in time series.

[装置動作:選別部16]
次に、図3を用いて、図1に示した選別部16の動作について説明する。図3は、本発明の実施の形態における監視装置を構成する選別部の動作を示すフロー図である。
[Device Operation: Sorting Unit 16]
Next, the operation of the selection unit 16 shown in FIG. 1 will be described with reference to FIG. FIG. 3 is a flowchart showing the operation of the selection unit constituting the monitoring apparatus according to the embodiment of the present invention.

まず、図2に示したステップA9が実行されると、図3に示すように、選別部16は、判断部12から、「有効」に設定されている選別条件を取得する(ステップB1)。   First, when step A9 shown in FIG. 2 is executed, as shown in FIG. 3, the selection unit 16 acquires the selection condition set to “valid” from the determination unit 12 (step B1).

次に、選別部16は、通報蓄積部13に蓄積されている通報から、判断部12によって有効化されている選別条件に合致する通報、具体的には、選別条件の「発行サーバ名」及び「通報の内容」が一致する通報を選択する(ステップB2)。   Next, the sorting unit 16 reports from the reports stored in the report storage unit 13 that matches the screening conditions enabled by the determination unit 12, specifically, the “issue server name” of the screening conditions and A report whose "content of report" matches is selected (step B2).

続いて、選別部16は、通報記憶部15に蓄積されている通報からも、判断部12によって有効化されている選別条件に合致する通報、具体的には、選別条件の「発行サーバ名」及び「通報の内容」が一致する通報を選択する(ステップB3)。   Subsequently, the sorting unit 16 also reports from the reports stored in the report storage unit 15 that matches the screening conditions enabled by the determination unit 12, specifically, the “issue server name” of the screening conditions. And the report whose “contents of report” matches is selected (step B3).

その後、選別部16は、ステップB2で選択した通報と、ステップB3で選択した通報とを、緊急通報部17に通知する(ステップB4)。ステップB4の実行後、選別部16は、自動的に処理を終了する。ステップB4の実行により、緊急通報部17は、後述の図4に示すステップC2を実行する。   Thereafter, the sorting unit 16 notifies the emergency notification unit 17 of the notification selected in step B2 and the notification selected in step B3 (step B4). After execution of step B4, the sorting unit 16 automatically ends the process. By executing step B4, the emergency call unit 17 executes step C2 shown in FIG.

例えば、通報蓄積部13又は通報記憶部15に、通報Aと通報Bとが蓄積されているとする。また、通報Aにおいては、「発行サーバ名」が「アプリケーションサーバ」であり、「通報の内容」が「CPU使用率が警告域です」であるとする。通報Bにおいては、「発行サーバ名」が「データベースサーバ」であり、「通報の内容」が「ディスクアクセス率が警告域です」であるとする。このような場合、通報A及びBは、上述した選別条件に合致するので、選別部16によって選択され、緊急通報部17へ通知される。   For example, it is assumed that the report A and the report B are stored in the report storage unit 13 or the report storage unit 15. In the case of notification A, it is assumed that “issue server name” is “application server” and “contents of notification” is “CPU usage is in warning area”. In report B, it is assumed that “issue server name” is “database server” and “content of report” is “disk access rate is in warning area”. In such a case, since the notifications A and B meet the above-described selection conditions, they are selected by the selection unit 16 and notified to the emergency notification unit 17.

[装置動作:緊急通報部17]
次に、図4を用いて、図1に示した緊急通報部17の動作について説明する。図4は、本発明の実施の形態における監視装置を構成する緊急通報部の動作を示すフロー図である。
[Device operation: Emergency call section 17]
Next, the operation of the emergency call unit 17 shown in FIG. 1 will be described with reference to FIG. FIG. 4 is a flowchart showing the operation of the emergency call unit constituting the monitoring device according to the embodiment of the present invention.

まず、図2に示したステップA10が実行されると、緊急通報部17は、判断部12から通知された緊急通報を取得する(ステップC1)。続いて、図3に示したステップB4が実行されると、緊急通報部17は、選別条件に合致する通報を取得する(ステップC2)。   First, when step A10 shown in FIG. 2 is executed, the emergency call unit 17 acquires the emergency call notified from the determination unit 12 (step C1). Subsequently, when step B4 shown in FIG. 3 is executed, the emergency notification unit 17 acquires a notification that matches the selection condition (step C2).

次に、緊急通報部17は、ステップC1で取得された緊急通報の専用の監視画面22に、この緊急通報と、ステップC2で取得した通報とを、時系列に沿って表示する(ステップC3)。   Next, the emergency call unit 17 displays the emergency call and the call acquired in step C2 in chronological order on the dedicated monitoring screen 22 for the emergency call acquired in step C1 (step C3). .

例えば、判断部12から通知された緊急通報において、上述したように、「発行サーバ名」が「Webサーバ」となり、「通報の内容」が「Webサービスのスループットが低下しています。」であるとする。この場合は、上述した通報Aと通報Bとが、専用の監視画面22に時系列に沿って表示される。   For example, in the emergency call notified from the determination unit 12, as described above, the “issue server name” is “Web server” and the “contents of the report” is “Web service throughput is decreasing”. And In this case, the above-described notification A and notification B are displayed on the dedicated monitoring screen 22 in time series.

この結果、監視装置10の監視員(又は対応者)は、専用の監視画面22を確認することにより、Webサービスのスループットが低下している原因が、アプリケーションサーバのCPU使用率とデータベースサーバのディスクアクセス率とにある、と容易に理解することができる。   As a result, the monitor (or responder) of the monitoring apparatus 10 confirms the dedicated monitoring screen 22 and the cause of the decrease in the throughput of the Web service is that the CPU usage rate of the application server and the disk of the database server It can be easily understood that it is in the access rate.

なお、判断部12は、緊急通報部17に通知した緊急通報を、通報蓄積部13にも通知しているので(ステップA15参照)、この緊急通報は、上述したように、通常通報部14及び通報記憶部15を経由して、監視画面21にも表示される。監視画面21は、通報全部を表示する全体の監視画面である。   In addition, since the determination part 12 has also notified the emergency call notified to the emergency call part 17 also to the call storage part 13 (refer step A15), as above-mentioned, this emergency call is the normal call part 14 and It is also displayed on the monitoring screen 21 via the notification storage unit 15. The monitoring screen 21 is an entire monitoring screen that displays all reports.

次に、緊急通報部17は、図2に示すステップA2で判断部12が停止指示を受けているかどうかを判定する(ステップC4)。ステップC4での判定の結果、判断部12が停止指示を受けている場合は、緊急通報部17は、処理を終了する。一方、ステップC4での判定の結果、判断部12が停止指示を受けていない場合は、緊急通報部17は、判断部12がステップA12で通知した復旧通報、又はステップA14で通知した復旧通報以外の通報を取得する(ステップC5)。   Next, the emergency call unit 17 determines whether or not the determination unit 12 has received a stop instruction in Step A2 shown in FIG. 2 (Step C4). If the result of determination in step C4 is that the determination unit 12 has received a stop instruction, the emergency call unit 17 ends the process. On the other hand, if the result of determination in step C4 is that the determination unit 12 has not received a stop instruction, the emergency notification unit 17 is not the recovery notification notified by the determination unit 12 in step A12 or the recovery notification notified in step A14 Is obtained (step C5).

次に、緊急通報部17は、ステップC5で判断部12から取得した通報に基づき、ステップA11において判断部12が復旧通報を取得しているかどうかを判定する(ステップC6)。   Next, the emergency notification unit 17 determines whether the determination unit 12 has acquired a recovery notification in step A11 based on the notification acquired from the determination unit 12 in step C5 (step C6).

ステップC6の判定の結果、判断部12がステップA11において復旧通報を取得していない場合は、緊急通報部17は、ステップC5で判断部12から取得した、復旧通報以外の通報を専用の監視画面に表示する(ステップC8)。また、その後、緊急通報部17は、再度ステップC4を実行する。   As a result of the determination in step C6, when the determination unit 12 has not acquired the recovery notification in step A11, the emergency notification unit 17 uses the dedicated monitoring screen for notifications other than the recovery notification acquired from the determination unit 12 in step C5. (Step C8). Thereafter, the emergency call unit 17 executes Step C4 again.

一方、ステップC6の判定の結果、判断部12がステップA11において復旧通報を取得している場合は、緊急通報部17は、ステップC5で判断部12から取得した復旧通報を専用の監視画面22に表示し(ステップC7)、その後、処理を終了する。また、これにより、専用の監視画面22には、復旧が完了したことが表示される。以後、監視員の操作により、監視画面22は、閉じられる。   On the other hand, as a result of the determination in step C6, when the determination unit 12 has acquired the recovery notification in step A11, the emergency notification unit 17 displays the recovery notification acquired from the determination unit 12 in step C5 on the dedicated monitoring screen 22. Display (step C7), and then the process ends. As a result, the dedicated monitoring screen 22 displays that the restoration has been completed. Thereafter, the monitor screen 22 is closed by the operation of the monitor.

[効果]
以上のように、本実施の形態では、緊急通報の受信を契機に、蓄積されている通報から、緊急通報に関連する通報が自動的に選択され、選択された通報と緊急通報とが、専用の監視画面に表示される。
[effect]
As described above, in the present embodiment, when an emergency call is received, a call related to the emergency call is automatically selected from the accumulated calls, and the selected call and the emergency call are dedicated. Displayed on the monitoring screen.

従って、監視者は、この専用の監視画面にだけ集中すれば良いため、緊急通報を出力していない他のサーバコンピュータからの関係の無い通報に影響されることなく、障害の発生に至る経緯の調査及び確認を迅速に行なうことができる。結果、本実施の形態によれば、緊急対応(復旧等)の初動を迅速にとることができ、結果、緊急状態が発生してから対応(復旧等)するまでの時間の短縮化が図られる。   Therefore, the monitor only has to concentrate on this dedicated monitoring screen, so that it is not affected by irrelevant notifications from other server computers that have not output emergency notifications, and the circumstances leading to the occurrence of a failure. Investigation and confirmation can be performed quickly. As a result, according to the present embodiment, it is possible to quickly take the initial action of emergency response (recovery, etc.), and as a result, it is possible to shorten the time from the occurrence of an emergency state to response (recovery, etc.). .

また、本実施の形態では、予め設定された選別条件を用いて、緊急通報に関連する通報が自動的に選択されるので、監視員(又は対応者)の熟練度の影響が抑制される。結果、本実施の形態によれば、一定の管理水準が確保される。   Moreover, in this Embodiment, since the report relevant to an emergency call is automatically selected using the preset selection conditions, the influence of the skill level of a monitoring person (or responder) is suppressed. As a result, according to the present embodiment, a certain management level is ensured.

[プログラム]
本実施の形態におけるプログラムは、コンピュータに、図2に示すステップA1〜A14、図3に示すステップB1〜B4、図4に示すステップC1〜C7を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態における監視装置10と監視方法とを実現することができる。
[program]
The program in the present embodiment may be a program that causes a computer to execute steps A1 to A14 shown in FIG. 2, steps B1 to B4 shown in FIG. 3, and steps C1 to C7 shown in FIG. By installing and executing this program on a computer, the monitoring device 10 and the monitoring method in the present embodiment can be realized.

この場合、コンピュータのCPU(Central Processing Unit)は、判断部12、通常通報部14、選別部16、及び緊急通報部17として機能し、処理を行なう。また、コンピュータに備えられたメモリが、通報蓄積部13として機能し、ハードディスク等の記憶装置が、通帳記憶部15として機能する。   In this case, a CPU (Central Processing Unit) of the computer functions as the determination unit 12, the normal notification unit 14, the selection unit 16, and the emergency notification unit 17, and performs processing. Further, a memory provided in the computer functions as the notification storage unit 13, and a storage device such as a hard disk functions as the passbook storage unit 15.

ここで、本実施の形態におけるプログラムを実行することによって、監視装置10を実現するコンピュータについて図5を用いて説明する。図5は、本発明の実施の形態における監視装置を実現するコンピュータの一例を示すブロック図である。   Here, a computer that realizes the monitoring apparatus 10 by executing the program according to the present embodiment will be described with reference to FIG. FIG. 5 is a block diagram illustrating an example of a computer that implements the monitoring device according to the embodiment of the present invention.

図5に示すように、コンピュータ110は、CPU111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。   As shown in FIG. 5, the computer 110 includes a CPU 111, a main memory 112, a storage device 113, an input interface 114, a display controller 115, a data reader / writer 116, and a communication interface 117. These units are connected to each other via a bus 121 so that data communication is possible.

CPU111は、記憶装置113に格納された、本実施の形態におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであっても良い。   The CPU 111 performs various calculations by developing the program (code) in the present embodiment stored in the storage device 113 in the main memory 112 and executing them in a predetermined order. The main memory 112 is typically a volatile storage device such as a DRAM (Dynamic Random Access Memory). Further, the program in the present embodiment is provided in a state of being stored in a computer-readable recording medium 120. Note that the program in the present embodiment may be distributed on the Internet connected via the communication interface 117.

また、記憶装置113の具体例としては、ハードディスクの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、及びコンピュータ110における処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、監視対象となるサーバコンピュータ30との間のデータ伝送を仲介する。   Specific examples of the storage device 113 include a hard disk and a semiconductor storage device such as a flash memory. The input interface 114 mediates data transmission between the CPU 111 and an input device 118 such as a keyboard and a mouse. The display controller 115 is connected to the display device 119 and controls display on the display device 119. The data reader / writer 116 mediates data transmission between the CPU 111 and the recording medium 120, and reads a program from the recording medium 120 and writes a processing result in the computer 110 to the recording medium 120. The communication interface 117 mediates data transmission between the CPU 111 and the server computer 30 to be monitored.

また、記録媒体120の具体例としては、CF(Compact Flash)及びSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記憶媒体、又はCD−ROM(Compact Disk Read Only Memory)などの光学記憶媒体が挙げられる。   Specific examples of the recording medium 120 include general-purpose semiconductor storage devices such as CF (Compact Flash) and SD (Secure Digital), magnetic storage media such as a flexible disk, or CD-ROM (Compact Disk). Optical storage media such as Read Only Memory).

上述した実施の形態の一部又は全部は、以下に記載する(付記1)〜(付記12)によって表現することができるが、以下の記載に限定されるものではない。   Part or all of the above-described embodiments can be expressed by (Appendix 1) to (Appendix 12) described below, but is not limited to the following description.

(付記1)
監視対象となる装置からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、判断部と、
前記判断部が前記緊急通報に該当すると判断した通報以外の通報のうち、前記選別条件に合致する通報を特定する、選別部と、
前記判断部が該当すると判断した場合に、前記判断部が前記緊急通報に該当すると判断した通報と、前記選別部が特定した通報とを、外部に知らせるための専用の画面を生成する、緊急通報部と、
を備えていることを特徴とする監視装置。
(Appendix 1)
A determination unit that determines whether or not a notification that reports a failure from a device to be monitored corresponds to an emergency call, and if so, sets a selection condition that identifies a report related to the notification;
Among the notifications other than the notification determined by the determination unit to correspond to the emergency call, the selection unit that specifies a notification that matches the selection condition; and
An emergency call that generates a dedicated screen for notifying the outside of the report determined by the determination unit to correspond to the emergency call and the report specified by the selection unit when the determination unit determines that the determination is applicable And
A monitoring device comprising:

(付記2)
前記判断部による判断が終了した通報を一時的に蓄積する、通報蓄積部と、
前記通報蓄積部に蓄積された通報を外部に知らせるための画面を生成し、前記通報蓄積部に蓄積された通報を通知された順に前記画面に表示させる、通常通報部と、を更に備え、
前記選別部が、前記通報蓄積部に蓄積されている通報と、前記通常通報部が前記画面に表示させた通報との中から、前記選別条件に合致する通報を特定する、
付記1に記載の監視装置。
(Appendix 2)
A message storage unit for temporarily storing a report for which the determination by the determination unit is completed; and
A normal notification unit that generates a screen for notifying the notification accumulated in the report storage unit to the outside, and displays the reports stored in the report storage unit on the screen in the order in which the notification is notified;
The sorting unit identifies a report that matches the sorting condition from the reports stored in the report storage unit and the reports displayed on the screen by the normal reporting unit.
The monitoring apparatus according to appendix 1.

(付記3)
前記判断部が、緊急通報に該当する通報が予め規定された緊急通報条件に基づいて、前記緊急通報に該当するかどうかを判断する、付記1または2に記載の監視装置。
(Appendix 3)
The monitoring apparatus according to appendix 1 or 2, wherein the determination unit determines whether a report corresponding to the emergency call corresponds to the emergency call based on a predetermined emergency call condition.

(付記4)
前記監視対象となる装置がサーバコンピュータであり、前記サーバコンピュータに組み込まれた監視プログラムが、当該サーバコンピュータの識別子と発生した障害の内容とを含む通報を通知しており、
前記緊急通報条件及び前記選別条件が、前記サーバコンピュータの識別子と、発生した障害の内容とで規定されている、
付記3に記載の監視装置。
(Appendix 4)
The device to be monitored is a server computer, and the monitoring program incorporated in the server computer notifies the report including the identifier of the server computer and the content of the failure that has occurred,
The emergency call condition and the selection condition are defined by the identifier of the server computer and the content of the failure that has occurred,
The monitoring device according to attachment 3.

(付記5)
(a)監視対象となる装置からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、ステップと、
(b)前記(a)のステップで前記緊急通報に該当すると判断した通報以外の通報のうち、前記選別条件に合致する通報を特定する、ステップと、
(c)前記(a)のステップで該当すると判断した場合に、前記(a)のステップで前記緊急通報に該当すると判断した通報と、前記(b)のステップで特定した通報とを、外部に知らせるための専用の画面を生成する、ステップと、
を有することを特徴とする監視方法。
(Appendix 5)
(A) determining whether a notification notifying a failure from a device to be monitored corresponds to an emergency call and, if applicable, setting a selection condition for identifying a report related to the notification; and ,
(B) identifying a report that matches the selection condition among reports other than the report determined to correspond to the emergency call in the step (a); and
(C) When it is determined that it corresponds in the step (a), the notification determined to correspond to the emergency call in the step (a) and the notification specified in the step (b) Creating a dedicated screen to inform, steps,
The monitoring method characterized by having.

(付記6)
(d)前記(a)のステップでの判断が終了した通報を一時的に蓄積する、ステップと、
(e)前記(d)のステップで蓄積された通報を外部に知らせるための画面を生成し、前記(d)のステップで蓄積された通報を通知された順に前記画面に表示させる、ステップと、を更に有し、
前記(b)のステップで、前記(d)のステップにおいて蓄積されている通報と、前記(e)のステップにおいて前記画面に表示させた通報との中から、前記選別条件に合致する通報を特定する、
付記5に記載の監視方法。
(Appendix 6)
(D) temporarily storing the notification that the determination in step (a) is completed; and
(E) generating a screen for notifying the outside of the notification accumulated in the step (d) and displaying the notification accumulated in the step (d) on the screen in the order of notification; Further comprising
In the step (b), the notification that matches the selection condition is identified from the notifications accumulated in the step (d) and the notifications displayed on the screen in the step (e). To
The monitoring method according to attachment 5.

(付記7)
前記(a)のステップで、緊急通報に該当する通報が予め規定された緊急通報条件に基づいて、前記緊急通報に該当するかどうかを判断する、付記5または6に記載の監視方法。
(Appendix 7)
The monitoring method according to appendix 5 or 6, wherein, in the step (a), it is determined whether a report corresponding to an emergency call corresponds to the emergency call based on an emergency call condition defined in advance.

(付記8)
前記監視対象となる装置がサーバコンピュータであり、前記サーバコンピュータに組み込まれた監視プログラムが、当該サーバコンピュータの識別子と発生した障害の内容とを含む通報を通知しており、
前記緊急通報条件及び前記選別条件が、前記サーバコンピュータの識別子と、発生した障害の内容とで規定されている、
付記7に記載の監視方法。
(Appendix 8)
The device to be monitored is a server computer, and the monitoring program incorporated in the server computer notifies the report including the identifier of the server computer and the content of the failure that has occurred,
The emergency call condition and the selection condition are defined by the identifier of the server computer and the content of the failure that has occurred,
The monitoring method according to appendix 7.

(付記9)
監視対象となる装置に接続された、コンピュータに、
(a)前記監視対象となる装置からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、ステップと、
(b)前記(a)のステップで前記緊急通報に該当すると判断した通報以外の通報のうち、前記選別条件に合致する通報を特定する、ステップと、
(c)前記(a)のステップで該当すると判断した場合に、前記(a)のステップで前記緊急通報に該当すると判断した通報と、前記(b)のステップで特定した通報とを、外部に知らせるための専用の画面を生成する、ステップと、
を実行させるプログラム。
(Appendix 9)
To the computer connected to the device to be monitored,
(A) determining whether or not a report notifying a failure from the device to be monitored corresponds to an emergency call, and if so, setting a selection condition for specifying a report related to the report; When,
(B) identifying a report that matches the selection condition among reports other than the report determined to correspond to the emergency call in the step (a); and
(C) When it is determined that it corresponds in the step (a), the notification determined to correspond to the emergency call in the step (a) and the notification specified in the step (b) Creating a dedicated screen to inform, steps,
A program that executes

(付記10)
前記コンピュータに、
(d)前記(a)のステップでの判断が終了した通報を一時的に蓄積する、ステップと、
(e)前記(d)のステップで蓄積された通報を外部に知らせるための画面を生成し、前記(d)のステップで蓄積された通報を通知された順に前記画面に表示させる、ステップと、を更に実行させ、
前記(b)のステップで、前記(d)のステップにおいて蓄積されている通報と、前記(e)のステップにおいて前記画面に表示させた通報との中から、前記選別条件に合致する通報を特定する、
付記9に記載のプログラム。
(Appendix 10)
In the computer,
(D) temporarily storing the notification that the determination in step (a) is completed; and
(E) generating a screen for notifying the outside of the notification accumulated in the step (d) and displaying the notification accumulated in the step (d) on the screen in the order of notification; Is executed further,
In the step (b), the notification that matches the selection condition is identified from the notifications accumulated in the step (d) and the notifications displayed on the screen in the step (e). To
The program according to appendix 9.

(付記11)
前記(a)のステップで、緊急通報に該当する通報が予め規定された緊急通報条件に基づいて、前記緊急通報に該当するかどうかを判断する、付記9または10に記載のプログラム。
(Appendix 11)
The program according to appendix 9 or 10, wherein, in the step (a), it is determined whether a report corresponding to an emergency call corresponds to the emergency call based on an emergency call condition defined in advance.

(付記12)
前記監視対象となる装置がサーバコンピュータであり、前記サーバコンピュータに組み込まれた監視プログラムが、当該サーバコンピュータの識別子と発生した障害の内容とを含む通報を通知しており、
前記緊急通報条件及び前記選別条件が、前記サーバコンピュータの識別子と、発生した障害の内容とで規定されている、
付記11に記載のプログラム。
(Appendix 12)
The device to be monitored is a server computer, and the monitoring program incorporated in the server computer notifies the report including the identifier of the server computer and the content of the failure that has occurred,
The emergency call condition and the selection condition are defined by the identifier of the server computer and the content of the failure that has occurred,
The program according to appendix 11.

以上のように、本発明によれば、監視対象となる装置から、重要度の高い通報がなされた場合に、当該通報とこれに関連する通報とを特定し、これらをまとめて監視者に提示することができる。本発明は、複数のサーバコンピュータの障害発生を監視する監視システムに有用である。   As described above, according to the present invention, when a highly important report is made from a device to be monitored, the report and a report related thereto are specified, and these are collectively presented to the monitor. can do. The present invention is useful for a monitoring system that monitors the occurrence of failures in a plurality of server computers.

10 監視装置
11 通報受信部
12 判断部
13 通報蓄積部
14 通常通報部
15 通報記憶部
16 選別部
17 緊急通報部
20 表示装置
21 全体の監視画面
22 専用の監視画面
30 監視対象となる装置(サーバコンピュータ)
31 監視プログラム
40 ネットワーク
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス
DESCRIPTION OF SYMBOLS 10 Monitoring apparatus 11 Report receiving part 12 Judgment part 13 Report storage part 14 Normal notification part 15 Report storage part 16 Sorting part 17 Emergency call part 20 Display apparatus 21 Overall monitoring screen 22 Dedicated monitoring screen 30 Apparatus (server) to be monitored Computer)
31 Monitoring program 40 Network 110 Computer 111 CPU
112 Main Memory 113 Storage Device 114 Input Interface 115 Display Controller 116 Data Reader / Writer 117 Communication Interface 118 Input Device 119 Display Device 120 Recording Medium 121 Bus

Claims (6)

監視対象となる装置からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、判断部と、
前記判断部が前記緊急通報に該当すると判断した通報以外の通報のうち、前記選別条件に合致する通報を特定する、選別部と、
前記判断部が該当すると判断した場合に、前記判断部が前記緊急通報に該当すると判断した通報と、前記選別部が特定した通報とを、外部に知らせるための専用の画面を生成する、緊急通報部と、
を備えていることを特徴とする監視装置。
A determination unit that determines whether or not a notification that reports a failure from a device to be monitored corresponds to an emergency call, and if so, sets a selection condition that identifies a report related to the notification;
Among the notifications other than the notification determined by the determination unit to correspond to the emergency call, the selection unit that specifies a notification that matches the selection condition; and
An emergency call that generates a dedicated screen for notifying the outside of the report determined by the determination unit to correspond to the emergency call and the report specified by the selection unit when the determination unit determines that the determination is applicable And
A monitoring device comprising:
前記判断部による判断が終了した通報を一時的に蓄積する、通報蓄積部と、
前記通報蓄積部に蓄積された通報を外部に知らせるための画面を生成し、前記通報蓄積部に蓄積された通報を通知された順に前記画面に表示させる、通常通報部と、を更に備え、
前記選別部が、前記通報蓄積部に蓄積されている通報と、前記通常通報部が前記画面に表示させた通報との中から、前記選別条件に合致する通報を特定する、
請求項1に記載の監視装置。
A message storage unit for temporarily storing a report for which the determination by the determination unit is completed; and
A normal notification unit that generates a screen for notifying the notification accumulated in the report storage unit to the outside, and displays the reports stored in the report storage unit on the screen in the order in which the notification is notified;
The sorting unit identifies a report that matches the sorting condition from the reports stored in the report storage unit and the reports displayed on the screen by the normal reporting unit.
The monitoring apparatus according to claim 1.
前記判断部が、緊急通報に該当する通報が予め規定された緊急通報条件に基づいて、前記緊急通報に該当するかどうかを判断する、請求項1または2に記載の監視装置。   The monitoring apparatus according to claim 1, wherein the determination unit determines whether a notification corresponding to the emergency notification corresponds to the emergency notification based on a predetermined emergency notification condition. 前記監視対象となる装置がサーバコンピュータであり、前記サーバコンピュータに組み込まれた監視プログラムが、当該サーバコンピュータの識別子と発生した障害の内容とを含む通報を通知しており、
前記緊急通報条件及び前記選別条件が、前記サーバコンピュータの識別子と、発生した障害の内容とで規定されている、
請求項3に記載の監視装置。
The device to be monitored is a server computer, and the monitoring program incorporated in the server computer notifies the report including the identifier of the server computer and the content of the failure that has occurred,
The emergency call condition and the selection condition are defined by the identifier of the server computer and the content of the failure that has occurred,
The monitoring device according to claim 3.
(a)監視対象となる装置からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、ステップと、
(b)前記(a)のステップで前記緊急通報に該当すると判断した通報以外の通報のうち、前記選別条件に合致する通報を特定する、ステップと、
(c)前記(a)のステップで該当すると判断した場合に、前記(a)のステップで前記緊急通報に該当すると判断した通報と、前記(b)のステップで特定した通報とを、外部に知らせるための専用の画面を生成する、ステップと、
を有することを特徴とする監視方法。
(A) determining whether a notification notifying a failure from a device to be monitored corresponds to an emergency call and, if applicable, setting a selection condition for identifying a report related to the notification; and ,
(B) identifying a report that matches the selection condition among reports other than the report determined to correspond to the emergency call in the step (a); and
(C) When it is determined that it corresponds in the step (a), the notification determined to correspond to the emergency call in the step (a) and the notification specified in the step (b) Creating a dedicated screen to inform, steps,
The monitoring method characterized by having.
監視対象となる装置に接続された、コンピュータに、
(a)前記監視対象となる装置からの障害を通知する通報が、緊急通報に該当するかどうかを判断し、該当する場合に、当該通報に関連した通報を特定する選別条件を設定する、ステップと、
(b)前記(a)のステップで前記緊急通報に該当すると判断した通報以外の通報のうち、前記選別条件に合致する通報を特定する、ステップと、
(c)前記(a)のステップで該当すると判断した場合に、前記(a)のステップで前記緊急通報に該当すると判断した通報と、前記(b)のステップで特定した通報とを、外部に知らせるための専用の画面を生成する、ステップと、
を実行させるプログラム。
To the computer connected to the device to be monitored,
(A) determining whether or not a report notifying a failure from the device to be monitored corresponds to an emergency call, and if so, setting a selection condition for specifying a report related to the report; When,
(B) identifying a report that matches the selection condition among reports other than the report determined to correspond to the emergency call in the step (a); and
(C) When it is determined that it corresponds in the step (a), the notification determined to correspond to the emergency call in the step (a) and the notification specified in the step (b) Creating a dedicated screen to inform, steps,
A program that executes
JP2011137015A 2011-06-21 2011-06-21 Monitoring device, monitoring method, and program Expired - Fee Related JP5459797B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011137015A JP5459797B2 (en) 2011-06-21 2011-06-21 Monitoring device, monitoring method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011137015A JP5459797B2 (en) 2011-06-21 2011-06-21 Monitoring device, monitoring method, and program

Publications (2)

Publication Number Publication Date
JP2013005365A true JP2013005365A (en) 2013-01-07
JP5459797B2 JP5459797B2 (en) 2014-04-02

Family

ID=47673412

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011137015A Expired - Fee Related JP5459797B2 (en) 2011-06-21 2011-06-21 Monitoring device, monitoring method, and program

Country Status (1)

Country Link
JP (1) JP5459797B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190046A (en) * 1989-01-19 1990-07-26 Hitachi Ltd Network management equipment
JPH1063539A (en) * 1996-08-26 1998-03-06 Hitachi Inf Syst Ltd Operation monitoring and reporting system
JP2001256032A (en) * 2000-03-14 2001-09-21 Mitsubishi Electric Corp Fault message display device
JP2001306141A (en) * 2000-04-24 2001-11-02 Toshiba Corp Alarm display device, alarm display method, and computer-readable storage medium
JP2003186704A (en) * 2001-12-18 2003-07-04 Nec Corp Error window display control device, error message display method and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02190046A (en) * 1989-01-19 1990-07-26 Hitachi Ltd Network management equipment
JPH1063539A (en) * 1996-08-26 1998-03-06 Hitachi Inf Syst Ltd Operation monitoring and reporting system
JP2001256032A (en) * 2000-03-14 2001-09-21 Mitsubishi Electric Corp Fault message display device
JP2001306141A (en) * 2000-04-24 2001-11-02 Toshiba Corp Alarm display device, alarm display method, and computer-readable storage medium
JP2003186704A (en) * 2001-12-18 2003-07-04 Nec Corp Error window display control device, error message display method and program

Also Published As

Publication number Publication date
JP5459797B2 (en) 2014-04-02

Similar Documents

Publication Publication Date Title
US8892960B2 (en) System and method for determining causes of performance problems within middleware systems
US8595564B2 (en) Artifact-based software failure detection
US9049105B1 (en) Systems and methods for tracking and managing event records associated with network incidents
CN107660289B (en) automatic network control
US9367379B1 (en) Automated self-healing computer system
US8892965B2 (en) Automated trouble ticket generation
US9495234B1 (en) Detecting anomalous behavior by determining correlations
US11157343B2 (en) Systems and methods for real time computer fault evaluation
US20140019403A1 (en) Transaction server performance monitoring using component performance data
US10476742B1 (en) Classification of auto scaling events impacting computing resources
CN105357038A (en) Method and system for monitoring virtual machine cluster
US20170364403A1 (en) Enabling Symptom Verification
US20150074164A1 (en) Event and alert analysis in a distributed processing system
CN102271054B (en) For bookmark and the performance histories of network software deployment evaluation
US10664335B2 (en) System and method for maintaining the health of a machine
JP6002856B2 (en) Monitoring system and monitoring method
WO2017045436A1 (en) Virtual machine fault processing method and device
US9317355B2 (en) Dynamically determining an external systems management application to report system errors
JP2013522741A (en) Method, apparatus, and computer program in a multi-threaded computing environment for collecting diagnostic data
US20140289551A1 (en) Fault management in an it infrastructure
US12399768B1 (en) Method and system for detecting anomalous sub-sequences in metadata
JP5459797B2 (en) Monitoring device, monitoring method, and program
JP2011159234A (en) Fault handling system and fault handling method
JP2016015021A (en) Correction application determination program, information processing apparatus, and correction application determination method
US10282775B1 (en) System, method, and computer program for automatically remediating fallouts in an ordering system of a consumer telecommunications network

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140109

R150 Certificate of patent or registration of utility model

Ref document number: 5459797

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees