Monitoring 操作マニュアル

本マニュアルでは、 Cloudn Monitoringのご利用方法に関してご説明いたします。
右のサイドバーより検索がご利用いただけます

1. はじめに

1.1. サービスの概要

Cloudn Monitoringは Cloudn が提供するCompute、Load Balancing Advanced (LBA) 、RelationalDatabase (RDB) 、 Autoscaling (AS)等の各種サービスの状態を監視するサービスです。
Monitoringを利用することで、システムの負荷やトラフィック等のあらかじめ指定された監視項目を一元管理することができます。

また、監視項目に対して閾値を設定することで、アラームを設定できます。
アラームは指定したメールアドレスに送られます。
AutoScalingと連携させ、アラームをオートスケーリングのトリガーにすることも可能です。

主な提供機能

Monitoringで提供する主な機能は以下のとおりです。

  • データ蓄積・グラフ生成機能

  • アクション設定機能

    • メトリクスに閾値を設定し、アクションを設定することが可能です
    • 例えば、CPU Usageが50%を超えたら、アラートを飛ばす、Autoscalingを利用してスケールアウトさせる、等

1.2. サービスの用語・提供機能一覧・技術仕様

Cloudn Monitoringの主な技術仕様、および用語は以下の通りです。

Cloudn Monitoringで用いられる用語

メトリクス (Metrics/Metric)
Cloudn Monitoringにより監視・収集されたデータです。
例えば、Computeの仮想サーバーのCPU Utilizationの時間ごとの変化などのデータがこれに該当します。

メトリクスは以下の要素で定義されます
メトリクス名 (MetricName)

メトリクスの名前を表します。

ネームスペース (Namespace)
メトリクスをまとめる集合名を表します。
Cloudn では、以下のNamespaceが標準提供メトリクスで利用されています。
そのためカスタムメトリクスのNamespaceとして利用することが出来ません。
  • Cloudn/Compute
  • Cloudn/DataDisk
  • Cloudn/RDB
  • Cloudn/AutoScale
  • Cloudn/LBA
ディメンション (Dimension)
メトリクスの指し示す対象を表します。
例えば、Computeの場合、以下のNamespace/Dimensionで対象を表します。
  • Cloudn/Compute

    • InstanceId

各種DimensionのIDなどは各種サービスより確認可能です。

標準提供メトリクス
Cloudn Monitoringで標準提供するメトリクスです。
Compute, RDBなどの各種サービスの統計情報が自動で収集され、表示されます。

標準提供メトリクスの一覧に関する詳細は 標準提供メトリクス 技術仕様 を参照して下さい。

注釈

仮想サーバーなどのリソース作成後、標準提供メトリクスが表示されるまで最大1時間程度 時間がかかります。

カスタムメトリクス
Cloudn Monitoringが提供する、お客様が任意のメトリクスを設定可能とするサービスです。
Monitoringがデフォルトで提供するメトリクス (ComputeのCPU使用率、ネットワークI/O等) 以外のメトリクスデータもMonitoringサーバが蓄積することによって、
お客様のすべてのメトリクスを一つのGUIで便利に一元管理することができます。
お客様でスクリプトなどを作成いただき、対象サーバーからデータを送信していただく必要があります。

参考

APIよりカスタムメトリクスの設定が可能です。

Monitoring APIリファレンス

カスタムメトリクスとして投入するデータの取得方法 (お客様仮想サーバー内部におけるメモリ取得の実施方法など) については サポート対象外となります。

お客様ご自身の責任においてご実施下さい。

API
Cloudn Monitoringでは、Amazon Web Servicess CloudWatchの互換APIを提供しております。
各種AWSのAPIツールをご利用いただくことが可能です
詳細はAPIマニュアルをお読み下さい。

Monitoring APIリファレンス

アクション
閾値を設定し、その閾値をまたいだ値がメトリクスに検出された際に、指定することができるアクションです。
アラーム、もしくはAutoScalingのアクションが指定可能です。
アラーム
アクションとして利用できるイベント通知です。
メールにより、設定した閾値をまたいだメトリクスがあったことをお知らせします。
リソース
Cloudn Monitoringにより監視される対象です。
例えば、Computeの仮想サーバーなどを指します。

提供機能一覧

Cloudn Monitoringで提供する機能は以下のとおりです。

カテゴリ 機能 GUI API
メトリクス表示 一覧表示 Yes Yes
グラフ表示 Yes  
統計表示   Yes
標準メトリクス利用 Compute Yes Yes
LBA Yes Yes
RDB Yes Yes
DataDisk Yes Yes
AutoScaling Yes Yes
カスタムメトリクス カスタムメトリクス一覧表示 Yes Yes
カスタムメトリクス作成   Yes
カスタムメトリクスグラフ表示 Yes  
カスタムメトリクス統計表示   Yes
アラーム 作成 Yes Yes
削除 Yes Yes
有効化   Yes
無効化   Yes
履歴確認   Yes

技術仕様・制限

料金
アラーム
  • アラームメール中のタイムスタンプ: UTC

    • 変更することはできません
  • 最大設定可能アラーム数

    • 設定なし
  • AutoScalingグループを作成し、トリガーの設定を行った場合、AutoScalingグループ名(およびその閾値)で自動的にアラームが登録されます。

    • こちらも課金対象となります。ご注意下さい。
モニタリング
  • 標準提供監視メトリクス/監視間隔/監視項目

    • Compute (FLATタイプ|VPCタイプ OpenNW) [5 min間隔監視]

      • 仮想サーバー

        • CPUUtilization
        • DiskReadBytes
        • DiskReadOps
        • DiskWriteBytes
        • DiskWriteOps
        • NetworkIn
        • NetworkOut
        • StatusCheckFailed
        • StatusCheckFailed_Instance
        • StatusCheckFailed_System
      • データディスク

        • VolumeReadBytes
        • VolumeReadOps
        • VolumeWriteBytes
        • VolumeWriteOps
    • LBA (FLATタイプ|VPCタイプ OpenNW) [1 min間隔監視]

      • HealthyHostCount
      • RequestCount
      • UnHealthyHostCount
    • RDB (FLATタイプ) [1 min間隔監視]

      • BinLogDiskUsage
      • CPUUtilization
      • DatabaseConnections
      • FreeableMemory
      • FreeStorageSpace
      • ReadIOPS
      • ReadLatency
      • ReadThroughput
      • ReplicaIOStatus
      • ReplicaLag
      • ReplicaSQLStatus
      • SwapUsage
      • WriteIOPS
      • WriteLatency
      • WriteThroughput
    • AutoScaling (FLATタイプ|VPCタイプ OpenNW) [1 min間隔監視]

      • GroupDesiredCapacity
      • GroupInServiceInstances
      • GroupMaxSize
      • GroupMinSize
      • GroupPendingInstances
      • GroupTerminatingInstances
      • GroupTotalInstances
  • リソース作成後のメトリクス取得開始時間

    • リソース作成より約10〜30分後
  • メトリクスデータ保存期間

    • 最大2週間 (変更不可)
  • グラフ横軸の最低時間

    • 1時間以上
  • 仮想サーバーのセキュリティグループの設定はMonitoringには影響いたしません

  • 監視方法

    • Compute: 仮想サーバーのハイパーバイザーより見える状態を監視します
  • カスタムメトリクス

    • 2週間以上データの送信がないメトリクスは自動的に削除されます
    • APIなどでカスタムメトリクスを削除することはできません
    • データの保存期間は最大2週間です

注釈

 Monitoringのストレージ/メモリ容量(GBytes)のグラフ縦軸は
  1,000Bytes = 1KB
  1,000KB = 1MB
  1,000MB = 1GB
 として表記する仕様となっており、KiB, MiB, GiB表記ではございません。(例:縦軸の”10GB”は10,000,000,000Bytesに相当)
リソース
  • リソースの名前はIDで表示されます (変更不可)
AWS互換機能についての制限
  • Signature Version 2による署名が利用可能です

    • Signature Version 4による署名には対応しておりません
  • 対応APIバージョン: “2010-08-01”

AWS互換APIを提供しておりますが、以下の機能には対応しておりません

  • SetAlarmState API

下記のAWS標準メトリクスには対応しておりません。

  • Cloudn/DataDisk

    • VolumeTotalReadTime
    • VolumeTotalWriteTime
    • VolumeIdleTime
    • VolumeQueueLength
  • Cloudn/LBA

    • Latency
    • HTTPCode_ELB_4XX
    • HTTPCode_ELB_5XX
    • HTTPCode_Backend_2XX
    • HTTPCode_Backend_3XX
    • HTTPCode_Backend_4XX
    • HTTPCode_Backend_5XX
  • Cloudn/RDB

    • DiskQueueDepth

標準提供メトリクス 技術仕様

Compute (FLATタイプ|VPCタイプ OpenNW)

全て5分間隔の監視となります。

  • Namespace

    • Cloudn/Compute
  • Dimension Name

    • InstanceId
CPUUtilization [Percent]

お客様がComputeでご利用いただいている仮想サーバーの、ハイパーバイザーから見た時のCPU利用率です。

グラフの最大値は “100Percent × vCPUのコア数” となります。

注釈

(例): m1.mediumの場合、0〜200Percentとなります。

(例): vQ.smallの場合、0〜100Percentとなります。

DiskReadBytes [Bytes/Sec]

1秒間あたりのディスクにおける読み込みデータ量です。これは、5分間隔で計算された値を示しています。

DiskReadOps [Count/Sec]

1秒間あたりのディスクにおける読み出しIO数です。これは、5分間隔で計算された値を示しています。

DiskWriteBytes [Bytes/Sec]

1秒間あたりのディスクにおける書き込みデータ量です。これは、5分間隔で計算された値を示しています。

DiskWriteOps [Count/Sec]

1秒間あたりのディスクにおける書き込みIO数です。これは、5分間隔で計算された値を示しています。

NetworkIn [Bytes/Sec]

1秒間あたりの仮想サーバーの中への通信量です。これは、5分間隔で計算された値を示しています。

NetworkOut [Bytes/Sec]

1秒間あたりの仮想サーバーから外への通信量です。これは、5分間隔で計算された値を示しています。

StatusCheckFailed [Count]

メトリクス StatusCheckFailed_Instance [Count], StatusCheckFailed_System [Count] がいずれも正常の時に “0” を返却します。どちらかが異常のの場合は “1” を返却します。

StatusCheckFailed_Instance [Count]
仮想サーバーがハイパーバイザーより見て正常な管理下にある場合は「0」を返却します。
仮想サーバーがハイパーバイザーの管理外状態となった場合は「1」を返却します。

ほとんどの場合で「1」にはなりませんので仮想サーバーの起動状態を知る、電源状態を知る、といった監視には向きません。

意図的に仮想サーバーを停止した場合は、このメトリクス自体がMonitoringへ送信されません。(値は “空” )

注釈

“StatusCheckFailed_Instance”は、仮想サーバーの基盤であるComputeサービスの監視であり、 お客様仮想サーバー内部のトラブル(カーネルパニックやOSクラッシュ) による仮想サーバー故障を検知することはできません。

StatusCheckFailed_System [Count]
一定時間あたりにComputeサービスのハイパーバイザの仮想サーバー管理機構が正常に動作しなくなった場合は異常と検知し “1” を返却します。
正常の時は “0” を返却します。

意図的に仮想サーバーを停止した場合は、このメトリクス自体がMonitoringへ送信されません(値は “空”)。

注釈

上記の死活監視はpingなどによるものではなく、仮想サーバーのハイパバイザーによるものです。

ハイパーバイザーはComputeサービスにて監視されており、障害発生時にも仮想サーバーの動作を継続させようと試みます。

例えば仮想サーバーが動作している物理サーバーのハードウェア故障があった場合、Computeサービスは該当仮想サーバーを他の正常動作中のハイパーバイザー上に移動します。 この場合、上記のメトリクスでは異常を検出できないことがあります。

以下に例を示します。

  • Computeサービスが停止状態で仮想サーバーが正常の場合

    • 例:ハイパーバイザーのネットワークI/Fが故障しているため仮想サーバーにアクセスできないが、仮想サーバー自体は生きている。
    • この場合、「StatusCheckFailed_Instance」=0(正常)で、「StatusCheckFailed_System」=1(異常)という表示になります。
  • 仮想サーバーが停止状態でComputeサービスが正常の場合

    • 例: ハイパーバイザーは健康だが仮想サーバーが不意にクラッシュしてしまった。
    • Computeサービスにおいて本問題が起きる可能性は限りなく低いですが、この場合 “StatusCheckFailed_Instance”=1(異常)
    • “StatusCheckFailed_System”=0(正常)という表示になります。
Compute (FLATタイプ|VPCタイプ OpenNW)のデータディスク

全て5分間隔の監視となります。

  • Namespace

    • Cloudn/DataDisk
  • Dimension Name

    • VolumeId
VolumeReadBytes [Bytes/Sec]

1秒間あたりのディスクにおける読み込みデータ量です。これは、5分間隔で計算された値を示しています。

VolumeReadOps [Count/Sec]

1秒間あたりのディスクにおける読み込みIO数です。これは、5分間隔で計算された値を示しています。

VolumeWriteBytes [Bytes/Sec]

1秒間あたりのディスクにおける書き込みデータ量です。これは、5分間隔で計算された値を示しています。

VolumeWriteOps [Count/Sec]

1秒間あたりのディスクにおける書き込みIO数です。これは、5分間隔で計算された値を示しています。

LBA(FLATタイプ|VPCタイプ OpenNW)

全て1分間隔の監視となります。

  • Namespace

    • Cloudn/LBA
  • Dimension Name

    • LoadBalancerName
HealthyHostCount [Count]

正常に動作している振り分け先ポートの数(瞬間値)です。

注釈

ポートの数であることにご注意ください。 例えば、LBAの配下にComputeの仮想サーバーが2つあり、 それぞれ仮想サーバーのリスナーポートを80, 8080と設定していた場合には、 Countは “4” となります。

RequestCount [Counts]

現在接続中のHTTPセッション数(瞬間値)です。

UnHealthyHostCount [Counts]

正常に動作していない振り分け先ポートの数です。

RDB (FLATタイプ)

全て1分間隔の監視となります。

  • Namespace

    • Cloudn/RDB
  • Dimension Name

    • DBInstanceIdentifier
BinLogDiskUsage [Bytes]

バイナリログによるディスク使用量です。これは、1分毎に記録しますが、1分間の平均値ではなく瞬間値を示します。バイナリログはバックアップに使用されるファイルです。

CPUUtilization [Percent]

CPU使用率です。これは、1分間で平均した値を示しています。CPU使用率にはIO waitを含んでおりません。どのRDBプランでもグラフの最大値は100%となります。

DatabaseConnections [Count]

DBインスタンスへの接続数です。これは、1分毎に記録しますが、1分間の平均値ではなく瞬間値を示します。

FreeableMemory [Bytes]

使用可能な空きメモリ量です。これは、1分毎に記録しますが、1分間の平均値ではなく瞬間値を示します。FreeableMemoryは空きメモリ量を示しますが、FreeableMemoryが残っている場合でも、スワップが利用される場合があります。

FreeStorageSpace [Bytes]

DBデータディスクにおける、使用可能な空きディスク量です。バイナリログによるディスク使用量やMySQLが作成する一時ファイルも、DBデータディスクのディスク使用量に含まれます。

ReadIOPS [Count/Second]

1秒間あたりの読み込みIO数です。これは、1分間で平均した値を示しています。

ReadLatency [Milliseconds]

IO毎の平均読み込み時間です。これは、1分間で平均した値を示しています。

ReadThroughput [Bytes/Second]

1秒間あたりの読み込み量です。これは、1分間で平均した値を示しています。

ReplicaIOStatus [Count]

現在、提供しておりません。

ReplicaLag [Seconds]

現在、提供しておりません。

ReplicaSQLStatus [Count]

現在、提供しておりません。

SwapUsage [Bytes]

スワップ使用量です。これは、1分毎に記録しますが、1分間の平均値ではなく瞬間値を示します。一般的にlinux系OSでは、メモリが足りない場合ではなくても、メモリを効率的に使う為にスワップを使う場合があります。メモリ不足の場合には、SwapUsage が継続的に増え、IOが増えます。

WriteIOPS [Count/Second]

1秒間あたりの書き込みIO数です。これは、1分間で平均した値を示しています。

WriteLatency [Milliseconds]

IO毎の平均書き込み時間です。これは、1分間で平均した値を示しています。

WriteThroughput [Bytes/Second]

1秒間あたりの書き込み量です。これは、1分間で平均した値を示しています。

AutoScaling (FLATタイプ|VPCタイプ OpenNW)

全て1分間隔の監視となります。

  • Namespace

    • Cloudn/AutoScale
  • Dimension Name

    • AutoScalingGroupName
GroupDesiredCapacity [Count]

オートスケールグループの通常時に期待される仮想サーバー数です。

GroupInServiceInstances [Count]
オートスケールグループの中で稼働している仮想サーバーの数(瞬間値)です。
PendingやTerminatingの状態のインスタンスはカウントしません。
GroupMaxSize [Count]

オートスケールグループの最大サイズ(瞬間値)です。

GroupMinSize [Count]

オートスケールグループの最少サイズ(瞬間値)です。

GroupPendingInstances [Count]

オートスケールグループ配下の起動途中の仮想サーバー数(瞬間値)です。

GroupTerminatingInstances [Count]

スケールインにより削除された仮想サーバーの数(瞬間値)です。

GroupTotalInstances [Count]

オートスケールグループ配下の全仮想サーバー数(瞬間値)です。

1.3. 事前に準備いただくもの

Cloudn Monitoringをご利用頂くにあたっては、以下のものをご用意ください。

インターネットに接続するための機器

パソコンやモデム等、イントラネット/インターネットに接続する為に必要な機器をご用意ください。

インターネットに接続するためのサービス

インターネットへ接続するためのサービスをご用意ください。
例:OCNダイヤルアクセスサービス、OCN ADSL接続サービス、スーパーOCN等の常時接続サービスなど

※他社のインターネット接続サービスでもご利用いただけます。
※プロキシサーバーを利用されている場合は、「https(ポート番号443)」が開放されていることをご確認下さい。

コントロールパネルを閲覧するためのソフト(ブラウザソフト)

Firefox18.0.1 以降が推奨となります。
それ以外のブラウザは、一部、正常に表示されない場合がありますのでご注意ください。

「 【クラウド・エヌ】ご利用内容のご案内 」メール

開通時に送付される「 【クラウド・エヌ】ご利用内容のご案内 」を用意してください。

サービス利用登録後にメール送付される、下記ご利用案内(タイトル「 【クラウド・エヌ】ご利用内容のご案内 」)を参照しながら、本ご利用ガイドに従ってセットアップを実施してください。

ご利用内容のご案内メール

ご利用内容のご案内:メール本文

必要情報の一覧
Cloudn ポータルURL https://portal.cloudn-service.com/comgi/login
Cloudn ポータルログインID メールに記載のある文字(お申し込み時に設定したログインID、上記例ではTest0001)
Cloudn ポータルパスワード お申し込み時に設定されたパスワード

注釈

Monitoringサービスはアカウント作成時点で自動的に「ご利用中」ステータスとなります。

実際のご利用にて初めて課金が発生します。 詳しくは クラウド・エヌ 料金 をご確認ください。 また、「ご利用中」ステータスになっているものを「未利用」に戻すことは出来ません。

2. Monitoring コンソールを利用する

Cloudn Monitoringコンソールについて説明します

2.1. Monitoringコンソールを起動する

Cloudn Monitoringを管理するコンソールを起動します。

手順

Cloudn ポータルにログインし、監視を行いたい対象リソースの存在するリージョン・タイプを選択します。
|brandname| Monitoring 機能概要

Cloudn ポータルの画面 - タイプ・リージョンの選択

その上で、「Monitoring」アイコンへのマウスオーバーにて表示される、「コンソールへ」をクリックします。
|brandname| Monitoring 機能概要

Cloudn Monitoringの選択

Monitoringコンソールが起動します。

|brandname| Monitoring 機能概要

Cloudn Monitoringコンソール画面

3. グラフ管理

Metricsをグラフに表示し、グラフを管理する方法について説明します。

3.1. メトリクスの状態をグラフ表示する

メトリクスを選択し、状態をグラフ表示します。

手順

Monitoringコンソールのリソースメニューより、状態を表示させたいリソースの分類を選択します。
分類を選択しますと、その分類のリソースがすべて表示されます。
リソース分類の選択

リソース分類の選択

表示されたリソース画面の検索ボックスにキーワードを入力することで、リソースを絞り込むことが可能です。
リソースの選択

リソースの選択

リソースをクリックで選択すると、Graph領域に選択したリソースの最初のメトリクスの状態がグラフ表示されます。
以下は、ComputeリソースのCPUUtilizationメトリクスをグラフ表示した例を示します。
グラフの例

グラフの例

グラフ線上のデータポイントをマウスオーバーすると、その日時のメトリクス値が表示されます。
メトリクス値の表示

メトリクス値の表示

注釈

グラフ横軸の開始点、終点、およびメモリ幅を以下の三箇所で変更できます: - グラフ左上のZoomから表示範囲を選択 - グラフ右上のFrom〜Toに表示範囲日時を入力 - グラフ下のスクルールバーで表示範囲を変更

グラフ表示範囲の変更方法

グラフ表示範囲の変更方法

リソース画面でメトリクスを選択するには、画面右側のメトリクスタブをクリックしていただきます。
類似的なメトリクスは比較を容易にするために、一つのグラフにまとめられています。
以下は、ComputeリソースのDiskReadBytesとDiskWriteBytesメトリクスを同じグラフに表示したDisk I/O Bytesグラフの例を示します。
two_metrics_graph_new.png

複数メトリクス表示のグラフ

メトリクスタブと表示メトリクスの関係については以下のテーブルを参照願います。
リソースの分類 リソース画面のタブ名 表示メトリクス
Compute CPU Usage CPUUtilization
Disk I/O Ops DiskReadOps DiskWriteOps
Disk I/O Bytes DiskReadBytes DiskWriteBytes
Network I/O NetworkIn NetworkOut
StatusCheck StatusCheckFailed StatusCheckFailed_Instance StatusCheckFailed_System
DataDisk Volume I/O Ops VolumeReadOps VolumeWriteOps
Volume I/O Bytes VolumeReadBytes VolumeWriteBytes
LBA Request Count RequestCount
Backend Host/Port Count HealthyHostCount UnHealthyHostCount
RDB CPU Usage CPUUtilization
Disk Usage BinLogDiskUsage FreeStorageSpace
Memory Usage SwapUsage FreeableMemory
IOPS ReadIOPS WriteIOPS
Latency ReadLatency WriteLatency
Throughput ReadThroughput WriteThroughput
Database Connections DatabaseConnections
Replica Lag ReplicaLag
Replica Status ReplicaIOStatus ReplicaSQLStatus
AutoScaling Group Settings GroupMinSize GroupMaxSize GroupDesiredCapacity
Group Instance States GroupInServiceInstances GroupPendingInstances GroupTerminatingInstances GroupTotalInstances

注釈

グラフ横軸の開始点、終点、およびメモリ幅を以下の三箇所で変更できます: - グラフ左上のZoomから表示範囲選択 - グラフ右上のFrom〜Toに表示範囲日時を入力 - グラフ右下の 開始点および終点を変更した後は、「更新」をクリックしてください。

グラフ表示範囲の変更方法

グラフ表示範囲の変更方法

警告

AutoScalingのリソースを監視するには、AutoScalingのAPIである “EnableMetricsCollection”を対象オートスケーリンググループに対して実行する必要があります。 詳細はAutoScalingのAPマニュアルを参照ください。

なお、オートスケーリンググループの監視メトリクスは2種類あることご注意ください。

  • AutoScalingのメトリクス:

    • オートスケーリンググループに属する全VMのメトリクスの平均値を、オートスケーリンググループのComputeメトリクスで監視できます。
  • Computeのメトリクス:

    • オートスケーリンググループのComputeメトリクスを監視するためにAPIを実行する必要はありません

4. アラーム管理

アラームを管理する方法について説明します。

4.1. アラームを設定する

メトリクスに対し閾値を設定し、アラームを設定します。

手順

Monitoringコンソールより、「アラーム一覧」をクリックします。

アラーム一覧の選択

アラーム一覧の選択

警告

AutoScalingのグループを作成し、トリガーを設定した場合、自動的にアラームが設定されます。

また、AutoScalingにより作成されたアクションはアラーム課金個数に含まれます。 こちらをMonitoringより削除した場合、AutoScalingのトリガーも削除されます。

ご注意下さい。

アラーム一覧画面より、「作成」をクリックします。

アラーム作成の選択

アラーム作成の選択

「1. 基本情報設定」メニューにて、アラームの名前および目的の説明を入力します。

アラーム基本情報の入力

アラーム基本情報の入力

注釈

アラームの名前は半角英数字、「-」「_」「. 」以外の文字列は登録できません。 説明欄は半角英数字、「-」「_」「. 」と「 (半角スペース)」以外の文字列が登録できません。

「条件を設定」メニューにて、アラームの閾値と、上下どちらの領域を「ALARM」領域 [1] にするかの条件を選択します。

アラーム条件の設定

アラーム条件の設定

それぞれの条件の意味を以下に示します。

条件式一覧
条件 意味
>= 閾値以上の領域 (閾値自体を含む)
> 閾値を超えた領域 (閾値自体を含まない)
<= 閾値以下の領域 (閾値自体を含む)
< 閾値未満の領域 (閾値自体を含まない)

注釈

「~と…の間の領域」のような、2つ以上の閾値を持つアラーム領域は設定できません。

「アクションを設定」メニューにて、アラームの状態が変わったときにどういったアクションが実行されるか設定します。
アラームが条件に「あてはまらなかった場合(OK状態)」または「あてはまった場合(ALARM状態)」、
アクションとして「メールで通知する」か「オートスケーリングポリシーを実行する」ことを選択できます。

「メールで通知する」を選択される場合は送信先メールアドレスをEメール欄に入力してください。

「オートスケーリングポリシーを実行する」を選択される場合は対象オートスケーリンググループおよび対象オートスケーリングポリシーをプルダウンより選択してください。

なお、「オートスケーリングポリシーを実行する」アクションは、すでにオートスケーリングポリシーが設定されていなければMonitoringコンソールに表示されないのでご注意ください。
また、アラームのアクションを設定された場合必ず「追加」ボタンをクリックしてください。
アクション設定

アクション設定

アラームの状態は以下の2つがあります。

アラームの状態
状態 意味
OK状態 「ALARM」領域外であること; 「OK」領域内であること
ALARM状態 「ALARM」領域内であること; 「OK」領域外であること

「追加済みアラームアクション一覧」メニューにて、設定したアラームの情報が追加されたことを確認し、「作成」をクリックします。 以下は、アラーム領域に入った場合、出た場合両方に対してアクションを設定した例を示します。

アラームの作成

アラームの作成

確認ダイアログが表示されます。内容を確認された上でよろしければ、「OK」をクリックしてください。

アラーム作成の確認

アラーム作成の確認

アラーム一覧メニューに戻ると、設定したアラームが表示されます。
作成されたアラーム

作成されたアラーム

注釈

Cloudn ComputeおよびDataDiskメトリクスに対して作成されたアラームは、ステータス (アラームの状態を示す) が表示されるまで作成時より最大5分~30分ほどかかることがあります。 表示されるまで上図のようにステータス欄が空と表示されます。

アラームの対象となるCompute・およびDataDiskリソースが作成されて間もない場合、グラフにメトリクスデータがまだ入っていないことがあります。 データが蓄積し始められる (作成時より最大30分) まで、アラームのステータスは不明のため、表示されません。

すでにデータが蓄積されているCompute・およびDataDiskのリソースであれば、ステータスが表示されるまで (これらのリソースの監視間隔は5分のため) 最大5分かかります。

警告

ComputeのCPUUtilizationメトリクスの最大%は必ずしも100でないことご注意ください。 仮想サーバーのコア数×100がそのリソースのCPUUtilizationメトリクスの最大%となります。

例えば、仮想サーバーのプランがt1.microかm1.smallの場合、CPUUtilizationの最大%は100%ですが、 m1.mediumは2コアなので200%が最大となります。

また、ComputeのCPUUtilizationはハイパーバイザーから見たVMのCPU使用率であるため、 仮想サーバーの内部からtopコマンドやタスクマネージャーで確認できるCPU使用率とは違う%を表示します。

これはハイパーバイザーから見たCPU使用率はお客様の仮想サーバーを 仮想化するに必要なCPUも含めて計算しているに対し、 仮想サーバーから見たCPU使用率はvCPUにマッピングされている物理コアのCPU使用率を図っているからです。

仮想サーバのパフォーマンスを監視するうえで、両方のCPU使用率の観点が重要です。

脚注

[1]

アラームは設定した1つの閾値に対し「ALARM」の領域を設定します。 「ALARM」の領域とは、メトリクスデータがその領域に入った場合アラームが「ALARM」状態となる領域です。 設定された閾値の「ALARM」領域の反対側に「OK」領域(アラームが「OK」状態となる領域)があります。 例えば以下の図で表されているアラームは、「ALARM」領域を閾値以上の領域と設定しています。 メトリクスデータの変動により、「A」点で本アラームは「OK」から「ALARM」状態に変わります。 次に、「B」点で「ALARM」状態から再度「OK」状態へと変わります。Cloudn Monitoringでは、アラーム状態が変わるときにアラームのアクションが実行されます。 アクションについての説明は後述します。

ALARM領域の概念

ALARM領域の概念

4.2. アラームを変更する

設定したアラームの内容を変更します。

手順

Monitoringコンソールのメニューより、アラームの「一覧」をクリックします。

アラーム一覧の選択

アラーム一覧の選択

変更したいアラームのチェックボックスを選択し、「編集」をクリックします。

アラームの選択

アラームの選択

アラームの内容が表示されます。
アラームの設定を変更後、「作成」をクリックしてください。
Graph Sample

アラームの編集

警告

アラーム名まで変更すると、その名前で新しいアラームが作成されますことご注意ください。

確認ダイアログが表示されます。よろしければ「OK」をクリックしてください。

編集の確認

編集の確認

アラーム一覧メニューに戻ると、編集したアラームが表示されます。

編集したアラーム

編集したアラーム

4.3. アラームを削除する

設定したアラームを削除します。

手順

Monitoringコンソールのメニューより、アラームの「一覧」をクリックします。

アラーム一覧の選択

アラーム一覧の選択

削除したいアラームのチェックボックスを選択し、「削除」をクリックします。

アラームの削除

アラームの削除

確認画面が表示されます。
「OK」をクリックすると、アラームが削除されます。
アラームの削除確認

アラームの削除確認

5. アラーム履歴管理

アラーム履歴を管理する方法について説明します。

5.1. アラームの履歴を表示する

作成したアラームの履歴情報を表示します。

手順

Monitoringコンソールより、「アラーム履歴」をクリックします。
アラーム履歴の選択

アラーム履歴の選択

作成されたアラームの履歴が表示されます。
デフォルトではすべてのアラーム履歴が名前でソートされた状態で表示されます。
他にも時間、履歴タイプや、履歴タイプの詳細でソートできます。

注釈

アラーム履歴に記録される履歴タイプは以下の2種類あります。

履歴タイプ 説明
StateUpdate アラームのステータスがある状態からある違う状態へ遷移した 記録です。例えば、アラームがOKステータスからALARMステータス になったというイベントはStateUpdateとして区分されます。
ConfigurationUpdate アラームが作成されたときと設定値が更新されたときの記録です。
アラーム名、開始時刻、終了時刻、履歴タイプで検索結果自体を絞れます。
それぞれの欄に検索キーワードや時間を入力し、更新をクリックすると表示結果が更新されます。
アラーム履歴の検索

アラーム履歴の検索