ラボ 10 - メトリクスの監視
ダッシュボード
ダッシュボードはメトリクスやログのパネルが集まったもので、ユーザは経時的な傾向や重要なイベントを簡単に監視できます。
以前のラボで使用した 4 つのクエリによってダッシュボードを作成します。表示内容は、表示するように指定したラボや、選択した表示オプション (折れ線グラフや面グラフなどの種類、色、外れ値) に応じて変わるため、次のスクリーンショットとは異なります。
メトリクス モニタ
メトリクス クエリでは、時系列でモニタを設定して、メトリクスが静的しきい値を超えたらアラートを出し、メールまたは Webhook 通知を送信できます。モニタごとに 1 つの重大アラート、1 つの警告アラート、および 1 つの欠落データ アラートの最大値と、1 つ以上の通知の宛先を設定できます。
モニタは 1 つの時系列、複数の時系列、または 2 つのメトリクス クエリの結合に対してアラートを出すことができます。つまりモニタ クエリが 10 個の異なる時系列を生成する場合、ユーザは、そのすべての時系列に関するアラートを個々に受信します。クエリが結合条件のみに適用される場合、ユーザは、その結合された値に関する個別のアラートを受信します。たとえば 10 のホスト全体で CPU に関するアラートを生成するモニタを作成した場合、設定したしきい値を超えるホストごとに個別のアラートを受信します。
このラボでは、すべてのコンテナの CPU 使用率についてアラートするメトリック モニタを作成します。
-
次のクエリを作成します。
metric=CPU_usage container=container*
-
次に、特定のしきい値についてアラートするメトリクス モニタを作成します。クエリの右側にあるモニタ アイコンをクリックします。
-
[Metrics Monitors (メトリクス モニタ)] 画面で、しきい値を指定できます。次の値を指定します。
-
Critical (重大): greater than (超える)、90、for all of (すべて)、the last 15 minutes (過去 15 分間)
-
Warning (警告): greater than (超える)、85、for all of (すべて)、the last 15 minutes (過去 15 分間)
注意: メトリクス データによっては値の調整が必要になる場合があります。
-
-
メトリックによって、このしきい値がグラフィカルに反映されます。
-
[Name (名前)] と [Description (説明)] (省略可能) を指定したら、新しいメトリクス モニタを保存できます。
-
最後に、モニタを保存した場合は、このトレーニング データに関するアラートが表示されないように、このモニタを削除することを忘れないでください。トレーニングのメトリクス モニタを削除するには、次の手順に従ってください。
-
左側のナビゲーション バーで、[Manage Data (データの管理)] > [Alerts (アラート)] に移動します。
-
メトリクス モニタを名前で検索し、右側の [Delete (削除)] ボタンをクリックして削除します。
-