メインコンテンツまでスキップ
Sumo Logic Japanese

ラボ 8 - TravelLogic メトリクス

このラボでは、架空の旅行アプリケーションのデータを利用して、ビジネスや運用でどのようにメトリクスを追加するかについて説明します。

Sumo を使用することで、さらに組織のアプリケーション内でコード化された、カスタムの業務および運用データを収集できます。

このラボでは、TravelLogic デモのメトリクスについて確認します。 

まず、先程、トレーニングで確認した Graphite メトリックスのルールをテストすることから始めましょう。

  1. 最初に、元の Graphite 名を使用してメトリックのクエリを実行します。メトリクス クエリで、次のように入力します。

    travel.training.counters.travel-checkout*.bookings.success.count

  2.  2 番目のクエリで、次のクエリを実行して、まったく同じメトリックを照会します。ただし、今回は、メトリクスのルールで作成されたキーと値のタグを使用します。

    type=bookings metric=success.count

    step2.png

  3. この場合、まったく同じメトリックを 2 回グラフ化することになります。これを確認するには、[Legend (凡例)] タブをクリックして、メトリックの元の名前とその他すべてのメタデータ フィールドを確認します。

では次に、いくつかの追加の operator を使用する方法について確認しましょう。次の手順では、オンライン旅行 Web サイトからのデータをプロットして、成功した予約と失敗した予約を判断します。

  1. 新しい [Metrics (メトリクス)] タブで、過去 60 分間の成約データを検索するためのクエリを追加します。

    type=bookings metric=success.count

  2. その下に 2 番目のクエリを作成し、不成約データをすべて検索します。

    type=bookings metric=fail.count

    step6.png

  3. [Settings (設定)] タブで利用可能なオプションを確認します。たとえば、グラフの種類 (棒グラフや円グラフ)、使用するカラー パレット、線の幅、軸のラベルや目盛などを変更できます。

  4. [Legend (凡例)] タブでは、グラフ化する各メトリクスのすべての時系列の詳細を参照できます。

  5. クエリのタブに戻り、オレンジ色のアイコン () をクリックして success.count をオフにします。fail.count メトリクスのみがグラフに表示されます。

    グラフに表示されるピンクのドットは、データの外れ値を示します。外れ値の設定を編集するには、右上のピンクの点をクリックし、[Outliers (外れ値)] で、表示する外れ値の数 (一番上) と外れ値と見なすために使用する標準偏差の倍数 ([Threshold (しきい値)]) の設定を編集します。


    step10.png


右上にある 3 つのグレーのドットをクリックすると、クエリ情報を表示したり、クエリを更新したり、このグラフをダッシュボードに追加したりできます。

次に、timeshift operator を使用して、異なる期間の KPI を比較します。timeshift operator によって、クエリの時系列がシフトされます。これは、複数の期間を比較するときに非常に便利です。

  1. 新しい [Metrics (メトリクス)] タブで、過去 60 分間の平均レイテンシをすべて検索するためのクエリを追加します。

    metric=latency.mean

これを 1 日前のレイテンシと比較します。

metric=latency.mean | timeshift 1d

step13.png
ログと同じようにメトリクスにも通常の operator (min、max、sum、count、avg) があります。ただし、測定したい対象の大半は「変化」です。

この次の演習では、差し迫った問題について早期に警告を通知できるように変化率を識別します。

  1. 新しい [Metrics (メトリクス)] タブで、過去 60 分間に受信したパケット数を検索するためのクエリを追加します。

    type=packets_received metric=count

  2. あるデータ ポイントと次のデータ ポイントとの違いを検出するために、デルタを表示するようにクエリを編集します。

    type=packets_received metric=count | delta

変化レート (この場合は毎秒の受信パケット数の変化レート) を特定するため、クエリを次のように編集します。

type=packets_received metric=count | rate

この最後のクエリを使用することで、パケットを受信したときの変化率が徐々に増加しているか、または急激に急上昇しているかを判断できます。変化率の外れ値を特定することは、差し迫った問題を見分けるための優れた指標です。

step15.png

 

最後に、メトリクスを関連するログに関連付けて根本原因を特定する方法について確認しましょう。

メトリクスを使用すると、環境の症状 (何が起きているか) を特定できます。そして関連するログを使用すると、その原因 (なぜそれが起きているか) を調べることができます。成功した予約と失敗した予約をもう一度調べてみましょう。ただし、今回は、関連するログを参照して、予約が失敗した理由を特定しましょう。

  1. 旅行 Web サイトの成約件数と不成約件数を確認します。

    step6.png

  2. メトリクスに関連ログを重ねるため、このログのクエリを次のように入力します。

    _sourceCategory=training/travel/checkout error

    step18.png

  3. 一番上にあるオレンジ色のバーに注目してください。色が濃い部分ほど「ERROR」という単語を含むログ メッセージの数が多いことを示しています。バーをクリックすると、同じ画面に関連ログが表示されます。Shift キーを押しながらクリックすると、ログが [Log Search (ログ検索)] 画面に表示されます。

  • この記事は役に立ちましたか?