今日、レジリエンスの強化は重要な経営課題の1つだろう。しかし、テクノロジーが絶えず進化する中、従来の監視手法ではもはや十分ではないと指摘されるようになった。そこで注目されているのが「オブザーバビリティ(可観測性)」だ。
その実現において押さえるべきは、メトリクス、イベント、ログ、トレースといった多様なオブザーバビリティデータを理解し、正しく活用することだ。現場の調査ではログに頼ることが多いが、常にログだけを使うのはベストプラクティスとはいえない。大量のログデータをつぶさに調査するのは、現実的ではないからだ。
例えば、インフラに関する指標、エラー率、リクエスト数など、定量化できる情報を測定し、経時変化を把握するには、メトリクスを使った方が効率的だ。本資料では、「ログとメトリクスを使い分けていない」「ログとトレースを組み合わせていない」「データを階層化していない」といったログ管理でよくある3つの間違いとその修正方法を解説する。