マルチクラウド環境に展開するおよそ60ものサービスを、わずか5人でモニタリングする体制を確立しているグリーグループ。同グループは、モバイルゲームやメタバースなど、幅広いエンターテインメント事業を国内外で展開してきた。その中で、現在のマルチクラウドに至るまでのインフラの変化に合わせて、監視基盤も変遷を重ねてきた。
監視基盤が現在の形に行き着いたのは、事業拡大や一部サービスのEOL、新たなクラウド環境への対応などを契機とした基盤そのもののリプレースの結果だったという。同グループが新たな監視基盤を選定する際に重視したのは、「カスタムメトリクスの多用によるコストの増大を避けられること」「すでに構築済みの監視環境との親和性が高いこと」の2点だった。
本資料では、グリーグループでエンジニアとしてサービスの監視に取り組んできた「中の人」が、現在の監視基盤の導入に至った経緯や選定のポイント、それによって得られた効果について語っている。さらに、これまでの内部監視にとどまらず、外形監視を強化してUXやサービス品質を高めたいという今後の展望についても語られるなど、興味深い内容となっている。