個人の知識やスキルなどを売買できるココナラスキルマーケットを提供しているココナラ。同社は、自社が提供するサービスの効率的な監視運用に課題を抱えていた。そこで、ある統合監視基盤を導入する。以来、7年間利用しており、開発と運用に携わる約70人のエンジニアが利用している。
主なユースケースとしては、「日次モニタリング」「障害発生時の原因追究」「サーバリソースのアラートと死活監視」という3点が挙げられる。日次モニタリングでは、サービスのリクエスト数を毎日確認し、不自然なリクエストが増えた際には、障害やサイバー攻撃を疑いながら原因の追究に着手する。別途利用しているWebサイト稼働監視ツールなどで異常が発見された際には、原因を探るために同基盤の各種メトリクスを確認するという。
長きにわたり安定稼働を続けている同基盤は、同社に安心感をもたらしただけではなく、サービスが増え続ける中でインフラ運用の効率化や管理工数の削減にも貢献している。本資料で詳しく解説しているので、同社がどのようにサービス監視に関する運用の効率化を実現したのか、ぜひ確認してほしい。