採用メディアや人事向け採用クラウドなどを展開するワンキャリアでは、サービスプラットフォームにマルチクラウドを利用している。利用者が急増する中で課題となったのは、「分散するシステムやアプリケーションの並行監視」「サービスの信頼性担保」だった。
同社は課題解決に向け、「オブザーバビリティ強化」「パフォーマンスの計測・改善」「運用コスト削減」の3つが必要だと考えた。従来は複数ツールを使い分けて監視を行っていたため定常的な監視ができず、障害発生時の対応に手間取ることがあった。そこで同社は、複数サービスを横断して監視ができる統合監視ツールを導入。導入の決め手となったのは、“SREの民主化”を見据えた使用量課金体系にあったという。
同ツールの導入効果は早々に現れ、課題であった障害原因の特定時間が大幅に短縮された。同社では今後、SREが複数のプロダクトの監視やアラートに対応している状況を、事業部門やプロダクトチーム主導で自律的に対応する体制に改め、“SREの民主化”を本格的に進めていく。その中で、同ツールが不可欠なものとなっているという。