事例
株式会社はてな
サーバ監視していたのに障害に気付けない、ベネッセはこの難題をどう克服したか
コンテンツ情報
公開日 |
2021/12/01 |
フォーマット |
PDF |
種類 |
事例 |
ページ数・視聴時間 |
7ページ |
ファイルサイズ |
4.38MB
|
要約
監視ツールによるサーバの死活監視を実施していながら、顧客から連絡を受けるまでサービス停止に気付けなかった。ベネッセホールディングスのサーバ監視改革は、その衝撃から始まったという。
必要な指標を取得できていないとの問題意識を抱いたIT部門は、ユーザーが独自の指標(カスタムメトリック)を収集・可視化できるサーバ監視サービスに注目する。無料で試用できるメリットもあり、すぐに指標取得のためのスクリプトを小規模な構成で試してみたところ、従来できていなかった監視の高度化を実現できることが分かった。
こうして導入された新たな監視サービスの成果は、すぐに表れた。クラウド上に展開した大規模システムの性能問題に対し、性能劣化の予兆を早期に発見。傷口が広がる前に対応できたのだ。この成果を受け、今や1000台規模のサーバを、同サービスで監視しているという。同社の「育てる監視」というアプローチは、エンタープライズ系企業でのDevOps/クラウド監視づくりの参考となるだろう。