IT製品導入に関する技術資料を多数掲載 ホワイトペーパーダウンロードセンター
  • @IT
  • ITmedia エンタープライズ
  • ITmedia マーケティング
  • TechTarget
  • キーマンズネット

株式会社はてな

事例

株式会社はてな

サーバ監視していたのに障害に気付けない、ベネッセはこの難題をどう克服したか

DevOps/クラウド運用監視の最適解は何だろうか。徹底した監視体制を構築したはずが、ユーザーが障害に先に気付いたというケースも散見される。この悩みを「育てる監視」で解消した、ベネッセホールディングスの事例が参考になりそうだ。

コンテンツ情報
公開日 2021/12/01 フォーマット PDF 種類

事例

ページ数・視聴時間 7ページ ファイルサイズ 4.38MB
要約
 監視ツールによるサーバの死活監視を実施していながら、顧客から連絡を受けるまでサービス停止に気付けなかった。ベネッセホールディングスのサーバ監視改革は、その衝撃から始まったという。

 必要な指標を取得できていないとの問題意識を抱いたIT部門は、ユーザーが独自の指標(カスタムメトリック)を収集・可視化できるサーバ監視サービスに注目する。無料で試用できるメリットもあり、すぐに指標取得のためのスクリプトを小規模な構成で試してみたところ、従来できていなかった監視の高度化を実現できることが分かった。

 こうして導入された新たな監視サービスの成果は、すぐに表れた。クラウド上に展開した大規模システムの性能問題に対し、性能劣化の予兆を早期に発見。傷口が広がる前に対応できたのだ。この成果を受け、今や1000台規模のサーバを、同サービスで監視しているという。同社の「育てる監視」というアプローチは、エンタープライズ系企業でのDevOps/クラウド監視づくりの参考となるだろう。