ネットワーク機器のトラブルの中でも、ハードウェアの故障はかなりの割合を占める。管理する機器が多い組織ほど、トラブルの調査や機器の入れ替えに手間と時間が多くかかってしまう。東京ドーム12個分にも及ぶ広大なキャンパスを保有する日本大学の生物資源科学部も、そうした課題を抱えた組織の1つだった。
同学部のネットワークにおいて、ハードウェアの故障が機器のダウンの原因の8~9割を占めるという。特に故障が多くなるのが年1回の法定停電のときだ。法定停電後の復電時にネットワーク機器の故障が発生することが多く、対応に時間を要していた。こういったトラブルを検知するためにネットワーク監視ツールを利用していたが、視認性や操作性に関する問題に加え、監視対象となるネットワーク機器のダウン検知や、新たなデバイスの監視対象への追加にも難があり、有効な対策とはなっていなかった。
このような課題に対応するためにネットワーク監視ツールを切り替えたところ、以前と比べて年間コストを3分の1に、対応時間を10分の1に削減できたという。ツールをどのように選定し、どのような改善が見られたのか、本資料で具体的に紹介する。