コンテンツ情報
公開日 |
2019/08/27 |
フォーマット |
PDF |
種類 |
事例 |
ページ数・視聴時間 |
2ページ |
ファイルサイズ |
1.4MB
|
要約
2011年に世界最速のコンピュータと認定されたスパコン「京」を運用する理化学研究所 計算科学研究機構(現:計算科学研究センター)では、「京」を中核に、ネットワークシステム、HPCIサーバ群の3つのシステムを運用している。この効率的な運用・管理には、膨大なログをシステム横断的に分析・活用する仕組みが欠かせない。
同機構の環境を支えているのが、大量のログ管理と高速な検索を可能にするログ分析システムだ。蓄積場所の分散や利用者権限の設定も容易で、効率的な圧縮機能、スケールアウトによる拡張性も備える。システムの生成ログは1日に数百GBにもなると見込まれるが、点在する事象をログ分析でつなぐことで障害の予兆を発見したり、データ間の相関分析により異常検知の精度を向上したりするなど、ログ活用の選択肢が大きく広がるという。
また、「京」は巨大なシステムなだけに思わぬ異常が発生する可能性もある。ログ流量に対するアラート、外部委託しているネットワーク運用の監査など、安心感を生む機能の評価も高い。本資料では、同機構の事例を通じ、巨大システムのログ蓄積・管理を効率化するポイントを明らかにする。