コンテンツ情報
公開日 |
2017/01/19 |
フォーマット |
PDF |
種類 |
技術文書・技術解説 |
ページ数・視聴時間 |
8ページ |
ファイルサイズ |
2.72MB
|
要約
長年に渡り、データ分析基盤の中心となってきたEDW(Enterprise Data Warehouse)。近年は、データのボリュームと多様性の増加、データの移動と変換の複雑化、新たなデータソースの追加といった要因により、これまでのアプローチに限界が見え始めている。
従来型の高コスト/高性能なデータシステムの多くで、ストレージの大半をコールドデータ(ほとんど使用されないデータ)が占める状況が見られ、価値の低いETL(抽出/変換/ロード)ワークロードが処理サイクルを大幅に浪費している。また、新しいタイプのデータの管理が貧弱で、価値のある分析結果も見逃されている。
そこで、データアーキテクチャを最適化し、「コスト」「複雑さ」「拡張」の課題を解消する方法として採用されているのが「Apache Hadoop」だ。本コンテンツでは、Hadoopのメリットに加え、導入に適したデータ基盤について分かりやすく解説する。