コンテンツ情報
公開日 |
2016/10/14 |
フォーマット |
PDF |
種類 |
技術文書・技術解説 |
ページ数・視聴時間 |
19ページ |
ファイルサイズ |
1.77MB
|
要約
データウェアハウスや予算が追い付かないほどのペースでデータが増加する中、ビッグデータの保管と処理を行うオープンソースのフレームワークであるHadoopが注目されている。しかし、技術に詳しいビジネス担当者の中でも、データ管理におけるHadoopの影響力はまだ十分に認知されていない。
まず知っておきたいのが、Hadoopが提供する2つのコンポーネントだ。構造化、半構造化、非構造化を問わずにデータを保管できる分散ファイルシステム「HDFS」と、大規模データセットを並列処理できるプログラミングモデル「MapReduce」を活用することで、Hadoopはビッグデータ以外でも効果を発揮するようになる。
それでは、Hadoopでデータウェアハウスのエコシステムをサポート/拡張するための具体的な手法にはどのようなものがあるのだろうか。本コンテンツでは、一般的な手法から複雑で統合された手法まで、Hadoop活用に向けた6つの攻略法を分かりやすく解説する。