コンテンツ情報
公開日 |
2015/04/13 |
フォーマット |
PDF |
種類 |
製品資料 |
ページ数・視聴時間 |
7ページ |
ファイルサイズ |
727KB
|
要約
ビッグデータ活用には「人」「データ」「システム」の3つの観点からの取り組みが欠かせない。本資料では、その3つの要素の1つ「システム」にフォーカスし、「データレイク」と呼ばれるアプローチにより実現するビッグデータインフラについて解説する。
データ活用は規模の大小を問わず、多くの企業で少なからず行われている。グループや部門によるデータ活用は、部門ごとにシステム構築して行われるケースが多く、用途ごとに立ち上がったデータウェアハウスはサイロ化しているのが現状だ。
この点在化したデータを一元管理し、さらに拡張を実現するのが「データレイク」構想だ。資料では、PivotalのSQLが使えるHadoopと、EMCのスケールアウトNAS「EMC Isilon」の組み合わせで実現するビッグデータインフラについて詳しく解説する。また、EMC Isilonのインタフェースを使用した柔軟なデータ取り込みと活用を実現するプラットフォームや、低スペックなマシンで構築したHadoop環境のシステム効率化という具体的な利用イメージを紹介。真に役立つビッグデータ活用インフラとはどのようなものかが理解できる内容になっており、医療、金融、流通などの分野で既にHadoopを利用している組織や、Hadoopを検討している組織は参考にしてほしい。