製品資料
インテル株式会社
多様なデータを統合管理、DWHの制限を取り払う「統合分析ハブ」
コンテンツ情報
公開日 |
2017/06/01 |
フォーマット |
PDF |
種類 |
製品資料 |
ページ数・視聴時間 |
10ページ |
ファイルサイズ |
578KB
|
要約
企業がデータ活用を進めていく上では、従来型のデータウェアハウス(DWH)の制約が課題となる。例えば、ソーシャルメディアなどの情報を活用する場合、分析基盤には構造化データと非構造化データの両方が大量に入ってくるが、こうしたデータから潜在的な価値を引き出すには、柔軟性の高いデータスキーマ(データベースの構造)が必要となる。
しかし、従来型DWHではデータを取り込む前にスキーマを決めなければならず、潜在的な価値が失われかねない。また、取り込むデータに対してスキーマを定義して抽出・変換・ロードする際に、時間のロスも生じ、迅速な対応を妨げる要因にもなっている。
そこで注目されるのが、データレイクと、それを基盤とした統合分析ハブだ。データレイクは構造化データと非構造化データの両方を大量に保管できるリポジトリ(保管庫)となり、柔軟性の高いスキーマを実現できる。本コンテンツでは、データレイクや統合分析ハブがどのような効果をもたらすかを分かりやすく解説する。