コンテンツ情報
公開日 |
2021/03/11 |
フォーマット |
PDF |
種類 |
製品資料 |
ページ数・視聴時間 |
18ページ |
ファイルサイズ |
1.44MB
|
要約
データレイクは基盤となるハードウェアに特別なコンポーネントを必要とせず、さまざまなオープンソーススクリプトやツールを使ってデータを処理できる。そのため、従来のエンタープライズデータウェアハウス(EDW)に取って代わるものとして期待を集めたが、現状では多くの企業が期待ほどの効果を得られていない。
その背景には、データレイクに対する誤解もあった。これまでデータレイクを新たなデータウェアハウスと見なして、「取りあえず保存して、後で価値を見いだす」という心構えで臨んだ企業は多い。しかし、その結果もたらされたのが、予期せぬコストと混乱だったことは今後の教訓とすべきことだろう。
データレイクとデータウェアハウスは、どちらも大量のデータの保存と分析に使用されるものだが、その意義は大きく異なる。適切に選択して有効に活用するためには、それぞれの機能や特長を十分に把握しておく必要がある。本コンテンツでは、データレイクの導入と運用における課題を解説するとともに、データレイク内のデータから真の価値を引き出すためのアプローチを紹介する。