コンテンツ情報
公開日 |
2016/11/28 |
フォーマット |
PDF |
種類 |
技術文書・技術解説 |
ページ数・視聴時間 |
5ページ |
ファイルサイズ |
4.43MB
|
要約
大規模な分散処理も低コストに実現するフレームワーク「Apache Hadoop」により、分散処理によるビッグデータ分析が本格的に普及し始めた。銀行におけるきめ細かな顧客コミュニケーションや、運転データのリアルタイム分析による事故防止サービス、生活者の価値観などに基づくマーケティング支援サービスなど、既にHadoopを活用したさまざまななサービスが登場している。
また、Hadoopには遅延が大きいという課題もあったが、「Apache Spark」というエコシステムが解決してくれる。このように分散処理や機械学習の活用は急速に身近になり、多くの企業がその導入を検討し始めている。
ただしHadoopやSparkの性能を十分に発揮させるには、それらのワークロードと相性の良いプラットフォームが必要となる。その選定を一から行うには、時間と手間が大いにかかってしまうだろう。本コンテンツでの解説が、効果的なデータ分析を行いたい企業にとっての助けとなるはずだ。