コンテンツ情報
公開日 |
2016/10/03 |
フォーマット |
PDF |
種類 |
技術文書・技術解説 |
ページ数・視聴時間 |
6ページ |
ファイルサイズ |
735KB
|
要約
データの大容量化と多様化が進む中、さまざまな種類の膨大なデータを低コストで格納し分析するためにHadoopの採用を検討する企業が増えている。しかし、Hadoop内部に格納されているデータから重要な洞察を引き出すためには、予想以上に高度なスキルと多大な労力が必要だ。ビッグデータは分析しなければ単なる大量のデータにすぎない。
例えばビジネスアナリストは、これまで培ったSQLスキルを使ってHadoopを含むあらゆるソースからデータを検索し、可視化することに苦心している。一方、データサイエンティストにとっては、データの準備と機械学習が主な課題となっている。データサイエンティストは自動予測モデルを構築するために通常はオープンソースのR言語を使用するが、ビッグデータ処理にHadoopを使うようになると、その性能を生かしきる機械学習の実装環境はほとんどないことが分かっている。
このホワイトペーパーでは上記のような課題を解決するために、ビッグデータ分析基盤「IBM BigInsights for Apache Hadoop」に搭載された新機能を紹介する。Hadoopクラスタのスケーラビリティ、パフォーマンスおよびセキュリティを確保するために突き詰められた機能の詳細を見ていこう。