IT製品導入に関する技術資料を多数掲載 ホワイトペーパーダウンロードセンター
  • @IT
  • ITmedia エンタープライズ
  • ITmedia マーケティング
  • TechTarget
  • キーマンズネット
  • ITmedia ビジネスオンライン
  • ITmedia NEWS

日本アイ・ビー・エム株式会社

技術文書・技術解説

日本アイ・ビー・エム株式会社

Hadoopよりも高速なSparkの活用を積極推進するIBMは何をしようとしているのか?

「Apache Spark」は、Hadoopよりも高速で、ほぼリアルタイムに大規模データを分析できるシステム として注目されている。目前に迫るIoT時代に向けて、IBMはSparkの活用を積極推進している。

コンテンツ情報
公開日 2015/11/30 フォーマット PDF 種類

技術文書・技術解説

ページ数・視聴時間 62ページ ファイルサイズ 4.66MB
要約
 2009年にUC Berkeley AMPLabのプロジェクトとしてスタートした「Apache Spark」は、2010年にオープンソース化され、現在ではApache Software Foundationで最もアクティブなプロジェクトの1つとなった。SparkはHadoopと比較して、統計処理や機械学習のような「繰り返し計算」や「多段処理」が必要な複雑な処理を得意としているため、IoT(Internet of Things:モノのインターネット)から上がってくるビッグデータの分析や処理の基盤として注目を集めている。

 そのSparkに対して、他ベンダーに先駆けてさまざまな取り組みを行っているのがIBMだ。米国サンフランシスコに「Spark Technology Center」を設立し、AMPLabなどとのパートナーシップを維持・強化し、Sparkテクノロジーの活用を加速している。また、IBMでは社内外プロジェクトにSparkを積極的に取り入れ、既に100に及ぶプロジェクトが進行中だ。

 本コンテンツではSparkが注目されるようになった背景を解説するとともに、IBMが行っているSparkを活用したさまざまな取り組みを紹介する。IoT技術本格活用時代に向けて100万人のデータサイエンティストとデータ活用の技術者育成を目指すIBMは、Sparkで何をしようとしているのか?