コンテンツ情報
      
      
        | 公開日 | 2015/11/30 | フォーマット | PDF | 種類 | 技術文書・技術解説 | 
      
        | ページ数・視聴時間 | 62ページ | ファイルサイズ | 4.66MB | 
      
    
    
    
    
      要約
      
         2009年にUC Berkeley AMPLabのプロジェクトとしてスタートした「Apache Spark」は、2010年にオープンソース化され、現在ではApache Software Foundationで最もアクティブなプロジェクトの1つとなった。SparkはHadoopと比較して、統計処理や機械学習のような「繰り返し計算」や「多段処理」が必要な複雑な処理を得意としているため、IoT(Internet of Things:モノのインターネット)から上がってくるビッグデータの分析や処理の基盤として注目を集めている。
 そのSparkに対して、他ベンダーに先駆けてさまざまな取り組みを行っているのがIBMだ。米国サンフランシスコに「Spark Technology Center」を設立し、AMPLabなどとのパートナーシップを維持・強化し、Sparkテクノロジーの活用を加速している。また、IBMでは社内外プロジェクトにSparkを積極的に取り入れ、既に100に及ぶプロジェクトが進行中だ。
 本コンテンツではSparkが注目されるようになった背景を解説するとともに、IBMが行っているSparkを活用したさまざまな取り組みを紹介する。IoT技術本格活用時代に向けて100万人のデータサイエンティストとデータ活用の技術者育成を目指すIBMは、Sparkで何をしようとしているのか?