技術文書・技術解説
株式会社ネットワールド
IoT時代のデータ分析、データサイエンティストは1日60時間労働しかないのか?
コンテンツ情報
公開日 |
2016/09/09 |
フォーマット |
PDF |
種類 |
技術文書・技術解説 |
ページ数・視聴時間 |
19ページ |
ファイルサイズ |
11MB
|
要約
IoTの活用は、収集したビッグデータを分析した結果を基に新しいサービスを始めたり、業務の最適化をしたりすることにある。つまり、最終的に分析するところまで持っていかない限り、ビッグデータからは何の価値も生まれないということになる。
しかも、IoTなどで使うセンサーデータや、Twitterなどのインターネットデータを利用する場合、目的の分析をするためにデータ形式の加工、いわゆるETL作業に多くの時間を要する。データサイエンティストが「業務の80%をデータクレンジングに費やす」という説に従えば、1日8時間労働換算で6.4時間がこのような作業で失われることになる。
また、現在のデータ量の9~10倍といわれる“顕在化されていない”データが利用可能となれば、状況はさらに悪化し、データサイエンティストは今より7、8人多く必要となる。そこで、ビッグデータ分析を行うデータサイエンティストの工数を劇的に削減する方法として、ビッグデータ分析に最適な環境を全てそろえたクラウドサービスを紹介する。