ビッグデータの活用になぜテキストマイニングツールが必要なのか？

コンテンツ情報

公開日	2012/09/11	フォーマット	PDF	種類	製品資料
ページ数・視聴時間	4ページ			ファイルサイズ	1.45MB

要約

　今、Facebookだけで1日に朝刊1万年分（10Tバイト）のデータが処理されている。こうしたデータを分析することで、新たな知見や洞察を得ることができると期待されている。

　だが、ビッグデータの約80％は自然言語で構成された「非構造化データ」であり、その分析にはテキストマイニングツールが不可欠である。文書中のキーワード比率やキーワード間の相関関係、時系列や出現増減傾向の分析、「好評」「不評」などの感情の分析を実施し、各種グラフやマップを生成。これらをダッシュボードで一覧表示することで、非構造化データの活用方法が見えてくる。

　本ホワイトペーパーでは、ビッグデータの収集から分類、分析までを統合的に実行するテキストマイニングツール「IBM Content Analytics with Enterprise Search」の各種機能について紹介する。

ログインして閲覧