量(Volume)、速度(Velocity)、種類(Variety)という従来の3つの「V」に加え、新たに4つ目のVである(Value)が追加され、より複雑さを増しているビッグデータ。企業が戦略的利益を得る上での重要度が高まる中、ビジネスのリアルタイムな意思決定を支援するため、多様な形式の大量データを効果的に結び付けることが求められている。
ビッグデータ戦略で成功するためには、まずビッグデータのフレームワークを構築するに当たり、明確なビジネスケースを設定し、その最終目標から統合する必要のあるデータを把握することが欠かせない。統合するデータを確立したら、データ品質の確保だ。データはダウンストリームアプリケーションに向かって移動するため、どのように表示され、理解されるかについて考慮する必要がある。
また、使用する全てのデータに対し、規制、コンプライアンス、データガバナンスの要件を満たす慣行も不可欠だ。本資料ではこうした4つの要素に加え、プロジェクトの目標達成を早める「再現性のあるプロセス構築」と、そのフレームワークの詳細、データ品質を確保するためのデータプロファイリングについて解説する。