データに基づいた意思決定、AI/機械学習(ML)プロジェクトの推進といった、データ駆動型ビジネスで成功を収めるには、ソースからのデータ抽出、必要に応じたデータ変換と加工、加工済みデータのアナリティクスシステムやユーザーへの提供というETLプロセスを、迅速かつ円滑に行える環境が求められる。しかし多くの組織では、それが実現できていない。
その背景には、データソースのサイロ化がある。これまでは主にメインフレームやIBM iなどのレガシーシステムにデータが保存されていたが、現在ではそこにクラウドも加わり、データ量の爆発的な増大に対応しなければならない。こうした状況においては、分散したデータソースを、データ形式の違いを意識せずに統合する必要がある。
本資料では、データ活用の阻害要因を指摘した上で、レガシーシステムとクラウドを結ぶパイプラインの構築により、データ統合を図る必要性を簡潔に解説。併せて、その実現のためのソリューションとして、高速ETLツールとデータ分析プラットフォームの組み合わせを推奨している。