組織が取得・活用するデータが爆発的に増大するに伴い、データの活用と価値をいかに最大化できるかが極めて重要になった。しかし現状は、膨大な数のデータプロダクト(加工済みで特定用途に特化したデータセットやデータ資産)を前に、「何から着手すればよいのか分からない」という組織がほとんどだ。
このような状況から脱却するには、データの再利用性を上げる必要がある。そのためには、データを「プロダクト」とみなし、組織全員で活用できるようにすることが大切だ。まずはデータをプロダクト化する必要があるが、現状で主流となっているETLなどによるバッチによるデータ統合やデータ処理、実際のデータコピーを伴わない仮想化統合では、リアルタイム性に欠け、データの信頼度が損なわれるという問題がある。
そこで、新たな統合の形として注目されているのが、ストリーミング基盤によるリアルタイム処理によるデータ統合だ。本資料では、その実践において考慮すべきポイントや、組織に最適な形で実装する方法について解説している。DXの推進やデータ活用基盤の新規導入、既存システムの刷新・改良を検討している組織にとって、必見の内容となっている。