業務で取り扱うデータの種類や量が増加する中、膨大なデータを元の形式のまま保存できる「データレイク」の導入が進んでいる。ただし、そのメリットを最大限に享受するには、データを継続的に取り込むだけでなく、それらをAI・機械学習・データサイエンス・分析で利用できるようにする必要がある。また、IT部門に頼らずにユーザーにデータを提供することも重要だ。
そこで実践したいのが、データ統合ソリューションとの連携である。理想としては、汎用的かつリアルタイムのデータ取り込みができ、データパイプライン全体をノーコードで自動化できるようなソリューションを選定したい。さらに、安全かつ完全に統制されたデータカタログによって、信頼性に優れたデータへのアクセスを容易にすることも必須だ。
本資料では、高性能なデータレイクを構築するためのデータ統合ソリューションの要件について詳しく解説する。併せて、それらを網羅したソリューションによってリアルタイムデータの活用を実現し、ユーザー体験を大幅に改善している物流会社の事例も紹介する。