AIをビジネスで生かし、大きな成果を得るには、データをAI対応にすることが重要だ。「AI対応データ」とは、高品質で正確、一貫性があるデータを指す。こうしたデータは、構造化されているか非構造化されているかを問わず、AIシステムが容易に取り込める形式であることが求められる。
AI対応データを手に入れるには、地道なデータ準備が必要になる。有意義な答えを得るためには、生データを適切にクレンジング、検証、統合することが欠かせない。しかし、多くの組織では、表計算ソフトを使ってデータを手作業で扱っており、サイロ化された環境になりがちで、そのポテンシャルを十分に発揮できていない。
そこで本資料では、AI対応データを準備するための6つのステップを紹介する。「データ探索」「データクレンジング」「複数データセットの結合」「データのプロファイリング」「ETL(抽出・変換・書き出し)」「データラングリング」の各ステップにおいて、具体的に何をなすべきかを解説。その上で、分析の自動化を実現し、適切なAI対応データを準備する点で力を発揮するデータ分析プラットフォームの強みとメリットを紹介している。