昨今、大規模言語モデル(LLM)などの生成AIを業務に活用する動きが加速している。その推進に当たって、クローズドな情報である社内データをLLMと連携させるために、「検索拡張生成(RAG)」の活用が注目されている。しかし、社内データは形式が多岐にわたり、LLMでは解釈が難しい書式も含まれるため、事前準備としてデータの整備が必要だ。
そこで注目したいのが、LLMの回答精度向上に不可欠なデータ構造化や精度評価をサポートする「RAGデータ作成ツール」だ。社内データに多く含まれる図表やグラフは視覚情報を使った表現であり、これらの表現をLLMが解釈できるデータに変換するにはデータ構造化が必須となる。
一方で、ユースケースを実現するデータに仕上げるためには、データの構造化、回答精度評価、再修正のサイクルを回す検証が必要となる。構造化のノウハウも必要であるが、検証実施には多くの時間を要する。
本資料では、RAG活用を阻む課題を整理しながら、同ツールの詳細を紹介する。RAG活用におけるデータ準備や回答精度に課題を感じている企業は、ぜひ本資料で同ツールが実現する内容を確認してほしい。