技術系トピックの中でも一大トレンドとなっているRAG(検索拡張生成)。これは簡単に言えば、大規模言語モデル(LLM)と検索機能を組み合わせて、生成AIを使って最適かつ正確な検索結果を出力するためのプロセス、あるいは仕組みを意味する。その注目度の高さから、多くのエンジニアが開発に取り組んでいるものの、プロジェクトが失敗に終わるケースも散見される。
それでは、「業務で利用可能なレベルの回答が得られず、結局使われない」という典型的な失敗を回避するためには、どうすればよいのか。構造がシンプルな分、エンジニアは「まず手を動かす」ことから始めがちだが、一歩立ち止まり、RAGを入れる目的の明確化から始めることが重要だ。
本資料では、RAGシステムの開発で成功を収めるため、あるいは早期に失敗してそこから教訓を得るための、エンジニアの心構えや押さえておくべきポイントを解説する。製造業を念頭に置いた、3つのRAGコード例も紹介されているので、参考にしてほしい。