インストラクションチューニングとは、生成AIが特定の指示に的確に回答できるようにする追加学習のことだ。タスクごとに「指示文」と「期待される出力」のペアを学習させることで指示理解や応答の精度を高められる。実務で使えるレベルの回答を作成するには、具体的な業務内容や利用シーンを反映した高品質なインストラクションチューニングデータが必要だ。
しかし実際には、設計面/実務面/運用面で課題を抱えるケースが多い。これらの課題の大半は、要件定義があいまいになっていることに起因するため、データを作成する前に、目的に合わせてどのようなデータが必要なのかを明確化することが重要になる。また、高品質なデータを継続的に作成/管理できる体制を構築することで運用面の課題も解消できる。その際は、法的リスクへの配慮やスケーラビリティ課題への対応も欠かせない。
本資料では、インストラクションチューニングを行う現場で発生しがちな課題と解決策を解説するとともに、データの作成支援を行うサービスについて紹介する。生成AI開発を加速させるヒントとして活用してほしい。