コンピューティング性能の進化に伴い、ワークロードの需要が変化し、新たなボトルネックが発生している。その1つが、生成AIにおけるメモリウォールだ。トレーニングと展開の際、ストレージからデータが提供されるまでの待ち時間が長くなることで生産性が低下し、コストとリソースの増大がプロジェクトの本番稼働を阻む要因となっている。
この課題の解決策として注目したいのが、ワークロードのニーズに基づくストレージの階層型戦略だ。生成AIでは、データ集約、トレーニング、チューニング、推論といった各プロセスで異なる要件が求められるため、実装には必要に応じて拡張できる柔軟性が必要となる。そして、処理能力からストレージソリューションを切り離すことも重要なポイントとなる。
これらの戦略には画一的なアプローチが存在せず、効率的な方法を特定するには、組織全体の関係者や、外部専門家の知見を取り入れることが重要となる。本資料では、生成AIのイニシアチブを停滞させるボトルネックとその解決策について解説する。