世界中の企業や研究機関、政府機関などがさまざまな課題解決に活用しようと、AIモデルのトレーニングとチューニングに取り組んでいる。AIは、データセットが膨大なため、成果を最大化するには、処理スピードが最優先となる。また、大規模言語モデルやディープラーニング推奨モデルのトレーニングといったAIワークロードの場合、24時間年中無休で長期的に稼働できる強力なコンピュート性能も求められる。
そこで現在注目されているのが、AIモデルのトレーニングや達成成果を加速させるスーパーコンピューティングだ。スーパーコンピューティングは、極めて高負荷なワークロードとアプリケーションに必要となる、非常に高いAIパフォーマンス密度を提供する。
本資料では、ハードウェアとソフトウェア、さらにさまざまなサービスを組み合わせた新しいエンドツーエンドのスーパーコンピューティングソリューションを紹介している。CPUベースのスーパーコンピューティングソリューションが抱えていた拡張性の課題なども解消したこのソリューションの詳細を、ぜひ確認してほしい。