一般的なコンピューティングにおいて、負荷の高い画像処理を担うためのチップであるGPUだが、近年はAIの基幹技術の1つである機械学習の計算速度を高めるために用いられるケースが増えつつある。特に、研究分野などの大規模データのAI分析が大量に実行される現場では、機械学習に特化したGPUが搭載されたサーバが主流となっている。
こうした中、GPUベンダー各社は精力的に技術革新に取り組んでおり、代表的なベンダーが提供する最新世代のアーキテクチャでは、製造プロセスが前世代の8ナノから4ナノに進化。コア数とクロック数がさらに向上し、理論性能も2倍以上に伸びたという。
そこで本資料では、最新世代ハイエンドGPUの機械学習性能にフォーカスしたベンチマークテストの結果と、それに関する考察をまとめている。最新世代が前世代と比べて、実効性能でどれだけの飛躍を遂げたのか、現時点での課題はどこにあるのかなど、興味深いトピックについても言及されているので、参考にしてほしい。