IT製品導入に関する技術資料を多数掲載 ホワイトペーパーダウンロードセンター
  • @IT
  • ITmedia エンタープライズ
  • ITmedia マーケティング
  • TechTarget
  • キーマンズネット
  • ITmedia ビジネスオンライン
  • ITmedia NEWS

富士通株式会社

技術文書・技術解説

富士通株式会社

AIを左右するGPU間通信性能、次世代技術「CDI」の検証で見えた新基準とは

機械学習を左右する要素の1つに、サーバのGPU間通信性能がある。次世代技術「CDI」(Composable Disaggregated Infrastructure)により、GPUを複数サーバの共有プール化できるPCIeボックスと、従来のサーバ内蔵GPUの性能評価を行った。

コンテンツ情報
公開日 2024/03/19 フォーマット PDF 種類

技術文書・技術解説

ページ数・視聴時間 8ページ ファイルサイズ 888KB
要約
AIを左右するGPU間通信性能、次世代技術「CDI」の検証で見えた新基準とは
 ResNet(画像認識モデル)のようなアプリケーションの学習で重要なGPU間通信を、高速化するにはどのようなサーバを選べばよいのだろうか。本資料は、次世代技術「CDI」(Composable Disaggregated Infrastructure)を採用したシステム実性能を検証したレポートだ。

 対象となるシステムは、GPUやストレージ、ネットワーク(NIC)などのPCIeデバイスリソースを外部のPCIeボックスに分離収納し、高速なファブリックスイッチでそれをサーバ本体と接続している。この分離型アーキテクチャにより、高いパフォーマンスはもちろん、構造の合理化や優れたスケーラビリティを実現しているという。

 今後は業務の中核としてAIの活用を進めていきたい、AIの利用をさらに推進したいと考えている組織にとって、この検証で判明した性能評価は今後の選定の基準として大いに役立つだろう。検証は、業界標準の機械学習向けベンチマークである「MLPerf」を使用して行われており、既存環境との比較もしやすいので、ぜひ一読してほしい。