IT製品導入に関する技術資料を多数掲載 ホワイトペーパーダウンロードセンター
  • @IT
  • ITmedia エンタープライズ
  • ITmedia マーケティング
  • TechTarget
  • キーマンズネット
  • ITmedia ビジネスオンライン
  • ITmedia NEWS

Gcore Japan株式会社

技術文書・技術解説

Gcore Japan株式会社

AIの高速性を追求、エッジに近い場所でAI推論を走らせる方法とは?

コンテンツ情報
公開日 2024/09/18 フォーマット PDF 種類

技術文書・技術解説

ページ数・視聴時間 10ページ ファイルサイズ 13MB
要約
AIの高速性を追求、エッジに近い場所でAI推論を走らせる方法とは?
 AIは今や競合との差別化を図り、優位性を確保したいと考える組織にとって、必須テクノロジーの1つとなっている。そのため多くの組織で、AIで何ができるのか、AIをより高速に動作させるにはどうすればよいのかといった課題についての追及が進められている。

 特に後者の高速性については、大量のデータ、大量のコンピューティングリソースを要する学習モデルを、いかにエンドユーザーやエッジに近い場所に構築し、実行できるかが重要になる。しかし現状では、ハードウェアやリソース、技術的な制約から、依然として中央集約的なコンピューティング環境が学習モデル構築の主戦場となっている。

 本資料では、応答性とパーソナライズ性の高さを特長とする、低遅延ハイパフォーマンスサーバレスプラットフォームを用いて、その各エッジ拠点でAIを駆動させる試みをレポート形式で紹介している。この取り組みではCDN(コンテンツデリバリーネットワーク)上で駆動するサーバレス活用シーンの1つとして、軽量AIモデルの推論実行を行い、画像認識のタスク処理を効率的に行えることを証明できたが、そこに至るまでには課題もあったという。資料でこの詳細を確認してほしい。