IT製品導入に関する技術資料を多数掲載 ホワイトペーパーダウンロードセンター
  • @IT
  • ITmedia エンタープライズ
  • ITmedia マーケティング
  • TechTarget
  • キーマンズネット
  • ITmedia ビジネスオンライン
  • ITmedia NEWS

アーム株式会社

製品資料

アーム株式会社

クラウドからエッジまでのあらゆる環境で、AIの性能を限界まで引き出す方法

コンテンツ情報
公開日 2025/01/31 フォーマット PDF 種類

製品資料

ページ数・視聴時間 4ページ ファイルサイズ 1MB
要約
クラウドからエッジまでのあらゆる環境で、AIの性能を限界まで引き出す方法
 AI市場が活発化する背景として、さまざまな大規模言語モデル(LLM)がオープンソースで、矢継ぎ早に登場していることが挙げられる。大規模なAI推論を実現する上で、LLMの利用は不可欠だ。オープンに公開された最新のLLMは、オープンソースならではのスピードを生かして、急速に進化している。

 一方で、LLMおよびそれを利用するAIが高性能になればそれだけ、大量の演算リソースやエネルギーが要求されてしまう。そこで近年に登場したのが、オープンソースの最新LLMに、AIに最適化したCPUを組み合わせることで、パフォーマンスを向上させるアプローチだ。

 同CPUを採用したモバイルデバイスで、最新版LLMであるLlama 3.2 3Bを実行したところ、プロンプト処理が5倍に、トークン生成でも3倍になるという成果を挙げている。エッジでのAI処理の拡大も容易になり、クラウドを往来するデータによる消費電力、そしてコストを削減できる見込みだ。本資料では、このコラボレーションがAI活用に与える効果を、さらに詳しく解説していく。