OpenAIとBroadcom、LLM推論専用チップ「Jalapeño」を発表

OpenAIとBroadcomは、大規模言語モデル（LLM）の推論に特化して構築されたカスタムAIチップ「Jalapeño」を発表しました。このチップは、AIシステム全体のパフォーマンス、効率、スケーラビリティの向上を目指しており、AIワークロード向けカスタムシリコンにおける重要な一歩となります。汎用GPUとは異なり、JalapeñoはLLM推論特有の要求、すなわち低レイテンシで大量のデータを処理し、エネルギー消費を最小限に抑えることに最適化されています。チップアーキテクチャは、現代の言語モデルの計算基盤である行列乗算とアテンション機構の高速化に重点を置いています。初期のベンチマークでは、Jalapeñoは既存のソリューションと比較して最大3倍の推論速度を実現し、消費電力を50%削減できるとされています。この開発は、AIモデルがより大規模かつ複雑化する中で極めて重要です。チャットボット、コードアシスタント、コンテンツ生成ツールを展開する企業は、コストを急騰させることなくリアルタイムの要求に対応できるハードウェアを必要としています。推論専用のチップを設計することで、OpenAIとBroadcomは、本番環境におけるLLMの広範な採用を制限してきたボトルネックに対処しています。このパートナーシップは、AIにおける垂直統合に向けた幅広いトレンドを示しています。大手AI企業は、既製のハードウェアにのみ依存するのではなく、競争上の優位性を得るためにカスタムシリコンに投資しています。Jalapeñoは2025年半ばまでに一部のクラウドプロバイダーが利用可能になる見込みで、その後さらに広く提供される予定です。開発者や企業にとって、これはより高速で安価、かつスケーラブルなAI推論を意味し、より野心的なアプリケーションへの道を開くことになります。

OpenAIとBroadcom、LLM推論専用チップ「Jalapeño」を発表

関連ニュース