OpenAI Jalapeño、LLM 推論向け Intelligence Processor

OpenAI と Broadcom は、OpenAI 初の Intelligence Processor である LLM 推論向けアクセラレータ Jalapeño を公開した。ChatGPT、Codex、API など OpenAI の対話型製品を利用する開発者とエンドユーザー向けで、推論コスト・レイテンシ・ピーク時の可用性の改善が狙いである。

Jalapeño の要点は次のとおりである。

LLM 推論専用の白紙設計で、汎用 AI アクセラレータの流用ではない。OpenAI のモデルロードマップ、カーネル、サービング、製品要件に基づき設計されている。
設計から製造 tape-out まで 9 か月で共同開発した。OpenAI のモデルが設計・最適化の一部を加速した。
エンジニアリングサンプルは、量産目標の周波数・消費電力で GPT-5.3-Codex-Spark を含む ML ワークロードをラボで実行している。
最終性能は測定中だが、初期試験では性能あたりの消費電力（performance per watt）が現行の最先端を大きく上回る見込みとされる。詳細な技術レポートは今後数か月以内に公開予定である。
アーキテクチャはデータ移動を減らし、計算・メモリ・ネットワークのバランスを取ることで、理論ピークに近い利用率を目指す。Broadcom のシリコン実装と Tomahawk ネットワーク、Celestica の基板・ラック・システム統合が量産基盤を担う。
Jalapeño は多世代コンピュート基盤の第一世代で、2026 年末までに初回展開し、Microsoft などのデータセンターパートナーとギガワット規模の展開を 2026 年から進める。

OpenAI は推論を製品から利用者へ届ける接点と位置づけ、チップからカーネル、メモリ、ネットワーク、スケジューリング、デプロイまで自社スタックで最適化する方針を示している。

#参考文献

OpenAI and Broadcom unveil LLM-optimized inference chip（OpenAI）