OpenAIとBroadcomが「Jalapeño」チップを発表、推論コストを50%削減

OpenAI初のカスタムチップはBroadcomと9カ月で共同開発され、推論コストを半減し、Nvidia GPUへの依存度を低減する。

OpenAIとBroadcomは、カスタム推論チップ「Jalapeño」を発表した。Broadcomの最高経営責任者（CEO）によれば、このチップはコストを約50%削減し、AI半導体市場におけるNvidiaの支配的地位を脅かす可能性がある。

「スタックのより多くの部分を自社で設計することで、より高い効率で、より多くのインテリジェンスを提供できる」と、OpenAIの社長兼共同創業者であるGreg Brockman氏は声明で述べた。「Jalapeñoは、コンピューティングをより豊富にするための当社の長期的なフルスタックインフラ戦略の一環である」

初期設計からテープアウトまで9カ月で開発されたこのチップは、従来のAIアクセラレータを改良したものではなく、大規模言語モデル（LLM）推論のための白紙状態からのアーキテクチャである。エンジニアリングサンプルはすでに、生産目標の周波数と電力でGPT-5.3-Codex-Sparkを実行しており、初期テストでは、現在の最先端チップと比較してワット当たりの性能が「大幅に優れている」ことが示されているとOpenAIは述べている。発表後、Broadcomの株価は約2%上昇したが、その後半導体セクター全体の下落に伴い約3%下落して取引を終えた。

この提携は、2022年に生成AIブームが始まって以来、Nvidiaの最大のGPU購入者の一角であったOpenAIにとって戦略的な転換点となる。自社でシリコンを設計することで、OpenAIは推論コンピューティングへの需要が爆発的に高まる中、調達コストの削減を目指す。Jalapeñoベースのシステムの初期導入は2026年末までに見込まれており、Microsoftや他のパートナーとともにギガワット級のデータセンターへのスケールアップが計画されている。

Jalapeñoは、LLM推論専用に設計された特定用途向け集積回路（ASIC）である。トレーニングと推論の両方を多様なワークロードで処理するNvidiaの汎用GPUとは異なり、ASICは柔軟性と引き換えに特定タスクにおける効率性を追求する。OpenAIによれば、このアーキテクチャはデータ移動を低減し、コンピュート、メモリ、ネットワーキングリソースのバランスを最適化することで、「理論上のピーク性能に大幅に近い」利用率を実現する。Broadcomは自社のTomahawkネットワーキングシリコンとチップ実装の専門知識を提供し、Celesticaがボード、ラック、システム統合を担当した。

このチップは、計画されているマルチ世代コンピューティングプラットフォームの第一弾となる。OpenAIはまた、Amazon Web ServicesのTrainiumチップ、ならびにAdvanced Micro DevicesおよびCerebrasとの契約を結んでおり、Nvidiaからの多様化を図る戦略を意図的に進めている。同社は、この9カ月の開発サイクルは、高性能半導体分野でこれまでに達成された中で最速のASIC開発である可能性があると述べており、その一因として、OpenAI自身のモデルがチップの設計と最適化に貢献したことを挙げている。

投資家にとって、この意味合いは諸刃の剣である。2022年末以降、株価が約7倍に上昇しているBroadcomは、OpenAIという大口カスタムチップ顧客を獲得し、ネットワーキングを超えてAI関連収益を多様化する。GPUでAIチップ市場を支配してきたNvidiaは、最大の顧客の一角が、AIコンピューティングの中で最も急成長しているセグメントである推論向けの代替案を構築しているという事実に直面する。OpenAIはプログラムの総コストやチップ単価を開示していないが、BroadcomのCEOであるHock Tan氏は、この協力関係は「マルチ世代ロードマップの始まりに過ぎない」と述べ、2026年からギガワット級データセンターの導入を可能にすると語った。

本記事は情報提供のみを目的としており、投資助言を構成するものではない。