AIが安くなるほど、企業はより多くの費用を費やす——その数字がそれを証明し始めている。
AIが安くなるほど、企業はより多くの費用を費やす——その数字がそれを証明し始めている。

AIのトークンあたりのコストは3年間で1000分の1に低下したが、エンタープライズのコンピュート消費は爆発的に増加している——Uberは2026年のAI予算全体を4月までに使い果たし、AT&Tは現在、18カ月前の10億トークンから27億トークンを毎日処理している。
「同じ知能の単位がより安くなるたびに、私たちは消費を減らしているのではなく、増やしている。同じ予算でより複雑なタスクを解決できるからだ」と、AIクラウド企業Nebiusの共同創業者兼最高事業責任者であるRoman Chernin氏は述べた。
19世紀の経済学者ウィリアム・スタンレー・ジェヴォンズにちなんで名付けられた「ジェヴォンズのパラドックス」として知られるこの現象は、コストを下げる効率向上が総資源消費を増加させる可能性があることを示している。今週ウォール・ストリート・ジャーナルに寄せた書簡で、経済学者のMaury Harris氏は、この原理はAIコンピュートにも適用され、需要の価格弾力性が「非常に弾力的」であることが証明されるかもしれないと主張した。大規模GPUクラスターを構築するNebiusは、1月のDeepSeekパニックで株価が40%下落したが、Chernin氏はその同じ週が「おそらく営業面で最高の週だった」と述べている。企業がスケールでの推論を負担できることに気づいたからだ。
投資家にとっての影響は大きい。ゴールドマン・サックスは、年間のAIインフラ支出が2026年の7650億ドルから2031年には1.6兆ドルに増加すると推定している。しかし、勝者は稼働率、資金調達の規律、変動するコンポーネントコストを吸収する能力に依存するだろう——メモリチップ価格は、AI需要がデータセンターを超えて経済全体に波及する中、過去1年間で6倍に上昇した。
実験的なチャットボットからエージェンティックAIシステムへの移行が主な原動力である。企業がシングルターンのクエリから、コールを連鎖させ、文書を取得し、アクションを実行するマルチステップの自律型エージェントに移行すると、トークン消費は桁違い、あるいはそれ以上に跳ね上がる。ある大手医療保険会社では、月間AIトークン消費量が1年足らずで300万から1億5000万以上に増加した。
この支出急増はベンダーの価格設定を変えている。Anthropicは、デベロッパーが月額200ドルのプランで数千ドル相当のコンピュートを消費していることを発見した後、エンタープライズ定額制を廃止した。OpenAIも同月にCodexのトークン単位課金に移行した。主要なAIベンダーはすべて従量課金制に収斂しつつあり、Chernin氏が「構造的ロックイン」と呼ぶ状況を生み出している。新たなエージェントが展開されるたびに、レートを設定し条件を管理するプロバイダーへの依存が深まる。
しかし、需要側の状況は1月に市場を襲ったパニックとは異なる物語を語っている。DeepSeekのリリースがNebiusの株価を40%押し下げ、AIインフラ関連銘柄の広範な売りを誘発したとき、企業のエンジニアリングチームは撤退とは正反対の動きを取っていた——拡大していたのである。コスト低下により、内部知識検索から自動化されたカスタマーワークフローに至るまで、これまで経済的に成り立たなかったアプリケーションが実現可能になった。
競争力学は、テクノロジースタックを上へと移動する企業に有利に働く。Chernin氏は、ベアメタルGPUレンタル市場の顧客は世界で約12社と推定する。マネージドインフラは数百社にリーチする。推論プラットフォームは数千社を引き付ける。エージェンティックシステムは、数万人のデベロッパーを引き寄せるだろうと同氏は予測する。
マネージド推論プラットフォームであるNebiusのToken Factoryは、この戦略を体現している。このサービスは、企業がバックエンドインフラを管理することなくオープンソースモデルを実行し、コストを予測可能に保つための最適化技術を適用することを可能にする。エンタープライズにとっての価値提案は明確だ。ホスト型モデルは、コスト追跡、稼働時間維持、予算と速度要件に基づく異なるモデル間のタスクルーティングの複雑さを処理する。
しかし、ホスト型推論レイヤー自体もコモディティ化のリスクに直面している。2026年の調査では、大規模言語モデルの推論価格が2020年から2026年の間に約600倍低下したことが判明しており、OECDの2025年AI市場報告書は、競争激化に伴う品質調整後のモデル価格の急激な低下を記録している。これは、チップメーカーを襲ったマージン圧縮圧力がスタックを上昇していることを示唆している。
投資家にとっての重要な問いは、どの企業が持続可能な堀を構築できるかである。Nvidiaは予想株価収益率が約35倍で推移しており、推論コストの低下が最高マージンのトレーニングチップへの需要を減少させるリスクに直面している。クラウドハイパースケーラー(Amazon、Microsoft、Google)は、コンピュート消費の増加から恩恵を受けるが、資本要件の上昇に直面している。そしてNebiusのようなインフラプロバイダーは、市場が拡大する中で稼働率と価格決定力を維持できることを証明しなければならない。
ジェヴォンズのパラドックスは、AI業界の総収益がユニット価格の下落にもかかわらず成長することを示唆している。しかし、その収益を獲得するには、コンピュートを所有するだけでは不十分であり、生の処理能力を完成品に変えるソフトウェア、ツール、エンタープライズ関係が必要である。
本記事は情報提供のみを目的としており、投資助言を構成するものではありません。