主なポイント:
- DeepSeek V4正式版、2026年7月中旬にローンチ、API料金にピーク・オフピーク制を導入
- ピーク時間帯(午前9時~正午、午後2時~午後6時)は通常料金の2倍に
- この動きは、推論速度を最大85%向上させるDSparkのリリースに続くもの
主なポイント:

DeepSeekは7月中旬にV4正式版をローンチし、ピーク時間帯のAPI料金を通常の2倍に設定する。
7月中旬にリリースされるDeepSeekのV4正式版は、ピーク時間帯の顧客料金を2倍にする。この価格戦略は、AnthropicやOpenAIと比較した同中国ラボの既存のコスト優位性をさらに強化するものだ。
「ピーク・オフピーク料金制により、需要の高い時間帯にコンピューティング容量をより効率的に割り当てることができます」とDeepSeekの広報担当者は述べたが、正式版の基本トークン単価は明らかにしなかった。
ピーク時間帯は毎日午前9時~正午と午後2時~午後6時で、料金はオフピーク時の2倍となる。V4-Proモデルは、前方通過あたり1.6兆の総パラメーターのうち490億を活性化するが、Deutsche BankのアナリストJim Reid氏によると、同等のタスクにおいてAnthropicのClaude Fable 5の約1.5%のコストですでに済むという。
この価格設定は、DeepSeekが6月27日にリリースしたDSparkに続くものだ。DSparkは、ハードウェアのアップグレードなしでV4-Flashの生成速度を最大85%向上させる投機的デコードフレームワークである。V4を大規模に運用する企業にとって、より高速な推論と段階的料金制により、トークンあたりのコストはさらに低下する可能性があり、IPOを予定する米国のモデルプロバイダーのマージンを圧迫することになる。
正式版のローンチは、急速な反復開発の期間を締めくくるものだ。DeepSeekのDSparkフレームワークは、以前のMTP-1ベースラインと比較して、V4-Flashではユーザーあたりの生成速度を60%~85%、V4-Proでは57%~78%改善したと、社内のプロダクションデータが示している。同社はまた、投機的デコード用ドラフトモデルの完全なトレーニングスタックであるDeepSpecをMITライセンスのもとでオープンソース化し、Qwen3およびGemmaモデルを使用するチームがこの技術を利用できるようにした。
中国のAIラボ、価格圧力を強める
DeepSeekだけが米国の価格設定に挑戦しているわけではない。元Zhipu AIのZ.aiは今週、GLM5.2をローンチした。JefferiesのストラテジストChristopher Wood氏は、このモデルを「企業市場においてAnthropicとほぼ遜色のない競争力を持つ」と評価し、トークンあたりのコストは4分の1だという。Morgan Stanleyのトレーダーらは、「需要構成は明らかに低コストモデルへとシフトしている」と指摘した。
ピーク・オフピークメカニズムにより、オフピーク時間帯(料金はピーク時の半分)にはDeepSeekのコスト差はさらに拡大する可能性がある。日常的なタスクの約90%において、DeepSeekのV4-Proは「AnthropicのClaude Fable 5の約1.5%のコストでほぼ同じ仕事をする」と、Deutsche BankのReid氏は6月18日に指摘している。
投資家にとっての意味
低コストモデルへのシフトは、IPOを計画する米国のAIプロバイダーのバリュエーション・ストーリーを脅かしている。New York Timesの報道によると、OpenAIはハイテクIPOの低調なパフォーマンスと価格競争の激化を理由に、IPOの時期を再検討している。Anthropicも、エンタープライズ顧客が低コストの代替案を評価する中で、同様の圧力に直面している。
GPUメーカーやクラウドプロバイダーにとって、このトレンドは諸刃の剣である。トークンあたりの低コストは普及を促進する可能性がある。Deloitteは、推論ワークロードが2026年には全AIコンピューティングの約3分の2を占めると予測しており、2023年の3分の1から増加する見通しだ。しかし、企業がワークロードをより安価なモデルやセルフホスト型モデルに移行させれば、ハイパースケールクラウドプロバイダーの収益成長は減速する可能性がある。DeepSeekのピーク・オフピーク料金制は、AI価格戦争の新たな局面を示すものであり、中国のラボがソフトウェア最適化と積極的な価格設定によって米国の既存企業から市場シェアを奪おうとしている。
本記事は情報提供のみを目的としており、投資助言を構成するものではありません。