GoogleのGemini 3.5 Proは、200万トークンのコンテキストウィンドウとDeep Think推論機能を搭載し、7月にリリースされる。同社は早期テスターからのフィードバックを反映させるためで、この遅延は市場が激変する中、OpenAIやAnthropicに主導権を渡すリスクがある。
GoogleのGemini 3.5 Proは、200万トークンのコンテキストウィンドウとDeep Think推論機能を搭載し、7月にリリースされる。同社は早期テスターからのフィードバックを反映させるためで、この遅延は市場が激変する中、OpenAIやAnthropicに主導権を渡すリスクがある。

GoogleのGemini 3.5 Proは、200万トークンのコンテキストウィンドウとDeep Think推論機能を搭載し、7月にリリースされる。同社は早期テスターからのフィードバックを反映させるためで、この遅延は市場が激変する中、OpenAIやAnthropicに主導権を渡すリスクがある。
GoogleがGemini 3.5 Proのリリースを7月に延期したことで、OpenAIとAnthropicは自社のポジションを固める時間をより多く得ることになる。同モデルの200万トークンのコンテキストウィンドウとDeep Think推論モードは、競争環境を一変させると期待されていた。同社は以前、6月のローンチを目標とし、最高経営責任者サンダー・ピチャイ氏は5月19日のI/Oカンファレンスで開発者に対し、同モデルが「来月」リリースされると語っていた。
「追加の数週間で、早期テスターからの実際のユースケースを反映し、Flash 3.5からのフィードバックに対処することができます」と、関係者は述べ、Flashのトークン消費率に対する批判がProの開発サイクルに影響を与えたことを認めた。
Gemini 3.5 Proは、Flashの100万トークンから倍増となる200万トークンのコンテキストを備え、これは1回の呼び出しで約1500ページの技術文書、あるいはエンタープライズ全体のコードベースを保持するのに十分な量である。これはAnthropicのFable 5の25万6000トークンと比較して8倍、OpenAIのGPT-5標準ティアの12万8000トークンと比較して15倍以上のコンテキスト量となる。同モデルのDeep Think連鎖思考推論モードは、Fable 5の拡張思考やOpenAIのo3と同じカテゴリーの能力をターゲットとしているが、従量課金制のAPI価格ではなく、Googleの月額250ドルのUltraサブスクリプションの背後に置かれることになる。マルチモーダル入力は、ローンチ時点ではテキストと画像をサポートし、動画と音声は今後のアップデートで追加される見込みである。
この遅延は、Googleの競争上のポジショニングにとっては異例なほど好都合なタイミングで発生している。Fable 5は、Anthropic Mythosセキュリティインシデントに関連する米国政府の輸出管理指令を受けて、6月12日以降制限されているが、6月21日にはAnthropicのAndroidアプリに再登場し、APIおよびWebアクセスは依然として非政府ユーザーに限定されている。一方OpenAIは、同じ週に開始された42州の司法長官による調査と、IPO開示要件により、製品ロードマップをめぐるエンタープライズの不確実性が高まっている。
200万トークンのコンテキストが可能にするもの
コンテキストウィンドウこそが真の差別化要因である。現在のプロダクション向けフロンティアモデルのほとんどは、12万8000トークンから25万6000トークンで動作するため、開発者は文書をチャンク化し、関連セクションを順次取得する検索拡張生成(RAG)パイプラインを構築せざるを得ない。200万トークンのモデルは、多くのユースケースでそのようなアーキテクチャを不要にする。リポジトリ全体のコード分析、50万トークンを超える契約ポートフォリオにわたるリーガルドキュメントレビュー、現在のモデルでは保持できないマルチセッションのエンタープライズ会話状態などである。
価格への影響は大きい。Gemini 3.1 Proのレートである入力トークン100万あたり2ドルで計算すると、200万トークンのフルコールにかかる入力コストはわずか4ドルとなる。単純なタスクには高額だが、カスタムRAGインフラを維持するのに比べれば格段に安い。GoogleはGemini 3.5 Proの価格を発表していないが、20万トークン以上のコンテキストに課される割増料金の構造が、大規模コンテキストのユースケースがスケールにおいて経済的に viable となるかどうかを決定づけることになる。
Deep Thinkとサブスクリプションゲーティングの問題
Deep Thinkは、応答を生成する前のモデルの熟考時間を延長し、数学、論理、構造化推論タスクにおけるパフォーマンスを向上させる。内部データによれば、SWE-bench Verifiedにおいて3.1世代と比較して10〜15ポイントの改善が見られるが、これらの数値は外部ベンチマークでは未検証である。
拡張推論を従量課金制のAPIではなく、月額250ドルのサブスクリプションの背後にロックすることは、推論品質を最も重視する開発者セグメントにとって摩擦を生み出す。固定シート数のエンタープライズ顧客はコストを吸収できるが、推論集約型アプリケーションを構築する個人開発者やスタートアップはそれができない。Googleは過去のGeminiモデルでも、サブスクリプション層で機能をローンチし、後にAPIでリリースするパターンを取っており、Deep Thinkもおそらくその道をたどることになる。
競争環境と投資家への影響
Google、OpenAI、Anthropicによる三つ巴の競争が、これほど真にオープンな状態であったことは稀である。各プロバイダーは大きな能力と、同時に大きな制約を抱えている。Alphabetにとって、Gemini 3.5 Proのローンチは、同社がAIインフラにコミットした年間500億ドルを超える設備投資を収益化する上で極めて重要である。トレーニング実行の大部分を動かすH100およびB200 GPUを製造するNvidiaは、どのモデルプロバイダーが市場シェアを獲得しようとも恩恵を受ける立場にある。
Googleが200万トークンのコンテキストに対して、倍増した割増料金ではなくフラットレートで価格設定を行えば、大規模コンテキストアプリケーションのコストモデルは大きく変わる。GA発表時に提供されるベンチマーク数値よりも、価格ページの方が重要である。フロンティアモデルは能力において十分に接近しており、スケールでの採用は2〜3ポイントのベンチマークの差よりも、コストとコンテキストサイズによって決定されるからである。
本記事は情報提供のみを目的としており、投資助言を構成するものではない。