主な takeaways:
- バイトダンスの Seedance 2.5 は、1つのプロンプトから最大30秒のネイティブAI動画クリップを生成し、業界の15秒の壁を突破
- Doubao 2.1 Pro はコーディングベンチマークで Claude Opus 4.7 と同等の性能を、約80%低いコストで実現
- 同社はテキスト、動画、画像、音声の5つのAIモデルを発表、1日あたり180兆トークンの呼び出しと49.5%のパブリッククラウド市場シェアを達成
主な takeaways:

バイトダンスは6月23日、年次FORCEカンファレンスで5つの新AIモデルを発表し、AI動画生成における30秒の壁を突破、Claude Opus 4.7と同等のコーディング性能を5分の1の価格で実現した。
「Seedance 2.5 は、単一のプロンプトからネイティブで30秒のクリップを生成する初の動画生成モデルであり、シーンの変化やテンポの変移が内蔵されています」と、バイトダンスのクラウド事業である火山エンジンの社長、譚待(タン・ダイ)氏は北京でのカンファレンスで述べた。「最大50のマルチモーダル参照入力を同時に受け付けることができ(画像、音声、3Dモデル)、生成後のローカライズ編集も視覚的一貫性を損なうことなくサポートします。」
発表の目玉であるSeedance 2.5は、最大30秒の単一动画クリップをネイティブ4K解像度、10ビット色深度で生成する。これは、ほとんどのAI動画ツールを制限してきた15秒の上限からの飛躍的な進歩である。同モデルはまた、3Dホワイトモデルによるプリビジュアライゼーション機能を導入した。これは、CEOの梁汝波(リャン・ルーボー)氏によると、バイトダンスとのコラボレーション中に映画監督から寄せられた要望にヒントを得たものだという。ユーザーはクリップ全体を再生成することなく、生成後に背景や商品などの個別要素を編集できる。バイトダンスはこれを実演し、シーンを変えずにコマーシャル内の口紅の色味を変更してみせた。同モデルは7月上旬にリリースされる見込みである。
競争の舞台は動画をはるかに超えている。バイトダンスの旗艦言語モデルであるDoubao 2.1 Proは、科学推論ベンチマークSciCodeで59.8点を記録し、Claude Opus 4.7およびGPT-5.5を上回った。また、リポジトリレベルのコード生成NL2Repoでは47点を達成し、GPT-5.5やGemini 3.1を凌駕した。火山エンジンによると、その価格設定は入力トークン100万あたり6元(0.83ドル)、出力トークン100万あたり30元(4.14ドル)であり、AnthropicのClaude Opusシリーズと比較して約80%のコスト削減に相当する。Pro層の半額に設定されたターボバリアントは、高頻度のエンタープライズワークロードを対象としている。
フルスタックAI攻勢
バイトダンスの取り組みはテキストと動画にとどまらない。同社は画像生成向けのSeedream 5.0 Proもプレビュー公開した。これはインタラクティブ編集(ユーザーが矢印を描いたり領域を囲んで特定要素を修正)や、画像レイヤーを再帰的に分割しながら背景を自動補完するマルチレイヤー分離機能を追加する。同モデルは英語、スペイン語、アラビア語、日本語を含む10以上の言語で高密度テキストレイアウトをサポートし、文化的に適応されたタイポグラフィを提供する。
音声面では、Doubao音声生成モデル1.0が、テキストのみから完全な映画のようなサウンドトラックを生成する。キャラクターの音声特性、感情表現、方言のアクセント、背景の雰囲気、効果音をワンパスで自動推論する。デモでは、約1分間の武侠シーケンスが、一貫したキャラクターボイス、雨のアンビエンス、武器の衝突音を伴って再生され、すべて手動レイヤリングなしでモデルが生成したものだった。
2月にリリースされた前世代モデルSeedance 2.0も、今回の発表の一環としてネイティブ4K対応のアップグレードを受けた。
商業的勢いとエンタープライズ採用
火山エンジンのクラウド事業は現在、中国のパブリッククラウド市場の49.5%を占めていると譚氏は述べた。バイトダンスのDoubaoモデルファミリー全体での1日あたりのトークン呼び出し数は180兆に達し、2年前から1500倍、過去1年だけで10倍に増加した。年間1兆トークン以上を消費するエンタープライズ顧客の数は、12月以降で200社に倍増した。
バイトダンスはまた、AI著作権商業化プラットフォームを立ち上げ、香港の映画監督チャウ・シンチー(Stephen Chou)を第一号パートナーとして迎えた。ユーザーは、抖音(Douyin)、即夢(Jimeng)、剪映(Jianying)上の公式テンプレートを使用して、チャウ・シンチーの名作『食神』や『ミラクル7号』などのクリップをリミックスできる。初日には1万以上の作品が生成されたと譚氏は述べている。
エンタープライズ採用は複数の業界に広がっている。テスラは、バイトダンスのリアルタイム音声モデルを使用し、全ラインナップにわたる音声ベースの車両制御にDoubaoを統合している。メルセデス・ベンツの新型電気自動車CLAも、自然言語インタラクションと感情認識のためにDoubaoを搭載する。金融サービスでは、中金公司(CICC)がバイトダンスのHiAgentプラットフォーム上にデジタル投資アドバイザーエージェントを構築し、300人以上のアナリストによるリサーチを集約している。中国移動(チャイナモバイル)は、国内のコンピューティングインフラを使用して、政府および金融機関向けの機密モデルサービスを共同で立ち上げた。
投資家にとっての意味
テキスト、動画、画像、音声にわたるバイトダンスのフルスタックAIリリースは、西側のAIリーダーと中国のライバル企業の双方に圧力をかける価格・能力戦争の到来を告げるものである。Doubao 2.1 ProによるClaude Opus 4.7とのコーディング性能の同等性を80%低いコストで実現したことは、プレミアム層のモデルプロバイダーのマージンを圧迫する。一方、Seedance 2.5の30秒生成能力は、OpenAIのSoraや他の競合(15~20秒の制限内にとどまっている)を飛び越える。同社の49.5%というパブリッククラウド市場シェアと1日180兆のトークン呼び出しは、エンタープライズ導入がほとんどのアナリスト予想を上回るペースで加速していることを示唆する。AIインフラ構築を追跡する投資家にとって、バイトダンスがモデルを複数のモダリティにわたって攻撃的な価格帯でバンドルし、抖音、即夢、剪映を通じて流通させる能力は、西側のどのAIプラットフォームにも匹敵する規模の垂直統合型競合企業を生み出している。
本記事は情報提供のみを目的としており、投資助言を構成するものではありません。