アリババの最新フラッグシップモデル「Qwen 3.7-Max」が、世界のプログラミングリーダーボード「Code Arena」で第 2 位を獲得しました。これは、欧米主導の AI 勢力図に対する直接的な挑戦であり、フルスタックで垂直統合された AI ソリューションに対する同社の巨額投資の正当性を証明するものです。
この成果は、アリババクラウドのシニアバイスプレジデントである劉偉光(リウ・ウェイグァン)氏が「中国の AI ファクトリー」と呼ぶ戦略の中核をなすものです。この戦略は、独自のモデルを「T-Head 震武(Zhenwu)M890」AI 加速チップを含む自社ハードウェアと組み合わせ、企業向け市場でアリババに競争優位性をもたらすように設計されたクローズドループ・システムを構築します。
5 月 26 日、Qwen 3.7-Max は Code Arena ベンチマークで 1541 点を記録し、「GPT-5.5」や「Gemini-3.5-Flash」などの著名なモデルを上回りました。このスコアにより、アリババのプログラミング能力は Anthropic の「Claude」シリーズに次ぐ第 2 位となり、コード生成および理解における世界の AI 開発のトップ層に Qwen を確固たるものとして位置づけました。
投資家にとって、このベンチマーク結果は単なる数字以上の意味を持ちます。これは、アリババがクラウドおよび AI インフラに 3 年間で投じた 530 億ドルの投資が、最先端で競争可能な製品を生み出しているという証拠です。自社製の国産チップ上でトップティアのモデルを実行できる能力は、欧米製ハードウェアへのアクセスが複雑な状況において、中国国内の膨大な企業需要を取り込むための有利な立場を同社に与えます。
垂直統合された「AI ファクトリー」
Qwen 3.7-Max の物語は、それが動作するハードウェアと切り離せません。「アリババクラウド・サミット」で披露されたこのモデルは、「震武 M890」AI 加速チップおよび「磐久(Panjiu)AL128」ラック型サーバーとともに、3 つのパーツからなる「AI ファクトリー」スタックの一部として発表されました。このソフトウェアと独自ハードウェアの統合こそが、アリババの核心的な戦略的優位性です。同社は、M890 チップが素のスペックでは欧米の主要な設計に劣るものの、中国市場においては輸出規制対象である Nvidia 製チップの「信頼できる代替品」であると主張しています。
この統合スタックの威力を証明するため、アリババは Qwen 3.7-Max が「震武 M890」プラットフォーム上で 35 時間自律的に動作した内部デモンストレーションの結果を報告しました。この実行中、モデルは自身が動作しているチップ向けにソフトウェアを繰り返し最適化するために、1,158 回のツール呼び出しを行いました。これらの結果は自社報告によるものですが、アリババの戦略目標を浮き彫りにしています。それは、単にタスクを実行するだけでなく、基盤となるハードウェアの効率性をも改善できる AI を作成することであり、これはサードパーティ製チップに依存する企業には不可能な再帰的ループです。
散文ではなく、難問解決のための設計
Qwen 3.7-Max の強みは、難解で構造化されたタスクに集中しています。Arena リーダーボードの数学部門では世界第 7 位にランクされ、大学院レベルの推論ベンチマーク「GPQA Diamond」では 92.4 を記録しました。あるテストでは、競合モデルがフリーズし誤答を出した第 19 次ディクソン多項式の問題を正解しました。数学、コーディング、およびエージェント能力(長い一連のアクションを実行する能力)へのこの注力は、自動化されたソフトウェア開発や複雑な財務報告などの高付加価値なエンタープライズ・ワークフローにこのモデルを適応させます。
しかし、このモデルはクリエイティブなパートナーというよりは、効率的な労働者に近いものです。クリエイティブ・ライティングのテストでは、その出力は「鋭く」「効率的」であるものの、より表現力豊かなモデルに見られる「豊かさ」や「重層的な内面性」に欠けると評されました。これは意図的な設計上の選択です。アリババは小説家をターゲットにしているのではなく、複雑で論理的な問題を解決するための信頼できるツールを必要とする開発者や企業をターゲットにしています。
投資家への留意事項と市場アクセス
印象的なベンチマーク結果にもかかわらず、いくつかの要因が投資家の即座の熱狂を和らげる可能性があります。フラッグシップの Qwen 3.7-Max モデルはオープンソース化されず、最良のモデルを収益化するというアリババの戦略を継続します。完全な API アクセスはまだ展開中であり、価格設定は競争力のあるものになると予想されますが、最終決定はされていません。さらに、独立した分析によると、このモデルの高い精度は、一部のベンチマークにおける試行率の低さに一部起因しています。確信がない場合に回答しないことを選択しているため、同ティアのモデルの中でハルシネーション(幻覚)率が最も低くなっています。
海外企業にとって、アリババのクラウドサービスを利用することは、中国の 2017 年国家情報法の対象となります。同法は、中国の組織が「国家の情報工作を支持、援助、協力」しなければならないと定めています。強制的なデータアクセスが発生した事例は記録されていませんが、機密データを扱う企業にとって、この法的枠組みは構造的なリスクとして残ります。
この記事は情報提供のみを目的としており、投資アドバイスを構成するものではありません。