Le dernier modèle phare d'Alibaba, Qwen 3.7-Max, a décroché la deuxième place du classement mondial de programmation Code Arena, signalant un défi direct à l'hégémonie occidentale sur l'IA et validant l'investissement massif de l'entreprise dans une solution d'IA complète et verticalement intégrée.
Cette réussite est un élément central de ce que le vice-président senior du cloud computing d'Alibaba, Liu Weiguang, appelle l'« usine à IA de la Chine ». Cette stratégie combine des modèles propriétaires avec le matériel de l'entreprise, notamment l'accélérateur d'IA T-Head Zhenwu M890, créant un système en boucle fermée conçu pour donner à Alibaba un avantage concurrentiel sur le marché des entreprises.
Le 26 mai, Qwen 3.7-Max a obtenu un score de 1541 au benchmark Code Arena, se plaçant devant des modèles de premier plan tels que GPT-5.5 et Gemini-3.5-Flash. Ce score place les capacités de programmation d'Alibaba au deuxième rang, juste derrière les modèles de la série Claude d'Anthropic, établissant fermement Qwen dans le peloton de tête du développement mondial de l'IA pour la génération et la compréhension de code.
Pour les investisseurs, ce résultat de benchmark est bien plus qu'un simple chiffre ; c'est la preuve que l'investissement de 53 milliards de dollars sur trois ans d'Alibaba dans l'infrastructure cloud et IA porte ses fruits avec un produit capable de rivaliser à la frontière technologique. La capacité de l'entreprise à fournir un modèle de premier plan fonctionnant sur ses propres puces nationales la positionne pour capturer une demande importante des entreprises en Chine, d'autant plus que l'accès au matériel occidental reste complexe.
Une « Usine à IA » verticalement intégrée
L'histoire du Qwen 3.7-Max est indissociable du matériel sur lequel il fonctionne. Dévoilé lors de l'Alibaba Cloud Summit, le modèle a été présenté comme l'un des trois éléments d'une pile d'« usine à IA », aux côtés de l'accélérateur d'IA Zhenwu M890 et du serveur à l'échelle du rack Panjiu AL128. Cette intégration du logiciel et du matériel propriétaire constitue l'avantage stratégique majeur d'Alibaba. L'entreprise affirme que la puce M890, bien qu'en retrait par rapport aux conceptions occidentales de pointe sur les spécifications brutes, constitue un « remplacement crédible » aux puces Nvidia sous contrôle à l'exportation sur le marché chinois.
Pour prouver la puissance de cette pile intégrée, Alibaba a fait état d'une démonstration interne où Qwen 3.7-Max a fonctionné de manière autonome pendant 35 heures sur la plateforme Zhenwu M890. Pendant cette période, le modèle a effectué 1 158 appels d'outils pour optimiser de manière itérative le logiciel destiné à la puce même sur laquelle il fonctionnait. Bien que ces résultats soient autodéclarés, ils illustrent l'objectif stratégique d'Alibaba : créer une IA capable non seulement d'exécuter des tâches, mais aussi d'améliorer l'efficacité du matériel sous-jacent, une boucle récursive inaccessible aux entreprises dépendant de puces tierces.
Conçu pour les problèmes complexes, pas pour la prose
Les points forts du Qwen 3.7-Max se concentrent sur les tâches difficiles et structurées. Il se classe septième mondial en mathématiques sur le classement Arena et a obtenu un score de 92,4 au benchmark GPQA Diamond pour le raisonnement de niveau universitaire. Lors d'un test, il a résolu correctement un problème de polynôme de Dickson de degré 19 qui avait provoqué le gel d'un modèle concurrent et une réponse incorrecte. Cette focalisation sur les mathématiques, le codage et les capacités agentiques — la capacité à effectuer de longues séquences d'actions — positionne le modèle pour des flux de travail d'entreprise à haute valeur ajoutée tels que le développement logiciel automatisé et les rapports financiers complexes.
Cependant, le modèle est moins un partenaire créatif qu'un travailleur efficace. Lors de tests d'écriture créative, sa production a été décrite comme « tranchante » et « efficace », mais manquant de la « richesse » et de l'« intériorité complexe » de modèles plus expressifs. Il s'agit d'un choix de conception délibéré. Alibaba ne cible pas les romanciers ; elle cible les développeurs et les entreprises qui ont besoin d'un outil fiable pour résoudre des problèmes logiques complexes.
Mises en garde pour les investisseurs et accès au marché
Malgré des benchmarks impressionnants, plusieurs facteurs pourraient tempérer l'enthousiasme immédiat des investisseurs. Le modèle phare Qwen 3.7-Max ne sera pas disponible en open-source, poursuivant la stratégie d'Alibaba consistant à monétiser ses meilleurs modèles. L'accès complet à l'API est toujours en cours de déploiement, et les tarifs, bien qu'attendus comme compétitifs, n'ont pas encore été finalisés. De plus, une analyse indépendante montre que la haute précision du modèle provient en partie d'un taux de tentative plus faible sur certains benchmarks ; il présente le taux d'hallucination le plus bas de sa catégorie en partie parce qu'il choisit de ne pas répondre lorsqu'il est incertain.
Pour les entreprises internationales, toute utilisation des services cloud d'Alibaba est soumise à la loi chinoise sur le renseignement national de 2017, qui stipule que les organisations chinoises doivent « soutenir, aider et coopérer avec les efforts de renseignement nationaux ». Bien qu'aucun incident d'accès forcé aux données n'ait été documenté, le cadre juridique reste un risque structurel pour les entreprises manipulant des données sensibles.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.