LongCat-2.0 de Meituan est le premier modèle de mille milliards de paramètres entièrement entraîné sur un cluster de GPU chinois domestiques, une étape qui remet en question les hypothèses sur la dépendance de la Chine vis-à-vis du matériel Nvidia et met la pression sur les laboratoires d'IA occidentaux en matière de tarification.
Fin juin, Meituan a annoncé la publication et la mise en open source de LongCat-2.0, un modèle de 1600 milliards de paramètres avec 48 milliards de paramètres activés en moyenne et une fenêtre de contexte native d'un million de tokens, entraîné à partir de zéro sur un cluster de 50 000 GPU nationaux.
« Cela démontre que les laboratoires d'IA chinois peuvent désormais entraîner des modèles de pointe sans dépendre du matériel Nvidia », a déclaré une personne proche du projet, qui s'est exprimée sous couvert d'anonymat car les détails ne sont pas encore publics.
LongCat-2.0 utilise une architecture Mixture-of-Experts, activant entre 33 et 56 milliards de paramètres par token — une conception qui maintient les coûts d'inférence proches de ceux d'un modèle dense de 48 milliards de paramètres tout en conservant la capacité d'un système de 1600 milliards de paramètres. La fenêtre de contexte d'un million de tokens est comparable aux plus longues disponibles dans les laboratoires occidentaux de pointe. Meituan n'a pas divulgué les scores de référence, le coût d'entraînement ni les tarifs d'inférence.
La publication en open source place Meituan en concurrence directe avec les laboratoires d'IA chinois Zhipu AI et Moonshot AI, dont les modèles GLM 5.2 et Kimi K2.7 Code ont récemment gagné en adoption auprès des entreprises ces dernières semaines. Elle met également sous pression des laboratoires occidentaux comme Anthropic et OpenAI, dont le pouvoir de fixation des prix dépend du maintien d'un écart de performance par rapport aux alternatives open weight.
La percée des GPU domestiques
L'entraînement d'un modèle de mille milliards de paramètres nécessite des dizaines de milliers de GPU fonctionnant en parallèle pendant des semaines — une tâche qui exige généralement des clusters Nvidia H100 ou B200 avec des interconnexions NVLink propriétaires. Le cluster de 50 000 cartes de Meituan utilisait des accélérateurs domestiques, bien que l'entreprise n'ait pas précisé le fournisseur ou l'architecture des puces. Les Ascend 910B et 910C de Huawei sont les candidats les plus probables, car ce sont les seules puces IA fabriquées en Chine disponibles à grande échelle.
Cette étape est importante car les contrôles à l'exportation américains, renforcés plus récemment en janvier 2025, restreignent la vente des H100 et B200 de Nvidia à la Chine. Si Meituan a réussi à entraîner un modèle compétitif de mille milliards de paramètres sur des puces domestiques, cela suggère que les laboratoires chinois ont trouvé une solution de contournement — une avancée qui pourrait accélérer le calendrier de développement de l'IA en Chine indépendamment des chaînes d'approvisionnement occidentales.
Pression sur les prix des laboratoires occidentaux
LongCat-2.0 arrive sur un marché où les modèles chinois open weight gagnent déjà du terrain. Le GLM 5.2 de Zhipu AI, publié le 13 juin sous licence MIT, coûte 1,40 $ par million de tokens d'entrée et 4,40 $ par million de tokens de sortie — soit environ un tiers à un sixième du prix de l'Opus 4.8 d'Anthropic. Le Kimi K2.7 Code de Moonshot AI, publié le 12 juin, suit une stratégie de tarification similaire. Coinbase a révélé le 27 juin qu'elle oriente désormais par défaut ses ingénieurs vers ces deux modèles, réduisant ainsi ses dépenses en IA de 50 %.
Meituan n'a pas divulgué les tarifs ni les performances de référence de LongCat-2.0, ce qui rend toute comparaison directe impossible. La décision de l'entreprise de publier le modèle en open source sous une licence non spécifiée suggère qu'elle misera sur l'accessibilité plutôt que sur un avantage propriétaire. Pour Meituan elle-même, le modèle représente un atout stratégique : le géant de la livraison de repas et des services locaux peut déployer LongCat-2.0 en interne pour ses systèmes de recommandation, l'optimisation logistique et l'automatisation du service client, réduisant potentiellement sa dépendance aux fournisseurs d'IA tiers.
Implications pour les investisseurs
Le marché de l'IA open weight se fragmente selon des lignes géopolitiques. Les entreprises occidentales sont désormais confrontées à un choix entre des modèles de pointe plus coûteux provenant de laboratoires américains et des alternatives chinoises moins chères qui comportent des risques réglementaires et d'origine. L'entrée de Meituan ajoute une option supplémentaire : un modèle entraîné sur du matériel domestique par une société cotée en bourse sans exposition directe aux contrôles à l'exportation américains.
Les actions Meituan sont négociées à la Bourse de Hong Kong. La société ne ventile pas ses dépenses en IA séparément dans ses informations financières, mais ses dépenses annuelles en R&D s'élevaient à environ 21,1 milliards de yuans (2,9 milliards de dollars) en 2025, selon son plus récent rapport annuel. L'entraînement de LongCat-2.0 a probablement consommé une part importante de ce budget, bien que l'entreprise n'ait pas divulgué le coût.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.