JPMorgan : L'avantage de coût de 40x de DeepSeek V4 met sous pression deux rivaux chinois de l'IA

Un rapport de JPMorgan révèle que le modèle de langage étendu V4 de DeepSeek possède un avantage de coût structurel qui met sous pression ses concurrents chinois de l'IA, KNOWLEDGE ATLAS (02513.HK) et MINIMAX-W (00100.HK). L'analyse, publiée trois semaines après le lancement du modèle V4, suggère que seule l'infrastructure propriétaire de DeepSeek peut faire fonctionner le modèle à une efficacité économique maximale, créant une nouvelle dynamique concurrentielle dans ce secteur en pleine croissance.

Le rapport de la banque souligne un avantage structurel direct dans la gestion de la réutilisation du cache de préfixes, de la densité du trafic et de l'allocation de calcul. « Dans les performances d'entrée avec succès de cache, il existe un écart d'environ 40x entre l'API officielle de DeepSeek et les canaux cloud tiers », a noté JPMorgan. La firme a conclu que si les poids des modèles peuvent être distribués, la courbe de coût sous-jacente ne le peut pas, ce qui donne à DeepSeek un avantage significatif.

Selon les données d'OpenRouter, le lancement de DeepSeek V4 n'a pas entraîné de baisse correspondante de l'utilisation pour des concurrents comme GLM et MiniMax, suggérant que le marché connaît une croissance contrainte par l'offre plutôt qu'une substitution à somme nulle. Le rapport cadre le marché avec DeepSeek V4-Pro définissant la frontière des bas coûts et le GLM-5.1 de KNOWLEDGE ATLAS ancrant le segment haut de gamme, laissant le modèle M2.7 de MINIMAX pris entre deux feux.

Pour les investisseurs, JPMorgan a attribué une note « Surpondérer » (Overweight) à KNOWLEDGE ATLAS et MINIMAX-W, avec des objectifs de cours respectifs de 950 HKD et 1 100 HKD. Cependant, le rapport souligne que les deux entreprises doivent renforcer leur positionnement stratégique pour rivaliser efficacement avec l'efficacité des coûts de DeepSeek.

La prime de Zhipu AI menacée

Pour KNOWLEDGE ATLAS, qui exploite le modèle Zhipu AI, JPMorgan estime que sa monétisation dépend désormais de l'extension de son leadership technologique. Bien que son GLM-5.1 soit actuellement en avance sur le V4 de DeepSeek dans les évaluations, justifiant une prime de prix, cette avance doit s'accentuer. Pour maintenir son pouvoir de fixation des prix, la prochaine version de GLM devra élargir son avantage de préférence dans les tâches complexes liées au flux de travail, comme le codage basé sur des agents et le raisonnement à contexte long, où le coût des tentatives et la qualité sont plus importants que le coût brut des jetons. Un échec pourrait lui faire perdre des clients sensibles aux prix au profit de DeepSeek.

L'usage de l'IA en Chine dépasse celui des États-Unis depuis 3 semaines

Cette concurrence intense survient alors que l'usage de l'IA en Chine continue de monter en flèche. Selon les dernières estimations d'OpenRouter pour la semaine du 11 au 17 mai, l'usage des jetons des grands modèles en Chine était 1,81 fois supérieur à celui des États-Unis, marquant la troisième semaine consécutive au premier rang mondial. Les modèles chinois ont enregistré une utilisation de 7,693 billions de jetons, tandis que les modèles américains ont affiché 4,24 billions. Deux des trois principaux modèles par utilisation mondiale de jetons étaient chinois, dont l'aperçu Hy3 de TENCENT (00700.HK), qui s'est classé premier avec un bond de 210 % de son utilisation sur une semaine pour atteindre 2,66 billions de jetons.

Pendant ce temps, MINIMAX fait face à une pression croissante sur sa proposition de valeur axée sur l'infrastructure. Historiquement concurrent sur le débit et la latence, il doit maintenant faire face à l'API à bas coût et à contexte d'un million de DeepSeek, ainsi qu'à une pile de services qui semble plus efficace. JPMorgan suggère que le successeur du modèle M2.7 de MiniMax devra prouver qu'il peut offrir des coûts globaux inférieurs grâce à moins de cycles et de tentatives pour maintenir sa différenciation.

Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.