OpenAI envisage de réduire les prix des tokens alors que les coûts des tokens IA sont multipliés par 10

Le passage de l'industrie de l'IA des subventions forfaitaires à la facturation par tokens a pris fin alors qu'OpenAI se prépare à réduire ses prix, redéfinissant l'économie du marché de l'IA générative, évalué à 200 milliards de dollars.

OpenAI envisage de réduire drastiquement les prix des tokens afin de conquérir des clients professionnels auprès d'Anthropic, une mesure qui comprimerait les marges des deux laboratoires d'IA, qui perdent déjà des milliards de dollars par an.

"Les coûts d'utilisation de l'IA sont devenus un énorme problème", a déclaré Sam Altman, PDG d'OpenAI, lors d'un récent événement, ajoutant que l'entreprise "aiderait les gens à obtenir plus de valeur pour moins de dépenses."

Cette guerre des prix survient après six mois brutaux pour les budgets d'IA des entreprises. Entre février et juin, OpenAI, Anthropic et GitHub sont tous passés des abonnements forfaitaires à la facturation par tokens à l'utilisation, exposant des coûts qui étaient auparavant cachés. Coinbase a mis en place des plafonds de prix hebdomadaires de 500 à 5 000 dollars par employé. Uber a épuisé l'intégralité de son budget IA pour 2026 dès avril. Salesforce prévoit de payer environ 300 millions de dollars à Anthropic cette année.

Les baisses de prix pourraient éroder les marges bénéficiaires d'OpenAI et d'Anthropic, qui perdent déjà des milliards en coûts de calcul. Mais le risque plus profond est que des prix plus bas valident l'idée que les modèles d'IA sont des produits standardisés — des produits interchangeables pour lesquels les clients se tournent vers l'option la moins chère. Cette dynamique menace les valorisations boursières des deux entreprises et pourrait se répercuter sur les fournisseurs d'infrastructure, notamment Nvidia, Oracle et CoreWeave.

Des subventions au choc des factures

Ce changement de facturation était en préparation depuis trois ans. Début 2023, OpenAI a lancé ChatGPT Plus à 19,99 $ par mois, établissant une norme de tarification forfaitaire bientôt suivie par GitHub Copilot de Microsoft et Gemini Advanced de Google. Pour stimuler l'adoption, les entreprises ont subventionné les utilisateurs intensifs : Microsoft perdait en moyenne 20 $ par abonné GitHub Copilot chaque mois, certains utilisateurs avancés coûtant jusqu'à 80 $.

En juin 2026, ce modèle s'était effondré. GitHub a basculé tous ses forfaits vers une facturation par tokens, transformant un abonnement mensuel de 19 $ en une allocation de tokens qu'une seule session de codage autonome pouvait épuiser. Un ingénieur logiciel senior de Deloitte a estimé qu'une invite très détaillée pourrait désormais coûter plus de 100 $ dans le cadre du nouveau système. La documentation développeur d'Anthropic montre qu'une équipe de 10 personnes utilisant Claude Code pourrait dépenser plus de 75 600 $ par an rien qu'en tokens.

Le retour sur cet investissement reste médiocre. La plateforme de données d'entreprise Entelligence.AI a analysé 2 444 entreprises et a constaté que pour chaque dollar dépensé en tokens d'IA, seuls 18 cents généraient de la valeur pour l'utilisateur final. Le reste servait à corriger des bugs introduits par l'IA, à des reprises et à des frictions de révision.

Les calculs de la guerre des prix

La décision d'OpenAI de réduire ses prix est en partie préventive. L'entreprise s'attend à ce qu'Anthropic baisse ses propres tarifs, selon des personnes proches du dossier, et veut frapper la première. Les revenus d'Anthropic ont bondi après que Claude Code soit devenu viral parmi les ingénieurs logiciels, et la startup âgée de cinq ans a dépassé la valorisation d'OpenAI pour la première fois.

Le problème est que les produits des deux entreprises sont hautement substituables. Les clients peuvent passer des modèles d'OpenAI à ceux d'Anthropic avec une friction minimale, ce qui signifie que les baisses de prix peuvent fidéliser temporairement les clients mais ne peuvent pas créer un avantage concurrentiel durable. Le cycle financier s'étend également aux fournisseurs de cloud : OpenAI et Anthropic représentent ensemble plus de la moitié des quelque 2 000 milliards de dollars d'engagements futurs de services cloud chez Microsoft, Oracle, Google et Amazon, selon The Information. Des attentes de revenus plus faibles dans les laboratoires d'IA pourraient se répercuter sur ces contrats.

Gary Marcus, chercheur en neurosciences et en IA, a prévenu qu'un ralentissement d'OpenAI "entraînerait probablement une baisse de Nvidia, Oracle, CoreWeave et d'autres."

Les gagnants pourraient être les alternatives moins chères

Les plus grands bénéficiaires d'une guerre des prix pourraient n'être ni OpenAI ni Anthropic. Les modèles d'IA chinois gagnent du terrain auprès des entreprises américaines soucieuses de leurs coûts. L'API de DeepSeek est proposée à environ un dixième du prix de GPT-5.5 et un onzième de celui de Claude Opus 4.7, selon des estimations tierces. La plateforme de dépenses d'entreprise Ramp a rapporté en juin que DeepSeek était devenu l'abonnement logiciel d'entreprise connaissant la croissance la plus rapide parmi les entreprises américaines.

"Les entreprises se demandent désormais si chaque tâche nécessite un modèle de pointe", a déclaré Niranjan Krishnan, responsable des solutions d'IA au sein du cabinet de conseil IT FPT Americas. "La nouveauté s'est estompée et l'utilité pragmatique a pris le relais."

Coinbase a commencé à orienter les tâches de base vers des modèles moins chers de DeepSeek et MiniMax. Harness, une startup logicielle, a formé ses ingénieurs à utiliser Claude Code plus efficacement, maîtrisant des coûts qui avaient augmenté de façon exponentielle d'octobre à mars.

Pour les investisseurs, les implications sont claires. Nvidia se négocie à environ 35 fois les bénéfices à terme, une grande partie de cette prime étant liée à la demande de formation des modèles d'IA. Si les clients professionnels se tournent vers des modèles d'inférence moins chers et des laboratoires plus petits, le cycle d'approvisionnement en GPU pourrait ralentir. CoreWeave, qui a affiché 2,08 milliards de dollars de revenus au premier trimestre mais 740 millions de dollars de pertes nettes, est particulièrement exposé à la dynamique des prix des laboratoires d'IA qu'elle sert.

Citadel Securities a proposé un cadre de tarification par niveaux et de facturation basée sur la rareté, où les modèles de pointe restent chers pour les tâches complexes tandis que les modèles plus simples gèrent le travail courant. Cette structure préserverait les revenus des laboratoires d'IA, mais limiterait le marché total adressable pour l'inférence premium.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.