Microsoft : Nadella met en garde les « tokenmaxxers » alors que les coûts de l'IA grimpent de 320 %

Satya Nadella a demandé aux employés de Microsoft de cesser d'utiliser les modèles d'IA les plus puissants pour chaque tâche, alors que les dépenses effrénées en tokens menacent l'économie de l'intelligence artificielle.

Le PDG de Microsoft, Satya Nadella, a déclaré qu'« énormément » de tokenmaxxing se produit au sein de l'entreprise et a exhorté les employés à adapter les modèles d'IA à la complexité des tâches, alors que les factures d'IA des entreprises grimpent de 320 %, même si les prix par token ont chuté de 98 %.

« N'utilisez pas les modèles de pointe pour des problèmes non prioritaires », a déclaré Nadella lors d'un enregistrement en direct du podcast « Hard Fork » du New York Times. « Accordons ces choses de manière à obtenir les résultats, à obtenir l'économie — cela ne peut pas être une course à des actions qui n'apportent tout simplement pas de valeur ajoutée. »

Nadella a cité le mode automatique de Microsoft Copilot, qui achemine les tâches vers le modèle le plus rentable, comme modèle d'une utilisation disciplinée de l'IA. Ces déclarations interviennent alors qu'Uber Technologies Inc. a révélé avoir épuisé l'intégralité de son budget de codage pour 2026 dès le mois d'avril, et qu'une entreprise non nommée a brûlé 500 millions de dollars en tokens en un seul mois après avoir omis de plafonner les licences Claude, selon Axios. Amazon.com Inc. et Meta Platforms Inc. ont discrètement supprimé leurs classements internes en matière d'IA, tandis que Walmart Inc. et Starbucks Corp. ont réduit leurs plans d'agents IA. Un vice-président senior d'Amazon a déclaré à ses employés dans un courriel divulgué de « cesser d'utiliser l'IA juste pour le plaisir d'utiliser l'IA ».

Cette pression sur la maîtrise des coûts menace les modèles économiques d'OpenAI et d'Anthropic, qui vendent des tokens comme produit principal et visent des introductions en bourse de plusieurs billions de dollars. OpenAI à lui seul perd plus d'un milliard de dollars par mois, en partie à cause de la gratuité de ChatGPT offerte à des centaines de millions d'utilisateurs. La cofondatrice d'Anthropic, Daniela Amodei, a suggéré que les deux entreprises avaient tellement dépensé qu'elles se trouvaient « à quelques mois de la faillite » et qu'elles avaient « épuisé leurs options » au-delà du dépôt de demandes d'introduction en bourse à plusieurs billions.

La gueule de bois du tokenmaxxing

Nadella a reconnu sa propre addiction à cette pratique. « Je suis aussi un tokenmaxxer, c'est addictif », a-t-il déclaré. « Mais il faut prendre du recul une fois que la nouveauté s'estompe pour se demander : "Qu'est-ce que j'essaie de créer ?" » Il a ajouté avoir récemment construit un outil utilisant le « vibe coding » qui maintient les projets logiciels à jour en suivant les conversations en milieu professionnel — un cas d'usage ciblé plutôt qu'un déploiement généralisé de l'IA.

Ce changement marque un revirement par rapport à 2025, lorsque les dirigeants de la Silicon Valley poussaient les employés à utiliser l'IA autant que possible, souvent via des classements internes mesurant la consommation de tokens. Les prix des tokens pour les réponses de niveau GPT-4 sont passés d'environ 20 dollars par million de tokens fin 2022 à environ 0,40 dollar, soit une baisse de 98 %, mais les factures d'IA des entreprises ont grimpé d'environ 320 % à mesure que les agents autonomes augmentent la consommation, selon The Next Web.

L'industrie face au gaspillage

Le PDG de Cognizant Technology Solutions Corp., Ravi Kumar S., a qualifié le tokenmaxxing de « mesure de vanité » lors d'une conférence de Fortune, accusant Sam Altman d'OpenAI et Dario Amodei d'Anthropic de « semer la peur » quant à l'impact de l'IA sur l'emploi. Altman, d'OpenAI, a reconnu la pression dans une interview sur CNBC, la qualifiant de « problème légitime », les clients demandant constamment « combien de temps dois-je attendre pour que les bénéfices de l'IA se reflètent dans les revenus ? »

Ce contrecoup dépasse les budgets d'entreprise. Un sondage Pew de mars a révélé que seulement 10 % des Américains se disent plus enthousiastes qu'inquiets quant à l'avenir de l'IA, tandis que 70 % ont déclaré ne pas vouloir de centre de données près de chez eux. Data Center Watch a recensé au moins 48 projets bloqués ou retardés en 2025. Dans l'Utah, l'opposition locale a forcé l'investisseur de Shark Tank, Kevin O'Leary, à réduire de 75 % l'empreinte foncière de son projet de centre de données Stratos.

Les actions de Microsoft se négocient à environ 33 fois les bénéfices à terme. La capacité de l'entreprise à maîtriser les coûts de l'infrastructure IA tout en monétisant Copilot auprès de ses 220 000 employés sera un facteur clé d'expansion des marges. Pour Nvidia Corp., qui a été le principal bénéficiaire du déploiement de l'IA, le ralentissement du tokenmaxxing pourrait signaler une croissance plus lente de la demande de GPU. Michael Burry, célèbre pour The Big Short, a maintenu une position courte sur Nvidia, selon les déclarations publiques. Le S&P 500 a refusé d'ajouter OpenAI, Anthropic ou SpaceX à l'indice, ce qui exerce une pression supplémentaire sur leurs valorisations d'introduction en bourse.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.