L'ère de la consommation illimitée de tokens d'IA au sein des entreprises du Fortune 500 touche à sa fin, remplacée par des budgets stricts, des plafonds d'utilisation et une course effrénée vers des modèles moins chers, alors que les coûts par employé atteignent 7 500 $ par mois.
AT&T a restreint l'accès des employés à GitHub Copilot de Microsoft. Meta a resserré ses dépenses sur Anthropic et d'autres services d'IA. Uber a épuisé l'intégralité de son budget IA pour le codage de l'année 2026 dès le mois d'avril et a plafonné chaque employé à 1 500 $ par outil et par mois. Walmart a fixé des limites à ses agents d'IA internes. Amazon a supprimé le classement interne qui classait les employés par leur utilisation de l'IA — après avoir découvert que les travailleurs consommaient de la puissance de calcul uniquement pour grimper dans le classement.
Ce revirement, du « tokenmaxxing » — la pratique consistant à maximiser la consommation de tokens d'IA — vers le « tokenminimizing », gagne les plus grands utilisateurs corporatifs de l'IA générative, selon des personnes proches du dossier. Dans les entreprises les plus intensives en IA, les coûts mensuels par employé ont atteint 7 500 $, a rapporté The Information, un chiffre qui a obligé les directeurs financiers à intervenir.
« Les entreprises réalisent que les workflows d'IA agentique ne passent pas à l'échelle avec une tarification forfaitaire », a déclaré Alex Nguyen, analyste IA entreprise chez Edgen. « Lorsqu'un seul agent d'IA peut enchaîner 50 appels de modèle pour accomplir une seule tâche, les calculs ne tiennent plus au volume d'une entreprise. »
Le problème mathématique des 7 500 $ par employé
Ce changement structurel trouve son origine dans l'essor des outils d'IA agentique — des logiciels qui enchaînent de manière autonome plusieurs appels de modèles pour accomplir des tâches complexes dans les e-mails, les feuilles de calcul et les applications de messagerie. Contrairement aux requêtes manuelles de chatbot, ces agents consomment des tokens par à-coups difficiles à prévoir ou à plafonner.
Microsoft a découvert que certains ingénieurs dépensaient entre 500 et 2 000 $ par mois en frais de tokens pour le seul logiciel Claude Code, selon des données internes examinées par l'entreprise. Les coûts d'interaction avec l'IA en entreprise ont bondi de 30 fois depuis 2023, et Goldman Sachs prévoit que les workflows agentiques pourraient multiplier la demande de tokens par 24 par rapport aux niveaux actuels.
L'écart de prix entre les modèles premium et open source rend la tension encore plus vive. Le dernier modèle phare d'Anthropic coûte environ 50 $ par million de tokens, tandis que le DeepSeek V4 Pro tourne à environ 0,87 $ par million de tokens — soit une différence d'un facteur 57, selon les données de tarification publiées par les deux sociétés. Microsoft étudie désormais une version affinée et auto-hébergée de DeepSeek V4 comme backend à moindre coût pour son produit Copilot Cowork, a rapporté Axios le 16 juin.
Toutes les entreprises ne resserrent pas leurs dépenses. Databricks n'impose aucun plafond budgétaire IA à ses ingénieurs, a déclaré le responsable de l'ingénierie Nikita Shamgunov lors d'un événement Nebius la semaine dernière. Aaron Levie, PDG de Box, a déclaré que son entreprise n'avait jamais adopté le tokenmaxxing en premier lieu. « Nous n'avions pas de classement, donc nous ne nous sommes pas égarés », a déclaré Levie.
Les gardiens de la nouvelle ère budgétaire de l'IA
La vague de contrôle des coûts crée une nouvelle demande d'infrastructure. Microsoft et Databricks ont chacun lancé des outils « passerelle » qui surveillent l'utilisation de l'IA par les employés et imposent des limites de dépenses. Factory, soutenu par Nvidia et valorisé à 1,5 milliard de dollars, a publié ce mois-ci un routeur de modèles qui attribue automatiquement les tâches de faible complexité à des modèles moins chers.
Les dirigeants de Palantir et de Box font état d'une demande croissante de la part des clients entreprises cherchant à transférer des tâches simples de modèles frontières coûteux vers des alternatives moins chères ou open source. Ce schéma rappelle le passage du cloud tout-premium au cloud à plusieurs niveaux qui a remodelé le marché du cloud public il y a dix ans.
Le PDG de Microsoft, Satya Nadella, a présenté cette tendance comme une nécessité stratégique. « Aucun d'entre nous ne veut voir un monde où chaque entreprise, dans chaque secteur, cède de la valeur à une poignée de modèles 'gagnants-remportent-tout' », a-t-il écrit sur X la semaine dernière. Ce commentaire a d'autant plus de poids que les propres logiciels de productivité de Microsoft sont désormais en concurrence avec Anthropic et OpenAI en matière de tarification.
Le nouveau produit Copilot Cowork de Microsoft, disponible en version générale depuis le 16 juin, incarne cette tension. Il nécessite une licence Microsoft 365 Copilot à 30 $ par utilisateur et par mois, plus des frais supplémentaires basés sur l'utilisation via les Copilot Credits — un modèle de double abonnement et consommation qui reflète la tarification entreprise d'Anthropic. Charles Lamanna, vice-président exécutif de Microsoft, a déclaré que les clients « peuvent choisir comment gérer les coûts », notamment en fixant des plafonds d'utilisation par employé et en remplaçant les modèles d'Anthropic par ceux d'OpenAI ou par les propres alternatives de Microsoft.
La question pour les investisseurs est de savoir si les contrôles des coûts atténueront les gains de productivité qui ont justifié les dépenses d'IA des entreprises en premier lieu. Les actions de Microsoft se négocient à 33 fois les bénéfices prévisionnels, les revenus liés à l'IA constituant un pilier clé du scénario haussier. Si le ralentissement des tokens freine l'adoption, les prévisions de revenus intégrées dans les valorisations actuelles pourraient s'avérer optimistes. Pour l'instant, les directeurs financiers ont le dessus.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.