Coinbase parie qu'une infrastructure plus intelligente, et non des plafonds d'utilisation, peut empêcher ses coûts d'IA de déraper alors que la consommation de jetons atteint des niveaux records.
Brian Armstrong, directeur général de Coinbase, a exposé cinq stratégies que la plateforme d'échange de crypto-monnaies utilise pour gérer la hausse des coûts liés à l'intelligence artificielle sans restreindre le nombre de jetons que ses ingénieurs peuvent utiliser, selon un message publié sur X vendredi.
« En fin de compte, ce ne sont pas les humains qui devraient choisir les modèles — l'IA peut automatiser cette tâche », a déclaré Armstrong, décrivant l'approche de l'entreprise consistant à orienter les requêtes vers les grands modèles de langage les plus appropriés en fonction de la difficulté de la tâche.
La première stratégie consiste à sélectionner des LLM par défaut moins chers. Coinbase expérimente des modèles chinois à poids ouverts, tels que GLM 5.2, développé par Z.ai, et Kimi 2.7, de Moonshot AI, comme options par défaut via sa passerelle LLM, a écrit Armstrong. Ces modèles coûtent nettement moins cher que ceux des laboratoires d'IA américains de pointe comme Anthropic et OpenAI.
La deuxième approche, dont Armstrong avait parlé plus tôt en juin, achemine les requêtes vers des modèles adaptés à la complexité de la tâche — en utilisant des modèles de pointe pour la planification mais des modèles moins chers pour l'exécution, là où ils seraient surdimensionnés. Les stratégies restantes incluent une meilleure mise en cache pour réduire les coûts d'inférence, le maintien d'un contexte léger en démarrant de nouvelles sessions lors du changement de tâches, et l'amélioration de la visibilité à l'échelle de l'entreprise sur les dépenses liées à l'IA.
Un graphique joint au message d'Armstrong montrait que l'utilisation des jetons chez Coinbase avait récemment atteint l'un des plus hauts niveaux de l'histoire de l'entreprise, tandis que les dépenses en IA tombaient à près de la moitié de leur niveau record. « L'objectif n'est pas de supprimer l'utilisation. Il s'agit de construire l'infrastructure qui rend une croissance exponentielle durable », a-t-il écrit.
Cette volonté de maîtriser les coûts de l'IA intervient moins de deux mois après que Coinbase a licencié 14 % de ses effectifs, en partie parce que l'IA avait changé la façon dont les gens travaillent. Dans un message publié en mai, Armstrong avait déclaré que les ingénieurs de l'entreprise utilisaient l'IA pour « livrer en quelques jours ce qui prenait auparavant des semaines à une équipe ».
L'approche de Coinbase contraste avec la tendance générale du secteur qui consiste à imposer des plafonds d'utilisation aux employés afin de freiner la consommation effrénée de jetons. Des entreprises comme Uber et Amazon ont réévalué leurs investissements dans l'IA après avoir épuisé leurs budgets plus rapidement que prévu, selon des rapports. Une étude de Flexera publiée début 2026 a révélé qu'environ 3 organisations sur 5 ont reconnu que les dépenses excessives en IA avaient augmenté d'une année sur l'autre.
Armstrong a déclaré que tous les ingénieurs de Coinbase peuvent utiliser autant de jetons qu'ils le souhaitent, mais qu'ils peuvent voir leur consommation. L'entreprise attend « plus d'impact » de la part des employés qui dépensent davantage en IA, a-t-il écrit.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.