Un nouveau marché intermédiaire pour les API de modèles d'IA émerge, stimulé par une multiplication par 1 000 du volume quotidien de jetons en Chine, dépassant les 140 billions, créant ainsi un réseau de « vente en gros au détail » pour l'intelligence artificielle.
La commercialisation de l'intelligence artificielle crée une nouvelle classe d'intermédiaires, une couche de distribution où les unités de base de l'intelligence artificielle sont achetées, acheminées et revendues comme une marchandise. Ce marché de la « tokenomics » (économie des jetons) est porté par une explosion de plus de 1 000 fois des appels API quotidiens aux modèles d'IA en Chine, qui sont passés de 100 milliards début 2024 à plus de 140 billions en mars 2026, selon un rapport de Huayuan Securities. Cette nouvelle couche relie les créateurs de modèles en amont, tels que ByteDance et Alibaba, à un réseau fragmenté de développeurs et d'entreprises en aval, créant ainsi une infrastructure de liquidité pour le flux mondial de jetons d'IA.
« L'exploitation des jetons forme un nouveau marché intermédiaire, explorant un modèle de distribution de jetons qui relie les fabricants de grands modèles en amont aux développeurs, entreprises et particuliers en aval. Il s'agit essentiellement d'une infrastructure de liquidité pour le réseau mondial de jetons, de la vente en gros au détail », a déclaré l'analyste de Huayuan Securities, Chen Liangdong, dans le rapport.
Cette croissance est alimentée par l'ampleur de la consommation d'IA et la compétitivité croissante des modèles chinois. Au premier trimestre 2026, les modèles chinois ont dépassé leurs homologues américains en volume d'appels hebdomadaires sur OpenRouter, une plateforme de routage populaire, pour la première fois. Entre le 16 et le 22 février, les modèles chinois représentaient quatre des cinq principaux modèles en volume d'appels, contribuant à hauteur de 85,7 % du total. Des plateformes comme OpenRouter, dont le chiffre d'affaires annualisé a quintuplé pour dépasser les 50 millions de dollars depuis octobre 2025, et la plateforme domestique Silicon Mobility (硅基流动) construisent l'infrastructure centrale de ce commerce, offrant des API unifiées qui permettent aux développeurs d'accéder à des centaines de modèles différents via une clé unique.
Cette nouvelle économie des jetons reflète l'évolution d'autres piles technologiques, du cloud computing aux paiements cryptos, où l'infrastructure et la distribution finissent par capturer une valeur significative. Alors que la course à l'IA passe du processus de formation des modèles, gourmand en capital, au défi opérationnel de les faire fonctionner pour des milliards d'utilisateurs (un processus appelé « inférence »), le nouveau rempart concurrentiel devient le coût par réponse. Avec des modèles chinois comme le M2.5 de MiniMax offrant des coûts d'entrée de seulement 0,30 $ par million de jetons contre 5 $ pour un modèle comme Claude 4.6, l'incitation économique à acheminer efficacement les charges de travail crée une opportunité de plusieurs milliards de dollars pour ces nouveaux courtiers en IA.
La couche utilitaire pour l'intelligence
L'activité de distribution de jetons ne consiste pas simplement à revendre l'accès aux API avec une marge. Si une marge de revente de base, comme la prime de 5,5 % d'OpenRouter, constitue un modèle commercial fondamental, la véritable valeur est créée plus haut dans la pile. Les acteurs les plus sophistiqués développent des moteurs d'accélération d'inférence propriétaires pour réduire le coût réel de fonctionnement d'un modèle. Silicon Mobility, par exemple, affirme que ses technologies SiliconLLM et OneDiff peuvent améliorer la vitesse d'inférence des modèles de langage par 10, ce qui lui permet de proposer des appels API à un prix qui, selon elle, représente un dixième du coût standard de l'industrie.
Cette focalisation sur l'économie unitaire de l'inférence est cruciale alors que l'industrie s'oriente vers l'« IA agentique » (agentic AI) — des systèmes autonomes et permanents qui pourraient être 60 à 130 fois plus énergivores que les outils d'IA actuels, selon les recherches de Goldman Sachs. Ces agents, qui géreront des tâches allant des flux de travail en entreprise à la gestion d'appareils intelligents, entraîneront une consommation persistante de jetons d'IA, semblable à un service public. Les plateformes capables d'acheminer, de mesurer et de facturer cette consommation de manière fiable et à bas prix se positionnent comme les services publics essentiels de l'économie de l'IA. Cela rappelle la bataille de l'infrastructure dans les crypto-monnaies, où des entreprises comme Circle et Coinbase ne sont pas seulement en concurrence pour l'émission d'un stablecoin, mais aussi pour la construction des rails de paiement et de règlement (comme Arc et Base) qui contrôlent son flux.
Risques et récompenses dans la chaîne d'approvisionnement de l'IA
Pour les investisseurs, l'émergence de cette couche de distribution de jetons ouvre de nouvelles perspectives au-delà du simple soutien aux bâtisseurs de modèles de renom. Le rapport Huayuan identifie deux thèses d'investissement principales : soutenir les entreprises ayant des capacités de modèles supérieures comme Alibaba, Tencent et ByteDance, et soutenir les entreprises ayant de solides relations clients et des scénarios de consommation élevée, en particulier dans le marketing, le jeu vidéo et l'e-commerce. Des entreprises comme yodo (易点天下) et BlueFocus (蓝色光标) sont mises en avant pour leur potentiel à intégrer des services d'IA basés sur des jetons directement dans les flux de travail existants de leurs clients.
Cependant, le modèle n'est pas sans risques. La faible barrière technique à l'entrée pour la revente d'API de base invite à une concurrence intense, qui peut comprimer les marges. Les distributeurs sont également confrontés à des pressions de capital importantes, car ils doivent souvent pré-acheter de la capacité auprès des fournisseurs de modèles tout en offrant des conditions de paiement plus flexibles aux clients en aval, créant ainsi une exposition aux créances douteuses. Le risque le plus important est la dépendance vis-à-vis des fournisseurs de modèles en amont, qui contrôlent les prix et l'accès. Un changement soudain de politique d'un fournisseur majeur pourrait instantanément saper l'activité d'un distributeur, ce qui en fait un segment à forte croissance mais potentiellement volatil de la chaîne de valeur de l'IA.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.