L'offre d'infrastructure IA est devenue si tendue que même les plus grandes entreprises technologiques du monde rationnent l'accès à leurs modèles les plus avancés.
L'offre d'infrastructure IA est devenue si tendue que même les plus grandes entreprises technologiques du monde rationnent l'accès à leurs modèles les plus avancés.

Alphabet Inc., la société mère de Google, a restreint l'accès de Meta Platforms Inc. à ses modèles d'intelligence artificielle Gemini plus tôt cette année, un signe que la demande en puissance de calcul pour l'IA commence à dépasser l'offre, même parmi les hyperscalers construisant leur propre infrastructure.
Google a informé Meta vers le mois de mars qu'elle ne pouvait pas satisfaire l'intégralité de la demande de capacité de calcul pour Gemini émanant du réseau social, selon un rapport du Financial Times. Ces restrictions ont perturbé plusieurs projets internes d'IA chez Meta et retardé leurs échéances, indique le rapport, Meta ayant été plus affectée que les autres clients de Google Cloud en raison de sa demande exceptionnellement élevée pour les modèles Gemini.
« Meta a été plus affectée que les autres clients de Google Cloud en raison de sa demande exceptionnellement élevée pour les modèles Gemini », a rapporté le Financial Times, citant des personnes proches du dossier. Ni Google ni Meta n'ont commenté publiquement ces restrictions.
Meta utilisait Gemini dans diverses applications, notamment la modération de contenu, la détection des arnaques, le service client, les outils publicitaires et le développement logiciel. L'entreprise s'est tournée vers Gemini parce qu'il surpassait certains de ses propres modèles d'IA sur certaines tâches, selon le rapport. En réponse aux contraintes de capacité, Meta a encouragé ses employés à utiliser les tokens d'IA — une mesure de la quantité de puissance de calcul consommée par les applications d'IA — de manière plus efficace.
Ces restrictions mettent en lumière un défi plus large qui frappe l'industrie de l'IA. Les entreprises du secteur technologique investissent des milliards de dollars dans les puces, les serveurs et les centres de données, mais la demande en informatique générative continue de dépasser l'offre disponible. Google a précédemment reconnu que sa capacité de calcul limitée a freiné la croissance de son activité cloud, malgré une forte demande des clients.
La migration de Meta vers ses modèles internes
Meta a commencé à transférer certaines de ses charges de travail de Gemini vers son propre modèle Muse Spark, réduisant ainsi sa dépendance vis-à-vis des fournisseurs d'IA externes. L'entreprise continue d'investir des milliards de dollars dans la construction de sa propre infrastructure IA, une stratégie qui pourrait la protéger de futures contraintes de capacité chez ses partenaires cloud.
Cet épisode souligne un changement structurel : l'accès à l'infrastructure IA devient aussi stratégiquement important que les modèles eux-mêmes. La puissance de calcul — mesurée en tokens, en heures GPU et en capacité des centres de données — est devenue l'une des ressources les plus précieuses et les plus rares de l'industrie.
Implications pour les investisseurs
Pour les investisseurs, le déséquilibre entre l'offre et la demande en matière de calcul IA soutient une perspective haussière pour les fournisseurs de cloud hyperscalers tels qu'Alphabet, Microsoft Corp. et Amazon.com Inc., ainsi que pour les fabricants de puces IA, notamment Nvidia Corp. et Advanced Micro Devices Inc. Les récits de dépenses d'investissement s'intensifieront à mesure que les entreprises se précipitent pour accroître leur capacité. Cependant, ces contraintes signalent également une hausse des coûts et une pression potentielle sur les marges pour les entreprises incapables d'obtenir une puissance de calcul suffisante, faisant de l'intégration verticale — construction de puces et de modèles propriétaires — un avantage concurrentiel de plus en plus important.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.