AWS ajoute près de 4 GW de capacité pour le "Cloud axé sur l'IA"
Amazon Web Services étend agressivement son infrastructure pour alimenter ce qu'elle appelle un "cloud axé sur l'IA", où les capacités d'inférence sont intégrées à chaque application. S'exprimant lors du Sommet IA de Cisco le 3 février 2026, un dirigeant d'AWS a révélé que l'entreprise avait ajouté "un peu moins de 4 GW" de nouvelle capacité de centre de données au cours de la dernière année. Cet investissement en capital significatif souligne la stratégie de l'entreprise visant à fournir la puissance brute nécessaire aux entreprises pour faire passer les modèles d'IA de l'expérimentation à la production.
Cette expansion est complétée par une stratégie de silicium personnalisé visant à améliorer la rentabilité. Tout en confirmant son partenariat avec NVIDIA, AWS développe ses propres puces, comme Trainium, pour offrir de meilleures alternatives en termes de rapport prix-performance. L'entreprise a déclaré que son approche historique est de répercuter les économies sur les clients, visant à maintenir les marges tout en baissant les prix pour alimenter un cycle de croissance. Ce plan matériel à long terme comprend un cycle de développement de puces de 18 à 24 mois et le maintien en ligne des serveurs de générations plus anciennes comme l'A100, pour lesquels la demande reste élevée.
De nouvelles balises ciblent la sécurité et la souveraineté de l'IA d'entreprise
AWS cible directement les principales craintes qui freinent l'adoption de l'IA d'entreprise : la sécurité, la mise à l'échelle et la souveraineté des données. Le dirigeant a noté que de nombreuses entreprises ont du mal à dépasser les preuves de concept en raison des risques associés aux "flux de travail agentiques" autonomes, y compris les agents prenant des actions involontaires ou créant des vulnérabilités de sécurité. Pour résoudre ce problème, AWS se concentre sur la fourniture de "blocs de construction" et de balises qui permettent aux équipes d'entreprise d'opérer l'IA en toute sécurité et à grande échelle.
Pour répondre aux préoccupations géopolitiques croissantes concernant le contrôle des données, AWS a récemment lancé son Cloud Souverain de l'UE. Le service fonctionne comme une filiale entièrement séparée, constituée en UE avec un conseil d'administration indépendant, garantissant que toutes les données et métadonnées des clients restent au sein de l'Union Européenne. Un dirigeant d'AWS a expliqué qu'il s'agissait d'une réponse directe aux clients qui demandaient : "que se passerait-il si le gouvernement américain décidait de me couper l'accès ?" En créant une région déconnectée et gouvernée indépendamment, AWS vise à établir la confiance fondamentale requise pour que les industries réglementées et les organismes gouvernementaux adoptent ses services d'IA.
Le codage IA affiche des gains de 100x tandis que les systèmes hérités restent un goulot d'étranglement
Alors que la stratégie d'AWS s'attaque à l'infrastructure et à la sécurité, l'entreprise reconnaît que le succès ultime de l'IA d'entreprise dépend de l'intégration avec des systèmes hérités complexes. La firme constate une "accélération massive" dans le développement de logiciels assistés par l'IA, certaines équipes atteignant une "amélioration de 100x" sur les nouveaux projets construits de toutes pièces avec des outils d'IA. Ces gains soulignent le potentiel transformateur pour les entreprises qui peuvent adopter avec succès le nouveau paradigme.
Cependant, le dirigeant a concédé que le plus grand écart de déploiement reste dans les grandes bases de code héritées distribuées, qui agissent comme un frein à l'innovation. Cela reflète un défi industriel plus large où les architectures de données obsolètes, ou "dette de données", empêchent les entreprises de capitaliser sur l'IA moderne. Bien qu'AWS n'ait pas encore atteint la même ampleur d'accélérations pour ces environnements hérités, il anticipe des progrès significatifs "au cours des six à neuf prochains mois", signalant que la résolution de ce problème d'intégration complexe est une priorité stratégique absolue.