Les ingénieurs n'écrivent plus de prompts pour l'IA. Ils conçoivent des boucles autonomes qui permettent aux agents de travailler sans intervention humaine — un changement qui a compressé quatre ères de codage distinctes en trois ans.
Les ingénieurs n'écrivent plus de prompts pour l'IA. Ils conçoivent des boucles autonomes qui permettent aux agents de travailler sans intervention humaine — un changement qui a compressé quatre ères de codage distinctes en trois ans.

Les ingénieurs n'écrivent plus de prompts pour l'IA. Ils conçoivent des boucles autonomes qui permettent aux agents de travailler sans intervention humaine — un changement qui a compressé quatre ères de codage distinctes en trois ans.
Jensen Huang, de Nvidia, a déclaré que l'écriture de prompts est obsolète, marquant l'arrivée du Loop Engineering — une méthode où les ingénieurs conçoivent des systèmes de rétroaction autonomes au lieu de taper des instructions, compressant quatre ères distinctes de codage IA en trois ans.
« Plus personne n'écrit de prompts », a déclaré Huang. « Le nouveau métier consiste à écrire et à gérer des boucles. » Boris Cherny, créateur de Claude Code d'Anthropic, a décrit une évolution similaire : « Je n'écris plus de prompts pour Claude. J'ai des boucles qui indiquent à Claude quoi faire et décident de la suite. »
Claude Code propose désormais trois primitives de boucle — /loop pour les cycles temporisés, /goal pour l'exécution pilotée par objectif jusqu'à validation réussie, et /schedule pour les exécutions cloud sans surveillance. La commande /goal impose une règle architecturale critique : le modèle qui écrit le code ne peut pas vérifier sa propre sortie. Anthropic achemine la génération de code via son grand modèle tandis qu'un modèle Haiku distinct et plus petit effectue les tests d'acceptation. Codex d'OpenAI adopte une approche parallèle, lançant jusqu'à huit agents dans des environnements cloud isolés, chacun travaillant sur une sous-tâche avant de fusionner les résultats.
Le passage des prompts aux boucles a des implications directes sur les dépenses d'infrastructure IA. Les systèmes à boucles autonomes consomment plus de tokens par tâche que les workflows à prompt unique, augmentant la demande en calcul d'inférence. Nvidia devrait en bénéficier en tant que principal fournisseur de GPU alimentant ces boucles multi-agents, tandis que les fournisseurs cloud — Amazon Web Services, Microsoft Azure et Google Cloud — se disputent la charge de travail supplémentaire. Anthropic, qui a déposé une demande d'introduction en bourse la semaine dernière, a intégré l'architecture de boucle directement dans Claude Code, accélérant potentiellement l'adoption par les entreprises et les revenus récurrents liés à l'API.
L'évolution en quatre étapes trace une trajectoire claire. De 2023 à 2024, l'Ingénierie des Prompts dominait — les utilisateurs élaboraient des instructions précises pour chaque interaction, et la qualité des résultats dépendait entièrement du savoir-faire en matière de prompts. Autour de 2024 à 2025, l'Ingénierie du Contexte a déplacé l'attention de « comment demander » vers « quoi montrer au modèle », alors que les pipelines RAG et l'intégration de codebase élargissaient les informations disponibles pour chaque requête. De 2025 à 2026, l'Ingénierie des Harnais a émergé, donnant aux agents accès à des outils, des API et des environnements d'exécution réels. Le Loop Engineering, quatrième et actuelle phase, boucle la boucle en permettant aux agents de fonctionner de manière autonome — planifier, exécuter, vérifier et réessayer sans intervention humaine à chaque étape.
L'Architecture Derrière la Boucle
L'idée centrale est la séparation des préoccupations. Dans le système /goal de Claude Code, un modèle génère du code tandis qu'un vérificateur indépendant — un modèle distinct sans visibilité sur le raisonnement du générateur — teste la sortie. Cela évite le problème de « noter son propre devoir » qui affecte les workflows à modèle unique. Le vérificateur rejette les sorties qui semblent plausibles mais échouent aux tests fonctionnels, forçant le générateur à revenir dans la boucle.
Addy Osmani, responsable technique chez Google et créateur du terme Loop Engineering, s'est montré prudent. « Encore tôt. Je réserve mon jugement. Il faut être très attentif aux coûts en tokens », a-t-il écrit. L'avertissement n'est pas théorique : les systèmes à boucles dépourvus de conditions d'arrêt strictes — limites de tokens, plafonds d'itérations ou bornes temporelles — peuvent tourner jusqu'à épuisement des budgets ou atteinte des limites de taux d'API.
Le Problème de la « Dette de Compréhension »
Andrej Karpathy, s'exprimant lors de la conférence AI Ascent 2026 de Sequoia Capital, a offert un contrepoint à l'enthousiasme pour l'automatisation. « Vous pouvez déléguer votre réflexion, mais vous ne pouvez pas déléguer votre compréhension », a-t-il déclaré, citant une phrase à laquelle il dit être revenu à maintes reprises. Alors que les boucles fusionnent le code plus vite que les humains ne peuvent le relire, les ingénieurs accumulent une « dette de compréhension » — des systèmes qu'aucun membre de l'équipe ne comprend pleinement. Le coût pratique n'est pas la facture de tokens, a suggéré Karpathy, mais le jour où quelqu'un doit déboguer un système que personne n'a lu.
Cherny, qui a déclaré avoir supprimé son IDE en novembre 2025 et gère désormais des centaines d'agents depuis son téléphone, a reconnu le compromis. Les agents incapables de résoudre des problèmes remontent jusqu'à sa boîte de réception. Son workflow représente le point d'aboutissement de la méthode des boucles : les humains écrivent les règles et prennent les décisions ; les agents exécutent tout le reste.
Le fondement académique des systèmes à boucles remonte au framework ReAct (Raisonner + Agir) de Yao Shunyu en 2022, qui a reçu une désignation Orale ICLR 2023 et accumulé des dizaines de milliers de citations. ReAct a formalisé le cycle penser-agir-observer qui sous-tend chaque boucle d'agent moderne. Les travaux ultérieurs — le mécanisme de rétroaction d'erreur de Reflexion, la recherche multi-chemins de Tree of Thoughts, et une cascade d'articles sur les agents utilisant des outils — ont convergé vers la discipline d'ingénierie désormais appelée Loop Engineering.
Pour les investisseurs, l'indicateur clé est le coût par modification acceptée. Si le taux d'acceptation d'une boucle tombe en dessous de 50 %, le système perd de l'argent — l'humain effectue le travail de révision que la boucle était censée automatiser. Alors que les entreprises déploient des architectures de boucles à grande échelle, les gagnants seront ceux qui minimisent le gaspillage de tokens tout en maximisant le débit autonome.
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.