Cloudflare fixe un délai à septembre 2026 pour la séparation des robots d'IA

Cloudflare oblige les entreprises d'IA à choisir entre l'indexation pour la recherche et l'entraînement des modèles sur les sites web financés par la publicité, un changement qui pourrait remodeler la manière dont 200 milliards de dollars de contenu numérique sont accessibles et monétisés.

Cloudflare bloquera par défaut les robots web à usage mixte sur les pages financées par la publicité à compter du 15 septembre 2026, obligeant les entreprises d'IA à séparer l'indexation des moteurs de recherche de l'entraînement des modèles, ou à payer les éditeurs pour y accéder. Cette politique cible les robots qui combinent recherche traditionnelle, utilisation d'agents d'IA et entraînement de modèles en un seul bot.

« L'écrasante majorité de nos clients souhaitent que l'IA interagisse avec leur contenu », a déclaré Stephanie Cohen, directrice de la stratégie chez Cloudflare. « Cependant, pour ceux qui dépendent de la publicité et des abonnements, le défi est distinct : ils veulent rester découvrables sans être contraints de donner gratuitement leur travail. »

Cette règle par défaut s'applique aux nouveaux clients de Cloudflare, aux nouveaux sites créés par les clients existants, ainsi qu'à tous les utilisateurs gratuits actuels, avec la possibilité d'ajuster les paramètres via leur tableau de bord. Cloudflare fait également évoluer son expérience Paiement par Crawl vers un modèle plus large de Paiement à l'Usage, où les éditeurs reçoivent une compensation lorsque leur contenu apparaît dans les résultats de recherche IA ou lorsqu'un agent achète des informations premium. Ceramic.ai et You.com sont les premiers partenaires du programme. Les données de Cloudflare montrent que plus de 50 % du trafic des robots d'IA consiste à récupérer des pages qui n'ont pas changé, gaspillant la bande passante pour les éditeurs comme pour les entreprises d'IA.

Cette initiative répond à une rupture structurelle du modèle économique du web. Les moteurs de réponse IA extraient des informations et fournissent des résumés sans rediriger les utilisateurs vers la source d'origine. Selon les données d'Adexchanger, Anthropic parcourt 11 122 pages pour chaque recommandation qu'il renvoie, tandis que les recommandations issues des chatbots IA génèrent environ 96 % de trafic en moins que la recherche traditionnelle, et les utilisateurs ne cliquent sur les sources citées qu'environ 1 % du temps. Les éditeurs ont perdu entre 20 % et 90 % de leur trafic et de leurs revenus au cours de l'année écoulée, créant une urgence pour un nouveau cadre de compensation.

Cloudflare a spécifiquement mentionné Google, qui a accès à environ deux fois plus d'informations que les autres entreprises d'IA, car le géant de la recherche rend difficile pour les clients de rester découvrables sans être utilisés pour l'entraînement de l'IA. Google propose un robot appelé Google Extended qui permet aux propriétaires de sites de refuser l'utilisation par l'IA, mais son robot phare Googlebot explore le web pour la Recherche, y compris les fonctionnalités d'IA comme AI Overviews et AI Mode. « Maintenant que la majorité du trafic sur Internet est non humaine, nous devons aller plus loin et agir plus rapidement pour qu'un écosystème durable puisse émerger », a déclaré Matthew Prince, cofondateur et PDG de Cloudflare, en annonçant cette politique.

Le fournisseur d'infrastructure n'est pas le seul à cibler l'opportunité de licence de contenu. TollBit, ProRata et Microsoft sont également entrés dans cet espace, chacun avec une approche différente quant à qui contrôle les conditions. Really Simple Licensing milite pour un standard ouvert avant qu'une entreprise unique n'impose ses propres règles. Près de 70 % des éditeurs s'attendent à ce que les accords de licence IA génèrent au moins quelques revenus au cours des trois prochaines années, selon Press Gazette, bien que la plupart le considèrent comme une source mineure aujourd'hui.

Cloudflare prévoit de lancer un tableau de bord Attribution Business Insights montrant comment les robots d'IA accèdent au contenu, où ce contenu est cité et combien de trafic humain les différentes plateformes d'IA génèrent en retour. Cet outil rendrait pour la première fois mesurable l'optimisation pour les moteurs de réponse — la pratique consistant à rendre le contenu trouvable par l'IA plutôt que seulement par les moteurs de recherche.

Les risques de l'approche de Cloudflare sont significatifs. L'entreprise pourrait potentiellement contrôler l'identification des agents, la couche d'autorisations, la mesure d'utilisation et l'infrastructure de paiement, concentrant le pouvoir en un seul intermédiaire. L'attribution reste également non résolue : une réponse générée par l'IA peut combiner des dizaines de sources ou paraphraser une idée originale sans afficher de citation. L'accès payant pourrait également renforcer les avantages existants des plateformes d'IA bien financées tout en rendant le web plus coûteux pour les startups, les chercheurs et les développeurs open source.

Cloudflare se négocie à environ 45 fois les bénéfices à terme, reflétant les attentes du marché selon lesquelles sa position d'infrastructure se traduit par de nouvelles sources de revenus. Le modèle Paiement à l'Usage de l'entreprise, s'il est largement adopté, pourrait ajouter une ligne de revenus récurrents liée à la consommation de contenu par l'IA — un modèle économique qu'aucun fournisseur d'infrastructure cloud n'a encore prouvé à grande échelle.

Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.