Le nouveau modèle de milieu de gamme d'Anthropic offre des performances agentiques proches du modèle phare pour environ la moitié du coût.
Anthropic a publié Claude Sonnet 5 mardi, un modèle d'IA de milieu de gamme qui égalise son modèle phare Opus 4.8 sur les benchmarks de travail cognitif tout en coûtant 60 % de moins par token, intensifiant la guerre des prix dans l'IA d'entreprise alors que l'entreprise accélère vers son introduction en Bourse.
"Avec Claude Sonnet 5, les agents respectent le plan, suivent nos conventions et livrent des modifications multi-étapes propres, le tout à un coût efficient", a déclaré Sualeh Asif, cofondateur de Cursor, un éditeur de code alimenté par l'IA.
Sonnet 5 obtient 63,2 % sur SWE-bench Pro, un benchmark de codage agentique, contre 58,1 % pour Sonnet 4.6 et à portée des 69,2 % d'Opus 4.8. Sur GDPval-AA v2, une évaluation de travail cognitif, il a surpassé le modèle phare — 1 618 contre 1 615 — tandis que les prix débutent à 2 $ par million de tokens en entrée et 10 $ par million de tokens en sortie jusqu'au 31 août, contre 5 $ et 25 $ pour Opus 4.8. Le modèle utilise un tokenizer mis à jour qui peut augmenter l'entrée de 1,0 à 1,35 fois selon le contenu, un changement qu'Anthropic a déclaré être calibré pour être "à peu près neutre en termes de coût" pendant la période d'introduction.
Ce lancement intervient alors qu'Anthropic se précipite vers une introduction en Bourse attendue plus tard cette année, après avoir déposé confidentiellement son S-1 le 1er juin. La société a déclaré un rythme de revenus de 47 milliards de dollars après une série H de 65 milliards de dollars en mai à une valorisation de 965 milliards de dollars, faisant de la capacité du niveau Sonnet à convertir l'utilisation expérimentale en revenus à l'échelle de la production une mesure critique pour les investisseurs des marchés publics.
La capacité agentique devient la nouvelle référence
L'accent mis par Sonnet 5 sur l'exécution autonome des tâches — planification, utilisation d'outils et achèvement de flux de travail multi-étapes — reflète un changement plus large dans l'industrie de l'IA. OpenAI a lancé GPT-5.6 Sol en avant-première la semaine dernière avec des capacités de sous-agent similaires, et Gemini 3.5 Flash de Google, publié en mai, a été présenté comme un outil agentique nécessitant un minimum d'intervention humaine. Le différenciateur n'est plus de savoir quelle entreprise peut construire des modèles agentiques, mais laquelle peut les livrer assez à bas prix pour un déploiement en production à grande échelle.
Les premiers partenaires d'accès ont rapporté que Sonnet 5 termine des tâches complexes là où les modèles précédents calaient. Daniel Shepard, ingénieur senior chez Zapier, a déclaré que le modèle a réalisé un travail d'automatisation en deux parties — mise à jour des niveaux de comptes Salesforce et envoi d'une annonce de lancement aux contacts d'entreprise — qui "avait l'habitude de caler à mi-parcours" avec les versions précédentes. Sur Terminal-Bench 2.1, une autre évaluation de codage, Sonnet 5 a obtenu 80,4 % contre 67,0 % pour Sonnet 4.6 et 82,7 % pour Opus 4.8.
Compromis en matière de sécurité et récit d'introduction en Bourse
Anthropic a déclaré que Sonnet 5 présente des taux d'hallucination et de sycophancie inférieurs à ceux de son prédécesseur et qu'il est plus résistant aux attaques par injection de prompts. Cependant, sur une évaluation de développement d'exploit pour Firefox 147 créée avec Mozilla, Sonnet 5 a montré un taux de réussite partielle de 13,2 %, contre 8,8 % pour Sonnet 4.6, bien qu'aucun des deux modèles n'ait produit d'exploit fonctionnel. Opus 4.8 a obtenu 68,8 % et le Mythos 5 restreint a obtenu 88,4 %. Anthropic a lancé Sonnet 5 avec des protections cybersécuritaires en temps réel activées par défaut, reflétant les protections d'Opus 4.7 et 4.8.
La stratégie de prix sert également un double objectif pour le récit d'introduction en Bourse d'Anthropic. L'entreprise doit démontrer que ses modèles moins chers peuvent générer des revenus API récurrents à volume élevé provenant de milliers de clients d'entreprise — et pas seulement une utilisation expérimentale de la part des développeurs. Gil Luria, responsable de la recherche technologique chez D.A. Davidson, a déclaré à CNBC que si Anthropic "semble avoir une longueur d'avance dans les modèles d'IA de pointe, une grande partie de leur utilisation actuelle concerne des essais et des expérimentations, ce qui pourrait ne pas être durable."
Hier encore, le gouverneur de Californie Gavin Newsom a annoncé un partenariat fournissant Claude à toutes les agences d'État avec une remise de 50 % et une formation gratuite de la main-d'œuvre — le type d'adoption institutionnelle durable qui pourrait ancrer des revenus récurrents. Anthropic fait face à la concurrence d'OpenAI, qui a levé 122 milliards de dollars en mars à une valorisation de 852 milliards de dollars et poursuit sa propre introduction en Bourse, ainsi que de Google, Meta et des startups asiatiques d'IA bien financées qui développent des capacités similaires.
Les actions d'Anthropic ne sont pas encore négociées publiquement. Le dépôt S-1 de la société, lorsqu'il sera rendu public, fera l'objet d'un examen minutieux pour déterminer si le niveau Sonnet — moins cher mais à volume élevé — ou le niveau Opus — coûteux mais à marge élevée — génère l'essentiel du bénéfice brut. Comme l'a déclaré Harrison Rolfes, analyste chez PitchBook, à CNBC, la fenêtre d'introduction en Bourse de 2026 "devient soit le cycle d'introduction en Bourse le plus important depuis l'ère dot-com, soit la leçon la plus coûteuse en matière de récit contre fondamentaux que les marchés publics aient jamais enseignée."
Cet article est fourni à titre informatif uniquement et ne constitue pas un conseil en investissement.