L'hallucination de l'IA a une réponse à 100 M$ — et elle vient de deux anciens chercheurs de Microsoft.
L'hallucination de l'IA a une réponse à 100 M$ — et elle vient de deux anciens chercheurs de Microsoft.

L'hallucination de l'IA a une réponse à 100 M$ — et elle vient de deux anciens chercheurs de Microsoft.
Scaled Cognition, une startup d'IA fondée par deux anciens chercheurs de Microsoft, a levé 100 millions de dollars en financement de série A pour commercialiser une architecture de modèle conçue pour éliminer les hallucinations dans les applications d'IA destinées aux entreprises.
« Ces modèles de pointe sont comme des génies schizophrènes : ils peuvent créer des réponses incroyables, puis vous posez la même question et obtenez une réponse complètement différente qui pourrait même ne pas être correcte », a déclaré Dan Roth, directeur général de Scaled Cognition.
Le modèle Agentic Pretrained Transformer, ou APT, prédit des objets structurés tels que des programmes et des requêtes système parallèlement aux flux de jetons traditionnels, une rupture avec les grands modèles de langage qui optimisent la plausibilité linguistique sans vérifier l'exactitude factuelle. Cette approche fonctionne mieux dans les domaines d'entreprise restreints où l'éventail des requêtes possibles est limité, a précisé Roth.
La valorisation de 750 millions de dollars et le soutien de Khosla Ventures, l'un des investisseurs les plus éminents de la Silicon Valley dans le domaine de l'IA, témoignent d'une demande croissante pour une infrastructure d'IA axée sur la fiabilité. Genesys, une plateforme d'expérience client basée sur le cloud, utilise déjà l'APT au sein de sa plateforme Genesys Cloud pour les capacités d'agents virtuels.
Les grands modèles de langage d'OpenAI, d'Anthropic et de Google ont démontré des capacités dans diverses tâches de connaissances générales, obtenant des scores supérieurs à 90 % sur des références telles que MMLU et HumanEval. Mais ces mêmes modèles peuvent produire des réponses qui semblent confiantes mais sont factuellement erronées — un défaut qui devient inacceptable dans les secteurs réglementés où une seule erreur de chiffre dans un numéro d'ordonnance pourrait entraîner une responsabilité juridique. « Une seule erreur peut avoir des conséquences désastreuses », a déclaré Roth, décrivant un agent de santé automatisé qui « ne peut pas se permettre d'halluciner ne serait-ce qu'un seul chiffre dans un numéro d'ordonnance. »
L'architecture de Scaled Cognition répond à ce problème en orientant différentes parties d'une requête vers le système le plus approprié, en fonction du besoin de fiabilité, selon Vinod Khosla, associé fondateur de Khosla Ventures. « C'est un modèle distinct pour les parties du système qui nécessitent une fiabilité réelle et qui ne peuvent pas être sujettes à des hallucinations », a-t-il déclaré.
Le défi de la vérification des résultats générés par l'IA à grande échelle constitue un obstacle majeur à l'adoption par les entreprises. Alors qu'un humain peut facilement vérifier quelques lignes de code, vérifier des centaines de milliers de lignes générées par l'IA est pratiquement impossible, a déclaré Ion Stoica, professeur d'informatique à l'Université de Californie à Berkeley et cofondateur de Databricks. « Cela fait de la fiabilité programmatique une nécessité absolue pour les systèmes d'entreprise », a-t-il ajouté.
Scaled Cognition prévoit d'utiliser ce financement pour élargir son équipe de recherche et accélérer les déploiements en entreprise. La startup, basée à Mountain View, en Californie, a été fondée par Roth et Dan Klein, chercheur en traitement du langage naturel et professeur d'IA à l'UC Berkeley. Le duo avait précédemment vendu leur startup Semantic Machines à Microsoft en 2018. La société cible l'expérience client comme premier marché, un segment où les agents basés sur l'IA gèrent des millions d'interactions chaque jour et où la précision affecte directement la fidélisation des clients et la conformité réglementaire. L'adoption de l'APT par Genesys offre une première preuve de la viabilité commerciale de la technologie.
Pour les investisseurs, le pari sur Scaled Cognition reflète une thèse plus large : à mesure que les entreprises dépassent le stade de l'expérimentation avec l'IA générative, la capacité à faire confiance aux résultats des modèles devient un avantage concurrentiel. Les entreprises qui résoudront le problème de la fiabilité pourraient capturer une part disproportionnée du marché de l'IA d'entreprise, que Gartner estime à 300 milliards de dollars de dépenses d'ici 2027. L'approche de Scaled Cognition, centrée sur des domaines restreints, pourrait limiter son marché adressable total par rapport aux modèles polyvalents, mais la prime que les entreprises sont prêtes à payer pour des résultats prouvés corrects pourrait compenser cette contrainte.
Cet article est fourni à titre d'information uniquement et ne constitue pas un conseil en investissement.