SenseTime (00020.HK) s'attaque au coût élevé des opérations d'intelligence artificielle avec un nouveau modèle qui réduit la consommation de jetons de 60 %, une initiative visant à améliorer l'efficacité sur un marché concurrentiel.
La société a annoncé le déploiement officiel de son modèle d'agent multimodal léger de nouvelle génération, « SenseNova 6.7 Flash-Lite ». Selon l'annonce, l'architecture du modèle réalise un bond en avant dans les capacités des agents avec une taille de paramètres réduite, diminuant considérablement la consommation de jetons lors de l'inférence, en particulier dans les scénarios de recherche d'informations.
Basé sur une architecture multimodale native, le modèle peut interpréter directement les mises en page complexes de pages Web, les structures de documents et les graphiques financiers, une différence clé par rapport aux modèles nécessitant une couche intermédiaire de conversion image-texte. Cela lui permet de mieux gérer les tâches complexes à longue chaîne telles que l'analyse de données, la recherche approfondie et la génération de présentations. La réduction de 60 % de l'utilisation des jetons est comparée aux modèles d'agents textuels uniquement effectuant des tâches similaires.
La recherche d'une plus grande efficacité répond à un problème critique de l'industrie de l'IA : le coût élevé du déploiement de modèles à grande échelle. En abaissant la consommation de jetons, SenseTime pourrait rendre ses solutions d'entreprise plus attractives pour les clients, se positionnant ainsi pour mieux rivaliser avec des acteurs plus importants comme OpenAI, Google et Anthropic. Cette avancée technologique pourrait renforcer l'avantage concurrentiel de SenseTime et sera probablement perçue positivement par les investisseurs comme un moteur potentiel de croissance des revenus.
Cet article est à titre informatif uniquement et ne constitue pas un conseil en investissement.