SenseTime (00020.HK) está abordando el alto costo de las operaciones de inteligencia artificial con un nuevo modelo que reduce el consumo de tokens en un 60 por ciento, una medida destinada a mejorar la eficiencia en un mercado competitivo.
La empresa anunció el despliegue oficial de su modelo de agente multimodal ligero de nueva generación, 'SenseNova 6.7 Flash-Lite'. Según el anuncio, la arquitectura del modelo logra un salto en las capacidades de los agentes con un tamaño de parámetros más pequeño, reduciendo sustancialmente el consumo de tokens durante la inferencia, particularmente en escenarios de búsqueda de información.
Construido sobre una arquitectura multimodal nativa, el modelo puede interpretar directamente diseños de páginas web complejos, estructuras de documentos y gráficos financieros, una diferencia clave con respecto a los modelos que requieren una capa de conversión intermedia de imagen a texto. Esto le permite manejar mejor tareas complejas de cadena larga, como el análisis de datos, la investigación profunda y la generación de presentaciones. La reducción del 60% en el uso de tokens se mide frente a modelos de agentes exclusivos de texto que realizan tareas similares.
El impulso por una mayor eficiencia aborda un problema crítico en la industria de la IA: el alto costo de desplegar modelos a gran escala. Al reducir el consumo de tokens, SenseTime podría hacer que sus soluciones empresariales sean más atractivas para los clientes, posicionándose para competir mejor con actores más grandes como OpenAI, Google y Anthropic. Este avance tecnológico podría fortalecer la ventaja competitiva de SenseTime y es probable que los inversores lo vean positivamente como un motor potencial para el crecimiento de los ingresos.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.