Alibaba Group Holding Ltd. lanzó un modelo de inteligencia artificial diseñado para ayudar a los robots a percibir e interactuar con el mundo físico, uniéndose a una creciente carrera entre gigantes tecnológicos chinos y startups globales para construir "modelos del mundo" que van más allá de la IA tradicional basada en lenguaje.
El modelo, cuyo nombre específico y número de parámetros no fueron revelados, busca dotar a los robots de la capacidad de comprender entornos espaciales, relaciones entre objetos y dinámicas físicas, capacidades que durante mucho tiempo han eludido a los sistemas convencionales de visión-lenguaje-acción. El movimiento de Alibaba se produce cuando la industria de la IA está desplazando el enfoque desde los grandes modelos de lenguaje hacia los modelos del mundo, que pueden simular y predecir la física del mundo real.
"Los modelos del mundo representan la próxima frontera en inteligencia incorporada, llevando la IA de la generación de texto a la comprensión del mundo físico", declaró Wang Xiaogang, presidente de ACE ROBOTICS, en un comunicado a principios de este mes. El modelo de mundo Kairos de código abierto de su empresa encabezó recientemente cuatro puntos de referencia globales de inteligencia incorporada, incluida una puntuación del 96,1 % en el punto de referencia RoboTwin 2.0 de manipulación con dos brazos.
La entrada de Alibaba lo enfrenta a un campo en rápida expansión. El modelo Kairos-4B de ACE ROBOTICS, con solo 4 mil millones de parámetros, obtuvo una puntuación general de 9,30 en el punto de referencia WorldModelBench Robot, superando a sistemas con hasta 28 mil millones de parámetros de Nvidia Corp. y otros. World Labs de Fei-Fei Li, valorada en $1 mil millones, lanzó su aplicación Marble en noviembre, utilizando modelos del mundo para generar réplicas 3D interactivas de espacios a partir de indicaciones visuales o escritas.
El panorama competitivo abarca tanto a China como a Estados Unidos. Cosmos 3.0 de Nvidia, presentado este año, adopta una arquitectura unificada que integra el razonamiento visual, la generación de mundos y la predicción de acciones en un solo sistema, la misma filosofía de diseño que ACE ROBOTICS introdujo por primera vez en diciembre de 2025. El modelo de Alibaba deberá igualar o superar estos puntos de referencia para ganar tracción entre los desarrolladores de robótica y los fabricantes de hardware.
Para Alibaba, el modelo extiende sus ambiciones en IA más allá de la computación en la nube y el software empresarial. La compañía ha invertido fuertemente en su familia de grandes modelos de lenguaje Tongyi Qianwen (Qwen) y ahora está incursionando en la IA incorporada, un mercado que podría desbloquear nuevas fuentes de ingresos en automatización industrial, logística y comercio minorista inteligente. Alibaba Cloud, la división de computación en la nube de la compañía, sería la plataforma natural para ofrecer el modelo a clientes empresariales.
El mercado de IA para robótica representa una oportunidad significativa. ACE ROBOTICS ha recaudado varios cientos de millones de dólares en el primer semestre de 2026 de inversores como Geely Capital y Shenzhen Capital Group, lo que indica un fuerte apetito inversor por la inteligencia incorporada. La escala de Alibaba y su infraestructura en la nube existente podrían otorgarle una ventaja de distribución sobre rivales más pequeños, aunque el rendimiento de su modelo en relación con los puntos de referencia establecidos sigue sin verificarse.
Las acciones de Alibaba cotizaban al alza tras el anuncio. La incursión de la compañía en los modelos del mundo la posiciona para competir por una parte del creciente ecosistema de software robótico, donde la capacidad de generalizar en entornos no vistos (iluminación, diseños, objetos y ruido de sensores) sigue siendo el desafío técnico central. Sin embargo, sin resultados independientes de referencia, es demasiado pronto para evaluar si el modelo de Alibaba puede igualar las puntuaciones de generalización a nivel de escena de líderes como Kairos, que alcanzó un 89,0 en el punto de referencia LIBERO-Plus, o la eficiencia de parámetros de modelos como Kairos-4B.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.