La familia de modelos de IA Claude de Anthropic ya está disponible de forma general en Microsoft Azure, ejecutándose en sistemas GPU Nvidia Blackwell Ultra GB300 — el primer despliegue de la startup en hardware de Nvidia y un hito en la alianza tripartita anunciada en noviembre pasado.
"Este despliegue está diseñado para mejorar el rendimiento y la eficiencia de inferencia, al tiempo que reduce el costo total de propiedad para cargas de trabajo empresariales de IA", declaró Anthropic en un comunicado el lunes. Los modelos se ejecutan en sistemas Nvidia GB300 NVL72 con redes Quantum-X800 InfiniBand, lo que permite a los clientes desplegar agentes autónomos que pueden operar en distintas funciones empresariales.
La oferta inicial incluye Claude Opus 4.8 y Claude Haiku 4, y Anthropic señaló que seguirá ampliando la disponibilidad de modelos en Azure. Microsoft gestiona la facturación, la autenticación y la gobernanza a través de su plataforma Foundry, reduciendo la barrera de integración para empresas que ya están en el ecosistema Azure. Los sistemas GB300 NVL72 combinan una CPU ARM de 72 núcleos con la GPU Blackwell Ultra, una configuración que Nvidia también utiliza en su recién anunciado DGX Station de escritorio — una estación de trabajo de entre $90,000 y $100,000 con 748 GB de memoria unificada capaz de ejecutar localmente modelos de 70 mil millones de parámetros.
El énfasis técnico recae en las cargas de trabajo de agentes autónomos. A través de habilidades de agentes verificadas por Nvidia, las empresas pueden equipar a los agentes Claude con capacidades específicas de dominio — integrando efectivamente agentes de IA en flujos de trabajo operativos centrales en lugar de tratarlos como herramientas independientes. El Diseño de Referencia de Espacio de Trabajo Seguro para Agentes de Nvidia proporciona controles a nivel de infraestructura para identidad, redes, credenciales y políticas de ejecución, un diseño dirigido a industrias reguladas como finanzas, salud y servicios legales, donde los requisitos de cumplimiento de datos son más estrictos.
El lanzamiento comercial convierte en un producto tangible el acuerdo marco de noviembre de 2025 entre Microsoft, Nvidia y Anthropic. Para Nvidia, el despliegue valida a Blackwell Ultra GB300 como plataforma de inferencia empresarial en un momento en que los hiperescaladores compiten por asegurar capacidad de GPU. Microsoft obtiene un canal de distribución empresarial exclusivo para Claude en Azure, fortaleciendo su posición frente a Amazon Web Services y Google Cloud en el mercado de agentes de IA. Para Anthropic, la alianza con Azure proporciona una vía de distribución que compite directamente con la relación de OpenAI con Microsoft — aunque OpenAI sigue siendo la carga de trabajo dominante en la infraestructura de IA de Azure.
El mercado de agentes empresariales es el premio. A medida que las empresas pasan de experimentar con modelos de lenguaje de gran escala a desplegar sistemas de producción que automatizan tareas empresariales complejas, la capa de infraestructura que soporta a esos agentes se convierte en un cuello de botella estratégico. Los sistemas GB300 de Nvidia, con su arquitectura de memoria unificada y redes de alto ancho de banda, están diseñados para manejar las demandas de inferencia de arquitecturas multiagente donde subagentes especializados se coordinan entre departamentos. Bit Origin Ltd, una firma emergente de infraestructura de IA, adquirió recientemente 16 servidores Nvidia Blackwell B300 por aproximadamente $11 millones, y espera que generen alrededor de $360,000 en ingresos mensuales — un dato que ilustra el potencial de ingresos de la infraestructura basada en Blackwell.
Las acciones de Nvidia han ganado más del 140% en los últimos 12 meses, cotizando a aproximadamente 35 veces las ganancias futuras, mientras el gasto empresarial en IA continúa acelerándose. La Blackwell Ultra GB300 representa el último intento de la compañía por defender su estimado 80% de participación en el mercado de aceleradores de IA frente a los chips propios de Amazon, Google y AMD. Para los inversores, la cuestión es si Nvidia puede mantener su poder de fijación de precios a medida que los hiperescaladores desarrollan alternativas personalizadas — o si el cambio hacia cargas de trabajo de IA agéntica genera suficiente demanda incremental para absorber tanto la oferta de Nvidia como la producción de sus competidores.
Este artículo es únicamente con fines informativos y no constituye asesoramiento de inversión.