La decisión de Microsoft de abandonar el uso ilimitado de IA para su producto empresarial Copilot Cowork marca un punto de inflexión: ni siquiera la segunda empresa más valiosa del mundo puede absorber los costos de token de la IA agente a escala.
El martes, Microsoft puso Copilot Cowork a disposición general con un modelo de facturación por uso, reemplazando el enfoque de acceso ilimitado que había estado vigente desde la vista previa del producto en marzo. El agente de IA —capaz de ejecutar de forma independiente tareas de múltiples pasos en documentos de Microsoft 365 incluso cuando el ordenador del usuario está apagado— ahora cobra a los clientes por crédito, con cada crédito valorado en $0.01 bajo el plan de pago por uso. Una licencia mensual separada de $30 por usuario para Microsoft 365 Copilot sigue siendo obligatoria para las grandes empresas.
"Algunos usuarios completan cientos de tareas por semana, lo cual es muy productivo, pero el costo puede escalar muy rápidamente", dijo Charles Lamanna, vicepresidente ejecutivo de Copilot en Microsoft.
El cambio de precios coincide con informes de que Microsoft está evaluando una versión autogestionada del modelo de código abierto DeepSeek V4 como una alternativa de menor costo a los modelos de Anthropic y OpenAI que actualmente impulsan Copilot Cowork, según Axios. Los clientes ya pueden elegir entre Opus 4.8 y Sonnet 4.6 de Anthropic, mientras que aquellos en el programa Frontier pueden acceder a GPT 5.5 de OpenAI y al modelo Cowork 1 de Microsoft. La incorporación de DeepSeek V4 le daría a Microsoft una opción de código abierto alojada que podría reducir drásticamente los costos de token por tarea, un movimiento que, según Axios, podría anunciarse en cuestión de semanas.
La presión sobre los costos no es exclusiva de Microsoft. El Índice de Tokens de Datos de Silicon Valley, que rastrea los precios de los tokens de IA entre los principales proveedores, ha caído en 12 de las últimas 13 sesiones de negociación, acercándose a mínimos de corto plazo mientras los proveedores compiten en precios y las empresas presionan contra el aumento de las facturas. Mason Daugherty, consultor de IA empresarial, dijo que en prácticamente todas las conversaciones con clientes en los últimos dos meses, el gasto en tokens a nivel organizacional ha surgido como una preocupación principal. Predijo que la "economía de los tokens" se convertirá en el tema dominante en las discusiones de adquisición de IA durante los próximos seis a doce meses, a medida que los contratos empresariales anuales lleguen a su renovación y los equipos de finanzas corporativas cuestionen si los precios elevados de los modelos frontera siguen estando justificados.
La Ventaja Arquitectónica
El campo de batalla competitivo se está desplazando de la inteligencia del modelo al enrutamiento eficiente en costos. Arvind Jain, director ejecutivo de la plataforma de IA empresarial Glean, dijo que el principal cuello de botella para la IA empresarial ya no es la capacidad del modelo sino la "eficiencia de salida de tokens" —cuánto trabajo útil produce cada token consumido. La mayoría de los costos de IA, señaló, no provienen de la instrucción en sí, sino de la infraestructura circundante: recuperación, llamadas a herramientas, gestión de memoria y razonamiento de múltiples pasos. Una solicitud simple de 11 palabras puede inflarse a miles de tokens una vez que el sistema recopila contexto y procesa las tareas de forma secuencial.
"La inteligencia fronteriza se está volviendo abundante; la ejecución eficiente no lo es", dijo Jain. "La verdadera ventaja competitiva proviene de arquitecturas que emparejan el modelo correcto y la profundidad de razonamiento adecuada para cada tarea —sistemas con un enrutamiento sólido, controles de costos y gobernanza".
Este diagnóstico se alinea con la estrategia de Microsoft. En lugar de simplemente reemplazar un modelo por uno más barato, la empresa está construyendo un mecanismo de enrutamiento de modelos que puede asignar dinámicamente tareas a la opción más rentable: Anthropic para razonamiento complejo, DeepSeek o el modelo propio de Microsoft para consultas más simples. El sistema de facturación ya desglosa los costos en cuatro componentes: uso del modelo, recuperación de contexto, llamadas a herramientas y tiempo de ejecución, lo que brinda a los administradores de TI una visibilidad granular de dónde se acumula el gasto.
El Marco de Nadella: Capital de Tokens vs. Capital Humano
El director ejecutivo de Microsoft, Satya Nadella, articuló recientemente un marco más amplio que contextualiza este cambio. Toda empresa debe construir lo que llamó "capital de tokens" —sus sistemas y capacidades de IA propietarios— junto con el "capital humano": el conocimiento, las relaciones y el juicio de su fuerza laboral. Sostuvo que el capital humano no se deprecia a medida que crece el capital de tokens: "Sin dirección humana, solo estás quemando cómputo en el vacío".
Nadella dijo que la verdadera prueba de la estrategia de IA empresarial es si una empresa puede reemplazar su modelo fundacional subyacente sin perder el conocimiento propietario y las capacidades que ha acumulado. "Esa es la prueba central de si mantienes el control y la soberanía en la era que viene", afirmó.
La advertencia contenía una tensión implícita: Nadella advirtió contra permitir que todo el valor se concentre en un puñado de modelos dominantes, comparándolo con cómo la globalización vació a las economías industriales. Sin embargo, su propia empresa está simultáneamente profundizando vínculos con OpenAI y Anthropic mientras explora una alternativa china de código abierto —un acto de equilibrio que refleja las presiones de costos que enfrenta todo comprador de IA empresarial.
Para los inversores, las implicaciones son claras. Los proveedores premium de API como OpenAI y Anthropic se enfrentan a una compresión de márgenes a medida que las empresas exigen alternativas más baratas, mientras que los anfitriones de modelos de código abierto como DeepSeek ganan tracción en las adquisiciones. Las empresas que construyen infraestructura de enrutamiento de modelos y optimización de costos —middleware que se sitúa entre el usuario y el modelo— podrían capturar un valor desproporcionado a medida que la economía de los tokens se convierte en el criterio central de contratación. Las acciones de Microsoft cotizan aproximadamente a 30 veces las ganancias futuras; la transición de Copilot Cowork podría ahorrarle a la empresa cientos de millones en costos anuales de inferencia si se adopta DeepSeek V4, pero también señala que los márgenes de la IA empresarial en toda la industria se están estrechando más rápido de lo que el poder de fijación de precios de muchos modelos puede sostener.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.