La paradoja de Jevons impulsa la demanda de cómputo de IA mientras los costos por token caen 1.000 veces

Los costos de IA por token han caído 1.000 veces en tres años, sin embargo, el consumo empresarial de cómputo explota — Uber agotó todo su presupuesto de IA para 2026 en abril, y AT&T procesa ahora 27 mil millones de tokens al día, frente a los 1.000 millones de hace 18 meses.

"Cada vez que obtenemos la misma unidad de inteligencia más barata, no estamos reduciendo el consumo; lo estamos aumentando porque podemos resolver tareas más complejas con el mismo presupuesto", afirmó Roman Chernin, cofundador y director de negocio de Nebius, una empresa de nube de IA.

El fenómeno, conocido como la paradoja de Jevons en honor al economista del siglo XIX William Stanley Jevons, describe cómo las ganancias de eficiencia que reducen los costos pueden aumentar el consumo total de recursos. En una carta al Wall Street Journal esta semana, el economista Maury Harris argumentó que el principio se aplica al cómputo de IA, donde la elasticidad precio de la demanda podría resultar "altamente elástica". Nebius, que construye clústeres de GPU a gran escala, vio caer sus acciones un 40 % durante el pánico de DeepSeek en enero — sin embargo, Chernin dijo que esa misma semana fue "probablemente la mejor semana en ventas", ya que las empresas se dieron cuenta de que podían permitirse inferencia a escala.

Las implicaciones para los inversores son significativas. Goldman Sachs estima que el gasto anual en infraestructura de IA podría aumentar de 765.000 millones de dólares en 2026 a 1,6 billones de dólares en 2031. Pero los ganadores dependerán de las tasas de utilización, la disciplina financiera y la capacidad de absorber costos volátiles de componentes: los precios de los chips de memoria se han multiplicado por seis en el último año, a medida que la demanda de IA se extiende más allá de los centros de datos hacia la economía en general.

La explosión de tokens golpea los presupuestos empresariales

El paso de chatbots experimentales a sistemas de IA agentivos es el principal motor. Cuando las empresas pasan de consultas de un solo turno a agentes autónomos de múltiples pasos que encadenan llamadas, recuperan documentos y toman acciones, el consumo de tokens se multiplica por un orden de magnitud o más. Una importante aseguradora de salud vio cómo su consumo mensual de tokens de IA pasó de 3 millones a más de 150 millones en menos de un año.

El aumento del gasto está reconfigurando los precios de los proveedores. Anthropic eliminó los precios empresariales planos después de descubrir que los desarrolladores gastaban miles de dólares en cómputo con planes de 200 dólares al mes. OpenAI trasladó Codex a facturación por token ese mismo mes. Todos los grandes proveedores de IA convergen hacia precios medidos, creando lo que Chernin denomina un bloqueo estructural: cada nuevo agente implementado profundiza la dependencia de proveedores que fijan la tarifa y controlan los términos.

Sin embargo, el lado de la demanda cuenta una historia diferente al pánico que se apoderó de los mercados en enero. Cuando el lanzamiento de DeepSeek desencadenó una caída del 40 % en las acciones de Nebius y una venta masiva más amplia en los valores de infraestructura de IA, los equipos de ingeniería corporativos estaban haciendo lo contrario de retirarse: estaban escalando. Los costos más bajos hicieron viables aplicaciones antes antieconómicas, desde la recuperación interna de conocimientos hasta flujos de trabajo automatizados para clientes.

Quién gana cuando el cómputo se abarata

La dinámica competitiva favorece a las empresas que ascienden en la pila tecnológica. Chernin estima que el mercado de alquiler de GPU en metal desnudo sirve a aproximadamente una docena de clientes a nivel mundial. La infraestructura gestionada llega a cientos. Las plataformas de inferencia atraen a miles. Los sistemas agentivos, predice, atraerán a decenas de miles de desarrolladores.

Token Factory de Nebius, una plataforma de inferencia gestionada, ejemplifica esta estrategia. El servicio permite a las empresas ejecutar modelos de código abierto sin gestionar la infraestructura backend, aplicando técnicas de optimización para mantener los costos predecibles. Para las empresas, la propuesta de valor es clara: los modelos alojados manejan la complejidad de rastrear costos, mantener el tiempo de actividad y enrutar tareas entre diferentes modelos según el presupuesto y los requisitos de velocidad.

Pero la capa de inferencia alojada se enfrenta a su propio riesgo de mercantilización. Un estudio de 2026 encontró una disminución de aproximadamente 600 veces en los precios de inferencia de modelos de lenguaje grandes entre 2020 y 2026, mientras que el informe de mercados de IA de 2025 de la OCDE documentó fuertes descensos en los precios de modelos ajustados por calidad a medida que se amplía la competencia. Esto sugiere que la presión de compresión de márgenes que afectó a los fabricantes de chips ahora se extiende hacia arriba en la pila.

Para los inversores, la cuestión clave es qué empresas pueden construir fosos duraderos. Nvidia, que cotiza aproximadamente a 35 veces las ganancias futuras, se enfrenta al riesgo de que una inferencia más barata reduzca la demanda de sus chips de entrenamiento de mayor margen. Los hiperescaladores de la nube — Amazon, Microsoft, Google — se benefician del mayor consumo de cómputo pero se enfrentan a crecientes requisitos de capital. Y los proveedores de infraestructura como Nebius deben demostrar que pueden mantener la utilización y el poder de fijación de precios a medida que el mercado se expande.

La paradoja de Jevons sugiere que los ingresos totales de la industria de la IA crecerán incluso cuando los precios unitarios caigan. Pero capturar esos ingresos requiere más que poseer cómputo — requiere el software, las herramientas y las relaciones empresariales que convierten la potencia de procesamiento bruta en productos terminados.

Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.