OpenAI redujo costos de inferencia a la mitad, ganando margen para socavar a rivales mientras prepara una recaudación de $120 mil millones.
OpenAI redujo costos de inferencia a la mitad, ganando margen para socavar a rivales mientras prepara una recaudación de $120 mil millones.

OpenAI redujo costos de inferencia a la mitad, ganando margen para socavar a rivales mientras prepara una recaudación de $120 mil millones.
Ingenieros de OpenAI redujeron los costos de inferencia en más del 50% para algunos modelos existentes, lo que permitió a la compañía fijar el precio de su modelo insignia GPT-5.6 Sol a la mitad del costo del competidor Claude Fable 5 de Anthropic, superándolo además en los puntos de referencia internos.
La compañía trata el método como una "receta secreta" con estrictos controles de acceso interno, según The Information. "Ni siquiera quieren contárselo a otros empleados de OpenAI porque si esto se filtra, otros laboratorios podrían adoptarlo y reducir también sus costos", señaló la reportera Steph Palazzolo.
Sol obtuvo una puntuación superior a la de Claude Mythos 5 de Anthropic en el benchmark Terminal-Bench 2.1, sin embargo cuesta un 50% menos que Claude Fable 5. Las ganancias de eficiencia también permitieron a OpenAI ejecutar tráfico de ChatGPT sin inicio de sesión con solo unos cientos de GPU Nvidia, una fracción de los requisitos típicos para un servicio que atiende a cientos de millones de usuarios activos mensuales.
La ventaja de costos llega cuando OpenAI se acerca a una ronda de financiamiento de $120 mil millones con una valoración previa a la inversión de $730 mil millones, mientras el director ejecutivo Sam Altman impulsa una oferta pública inicial antes que Anthropic. La mejora de márgenes proporciona un respaldo financiero crucial para esa narrativa de valoración, que depende de mejoras sostenidas en la rentabilidad.
El Giro hacia la Empresa
El avance en inferencia respalda un cambio estratégico más amplio en OpenAI. La directora de aplicaciones, Fidji Simo, dijo al personal en una reunión general reciente que la compañía dejaría de priorizar productos de consumo como el generador de video Sora —que cerró para redirigir recursos computacionales— y se concentraría en herramientas empresariales y productos de codificación donde los márgenes son más altos. La medida refleja un reconocimiento de que los productos de IA para consumo enfrentan márgenes reducidos y una intensa competencia de alternativas gratuitas, mientras que los clientes empresariales pagan tarifas premium por confiabilidad, seguridad y personalización.
El enfoque de OpenAI en herramientas de codificación es particularmente estratégico. El desarrollo de software representa uno de los mercados más grandes para la IA, con GitHub Copilot y herramientas similares generando ya miles de millones en ingresos anuales. Al combinar menores costos de inferencia con un rendimiento superior en codificación, OpenAI puede socavar a competidores como GitHub Copilot y CodeWhisperer de Amazon en precio mientras mantiene la calidad.
Independencia de Infraestructura
La reducción de costos también se alinea con el impulso de OpenAI por poseer más de su propia infraestructura. La compañía se asoció recientemente con Broadcom para desarrollar un chip de inferencia personalizado, un movimiento que podría reducir la dependencia de las GPU de Nvidia. Los ingresos del centro de datos de Nvidia alcanzaron los $62 mil millones en el año fiscal más reciente, impulsados en gran medida por cargas de trabajo de inferencia de IA que se ejecutan en procesadores H100 y B200. Un chip personalizado podría ahorrarle a OpenAI miles de millones al año en costos de adquisición de GPU, ampliando aún más su ventaja de margen sobre rivales que dependen de hardware de terceros.
Las ganancias de eficiencia pueden provenir de técnicas que incluyen cuantización —reducir la precisión de los pesos del modelo para acelerar el cálculo— y optimizaciones de almacenamiento en caché que guardan los resultados usados con frecuencia. Estos métodos son bien conocidos en la industria, pero la capacidad de OpenAI para lograr una reducción del 50% sugiere refinamientos propietarios que los competidores aún no han igualado.
Para los inversores, la pregunta clave es si la ventaja de costos de OpenAI es duradera. Si competidores como Anthropic, Google DeepMind o Meta replican el enfoque, la ventaja de precios podría erosionarse rápidamente. Las acciones de OpenAI no cotizan en bolsa, pero la valoración de la compañía de $730 mil millones en el mercado privado implica que los inversores ya están descontando una mejora sostenida de márgenes —lo que convierte cualquier erosión de esa ventaja en un riesgo para la narrativa de la OPI. La asociación de la compañía con Broadcom y su secreto interno en torno a los métodos de reducción de costos sugieren que OpenAI apuesta a que su ventaja en eficiencia de inferencia durará lo suficiente como para consolidar su participación de mercado antes de que los competidores la alcancen.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.