DeepSeek recauda $7.400M y planea duplicar su plantilla tras el detonante de Claude

La recaudación de $7.400 millones de DeepSeek —la mayor ronda individual realizada por una startup china de IA— fue desencadenada por la constatación de Liang Wenfeng de que la empresa no podía competir sin ingentes reservas de capital tras ver el avance de Claude Mythos de Anthropic en abril.

La recaudación de $7.400 millones de DeepSeek —la mayor ronda individual realizada por una startup china de IA— fue desencadenada por la conclusión del fundador Liang Wenfeng de que la empresa no podía sostener sus ambiciones de investigación sin ingentes reservas de capital tras revisar el avance de Claude Mythos de Anthropic en abril, según personas familiarizadas con el asunto. La compañía con sede en Hangzhou, valorada en más de $50.000 millones en esta ronda, planea duplicar su plantilla de aproximadamente 300 personas en todos los departamentos.

"La humanidad se encuentra actualmente en los albores de la AGI", declaró DeepSeek en un comunicado en WeChat. "A medida que la tecnología avanza, nos esforzamos por al menos duplicar la escala de todos los departamentos".

Liang contribuyó personalmente con aproximadamente $3.000 millones —200.000 millones de yuanes—, lo que representa aproximadamente el 40% de la recaudación total, manteniendo al mismo tiempo su participación de control. El gigante de Internet Tencent y el fabricante de baterías Contemporary Amperex Technology participaron como inversores institucionales, junto con el Fondo Nacional de Inversión en la Industria de Inteligencia Artificial de China, lo que indica un fuerte respaldo gubernamental. La empresa abre inmediatamente solicitudes para 27 tipos de puestos técnicos y corporativos, incluidos ingenieros de desarrollo, ingenieros de datos, gestores de productos de IA y personal de operaciones, con todas las plazas abiertas a becarios.

La recaudación de fondos marca un giro estratégico para DeepSeek, que había operado como un laboratorio de investigación autofinanciado durante tres años después de que las reuniones de Liang con posibles inversores en 2023 fracasaran al decirles que la empresa no tenía hoja de ruta de comercialización ni de producto. El cambio de enfoque fue impulsado por la presión competitiva: Claude Mythos de Anthropic, presentado como avance en abril, demostró capacidades basadas en ingente potencia computacional y datos que Liang concluyó que DeepSeek no podía igualar sin una base de capital significativamente mayor.

El equilibrio comercial con los chips de Huawei

El compromiso de DeepSeek de adaptar sus modelos para los chips nacionales de Huawei ha tenido un coste significativo. Los sistemas de entrenamiento e implementación de la empresa se construyeron en torno al software CUDA de Nvidia, lo que obligó a los ingenieros a reescribir el software subyacente para que funcionara eficientemente en hardware de Huawei. El esfuerzo ha resultado en una brecha de 15 meses sin lanzar ningún modelo de nueva generación —una pausa inusualmente larga en una era en la que los principales laboratorios lanzan nuevos modelos cada dos o tres meses.

La brecha hizo que DeepSeek perdiera el auge de las herramientas de codificación que siguió al lanzamiento de Claude Code de Anthropic en la segunda mitad del año pasado. Liang dijo a los inversores durante la gira de recaudación que las herramientas de codificación y los chatbots de IA son hitos temporales en el camino hacia la inteligencia general artificial, y que apostar fuertemente por productos a corto plazo distraería del objetivo final.

Liang cree que los chips de Huawei igualarán el rendimiento de Nvidia en varios años, y que DeepSeek debería completar el trabajo de adaptación antes de ese plazo. Huawei solo supo el año pasado que DeepSeek había estado probando sus chips de forma privada, tras lo cual ambas empresas comenzaron a trabajar directamente juntas.

Ganancias de cuota de mercado en EE.UU.

A pesar de la brecha en el lanzamiento de modelos, los modelos existentes de DeepSeek están ganando terreno en el mercado de desarrolladores estadounidense. Su modelo insignia V4, lanzado en abril, capturó el 17% del uso de tokens en la plataforma AI Gateway de Vercel en mayo, frente a menos del 1% del mes anterior. Esto convirtió a DeepSeek en el tercer proveedor de modelos más grande de la plataforma, solo por detrás de Anthropic y Google.

La variante ligera V4 Flash tiene un precio entre 20 y 50 veces más barato que los modelos comparables de Anthropic, una estrategia de precios que Liang ha afirmado que mantendrá. El crecimiento continuó en junio, según datos de la plataforma.

DeepSeek sigue siendo el único laboratorio importante de IA que publica en código abierto el código subyacente de todos sus modelos, una filosofía que Liang ha descrito como esencial para evitar que la IA sea controlada por un pequeño número de empresas. La empresa ha establecido un plan de participación accionarial para empleados que asigna acciones a la valoración de la recaudación.

Para los inversores, las implicaciones son claras. La agresiva expansión de DeepSeek y su estrategia de precios ultrabajos presionan los márgenes de los líderes estadounidenses de IA, incluyendo OpenAI y Anthropic, mientras que su giro hacia los chips nacionales refuerza la narrativa de autosuficiencia de semiconductores de China. Nvidia, cuyos GPU H100 y Blackwell alimentan la mayoría de los grandes entrenamientos de IA, se enfrenta a un riesgo a largo plazo si los laboratorios chinos logran desacoplarse de su ecosistema —aunque la brecha de 15 meses en los modelos de DeepSeek demuestra la dificultad de esa transición.

Este artículo es únicamente con fines informativos y no constituye asesoramiento de inversión.