Una startup con sede en París, fundada por un investigador que vulneró importantes modelos de IA con una sola instrucción, ha recaudado 11 millones de dólares para ayudar a las empresas a controlar sus propios sistemas de IA.
Una startup con sede en París, fundada por un investigador que vulneró importantes modelos de IA con una sola instrucción, ha recaudado 11 millones de dólares para ayudar a las empresas a controlar sus propios sistemas de IA.

(P1) La startup francesa de ciberseguridad White Circle ha recaudado 11 millones de dólares en una ronda de financiación semilla para expandir su plataforma de控制 de IA, una nueva capa de seguridad para empresas que despliegan modelos de lenguaje extensos. La financiación llega mientras las empresas lidian con riesgos que van más allá de los filtros de seguridad generales integrados por los proveedores de modelos, como la fuga de datos, las alucinaciones y los ataques de inyección de instrucciones (prompt injection).
(P2) "Los jailbreaks son solo una parte del problema", dijo Denis Shilov, fundador y CEO de White Circle, a Fortune. "De la misma manera que las personas pueden comportarse mal, los modelos también pueden hacerlo. Nosotros estamos imponiendo comportamientos".
(P3) La ronda de inversión contó con la participación de una lista de líderes de la industria de la IA, lo que indica una sólida confianza en el enfoque de la empresa. Entre los patrocinadores se encuentran el Director de Experiencia para Desarrolladores de OpenAI, Romain Huet; Durk Kingma, de Anthropic; el cofundador de Mistral, Guillaume Lample; y el cofundador de Hugging Face, Thomas Wolf. La empresa utilizará los fondos para contratar nuevos talentos, acelerar el desarrollo de productos y ampliar su base de clientes en EE. UU., el Reino Unido y Europa.
(P4) La necesidad de una capa de control dedicada se vuelve más urgente a medida que las empresas pasan de simples chatbots a agentes de IA autónomos que pueden realizar acciones como acceder a archivos o emitir reembolsos. La plataforma de White Circle se sitúa entre los usuarios de una empresa y sus modelos de IA, supervisando todas las entradas y salidas en tiempo real para aplicar políticas personalizadas, una función que los propios proveedores de modelos tienen incentivos contradictorios para perfeccionar.
La startup con sede en París nació de la propia investigación de Shilov a finales de 2024, cuando desarrolló una instrucción de jailbreak universal que podía eludir las medidas de seguridad de todos los modelos de IA líderes. Después de que sus hallazgos se volvieran virales en X, los principales laboratorios de IA como Anthropic lo invitaron a probar sus modelos, convenciéndolo de que las empresas necesitaban algo más que mejores modelos: necesitaban mejores controles.
El software de White Circle está diseñado para detectar una amplia gama de comportamientos erróneos de los modelos. Puede bloquear el intento de un usuario de generar malware, marcar cuando un modelo alucina y promete a un cliente un reembolso no autorizado, o detener a un agente de IA para que no filtre datos financieros confidenciales. La plataforma ya ha procesado más de mil millones de solicitudes de API y está siendo utilizada por la startup Lovable y varias empresas legales y de tecnología financiera, aunque no se han revelado cifras específicas de ingresos.
Para reforzar su credibilidad como árbitro independiente, el brazo de investigación de White Circle publicó "KillBench", un estudio que realizó más de un millón de experimentos en 15 modelos de IA de proveedores como OpenAI, Google y xAI. El estudio reveló sesgos ocultos que surgen en escenarios de alto riesgo, destacando riesgos que no son evidentes en el uso ordinario.
Esta inversión es una fuerte apuesta por la economía de "picos y palas" que crece en torno al sector de la IA. La participación de ejecutivos de laboratorios de IA competidores como OpenAI, Anthropic y Mistral sugiere un amplio consenso en que una capa de ejecución de terceros es un componente necesario de la pila de IA empresarial. Esto apunta a la aparición de una nueva y crítica categoría de mercado para los inversores centrados en la infraestructura y la seguridad de la IA.
Este artículo tiene únicamente fines informativos y no constituye asesoramiento de inversión.