Hermes, un nuevo agente de IA de código abierto, ha atraído más de 22,000 estrellas en GitHub al automatizar las dos partes más tediosas del desarrollo de agentes: la creación de habilidades y la memoria específica del usuario.
Atrás
Hermes, un nuevo agente de IA de código abierto, ha atraído más de 22,000 estrellas en GitHub al automatizar las dos partes más tediosas del desarrollo de agentes: la creación de habilidades y la memoria específica del usuario.

(P1) Un nuevo marco de trabajo para agentes de IA, Hermes Agent, ha capturado el primer lugar en la lista de tendencias de GitHub durante semanas, acumulando más de 22,000 estrellas y desafiando el dominio de su predecesor, OpenClaw. Aunque ambos agentes parecen funcionalmente similares, Hermes introduce una filosofía radical de automatización total que está marcando un nuevo rumbo para la industria, elevando la propuesta de valor de herramienta de desarrollo a socio autónomo.
(P2) El núcleo técnico del sistema de habilidades autoevolutivas de Hermes se basa en el algoritmo Genetic-Pareto Prompt Evolution (GEPA), detallado en un artículo de ICLR 2026 por Lakshya Agrawal y otros. "La evolución reflexiva de los prompts puede superar al aprendizaje por refuerzo", sostiene el artículo, proporcionando el respaldo académico para el alejamiento de Hermes de la mejora de habilidades tradicional basada en RL.
(P3) La diferenciación de Hermes proviene de dos sistemas automatizados clave. Primero, un sistema de habilidades autoevolutivas genera silenciosamente nuevos flujos de trabajo cuando una herramienta se usa más de cinco veces o se recupera un error. Estas habilidades se optimizan luego fuera de línea utilizando el algoritmo GEPA. Segundo, un sistema de memoria proactiva utiliza un mecanismo de "empujoncito" (nudge) cada 15 turnos de conversación para reflexionar activamente y guardar las preferencias del usuario, en marcado contraste con los guardados de memoria pasivos de OpenClaw destinados solo a la prevención del desbordamiento del contexto.
(P4) El rápido ascenso de Hermes señala un potencial cambio de paradigma para el mercado de desarrollo de IA de 25,000 millones de dólares. Su éxito sugiere un fuerte apetito de los desarrolladores por agentes que reduzcan la configuración manual y aprendan activamente. Esto podría acelerar la actividad de fusiones y adquisiciones en torno a proyectos prometedores de código abierto y obligar a actores establecidos como Anthropic, que fue señalado públicamente por copiar características de Hermes, a adoptar una filosofía de diseño más automatizada y centrada en el usuario.
La diferencia estructural más significativa entre Hermes y sus rivales es su sistema de ciclo cerrado para la evolución automática de habilidades. Mientras que OpenClaw requiere que los usuarios creen, instalen y autoricen manualmente nuevas habilidades, Hermes automatiza este proceso por completo. El sistema empaqueta silenciosamente cualquier flujo de trabajo exitoso que involucre cinco o más llamadas a herramientas en un nuevo archivo de habilidad.
Posteriormente, un proceso fuera de línea independiente detallado en el repositorio hermes-agent-self-evolution utiliza el marco DSPy y el algoritmo GEPA para refinar estas habilidades. Este algoritmo se apoya en tres conceptos: mutación reflexiva, donde el modelo analiza las trazas de ejecución para realizar cambios específicos; selección de frontera de Pareto, que preserva un conjunto diverso de variaciones de habilidades de alto rendimiento; y el uso de retroalimentación en lenguaje natural como señal primaria para la mutación. Este proceso genera una solicitud de extracción (pull request) para revisión humana, asegurando que un humano (human-in-the-loop) mantenga el control final sobre las capacidades centrales del agente, desmitificando la idea de un sistema que opera sin supervisión del usuario.
La segunda innovación clave de Hermes es su sistema de memoria agresivo y proactivo. Mientras que competidores como Claude Code tienen sistemas de memoria estrictamente aislados a un solo proyecto, y OpenClaw guarda recuerdos pasivamente solo antes de que se desborde una ventana de contexto, Hermes adopta un enfoque diferente. Aproximadamente cada 15 turnos de conversación, un mecanismo de "empujoncito" obliga al agente a reflexionar sobre la interacción y decidir si alguna preferencia del usuario o hecho vale la pena recordar permanentemente.
Este enfoque activo y de alta frecuencia asegura que se construya un modelo de usuario mucho más rico con el tiempo. El sistema se mejora aún más con una capacidad de búsqueda de texto completo SQLite FTS5 incorporada, lo que permite al agente recordar instantáneamente interacciones pasadas sin depender de bases de datos de vectores externas. Aunque el backend de memoria avanzado nativo de IA, Honcho, era el predeterminado en versiones anteriores, la actualización v0.7 lo convirtió en un complemento opcional, priorizando la estabilidad del sistema integrado más simple y otorgando más control a los usuarios.
La automatización de Hermes se logra reemplazando los juicios flexibles basados en modelos por reglas deterministas y codificadas. La complejidad del sistema no se elimina, sino que se transfiere de la responsabilidad del usuario al código subyacente del agente. Las decisiones como cuándo generar una habilidad (5 llamadas a herramientas) o cuándo reflexionar sobre la memoria (15 turnos) se rigen por una lógica rígida de si-entonces, no por el razonamiento del LLM.
Esta elección de diseño es una solución de ingeniería pragmática a las limitaciones actuales de los LLM para gestionar contextos largos, donde los estudios han demostrado que el rendimiento puede caer más del 39%. Cuando una conversación alcanza el 85% del límite del contexto, Hermes utiliza una simple sustitución de cadenas para la compresión en lugar de arriesgarse a un resumen defectuoso generado por IA. Este enfoque conservador basado en reglas garantiza la estabilidad y la previsibilidad, algo que los creadores de Hermes apuestan a que es más valioso para los usuarios que el rendimiento frágil de un LLM totalmente autónomo pero poco fiable. La estrategia es establecer un ecosistema ahora y esperar a que las mejoras de los modelos eleven gradualmente el techo de lo que se puede automatizar de forma segura.
Este artículo es solo para fines informativos y no constituye asesoramiento de inversión.