Hermes Desktop: El Agente IA Más Fácil de Instalar en 2026 | Fazt.dev

Hermes Desktop: probé la nueva app de escritorio del agente de IA personal (y me sorprendió)

Hace poco salió otra aplicación de escritorio para IA, y en este caso se llama Hermes Desktop. Hermes ya es un proyecto bastante conocido: por lo general lo instalas en un servidor o en tu computadora y terminas con un asistente personal que puedes configurar a tu gusto. Lo que han hecho con Hermes Desktop es dar un paso más y volver mucho más fácil la forma de tener ese asistente personal.

¿Qué significa esto en la práctica? Que si nunca instalaste Hermes por comando, o si te pareció muy complicado usar OpenClaw y proyectos similares, ahora hay una forma muy sencilla: entras a una web, descargas una app de escritorio y listo. Desde ahí puedes conectarlo con Telegram para tener tu agente de IA, comunicarlo con tu suscripción de ChatGPT, y básicamente tener lo mismo de antes pero a través de una interfaz gráfica muy sencilla.

Para mi sorpresa, resultó bastante más completo de lo que esperaba. Pensé que iba a ser un simple cliente para un Hermes ya desplegado, pero no: tiene características bastante interesantes. Aquí te dejo el review.

Instalación: solo descargar y abrir

Hermes Desktop es un proyecto abierto y, de hecho, tiene bastantes características, así que aquí me voy a centrar en las más básicas. Lo genial es que no está atado a la suscripción de IA de ninguna empresa: si usas ChatGPT, la API de algún modelo chino o cualquier otra suscripción, vas a poder conectarla. Y si no quieres pagar nada, ellos mismos ofrecen una suscripción gratuita para probarlo.

Para instalarlo solo entras a la web, le das en instalar y eliges entre los tres sistemas operativos disponibles (Windows, macOS y Linux). En mi caso lo descargué para Windows: la descarga arranca automática y solo hay que dar un clic para instalar. Bastante sencillo.

Una cosa que destaco de entrada: en cuanto a interfaz, es de las pocas apps de escritorio que tiene un diseño algo distinto. Si has visto aplicaciones como Codex, Conductor o Antigravity Desktop, todas se parecen entre sí, como copias. Hermes al menos tiene una UI más propia.

Conectar un proveedor de IA

Lo primero que vas a tener que hacer es conectar algún proveedor de IA. En la parte superior hay una sección que dice Open Settings, y dentro, una sección de Providers.

En mi caso conecté mi suscripción de OpenAI. Algo que debes saber es que Hermes está desarrollado por Nous Research, que además ofrece Nous Portal, un acceso a IA con opción gratuita. Yo no lo necesito, pero si quieres probarlo sin pagar aparte, también puedes registrarte ahí (aparece marcado como recomendado, con animación incluida).

Si quieres añadir otro proveedor, vas a "Connect another provider" y verás opciones de todo tipo: MiniMax, Qwen, tu suscripción de Grok, Gemini y muchos más. Al conectar con OpenAI/ChatGPT, se lanza una ventana, seleccionas tu cuenta, aceptas, te pide un código (el que aparece en pantalla), lo pegas, das Enter y listo: ya tendrías GPT-5.5 dentro de Hermes y podrías pedirle cualquier cosa.

No es solo un chat: ejecuta comandos de tu sistema

Como prueba rápida, le dije "hola" y respondió con normalidad. Luego le pedí: "crea dos carpetas en mi escritorio". Lo interesante es que, cuando necesita un dato, lanza una especie de selector al estilo de Claude Desktop. Le respondí "carpeta uno" y "carpeta dos", y al igual que Codex, accedió directamente a los comandos del sistema.

Ese es el punto clave que mucha gente no entiende: no es solamente un chat. Aquí puedes lanzar comandos reales de tu sistema.

Dictado por voz

También puedes usar dictado por voz. Por ejemplo, dicté: "crea una aplicación de Next.js que permita registrar citas médicas a través de una landing page". El texto aparece dentro del chat, y si das Enter se ejecuta igual que cualquier mensaje. Si quedó mal transcrito, puedes reescribirlo directamente con doble clic; no hace falta clic derecho ni menús.

A partir de ahí hace lo mismo que obtendrías en Codex o apps similares: un planning rápido de tareas que va una por una, y empieza a crear el proyecto. Un detalle: como no le dije dónde crearlo, lo guardó en la carpeta de mi usuario. Tenlo en cuenta y especifica la ruta (por ejemplo, "créalo en el escritorio").

Sesiones paralelas

Cada sesión es básicamente un chat distinto, y puedes correr varias a la vez. Mientras una sesión avanza creando un proyecto, puedes abrir otra y pedir algo más; por ejemplo: "crea un plan de una aplicación móvil de React Native + Supabase para manejo de inventarios". Ambas avanzan en paralelo, en chats separados.

Esta app está mucho más enfocada en el usuario común: no necesitas desplegar nada por comandos. Aunque, como veremos, hay capas que apuntan a alguien con algo más de conocimiento técnico.

Messaging: chatea con tu agente desde Telegram

Una de las características principales de Hermes siempre ha sido poder chatear con él desde apps externas. Aquí está bajo la sección Messaging, con todos los proveedores con los que puedes comunicarte.

¿Cómo funciona? No necesitas desplegar un servidor: solo entras a esta sección y la habilitas. Para Telegram, por ejemplo:

Busca en Telegram al usuario BotFather (el bot oficial para crear bots).
Usa el comando /newbot para crear uno nuevo; te pedirá un nombre.
Al crearlo te dará un token.
Copia ese token, pégalo en Hermes y guarda los cambios.

El gateway: el corazón de Hermes

Al guardar, te pedirá reiniciar el gateway. El gateway es el programa servidor de Hermes que se mantiene escuchando de forma permanente; normalmente Hermes vive dentro de un servidor Linux haciendo justo eso. Como la app de escritorio usa el mismo concepto, también lo levanta localmente.

En mi caso obtuve un error al reiniciar el gateway. No sé si te pasará igual, pero hay una sección con logs donde puedes reiniciarlo manualmente (aunque a mí ese reinicio no me funcionó del todo).

Aquí es importante entender algo: además de la interfaz gráfica, Hermes también instala un comando en tu sistema y trae su propia terminal. Si vas a "nueva sesión" y bajas, encontrarás una terminal integrada. Algunos comandos útiles:

hermes --version → te dice la versión instalada.
hermes gateway status → muestra los comandos que puedes ejecutar.
hermes gateway run → inicia el servicio (es lo que hace el botón de reiniciar).

En mi caso, el error indicaba que tenía que entrar a un archivo y configurar el gateway para todos los usuarios. Un truco: puedes pegarle ese mensaje de error al propio chat y decirle "establece esto en la configuración de Hermes". Como la app tiene acceso a tus archivos, puede reescribir la configuración por ti. Cuando veas el mensaje "gateway running", significa que ya está escuchando.

Emparejar Telegram

Con el gateway corriendo, escribes "hola" desde Telegram y te responderá algo como "no te reconozco aún, este es tu código de emparejamiento". Ejecutas ese comando de pareo en la terminal (Ctrl+L para limpiar si hace falta), apruebas el acceso, y listo.

Si quieres que el gateway se mantenga escuchando siempre, ejecuta hermes gateway install y acepta. Después hermes gateway status te confirmará que el servicio sigue corriendo. Desde ahí ya puedes pedirle cosas reales desde Telegram, por ejemplo "busca en internet si X ya está disponible para comprar", y tendrás un bot conversando con el servicio que corre en tu máquina. Funciona bastante bien; lo único es que, al ser un proyecto abierto, algunas cosas no salen a la primera.

Artifacts, Skills y Tools

La sección Artifacts lista recursos a los que Hermes puede acceder: imágenes, archivos, enlaces. Todo eso se carga como referencia para que el agente lo use y obtenga información extra.

Luego están Skills y Tools, que son justo las habilidades y herramientas de consola que puede usar. Vienen varias preinstaladas. Por dar una idea, hay un convertidor de video a ASCII, un generador de ASCII art, etc. Le pedí "crea un ASCII art de un Ferrari" y cargó el skill correspondiente para generarlo.

Algo importante: casi todos los skills y tools son herramientas de consola, porque Hermes se apoya fuertemente en CLIs para comunicarse con otros servicios. Por ejemplo, hay un skill de Excalidraw (la app de dibujo que siempre uso, open source). Le pedí "crea un diagrama explicando JWT con Excalidraw": llamó al skill, muchas veces te pide permiso para ejecutar el comando (le das Run, o Always Allow si no quieres que pregunte cada vez), generó un archivo y lo guardó en el sistema. Luego solo abres excalidraw.com, arrastras el archivo y ves el resultado. No es perfecto, pero está bastante avanzado.

¿Y MCPs? Mucha gente pensaría que al apoyarse tanto en CLIs no los soporta, pero sí los soporta. En la configuración encuentras la sección de MCPs y puedes añadir el que quieras (nombre y argumentos, igual que en otras apps). Mi recomendación personal: si existe un CLI equivalente, úsalo. Suele ser más fácil, más rápido y mejor que un MCP. Pero si la herramienta que usas solo ofrece MCP, configurarlo es muy simple.

En el catálogo de skills hay muchísimas opciones clasificadas: ComfyUI, GitHub para clonar repos, Obsidian, y hasta OpenCode, que es otra forma de delegar la tarea a otro agente. Ese tipo de skills me hace pensar que esta app no está pensada solo para un usuario común, sino para alguien con algo más de conocimiento técnico. No es excesivamente complicado, pero apunta más alto de lo que parece.

Gateways remotos: conecta un Hermes en la nube

Lo que más me llamó la atención es la sección Gateways. Aunque aquí tengo Hermes instalado localmente y me comunico con él desde Telegram, también puedes desplegar una instancia de Hermes en la nube (por ejemplo, en un VPS) y conectarte a ella desde la app de escritorio.

Si ya tienes Hermes desplegado en una dirección, solo colocas un remote gateway con esa dirección y listo. Lo genial de estos agentes es que se conocen a sí mismos porque cargan su propio contexto: si le preguntas "¿cómo conecto un gateway remoto desde una app desktop?", te explica que en la máquina remota debes habilitar usuario, contraseña y un secret/token.

Para conectarlo:

En tu VPS o máquina local, configura Hermes con usuario, contraseña y token. El usuario y contraseña son para entrar al panel de esa máquina; lo que importa aquí es el token.
La instancia suele instalarse en el puerto 9119; colocas esa dirección en la app.
Pegas el token, le das en Test Remote y, si aparece "conectado", le das Save and Reconnect.

La próxima vez que inicies sesión estarás usando ese Hermes que vive en otra máquina. En mi caso tengo Telegram configurado tanto en el Hermes local como en el remoto, así que puedo ver desde el dashboard los chats que vienen de Telegram en ambos.

Una aclaración importante sobre la arquitectura: esperaba que esta app fuera un simple cliente que se comunicara con un servidor Hermes. Pero no: Hermes Desktop se parece mucho más a Codex Desktop que a un cliente delgado. Funciona por sí solo en local, y además puede conectarse a instancias remotas.

Perfiles: varios agentes con distintas personalidades

Puedes fijar (pin) los chats que quieras destacar, y hay una sección de Perfiles para adaptar el agente a tu estilo.

Por ejemplo, creas un perfil llamado developer y lo defines: "eres un desarrollador experto, tienes acceso a comandos de desarrollo como gh, AWS CLI, Playwright CLI", etc. Eso carga un contexto adicional cada vez que pides algo bajo ese perfil. Puedes crear otro perfil, digamos uno que actúe como psicólogo, y definirlo igual. Al cambiar de perfil incluso cambia la interfaz (y el color, si quieres).

En el fondo es una preferencia de configuración sobre cómo esperas que te responda la IA, y puedes generar tantos perfiles como quieras.

Orquestación de agentes y delegación

Recuerda que todos esos skills permiten delegar. Por ejemplo: "delega la creación de una landing page para reserva de citas de un psicólogo en Next.js, y usa OpenCode". Cargará el skill de OpenCode y mandará la tarea a un agente externo.

Esto revela el rol real de Hermes: no intenta ser el agente que escribe código, porque eso lo hacen mejor OpenCode o herramientas similares. Hermes toma la tarea y se la pasa a otros programas. Piénsalo como una especie de orquestador de agentes.

Hablando de eso, en la parte inferior hay un loader que lanza una ventana con los agentes en ejecución. Le pedí: "crea múltiples agentes para hacer un clon de Hacker News: uno hace el scraping del sitio y el otro la documentación del proyecto". Lanzó dos sesiones de agentes y abajo apareció el contador de agentes corriendo. (El conteo no siempre coincide perfecto con lo que muestra la interfaz, pero ahí lleva la cuenta.) El resultado fue una carpeta hacker-news-clone ya ejecutándose, con un sitio muy parecido al original creado desde cero y consumiendo la misma API por detrás.

Tareas programadas (cron)

Junto al loader hay un ícono de cron, para tareas programadas. Puedes configurarlas con un formulario, pero es más fácil pedírselo en lenguaje natural. Por ejemplo, en una nueva sesión: "recuérdame a las 12 tomar mis medicinas". Hermes entiende que es una tarea programada, crea el cron automáticamente y aparece como "recordatorio de medicinas" sin que tengas que configurar nada. Puedes pausar la tarea o, al dispararse, lanza una notificación del sistema.

Terminal, explorador de archivos y contexto de proyecto

Como la terminal integrada es una terminal normal (si haces pwd ves que estás en el escritorio), puedes acceder a cualquier comando de tu sistema: GitHub CLI, Git, Node, etc. Por ejemplo, npm create vite para generar un proyecto rápido.

Después puedes abrir una nueva sesión, darle a Attach Folder, seleccionar esa carpeta y pedir algo como "crea un juego del dinosaurio en JavaScript". Como estás dentro del entorno de ese proyecto, tomará esa carpeta como referencia.

Arriba hay un explorador de archivos. Por defecto te coloca en la raíz de tu usuario, pero puedes elegir otra carpeta para trabajar. Si una sesión está ocupada (terminando un cambio en un proyecto), no te deja cambiar de carpeta hasta que termine.

Cuando abres un proyecto y preguntas "¿de qué va esto?", carga un skill llamado codebase inspection y te da un resumen (por ejemplo: "es un monorepo de una aplicación web, conformado por una API…", con las direcciones). También puedes dar doble clic a un archivo para verlo dentro de la app, aunque la interfaz se queda un poco corta de espacio (chat + código a la vez). Lo que sí puedes hacer es arrastrar un archivo o carpeta como contexto y preguntar, por ejemplo, "¿esto tiene testing?".

No es necesario editar el código manualmente —hoy casi nadie lo hace—, pero tener la estructura del proyecto a la vista sí ayuda a saber en qué parte estás trabajando.

Configuración: seguridad, memoria y más

Arriba están los shortcuts y la opción de activar/desactivar sonidos (hay pequeños sonidos al enviar un mensaje o al terminar una tarea). En ajustes encuentras:

Apariencia: para editar cómo se ve la UI.
Workspace: define en qué carpeta inicia (por defecto, la de tu usuario).
Safety: define qué puede hacer el agente. Está en modo approval manual, pero puedes pasarlo a un modo automático, o al modo Smart (similar al modo auto de otros agentes), que solo te pregunta ante algo importante en lugar de por cada comando.
Memory Context: lo que caracteriza a Hermes. Guarda información extra en archivos (user.md, soul.md, memory.md, etc.) con memoria persistente en tu computadora. Es básicamente texto que se va guardando a medida que lo usas. Hay quien lo desactiva porque, con tanto guardado, esa memoria puede terminar errada: a veces guarda por sí mismo cosas que no son y luego responde en base a eso. (Pronto haré contenido dedicado a cómo funcionan estas memorias; incluso hay proyectos abiertos que extienden la memoria de un agente.)
Dictado de voz y Avanzado: información extra de las herramientas que usa por debajo. Por ejemplo, correr sobre Docker, o limitar cuántos caracteres muestra la terminal.

Conclusión

De forma resumida: para mí, Hermes Desktop se parece mucho a OpenCode. Pero en usabilidad tiene un plus claro, y es que está más enfocado en ser un asistente de IA de escritorio, sobre todo por esa sección de messaging que te deja conectarlo con apps externas.

Para quienes no han trabajado mucho con asistentes de IA ni con instalaciones en la nube —donde el proceso puede ser complicado—, esto es un acercamiento mucho más amigable. Y si necesitas una interfaz para escribir código que a la vez funcione como asistente, lo veo adaptable. La interfaz está bastante bien trabajada.

En resumen: funciona bien y no encontré ningún error grave. Es una forma mucho más cercana de probar un asistente personal, y la instalación fue muy sencilla. Si quieres probarlo, te dejo el enlace en la descripción. Y si tienes dudas de cómo hacer algo o qué te gustaría ver con esta herramienta, déjalo en los comentarios.

Nos vemos en un próximo video.

Si quieres conocer más, te dejo mis enlaces sociales y mi web fazt.dev, donde puedes reservar asesorías personalizadas de cualquier tema.