La IA no inventó nada... y por eso puede hacerlo todo
Mucha gente cree que usar IA es solamente escribir en un chat y esperar la respuesta. Eso fue el primer paso. Pero los agentes inteligentes cambiaron todo.
La IA no llegó a un mundo vacío. Llegó a uno donde ya existían APIs, herramientas de consola, protocolos de automatización de navegadores y sistemas de colas. Lo que aportó fue algo que antes no existía: la capacidad de entender lenguaje natural y decidir qué herramienta usar para resolver un objetivo. Por eso hoy puede "hacerlo todo".
El mundo antes de la IA
Antes de que existiera ChatGPT, Claude o cualquier LLM, los programadores ya tenían superpoderes. Solo que había que saber exactamente cómo usarlos.
REST APIs
Desde principios de los 2000, los servicios web empezaron a exponer su funcionalidad a través de APIs HTTP. Stripe, Twilio, SendGrid, GitHub... todo tenía una API. Cualquier programador podía enviar un email, crear un pago o abrir un issue con una simple llamada HTTP.
Herramientas de consola (CLI)
Herramientas como curl, ffmpeg, imagemagick y pandoc existían décadas antes de la IA. Permiten manipular archivos, convertir formatos, procesar video, comprimir imágenes — todo desde la terminal con un comando.
Automatización de navegador
Selenium nació en 2004. Luego llegó Puppeteer (2017) y Playwright (2020, de Microsoft). Estas herramientas ya podían abrir Chrome, hacer clic, llenar formularios, extraer datos — completamente sin IA.
Dato: Selenium lleva más de 20 años automatizando navegadores. Playwright, creado por Microsoft en 2020, es hoy el estándar moderno para automatización web.
Sistemas de colas y tareas largas
Bull, Celery, RabbitMQ, AWS SQS... ya existían para ejecutar tareas asíncronas y programar trabajos durante días o semanas. La infraestructura para correr procesos largos ya estaba ahí.
Automatización de escritorio (RPA)
UiPath y Automation Anywhere ya hacían "computer use" antes que Claude o GPT-4. Controlaban el escritorio, llenaban formularios de software legacy, todo con scripts y visión computacional.
¿Qué aportó la IA a todo esto?
La IA no vino a inventar estas herramientas. Llegó y las encontró. Lo que sí trajo fue algo que antes no existía: la capacidad de entender qué quieres hacer y decidir cuál herramienta usar para lograrlo.
Antes (sin IA)
- Tú le dices exactamente qué hacer: "ejecuta este script", "llama a esta API con estos parámetros".
- Si algo cambia (un formulario, un endpoint), el script se rompe.
- Requiere un programador para mantenerlo.
Ahora (con agentes IA)
- Tú describes el objetivo: "revisa mis reuniones de mañana y prepárame un resumen".
- El agente decide qué herramientas usar: Google Calendar API, web search, etc.
- Puede adaptarse si algo cambia, porque entiende el contexto.
Dato: En 2025, la definición de "agente IA" pasó de académica a práctica: modelos que pueden usar herramientas de software y tomar acciones autónomas. Un punto de inflexión fue el lanzamiento del Model Context Protocol (MCP) por Anthropic en noviembre 2024, que estandarizó cómo los LLMs se conectan a herramientas externas.
Ejemplos concretos hoy (2025–2026)
| Capacidad | Cómo funciona |
|---|---|
| Generar imágenes | APIs como DALL-E, Stable Diffusion, Midjourney. La IA recibe un texto, llama a la API y devuelve la imagen. |
| Crear diagramas | Mermaid.js ya existía. El agente escribe el código del diagrama y lo renderiza. |
| Manejar Excel / Google Sheets | La API de Google Sheets existe desde 2006. El agente la usa para leer, escribir y calcular. |
| Crear PowerPoints | LibreOffice, python-pptx, APIs de Office. El agente genera el archivo programáticamente. |
| Controlar el navegador | Claude Computer Use, OpenAI Operator (enero 2025), Google Mariner. Ya navegan webs, llenan formularios, hacen compras. |
| Ejecutar código en terminal | Claude Code, Cursor, GitHub Copilot Agent. Corren comandos bash, instalan dependencias, hacen deploys. |
| Delegar tareas largas | Sistemas de colas como BullMQ o AWS SQS. El agente encola tareas que se ejecutan días o semanas después. |
| Multi-agentes coordinados | Un agente orquestador divide la tarea y llama a sub-agentes especializados (LangGraph, AutoGen, CrewAI). |
Dato real: Adobe Analytics reportó un incremento del 4,700% interanual en tráfico generado por agentes IA en sitios de retail de EE.UU. en julio 2025. El mercado global de agentes IA alcanzó USD $5.4B en 2024 y se proyecta a $7.6B en 2025.
Lo que se viene (futuro cercano)
Control total del escritorio
Claude Computer Use y la Gemini 2.5 Computer Use API (lanzada en octubre 2025 con más del 70% de precisión) permiten que el agente vea tu pantalla y actúe sobre ella.
Navegadores con agentes integrados
Perplexity Comet, OpenAI Atlas, Google Mariner, Opera Neon. El browser mismo se convierte en el agente.
Tareas de larga duración
Los agentes ya pueden ejecutar flujos que duran días usando sistemas de colas. Browserbase procesó 50 millones de sesiones en 2025.
Multi-agentes
Un agente principal delega subtareas a otros agentes especializados. Los frameworks líderes son LangGraph, AutoGen y CrewAI.
Estándares abiertos
MCP (Model Context Protocol) supera los 97 millones de descargas mensuales. ChatGPT, Claude, Gemini, Cursor y GitHub Copilot ya lo soportan nativamente.
Gobernanza
La Linux Foundation anunció la Agentic AI Foundation en 2025 para establecer estándares para agentes, de forma similar a lo que el W3C hace para la web.
Conclusión
La IA no es mágica. Es un motor de comprensión que encontró un mundo lleno de herramientas que ya funcionaban.
- Selenium automatizaba navegadores desde 2004.
- Las APIs REST existen desde los 2000.
- Los sistemas de colas llevan décadas.
Lo que cambió es que ahora puedes describir lo que quieres en español, y hay algo que entiende cómo unir todas esas piezas para hacerlo.
"El motor no es nuevo. Lo nuevo es que ahora hay algo que puede leer tus instrucciones, entender tu objetivo, y decidir qué piezas del mundo digital mover para lograrlo."
Eso es lo poderoso de los agentes.
Fuentes
- The State of AI Browser Agents in 2025 — fillapp.ai
- AI Agents Arrived in 2025 — The Conversation
- AI Agents 2025 Recap — Fast Company
- 11 Best AI Browser Agents in 2026 — firecrawl.dev
- Selenium nació en 2004 — Sauce Labs
- Playwright lanzado por Microsoft en 2020 — playwright.dev
- MCP (Model Context Protocol) — Anthropic, nov. 2024
- Browserbase: 50M sesiones en 2025 — firecrawl.dev/blog
- Adobe Analytics: +4,700% tráfico agentes en retail — firecrawl.dev/blog