Actualidad IA y guias para construir agentes
Seguimos modelos, benchmarks, plataformas y buenas practicas, pero lo traducimos a decisiones concretas para agentes reales.
Empezar por aqui
Ver curso gratis
OpenAI reactiva una alerta rara para builders: actualiza Codex y ChatGPT en macOS antes del 12 de junio
OpenAI explico el 13 de mayo de 2026 su respuesta al ataque de cadena de suministro contra TanStack npm. Para quienes usan Codex App o Codex CLI en macOS, lo practico es claro: actualizar antes del 12 de junio para quedar firmados con los nuevos certificados.
Noticias recientes
63 notas
Vercel Blob pasa a OIDC: la mejora real para agentes es matar el token largo
Vercel anuncio el 1 de junio de 2026 que Blob ahora soporta OIDC y lo deja como default en proyectos nuevos. Para builders de agentes, la ganancia grande no es storage: es poder leer y escribir en Blob desde funciones y terminal sin vivir atados a un BLOB_READ_WRITE_TOKEN.

GitHub Copilot CLI mete rubber duck, prompts programados y voz local: menos cambio de contexto para agentes de terminal
GitHub anuncio el 2 de junio de 2026 una actualizacion fuerte para Copilot CLI: critica interna con rubber duck, prompts programados con /every y /after, y dictado local. La historia util para builders no es la UI: es que el CLI ya compite como superficie operativa real para agentes.

GitHub Copilot CLI mete rubber duck, prompts programados y voz local: donde si mejora el trabajo diario
GitHub refresco Copilot CLI el 2 de junio de 2026 con rubber duck, scheduling de prompts, voice input y una UI experimental. Lo importante no es la novedad por separado: es que el terminal gana revision, cadencia y entrada multimodal sin salir del flujo.

GitHub Copilot ya corre automatizaciones por horario y eventos: como usarlo sin regalarle demasiado control
GitHub habilito el 2 de junio de 2026 las automations de Copilot cloud agent. La novedad no es solo programar tareas: combina prompts, triggers, tools, AI Credits y controles de seguridad dentro del mismo repo.

GitHub Copilot ya tiene sandboxes locales y en la nube: que cambia de verdad para agentes que tocan codigo
GitHub anuncio el 2 de junio de 2026 que Copilot puede ejecutar trabajo agentic dentro de sandboxes locales y cloud. La mejora no es cosmetica: pone aislamiento, reanudacion y politicas alrededor de comandos, archivos y red.

GitHub ya separa usuarios code-first, agent-first y multi-agent en Copilot: por que eso cambia como deberias medir adopcion
GitHub actualizo el 29 de mayo de 2026 su usage metrics API con cohortes de adopcion para Copilot. La novedad no es cosmetica: por fin deja medir si tu rollout se quedo en autocompletado o si de verdad avanzo a code review, CLI, cloud agent y loops multi-agent.

Vercel Blob se pasa a OIDC: por que esto le quita una deuda fea a los agentes que tocan archivos
El changelog de Vercel del 31 de mayo de 2026 convierte OIDC en el default para Blob en proyectos nuevos. La señal importante para builders es simple: menos tokens largos circulando y menos friccion para agentes que leen o escriben archivos privados.

Vercel mete Lark y Feishu a Chat SDK: por que esto abre otro frente serio para agentes internos
Vercel anuncio el 31 de mayo de 2026 soporte oficial para Lark y Feishu dentro de Chat SDK. Lo importante no es solo otro adaptador: es que los bots ya pueden vivir en chats internos con streaming, tarjetas interactivas y menos dependencia de webhooks expuestos.

Anthropic expande Project Glasswing: la señal no es el laboratorio, es que los agentes ya entraron al trabajo defensivo serio
Anthropic anuncio el 2 de junio de 2026 la expansion de Project Glasswing a mas organizaciones criticas. Para builders y equipos de seguridad, la noticia relevante es que los agentes ya estan entrando a ciclos reales de hunting, triage y patching.

GitHub abre Agent Tasks por REST API: ahora el punto no es pedir ayuda, es disparar trabajo real desde tus automatizaciones
La preview de Agent Tasks REST API publicada por GitHub el 13 de mayo de 2026 conecta issues, sesiones cloud y automatizaciones externas. Para builders, el cambio fuerte es que Copilot ya puede entrar a loops programables.

GitHub Copilot cambia billing y planes desde el 1 de junio: la noticia real es que ya toca gobernar costos por agente
GitHub actualizo Copilot el 1 de junio de 2026 con AI Credits, usage-based billing y presupuestos mas visibles. Para equipos que ya usan agentes en serio, el cambio no es comercial: es operativo.

Slack mete mas herramientas a su MCP server: ahora la pregunta es cuanto contexto deberias darle
Slack amplio su MCP server el 13 de mayo de 2026 con nuevas tools para reacciones, canales, emoji, miembros y archivos. El cambio parece pequeno, pero vuelve mucho mas operativo el uso de Slack como capa de contexto y accion para agentes internos.

Twilio Agent Connect ya esta en GA: el punto no es WhatsApp, es la memoria entre canales
Twilio llevo Agent Connect a general availability el 6 de mayo de 2026. Para builders, la noticia no es solo otro SDK de mensajeria: es una capa de orquestacion para voz y chat con memoria, handoff y control self-hosted sobre el runtime.

GitHub Copilot SDK llega a GA: por que esto importa mas que otro chat de coding
GitHub anuncio el 2 de junio de 2026 que Copilot SDK ya es general availability. Lo importante para builders no es el sello GA: es que GitHub abre el runtime agentic de Copilot para apps, CLIs y herramientas internas con soporte estable, hooks, MCP y trazas.

GitHub Copilot app junta worktrees, inbox y PRs en un solo loop: donde si puede ahorrar cambio de contexto
GitHub abrio en technical preview su Copilot app el 14 de mayo de 2026 y ya la documenta como una app de desktop para desarrollo agentic. La apuesta no es solo otra interfaz: es comprimir sesiones paralelas, revision, terminal, navegador y PR lifecycle en una misma superficie.

GitHub Copilot cloud agent ahora mezcla Auto y modelos baratos: como elegir sin disparar costo ni latencia
GitHub movio dos piezas entre el 14 y el 18 de mayo de 2026 para Copilot cloud agent: auto model selection y modelos mas baratos para tareas simples. Juntas cambian la conversacion de builders que delegan trabajo real desde GitHub.

Cloudflare mete Agent Skills, tareas programadas y Telegram en su Agents SDK: menos prompt gordo, mas runtime
Cloudflare anuncio el 2 de junio de 2026 la version 0.14.0 de su Agents SDK. Lo mas valioso para builders no es un solo feature: es la combinacion de Agent Skills on-demand, mensajeria con Telegram, tareas programadas y pasos durables dentro de Workflows.

Anthropic expande Project Glasswing: por que la seguridad de agentes ya se esta moviendo antes del exploit
Anthropic anuncio el 2 de junio de 2026 que Project Glasswing pasa de unos 50 socios iniciales a aproximadamente 150 organizaciones. La senal util para builders no es el programa en si: es que los modelos capaces de encontrar fallas ya estan empujando a mover verificacion, disclosure y patching mucho antes de donde suele reaccionar el mercado.

Qwen 3.7 Plus entra a Vercel AI Gateway: cuando conviene para agentes multimodales y cuando no
Vercel agrego Qwen 3.7 Plus a AI Gateway el 1 de junio de 2026. El movimiento importa menos por el logo de Alibaba y mas por lo que habilita: probar un modelo agentic con 1M de contexto, vision y BYOK sin salir del mismo plano operativo.

Anthropic baja agentes financieros a Excel y PowerPoint: la señal no es banca, es trabajo real entre apps
Anthropic anuncio el 5 de mayo de 2026 diez plantillas listas para agentes financieros, add-ins para Microsoft 365 y nuevos conectores con MCP. Aunque el vertical sea finanzas, la pista util para builders es otra: contexto continuo entre modelo, hoja, deck y datos gobernados.

GitHub vuelve util el MCP para seguridad: secret scanning ya puede frenar fugas antes del commit
GitHub llevo a disponibilidad general el 5 de mayo de 2026 el secret scanning dentro de su MCP server. La mejora no es cosmetica: permite pedirle a un agente que revise cambios locales antes del commit y respete la misma push protection que ya gobierna el repo.

Vercel endurece Elastic Build Machines contra OOM: por que esto importa mas a equipos con agentes que a una landing comun
Vercel actualizo el 1 de junio de 2026 Elastic Build Machines para reaccionar al uso real de memoria y evitar fallos OOM. La mejora pega directo a repos con agentes, monorepos y builds pesados donde cada deploy roto cuesta tiempo, contexto y dinero.

Claude Managed Agents entra a Cloudflare: mas control sobre sandboxes, red privada y observabilidad
Cloudflare y Anthropic conectaron Claude Managed Agents con Sandboxes, Browser Run y servicios privados el 19 de mayo de 2026. La novedad importa porque separa el cerebro del agente de la infraestructura donde ejecuta codigo y navega.

Gemini API suma Webhooks para agentes largos: menos polling inutil, mejor infraestructura
Google anuncio el 4 de mayo de 2026 Webhooks event-driven para Gemini API. La mejora no es marketing de arquitectura: baja el costo operativo de jobs largos, evita polling ciego y obliga a diseñar mejor reintentos, observabilidad y handoff entre sistemas.

Nuxt ya empuja MCP Apps: por que esto mueve a los agentes de texto a UI util de verdad
El 19 de mayo de 2026 el Nuxt MCP Toolkit sumo soporte para MCP Apps. La señal no es otro framework helper: es que tus tools ya pueden devolver interfaces HTML interactivas dentro de Claude o ChatGPT en vez de limitarse a texto plano.

Vercel MCP ya tiene forma de capa operativa real para agentes de deploy y soporte
La documentacion oficial de Vercel MCP, actualizada el 30 de enero de 2026, deja claro que ya no hablamos de un experimento aislado: hay OAuth, clientes aprobados, herramientas para proyectos y despliegues, y URLs por proyecto para bajar friccion cuando un agente opera en serio.

Vercel mete Firewall al CLI: por que eso si cambia como un agente despliega y se protege
Vercel llevo el Firewall al CLI el 12 de mayo de 2026 y lo conecto con un skill para agentes. La lectura util no es seguridad abstracta: es poder versionar reglas, probar mitigaciones y frenar trafico malo sin salir del loop operativo.

Workspace agents ya estan en ChatGPT para empresas: donde si encajan y donde te puedes meter en problemas
OpenAI movio los workspace agents a disponibilidad general para Business, Enterprise y Edu a finales de mayo de 2026. Hacen research, documentos y tareas conectadas a Slack, Drive o GitHub, pero el punto dificil no es el demo: son permisos, aprobaciones y limites.

OpenAI quiere sacar a Codex del nicho developer: plugins, sitios y flujos para cada rol
OpenAI movio el discurso de Codex el 2 de junio de 2026: ya no lo presenta solo como coding agent, sino como capa de trabajo para operaciones, analisis, producto y equipos mixtos. La oportunidad real esta en los plugins, sitios y flujos repetibles.

Replicate empaqueta skills y MCP para coding agents: menos prompting ciego, mas eleccion de modelo
Replicate publico el 21 de abril de 2026 un paquete oficial de skills para agentes y lo conecto con su MCP server. La idea importa porque convierte seleccion de modelos y prompting en conocimiento reusable, no en improvisacion por chat.

Vercel Sandbox ya corre Docker: por que esto le quita un cuello de botella serio a los agentes
Vercel anuncio el 29 de mayo de 2026 que Sandbox ya puede instalar y correr Docker dentro del entorno aislado. Para builders de agentes, la ganancia real es poder validar servicios y contenedores sin tocar la maquina host.

Como usa OpenAI Codex por dentro: AGENTS.md, Ask Mode y una cola real de trabajo
OpenAI detallo a finales de mayo de 2026 como sus propios equipos usan Codex a diario. La lectura util para builders no es aspiracional: es una receta concreta para bajar errores, recuperar foco y delegar trabajo sin soltar el control.

Anthropic compra Stainless: la señal no es el SDK, es la carrera por conectar agentes con APIs reales
Anthropic anuncio el 18 de mayo de 2026 la compra de Stainless, la empresa que ya generaba sus SDKs oficiales. La pista importante para builders no esta en el comunicado corporativo: esta en que Stainless tambien opera tooling para CLIs y servidores MCP, justo la capa que decide con que APIs, datos y herramientas puede trabajar un agente.

Gemini API Docs MCP y Agent Skills: Google muestra una forma concreta de corregir agentes de coding desactualizados
Google publico el 1 de abril de 2026 una combinacion simple y potente para coding agents: un MCP publico con documentacion viva de Gemini API y un paquete de skills con reglas y patrones actualizados. Segun sus evals, usar ambos lleva el pass rate al 96.3% y reduce 63% los tokens por respuesta correcta frente al prompting vanilla.

Cloudflare lleva Sandboxes a GA: por que esto si acerca a los agentes a un computador real
Cloudflare anuncio el 13 de abril de 2026 que Sandboxes y Containers ya estan en disponibilidad general. La novedad no es otro contenedor: es un entorno persistente con shell, filesystem, preview URLs, inyeccion segura de credenciales y un modelo de costos pensado para agentes que trabajan por rafagas.

Anthropic separa cerebro, manos y sesion en Managed Agents: la pista mas util para builders
Anthropic publico el 8 de abril de 2026 como diseno Managed Agents para tareas largas. La pieza importa porque deja un principio reutilizable para cualquier builder: separar el cerebro del agente, las manos que actuan y la sesion que guarda contexto evita que el runtime quede viejo demasiado rapido.

Anthropic abre su libreta de seguridad para agentes: como estan conteniendo Claude en 2026
El 25 de mayo de 2026 Anthropic publico como contiene Claude en claude.ai, Claude Code y Cowork. La pieza vale por dos razones: muestra fallos reales antes del trust prompt y aterriza por que los agentes utiles necesitan menos aprobaciones manuales, pero mas limites duros en sandbox, red y credenciales.

OpenAI llega a AWS con Codex y Managed Agents: que cambia para equipos que ya viven en Bedrock
OpenAI y AWS anunciaron el 28 de abril de 2026 una integracion que mete modelos frontier, Codex y Managed Agents dentro de Amazon Bedrock. Para equipos que ya operan sobre AWS, la novedad no es otra API: es una forma de desplegar agentes con IAM, CloudTrail, PrivateLink y compromisos de gasto ya existentes.

MLPerf Inference v6.0 mete GPT-OSS y DeepSeek-R1 interactivo: por que este benchmark si importa para builders
MLCommons presento MLPerf Inference v6.0 el 1 de abril de 2026 con nuevos tests para GPT-OSS 120B, DeepSeek-R1 interactivo y mas workloads reales. La señal util no es quien gano hoy, sino que se esta midiendo.

Gemini API ya mezcla tools nativas y funciones propias: por que esta actualizacion si cambia el diseño de agentes
Google anuncio el 17 de marzo de 2026 nuevas capacidades de tooling en Gemini API: combinar built-in tools con funciones propias, circular contexto y usar IDs por tool call. La mejora no es cosmética.

OpenAI explica por fin el sandbox de Codex en Windows: menos aprobaciones y menos Full Access a ciegas
OpenAI detallo el 13 de mayo de 2026 como resolvio el sandbox de Codex en Windows. La lectura util para builders es operativa: bajar friccion sin regalar red ni escritura total al agente.

OpenAI publica una guia practica para GPT-5: la señal real es Responses API, evals y control fino
OpenAI difundio a finales de mayo de 2026 una guia practica para construir con GPT-5. Mas que otro recurso de marketing, deja una tesis operativa clara: si quieres exprimir agentes y coding, toca migrar a Responses API, medir mejor y ajustar reasoning_effort y verbosity con disciplina.

Gemini API File Search ya entiende imagenes, metadata y citas por pagina: por que eso si mueve el RAG de agentes
Google actualizo Gemini API File Search el 5 de mayo de 2026 con soporte multimodal, metadata personalizada y page-level citations. Para builders, la noticia es simple: menos pegamento para RAG verificable y menos excusas para devolver respuestas sin trazabilidad.

Anthropic sube los limites de Claude Code y Claude API: que cambia de verdad para equipos que viven en agentes
Anthropic anuncio el 6 de mayo de 2026 mas capacidad para Claude Code y Claude API tras un acuerdo de compute con SpaceX. La noticia importa menos por el titular y mas por el efecto operativo: menos topes en sesiones largas y mas margen para flujos agenticos continuos.

ITBench-AA pone a los agentes contra incidentes SRE reales y deja una mala noticia: nadie llega al 50%
Artificial Analysis e IBM lanzaron ITBench-AA el 27 de mayo de 2026 para medir agentes en incidentes Kubernetes reales. La lectura importante no es quien lidera hoy, sino que incluso los modelos frontier fallan demasiado cuando toca diagnosticar causa raiz con shell, logs y precision.

Xcode 26.3 mete Claude Agent SDK dentro del IDE: por que eso cambia el trabajo solitario y los loops visuales
Anthropic anuncio el 3 de febrero de 2026 que Xcode 26.3 integra Claude Agent SDK con subagentes, tareas largas, Previews y MCP. La novedad importa menos por Apple y mas por lo que revela sobre el siguiente paso de los agentes de coding: trabajar con contexto, UI y verificacion visual desde el mismo flujo.

Cloudflare convierte Browser Run en una capa real para agentes que necesitan navegar, pausar y retomar
Cloudflare relanzo Browser Run el 15 de abril de 2026 con CDP, MCP, Live View, Human in the Loop y WebMCP. La novedad no es otro navegador remoto: es una capa mas util para agentes que deben verificar en la web sin vivir de screenshots fragiles.

KernelEvolve: Meta usa un agente para optimizar kernels y abrir 60% mas throughput en horas
Meta explico el 2 de abril de 2026 como KernelEvolve trata la optimizacion de kernels como un problema de busqueda y no de codegen de una sola pasada. Para builders, la señal es clara: algunos agentes ya compiten mejor cuando exploran que cuando solo escriben.

Meta convierte un agente en ingeniero de ranking: por que REA importa mas de lo que parece
Meta publico el 17 de marzo de 2026 como su Ranking Engineer Agent lleva hipotesis, jobs y debugging a un loop de varios dias. La noticia vale por dos metricas concretas: 2x en accuracy y 5x en output de ingenieria.

Claude Code explica su bajon de calidad: el postmortem que todo builder de agentes deberia leer
Anthropic detallo el 23 de abril de 2026 tres cambios que degradaron Claude Code, el Agent SDK y Claude Cowork. La leccion practica no es el bug en si, sino como evaluar latencia, memoria y prompts sin romper calidad.

Mistral Search Toolkit convierte retrieval en producto: por que eso importa para RAG y agentes
Mistral lanzo Search Toolkit en public preview el 28 de mayo de 2026 con ingestion, retrieval y evaluacion en el mismo framework. La novedad no es solo tecnica: cambia como equipos pequenos pueden depurar RAG sin pegar herramientas sueltas.

Mistral Vibe empuja los agentes remotos de coding: que ganas y que riesgos compras
Mistral anuncio el 22 de mayo de 2026 agentes remotos en Vibe y Work mode en Le Chat. La promesa es clara: sacar tareas largas de tu laptop y dejarlas correr en la nube con aprobaciones visibles.

Meta ya usa agentes para arreglar regresiones de rendimiento: la leccion no es IA, es codificar expertise
Meta explico el 16 de abril de 2026 como unifico herramientas y skills para que agentes detecten, expliquen y propongan fixes de eficiencia a escala. La novedad importa porque muestra una ruta mas seria para automatizar incidentes de performance.

Meta encontro un cuello de botella real en coding agents: no faltaba modelo, faltaba mapa del codigo
Meta conto el 6 de abril de 2026 como uso mas de 50 agentes para destilar conocimiento tacito en 59 archivos de contexto sobre 4,100 archivos reales. La leccion vale para cualquier equipo que quiera que un agente toque un repo privado sin inventar.

Open Agent Leaderboard: por fin ya puedes comparar sistemas de agentes y no solo modelos
El Open Agent Leaderboard publicado el 18 de mayo de 2026 cambia la pregunta para builders: no basta con mirar el modelo; ahora toca medir costo, herramientas y arquitectura del agente completo.

Google mata Gemini CLI para empujar Antigravity CLI: que cambia si tu equipo vive en agentes de terminal
Google confirmo el 19 de mayo de 2026 la transicion de Gemini CLI hacia Antigravity CLI. La novedad no es un rebrand: cambia el backend, el modelo operativo y la fecha limite para usuarios gratis y Pro el 18 de junio de 2026.

Claude Opus 4.8 empuja a los agentes de coding hacia flujos paralelos y mas verificacion
Anthropic lanzo Claude Opus 4.8 el 28 de mayo de 2026 y, junto con Dynamic Workflows en Claude Code, deja una pista clara para builders: menos sesiones lineales y mas trabajo paralelo con chequeo antes de entregar.

Chrome DevTools for agents ya es estable: como hacer que tu agente verifique en navegador y no adivine
Chrome DevTools for agents llego a 1.0 y le da a Claude Code, Gemini CLI, Codex y otros agentes acceso real a traces, Lighthouse y estado del navegador. La ganancia no es hype: es verificacion.

OpenAI suma WebSocket mode a la Responses API: menos latencia para agentes con muchas tools
WebSocket mode en la Responses API reduce overhead de multiples tool calls, mejora latencia en loops agentic y obliga a pensar en reconexion, secuencialidad y observabilidad.

OpenAI lleva el Agents SDK a ejecucion cloud: que cambia para agentes reales
La actualizacion del Agents SDK apunta a una pieza que muchos prototipos no tienen: ejecucion controlada, archivos, herramientas y sandboxes para tareas largas.

Google prepara Managed Agents en Gemini API: memoria, herramientas y conectores
Google anuncio Managed Agents para Gemini API en I/O 2026, una apuesta por agentes administrados con herramientas especializadas y despliegue mas directo.

Claude Opus 4.7 sube la apuesta para agentes de coding y tareas largas
Anthropic presenta Claude Opus 4.7 como una mejora para tareas complejas de software, flujos asincronos y trabajos de larga duracion.

Telegram Bot API 10.0: por que importa para agentes en mensajeria
La version 10.0 del Bot API agrega cambios utiles para bots y agentes, incluyendo guest mode y mejoras de administracion de chats.
Guias evergreen
6 guias
Como deployar un agente en WhatsApp, Telegram y Slack sin mezclar canales
Una guia practica para disenar un agente multicanal con webhooks, adaptadores, memoria separada y reglas por plataforma.

Evals para agentes: por que una demo bonita no prueba nada
Como medir si un agente funciona de verdad con tareas reales, criterios de exito, regresiones y revision humana.

Arquitectura minima de un agente en produccion: webhooks, colas, memoria y handoff
Los bloques basicos que necesita un agente antes de recibir usuarios reales: entrada, cola, orquestacion, herramientas, memoria y auditoria.

Como usar benchmarks de IA para elegir modelo de agente sin autoenganarse
SWE-bench, LiveCodeBench y leaderboards ayudan, pero no reemplazan pruebas con tus tareas, tus datos y tus costos.

Function calling y herramientas: reglas para que un agente no rompa tu negocio
Como disenar herramientas para agentes con contratos estrictos, permisos, validaciones y respuestas auditables.

Costos, latencia y seguridad antes de abrir tu agente a clientes reales
Checklist operativo para publicar un agente en mensajeria sin sorpresas de factura, respuestas lentas o fuga de datos.