El nuevo reporte de Anthropic, publicado el 3 de junio de 2026, vale más por lo que obliga a redisenar que por el titular de miedo. La empresa analizo 832 cuentas bloqueadas por actividad cibernetica maliciosa entre marzo de 2025 y marzo de 2026 y las mapeo contra MITRE ATT&CK.

La conclusión importante para builders no es simplemente “los malos usan IA”. Esa ya la sabiamos. Lo nuevo es el patron: la IA se esta usando cada vez más en fases posteriores al acceso inicial, en tareas que antes exigian más habilidad humana o más tiempo operativo.

Anthropic dice que 560 de las 832 cuentas usaron IA para preparar ataques, por ejemplo escribiendo malware. Pero el dato que más deberia importar a quien construye agentes es otro: el uso para lateral movement y otras tecnicas más profundas ya aparece en el dataset, y la proporcion de actores clasificados como riesgo medio o alto subio de 33% a 56% entre la primera y la segunda mitad del periodo.

Red editorial de movimiento lateral, credenciales y chaining de tareas dentro de un entorno comprometido

La senal no es “más phishing”; es post-compromise más barato

Anthropic también reporta un cambió fino pero importante:

el uso de IA para account discovery subio 8.9%;
el uso de IA para phishing asistido bajo 8.6%.

La lectura práctica es que la IA no solo esta ayudando a abrir la puerta. Tambien esta ayudando a moverse mejor una vez adentro.

Eso cambia como deberias pensar tus propios agentes defensivos y tus propias politicas de permisos. Si el atacante puede encadenar pasos tecnicos más complejos con menos friccion, entonces tus controles no pueden vivir solo en el primer prompt o en el primer login.

Por que esto importa incluso si no haces ciberseguridad

Muchos builders leen estos temas y piensan “eso es para SOCs grandes”. Error.

El mismo patron aplica a cualquier agente con tools:

una herramienta valida una acción;
otra recupera contexto;
otra cambia estado;
y el riesgo aparece en la cadena más que en cada paso aislado.

Eso es exactamente lo que Anthropic esta insinuando cuando dice que MITRE ATT&CK no captura del todo las actividades y herramientas que vuelven peligrosos a los atacantes habilitados por IA. El problema ya no es solo la técnica suelta. Es el sistema que decide, encadena y adapta.

Que haria con esta noticia si estoy construyendo agentes

Yo sacaria cuatro decisiones practicas:

instrumenta las cadenas de herramientas, no solo los resultados finales;
separa identidades y permisos por tarea o subtarea;
trata el contexto recuperado como entrada no confiable;
mide acciones posteriores al acceso, no solo intentos iniciales.

Eso conversa de forma muy directa con nuestra guia sobre function calling y herramientas: cuando el agente gana poder, la superficie peligrosa ya no es el prompt bonito. Es la composicion de tools, memoria y side effects.

Mi lectura

Esta historia no va de vender panico. Va de asumir una realidad técnica: la IA ya esta abaratando tareas posteriores al acceso y esta empujando ataques más autonomos y más encadenados.

Para builders, eso obliga a subir el liston. Ya no basta con “mi agente pide confirmacion”. Hay que pensar en runtime, identidad, trazabilidad y blast radius desde el diseno.

La conclusión corta: Anthropic no solo publico un reporte de amenazas; publico una advertencia sobre como deberiamos modelar agentes con tools antes de que nuestros propios stacks se vuelvan parte del problema.

Anthropic pone numeros al problema: la IA ya esta ayudando más después del acceso que antes del phishing

La senal no es “más phishing”; es post-compromise más barato

Por que esto importa incluso si no haces ciberseguridad

Lo más incomodo del reporte

Que haria con esta noticia si estoy construyendo agentes

Mi lectura