NoticiaSeguridad8 min

Anthropic pone numeros al problema: la IA ya esta ayudando mas despues del acceso que antes del phishing

Anthropic publico el 3 de junio de 2026 un analisis de 832 cuentas bloqueadas por actividad cibernetica maliciosa. La senal util para builders no es el susto: es que la IA ya esta empujando tareas de post-compromise, autonomia y chaining que tus agentes tambien deberian estar modelando a la defensiva.

AnthropicClaude
Mapa editorial de amenazas ciberneticas, rutas MITRE y actividad automatizada asistida por IA

El nuevo reporte de Anthropic, publicado el 3 de junio de 2026, vale mas por lo que obliga a redisenar que por el titular de miedo. La empresa analizo 832 cuentas bloqueadas por actividad cibernetica maliciosa entre marzo de 2025 y marzo de 2026 y las mapeo contra MITRE ATT&CK.

La conclusion importante para builders no es simplemente “los malos usan IA”. Esa ya la sabiamos. Lo nuevo es el patron: la IA se esta usando cada vez mas en fases posteriores al acceso inicial, en tareas que antes exigian mas habilidad humana o mas tiempo operativo.

Anthropic dice que 560 de las 832 cuentas usaron IA para preparar ataques, por ejemplo escribiendo malware. Pero el dato que mas deberia importar a quien construye agentes es otro: el uso para lateral movement y otras tecnicas mas profundas ya aparece en el dataset, y la proporcion de actores clasificados como riesgo medio o alto subio de 33% a 56% entre la primera y la segunda mitad del periodo.

Red editorial de movimiento lateral, credenciales y chaining de tareas dentro de un entorno comprometido

La senal no es “mas phishing”; es post-compromise mas barato

Anthropic tambien reporta un cambio fino pero importante:

  • el uso de IA para account discovery subio 8.9%;
  • el uso de IA para phishing asistido bajo 8.6%.

La lectura practica es que la IA no solo esta ayudando a abrir la puerta. Tambien esta ayudando a moverse mejor una vez adentro.

Eso cambia como deberias pensar tus propios agentes defensivos y tus propias politicas de permisos. Si el atacante puede encadenar pasos tecnicos mas complejos con menos friccion, entonces tus controles no pueden vivir solo en el primer prompt o en el primer login.

Por que esto importa incluso si no haces ciberseguridad

Muchos builders leen estos temas y piensan “eso es para SOCs grandes”. Error.

El mismo patron aplica a cualquier agente con tools:

  1. una herramienta valida una accion;
  2. otra recupera contexto;
  3. otra cambia estado;
  4. y el riesgo aparece en la cadena mas que en cada paso aislado.

Eso es exactamente lo que Anthropic esta insinuando cuando dice que MITRE ATT&CK no captura del todo las actividades y herramientas que vuelven peligrosos a los atacantes habilitados por IA. El problema ya no es solo la tecnica suelta. Es el sistema que decide, encadena y adapta.

Lo mas incomodo del reporte

Hay un detalle especialmente util: Anthropic dice que la plataforma usada no correlaciona bien con el riesgo del actor. O sea, no basta con preguntar si alguien usa API, Claude Code o chat. Tampoco basta con medir cuantas tecnicas usa.

Si un actor poco sofisticado puede apoyarse en IA para ejecutar pasos que antes eran de actores mas expertos, tus viejas heuristicas se rompen.

Traducido al mundo builder:

  • no asumas que un agente “simple” es poco riesgoso;
  • no asumas que menos tools implica menos dano;
  • y no asumas que el prompt visible es donde empieza y termina el problema.

Esquema editorial de riesgo operativo, clasificacion de actores y decisiones encadenadas por un sistema asistido por IA

Que haria con esta noticia si estoy construyendo agentes

Yo sacaria cuatro decisiones practicas:

  1. instrumenta las cadenas de herramientas, no solo los resultados finales;
  2. separa identidades y permisos por tarea o subtarea;
  3. trata el contexto recuperado como entrada no confiable;
  4. mide acciones posteriores al acceso, no solo intentos iniciales.

Eso conversa de forma muy directa con nuestra guia sobre function calling y herramientas: cuando el agente gana poder, la superficie peligrosa ya no es el prompt bonito. Es la composicion de tools, memoria y side effects.

Mi lectura

Esta historia no va de vender panico. Va de asumir una realidad tecnica: la IA ya esta abaratando tareas posteriores al acceso y esta empujando ataques mas autonomos y mas encadenados.

Para builders, eso obliga a subir el liston. Ya no basta con “mi agente pide confirmacion”. Hay que pensar en runtime, identidad, trazabilidad y blast radius desde el diseno.

La conclusion corta: Anthropic no solo publico un reporte de amenazas; publico una advertencia sobre como deberiamos modelar agentes con tools antes de que nuestros propios stacks se vuelvan parte del problema.