Noticia8 min

Cloudflare separa tráfico AI en Search, Agent y Training: por qué tu sitio ya necesita políticas distintas

Cloudflare anunció el 1 de julio de 2026 nuevas opciones para administrar tráfico de IA por uso: Search, Agent y Training. Para builders, la señal es que los agentes web ya no caben en una regla única de bots.

Cloudflare
Composición editorial de Cloudflare separando tráfico de IA en Search, Agent y Training antes de aplicar políticas

Por qué importa

Esta nota se enfoca en la decisión práctica para builders: qué cambia, qué riesgo agrega y cómo aplicarlo sin romper operación.

Cloudflare publicó el 1 de julio de 2026 un cambio que parece de bot management, pero en realidad toca la arquitectura de agentes web: sus clientes ya pueden administrar tráfico de IA separando Search, Agent y Training.

La distinción importa porque hasta ahora muchos equipos trataban todo lo automatizado como el mismo problema. Un crawler que indexa contenido, un agente que entra en nombre de un usuario y un bot que toma datos para entrenar modelos no deberían tener la misma política. Cloudflare está convirtiendo esa diferencia en controles visibles.

Panel editorial con catálogo de bots, agentes y categorías de uso antes de filtrar tráfico

El cambio útil es la taxonomía

Cloudflare define Search como comportamiento que recopila o indexa contenido para responder consultas después. Agent cubre actividad automatizada en tiempo real en nombre de una persona, como fetch bots de chat o agentes que usan navegador. Training cubre crawlers que toman contenido para entrenar o afinar modelos.

Eso baja a tierra una discusión que suele quedar abstracta. Si construyes un producto web, la pregunta ya no es solo “¿permito bots?”. La pregunta correcta es:

  • ¿quiero que me encuentren en buscadores?
  • ¿quiero que un agente autorizado complete tareas por un usuario?
  • ¿quiero que mi contenido termine absorbido en entrenamiento?
  • ¿qué pasa si el mismo operador mezcla esos usos?

Cloudflare dice que el 15 de septiembre de 2026 cambiará defaults para nuevos dominios: en páginas con anuncios, Training y Agent quedarán bloqueados por defecto, mientras Search seguirá permitido por defecto. Ese detalle es relevante para sitios de contenido, SaaS con docs públicas y productos que dependen de adquisición orgánica.

BotBase vuelve visible lo que antes era intuición

El segundo anuncio conectado es BotBase, un directorio searchable de bots y agentes que Cloudflare rastrea. El valor para operadores no es solo ver nombres. Es ver clasificación por comportamiento, filtrar tráfico propio hasta un bot específico y copiar IDs de detección para reglas de seguridad.

También aparece Attribution Business Insights, un dashboard para comparar cuánto crawlea un operador frente a cuánto tráfico refiere de vuelta. Ese ángulo importa para negocio: si un agente consume contenido y no devuelve visitas, la conversación deja de ser técnica y se vuelve de valor capturado.

Escena editorial de reglas de contenido con uso inmediato, referencia y reproducción completa antes de autorizar un agente

Qué cambia para builders de agentes

Si tu agente lee la web abierta, esta noticia anticipa fricción. Sitios grandes van a empezar a distinguir entre agente útil, crawler de entrenamiento y scraping disfrazado. La automatización que no se identifique bien puede perder acceso aunque no sea maliciosa.

Yo revisaría tres decisiones:

  1. identifica claramente el user agent y el propósito de tu agente;
  2. respeta señales de contenido y límites de robots cuando existan;
  3. separa tráfico de búsqueda, acciones en nombre del usuario y recolección masiva.

La intención de búsqueda es actual y cualificada: Cloudflare AI traffic options, Search Agent Training crawlers, BotBase Cloudflare, AI agent traffic policy. No hay SEO tooling conectado; la demanda se infiere por anuncio oficial, cobertura de Content Independence Day y el crecimiento de agentes que ya navegan sitios reales.

Si estás construyendo agentes que usan web o navegador, cruza esta noticia con el curso gratis. La lectura práctica es simple: el agente que no declara bien qué hace en la web va a chocar con reglas cada vez más finas.