Cloudflare lanzó el 11 de junio de 2026 una mejora concreta para equipos que ya dejaron de tratar la IA como experimento: custom AI prompt topics dentro de su capa de DLP. En vez de depender solo de patrones predefinidos como PII, código fuente o jailbreaks, ahora puedes describir un concepto propietario en lenguaje natural y usarlo como entrada de detección.

Eso importa mucho para agentes. Un agente conectado a correo, CRM, documentos o herramientas internas no siempre filtra “números de tarjeta” o “secrets” obvios. A veces filtra algo más sutil: roadmap no anunciado, términos de contrato, margen de cliente, incidentes internos o una estrategia comercial que no cabe en una regex.

Flujo editorial donde una política DLP detecta conceptos propietarios en prompts, respuestas y tráfico de agentes

Qué cambió exactamente

Según el changelog, el flujo vive en Zero Trust: vas a Data loss prevention, creas una entrada de detección tipo AI prompt topic, describes el concepto que quieres detectar y luego lo conectas a un perfil DLP.

La parte útil está en la forma de escribir la regla. Cloudflare recomienda describir el concepto, no listar keywords. Ese detalle es clave: en seguridad de agentes, muchas fugas ocurren con paráfrasis, resúmenes o fragmentos que no coinciden con una palabra exacta.

La documentación de AI Gateway DLP también muestra hacia dónde va el patrón: escanear tráfico de prompts y respuestas en tiempo real para aplicar acciones de protección. Para un equipo con agentes en producción, eso suena menos a compliance decorativo y más a control operativo.

Dónde sí ayuda

Este tipo de regla tiene sentido cuando el dato sensible no es un identificador clásico. Ejemplos razonables:

nombres de proyectos internos antes del anuncio;
pricing o descuentos negociados con clientes grandes;
investigaciones de seguridad todavía no divulgadas;
descripciones de arquitectura que revelan controles débiles;
datasets o prompts propietarios usados para entrenar workflows internos.

No es una defensa completa contra prompt injection. Pero sí añade una capa que muchos equipos no tienen: detectar intención y tema, no solo tokens prohibidos.

Tablero editorial con logs, acciones de DLP y revisión de eventos donde agentes intentan usar información sensible

El tradeoff que no conviene esconder

Las reglas conceptuales pueden reducir falsos negativos, pero también pueden traer falsos positivos. Si describes mal el tema, puedes bloquear investigación legítima o llenar a seguridad de ruido.

Por eso lo probaría así:

Empieza en modo registro, no bloqueo.
Usa temas estrechos y revisables.
Cruza detecciones con usuario, app, modelo y tool llamada.
Solo bloquea cuando el patrón ya tenga señal repetida.

La pregunta no es si Cloudflare puede detectar todo. La pregunta práctica es si te da una capa más cerca del tráfico real que tus documentos de política.

Por qué esta noticia encaja con builders

Si todavía estás en etapa de fundamentos, el curso gratis ayuda a ordenar herramientas y permisos antes de abrir datos reales. Si ya estás más avanzado, cruza esta pieza con Cloudflare y su capa de skills, scheduling y Telegram, porque una historia habla del runtime y esta de cómo reducir la fuga cuando ese runtime toca información sensible.

Mi lectura corta: custom topics no reemplaza una arquitectura segura, pero sí vuelve más defendible operar agentes con datos que una lista de keywords jamás iba a entender bien.