Cloudflare agrega temas personalizados para proteger prompts de IA: menos keywords, más concepto
Cloudflare lanzó el 11 de junio de 2026 custom AI prompt topics para DLP. Para equipos que conectan agentes a datos internos, la mejora importante es detectar conceptos propietarios en prompts y respuestas sin depender solo de listas de palabras.

Por qué importa
Esta nota se enfoca en la decisión práctica para builders: qué cambia, qué riesgo agrega y cómo aplicarlo sin romper operación.
Cloudflare lanzó el 11 de junio de 2026 una mejora concreta para equipos que ya dejaron de tratar la IA como experimento: custom AI prompt topics dentro de su capa de DLP. En vez de depender solo de patrones predefinidos como PII, código fuente o jailbreaks, ahora puedes describir un concepto propietario en lenguaje natural y usarlo como entrada de detección.
Eso importa mucho para agentes. Un agente conectado a correo, CRM, documentos o herramientas internas no siempre filtra “números de tarjeta” o “secrets” obvios. A veces filtra algo más sutil: roadmap no anunciado, términos de contrato, margen de cliente, incidentes internos o una estrategia comercial que no cabe en una regex.

Qué cambió exactamente
Según el changelog, el flujo vive en Zero Trust: vas a Data loss prevention, creas una entrada de detección tipo AI prompt topic, describes el concepto que quieres detectar y luego lo conectas a un perfil DLP.
La parte útil está en la forma de escribir la regla. Cloudflare recomienda describir el concepto, no listar keywords. Ese detalle es clave: en seguridad de agentes, muchas fugas ocurren con paráfrasis, resúmenes o fragmentos que no coinciden con una palabra exacta.
La documentación de AI Gateway DLP también muestra hacia dónde va el patrón: escanear tráfico de prompts y respuestas en tiempo real para aplicar acciones de protección. Para un equipo con agentes en producción, eso suena menos a compliance decorativo y más a control operativo.
Dónde sí ayuda
Este tipo de regla tiene sentido cuando el dato sensible no es un identificador clásico. Ejemplos razonables:
- nombres de proyectos internos antes del anuncio;
- pricing o descuentos negociados con clientes grandes;
- investigaciones de seguridad todavía no divulgadas;
- descripciones de arquitectura que revelan controles débiles;
- datasets o prompts propietarios usados para entrenar workflows internos.
No es una defensa completa contra prompt injection. Pero sí añade una capa que muchos equipos no tienen: detectar intención y tema, no solo tokens prohibidos.

El tradeoff que no conviene esconder
Las reglas conceptuales pueden reducir falsos negativos, pero también pueden traer falsos positivos. Si describes mal el tema, puedes bloquear investigación legítima o llenar a seguridad de ruido.
Por eso lo probaría así:
- Empieza en modo registro, no bloqueo.
- Usa temas estrechos y revisables.
- Cruza detecciones con usuario, app, modelo y tool llamada.
- Solo bloquea cuando el patrón ya tenga señal repetida.
La pregunta no es si Cloudflare puede detectar todo. La pregunta práctica es si te da una capa más cerca del tráfico real que tus documentos de política.
Por qué esta noticia encaja con builders
La intención de búsqueda aquí combina AI prompt protection, Cloudflare DLP AI prompts, custom prompt topics y AI Gateway DLP. La demanda se infiere por el aumento de agentes conectados a herramientas internas y por la presión de seguridad alrededor de MCP, BYOK, gateways y auditoría.
Para Agente IA, el ángulo competitivo está en aterrizarlo a decisiones concretas: si tu agente ya toca datos internos, no basta con “usa un modelo bueno”. Necesitas límites observables entre lo que el agente puede leer, resumir, enviar y registrar.
Si todavía estás en etapa de fundamentos, el curso gratis ayuda a ordenar herramientas y permisos antes de abrir datos reales. Si ya estás más avanzado, cruza esta pieza con Cloudflare y su capa de skills, scheduling y Telegram, porque una historia habla del runtime y esta de cómo reducir la fuga cuando ese runtime toca información sensible.
Mi lectura corta: custom topics no reemplaza una arquitectura segura, pero sí vuelve más defendible operar agentes con datos que una lista de keywords jamás iba a entender bien.