GitLab abre más modelos open source para Duo Agent Platform Self-Hosted: cuándo sí conviene y cuándo no

Cuando un vendor promete agentes para toda la empresa, casi siempre asume internet abierta, inferencia cloud y tolerancia razonable a que el código salga de tu perímetro. Muchísimos equipos no viven en ese mundo.

Por eso el anuncio de GitLab del 21 de mayo de 2026 sí merece atención: Duo Agent Platform Self-Hosted ahora soporta más modelos open source y empuja una idea muy concreta para entornos regulados, air-gapped o con residencia de datos estricta. La historia no es “más modelos por tener más modelos”. La historia es más margen para asignar el modelo correcto a la tarea correcta sin depender por defecto de un proveedor externo.

GitLab lista cuatro incorporaciones para ese tramo:

Mistral Devstral 2 123B
GLM-5.1
Kimi-K2.6
MiniMax-M2.7

Visual editorial con varios modelos open source detrás de un AI Gateway propio y políticas de red cerradas

La señal útil no es la lista; es el patrón de despliegue

La mayoría de comparativas de modelos se queda en benchmark, latencia o precio. GitLab baja la discusión a otra capa: qué modelo puedes usar cuando no puedes mandar el código a una API pública.

Ahí entran tres piezas que la documentación deja bastante claras:

puedes correr un AI Gateway propio;
puedes servir modelos compatibles desde plataformas como vLLM;
y puedes mezclar despliegue totalmente self-hosted con una configuración híbrida por feature.

Eso cambia bastante la conversación para builders empresariales. Ya no es solo “qué modelo razona mejor”, sino:

cuál entra en tu perímetro;
cuál aguanta tool use y diffs grandes;
cuál merece GPU propia;
y cuál solo usarías en ciertos flujos.

Lo importante: GitLab no te obliga a una sola estrategia

La docs de Self-hosted models remarca algo que vale más que la lista de compatibilidad: puedes operar en varios modos.

Opción 1: totalmente self-hosted

Sirve cuando de verdad no puede salir nada del entorno. GitLab lo plantea para escenarios con barreras físicas, red aislada o regulación fuerte. Aquí el argumento es claro: inference data, prompts, código y respuestas no salen de la red del cliente.

Opción 2: híbrido por feature

También puedes tener tu propio AI Gateway para la mayoría del trabajo y usar modelos gestionados por GitLab en funciones puntuales. Esa flexibilidad es útil cuando quieres aislar lo sensible, pero no pagar la complejidad de self-hostear absolutamente todo.

La consecuencia práctica es buena: ya no tienes que elegir entre pureza ideológica y pragmatismo total. Puedes rutear por riesgo y por costo.

El error sería creer que self-hosted sale gratis

No sale gratis. Sale distinto.

Moverte a esta ruta implica asumir:

operación del AI Gateway;
selección de hardware o GPU VM;
mantenimiento del serving stack;
y pruebas serias de calidad por feature, no por intuición.

GitLab recomienda vLLM como plataforma de serving para open source, pero eso no convierte el problema en trivial. Lo vuelve posible.

Escena editorial con enrutamiento por costo y riesgo entre modelos self-hosted, nube privada y políticas por feature

Cómo decidir si este anuncio te sirve de verdad

Yo usaría un criterio simple.

Sí conviene explorar esta ruta si:

tu equipo no puede exponer código a terceros;
ya tienes presión por residencia de datos;
quieres separar features por riesgo y no por moda;
o necesitas un plan real para agentes en entornos regulados.

No conviene venderlo como solución universal si:

todavía no tienes disciplina de evaluación;
ni siquiera sabes qué tareas justifican un agente;
o tu principal problema sigue siendo instrucción, no infraestructura.

En esos casos, cambiar a self-hosted solo te da más piezas que mantener.

Mi lectura

GitLab no está diciendo que todos deban self-hostear modelos. Está diciendo algo más razonable: si necesitas hacerlo, ahora tienes más opciones reales para empatar modelo, plataforma y restricción operativa.

Si estás comparando esta ruta con otras más abiertas, conviene cruzarla con nuestra nota sobre GitLab Orbit, porque una historia resuelve contexto y esta resuelve perímetro + modelo. Y si todavía te falta la base antes de elegir infraestructura, el punto de entrada correcto sigue siendo el curso gratis.

La conclusión corta es esta: GitLab está haciendo que Duo Agent Platform Self-Hosted se parezca menos a una casilla de compliance y más a una arquitectura usable para agentes con código sensible.