GitHub lanzó el 1 de julio de 2026 una mejora pequeña en interfaz y grande en operación: Copilot CLI y GitHub Copilot SDK ya permiten poner límites de AI credits por sesión. La función está en preview pública y apunta directamente a un problema de agentes: una tarea sin supervisión puede gastar en llamadas de modelo, subagentes y trabajo en background mucho más de lo que el equipo esperaba.

El cambio introduce un freno por corrida. En interactivo, el usuario puede usar /limits. En ejecuciones no interactivas, el parámetro relevante es --max-ai-credits. Cuando se alcanza el límite, Copilot termina o pausa de forma controlada en vez de seguir hasta acabar la tarea o hasta que alguien lo detenga.

Pipeline editorial de una corrida no interactiva con --max-ai-credits antes de abrir tareas, subagentes y compaction

Por qué esto importa más en automatización

Un chat manual ya tiene un freno humano: alguien ve que la conversación se alarga. Un agente programático no. Puede compilar, reintentar, crear subagentes, resumir contexto, buscar más archivos y seguir consumiendo créditos mientras nadie mira.

GitHub dice que el límite cubre el uso de la sesión completa, incluyendo llamadas de modelo, subagentes y trabajo de fondo como compaction. Esa parte es importante porque muchos presupuestos fallan por mirar solo el prompt visible. El costo real vive también en reintentos, delegación, contexto y tareas auxiliares.

La versión mínima indicada por GitHub es Copilot CLI 1.0.66 y Copilot SDK 1.0.5. Para scripts, la implicación es directa: cualquier job recurrente debería declarar su presupuesto junto a permisos, branch, entorno y criterio de salida.

Lo que no resuelve

El límite es un soft cap. GitHub advierte que el uso solo se conoce después de que una respuesta vuelve, así que una respuesta ya en curso puede terminar y exceder ligeramente el número configurado. Tampoco reemplaza budgets globales, cost centers o límites de gasto de la organización.

Eso significa que hay dos niveles de control:

el límite de sesión protege una corrida concreta;
los presupuestos y cost centers protegen el gasto agregado de equipos, repos o unidades.

Confundirlos genera falsa seguridad. Un agente con límite por sesión todavía puede gastar mucho si se ejecuta cien veces al día.

Escena operativa con soft cap, subagentes y revisión de gasto agregado antes de escalar una automatización

Criterios para elegir el límite

No pondría el mismo número a todos los trabajos. Separaría por tipo de tarea.

Para triage o resumen, el límite debe ser bajo y el agente debe terminar con hipótesis, no con cambios. Si se queda sin créditos, probablemente el scope era demasiado amplio.

Para cambios de código acotados, usaría un límite medio y exigiría que el agente priorice: leer contrato, modificar poco, correr prueba específica y reportar lo que no alcanzó.

Para migraciones largas, el límite debería dividirse por fase: exploración, primer patch, pruebas, limpieza. Un solo presupuesto grande invita a ocultar dónde se fue el gasto.

Para jobs recurrentes, guardaría métricas por slug de tarea: créditos consumidos, éxito, intervención humana, duración y archivos tocados. Si el costo crece sin mejorar tasa de éxito, el agente no necesita más presupuesto; necesita mejor contrato.

Qué cambia para builders

El lanzamiento baja una barrera para probar agentes en CI, cron o workflows internos sin dejar la tarjeta abierta. También fuerza una conversación saludable: cada automatización debería declarar qué puede gastar para producir una unidad de valor.

La demanda actual se infiere por señales oficiales: changelog reciente, docs de CLI, tutorial de optimización de AI usage, crecimiento de Copilot CLI/SDK y queries probables como Copilot max AI credits, Copilot CLI limits, AI credit session limits, Copilot SDK budget y costos agentes Copilot. No hay herramienta SEO conectada, así que no invento volumen.

Si estás montando agentes propios, el patrón aplica aunque no uses Copilot: presupuesto por corrida, salida parcial clara y medición por tipo de tarea. En el curso gratis la base es construir agentes útiles; este cambio recuerda la siguiente etapa: un agente útil también debe saber cuándo parar.