OpenAI publicó a finales de mayo de 2026 una guía práctica para construir con GPT-5. Podría parecer otro documento de evangelización, pero si la lees como builder deja una conclusión mucho más concreta: OpenAI ya no quiere que trates GPT-5 como un modelo al que le tiras prompts sueltos; quiere que lo operes sobre Responses API, con estado, evals y controles explícitos.

Esa señal importa porque muchos equipos siguen usando GPT-5 como si fuera una mejora lineal de Chat Completions. La propia guía dice lo contrario: para sacar rendimiento real en agentes, coding y tareas multi-step, la migración de superficie importa tanto como el modelo.

La tesis de OpenAI en cuatro pasos

La guía se organiza como una secuencia muy directa:

migrar a Responses API,
optimizar prompting,
ajustar reasoning y verbosity,
corregir fallos recurrentes con evals y troubleshooting.

No parece revolucionario, pero sí es una admisión útil: el mayor salto de productividad no viene solo del modelo. Viene de usar la infraestructura para la que el modelo fue diseñado.

OpenAI empuja especialmente tres ideas:

persistir contexto y razonamiento entre turnos y tool calls,
reducir glue code gracias al modelo y la API correcta,
medir antes de reescribir prompts a ciegas.

Eso encaja con lo que muchos equipos ya están viendo: cuando un agente usa herramientas, reintenta y encadena decisiones, la API deja de ser un detalle de implementación.

Responses API ya no es opcional para agentes serios

La parte más importante de la guía está en la migración. OpenAI sostiene que solo Responses API permite mantener mejor el estado, mejorar caching y aprovechar capacidades agenticas nuevas.

Dicho sin marketing: si sigues en una integración vieja, probablemente estás peleando contra el sistema.

Para builders que trabajan con:

copilotos internos,
agentes de coding,
flujos con herramientas,
procesos multi-turno,
salidas estructuradas largas,

la noticia es clara: seguir en la superficie anterior es aceptar más fricción de la necesaria.

Flujo visual de migracion desde una integración vieja hacia Responses API con estado tools y evals

Reasoning y verbosity: menos magia, más control

La guía también ordena algo que muchos usan de forma intuitiva y poco rigurosa: los controles de comportamiento.

OpenAI recomienda ajustar reasoning_effort y verbosity según complejidad real de la tarea. Eso puede sonar obvio, pero tiene una implicación operativa fuerte: deja de optimizar por sensaciones y empieza a optimizar por tipo de trabajo.

Ejemplos simples:

tareas cortas de clasificación o extracción no deberían cargar reasoning alto por costumbre,
coding difícil o tool use incierto sí puede justificar más esfuerzo,
respuestas largas no siempre son mejores, aunque el modelo pueda producirlas.

La guía básicamente te está diciendo que GPT-5 premia más la dirección explícita y castiga más el prompting genérico.

Lo que más me gusta: pone a las evals antes del retoque fino

La recomendación de empezar por evals antes de "mejorar prompts" es probablemente la parte más sana del documento.

OpenAI plantea un flujo sobrio:

corre tus prompts actuales,
mira fallos reales,
inspecciona razonamiento resumido,
metapromptea si hace falta,
documenta patrones buenos y malos.

Eso es mucho más útil que la obsesión típica por coleccionar prompts de internet. Para equipos que construyen producto, el aprendizaje no es "usa este prompt mágico"; es arma un circuito de medición que sobreviva al próximo cambió de modelo.

Que deberias hacer si hoy usas GPT-5 en producción

No hace falta reescribir todo hoy. Pero sí conviene revisar tres frentes:

API surface

Confirma qué flujos siguen en una integración vieja y cuáles deberían pasar primero a Responses API.

Configuración por tarea

Deja de usar un solo preset para todo. Un agente que resume tickets, uno que escribe código y uno que hace planning no necesitan el mismo esfuerzo ni la misma verbosidad.

Evals reutilizables

Si el equipo cambia de modelo o de prompt y nadie puede medir regressions rápido, vas a seguir operando por intuición.

Mesa de evaluación con controles de reasoning verbosity y pruebas reutilizables para GPT-5

La lectura final

Esta guía vale porque revela prioridades de plataforma, no porque enseñe un truco nuevo. OpenAI está diciendo, con bastante claridad, que el stack ganador para GPT-5 pasa por Responses API, controles finos y una cultura de evals que no dependa del entusiasmo del día.

Si vienes afinando flujos agenticos, compárala con nuestra nota sobre OpenAI y el modo WebSocket en Responses API, porque ambas empujan la misma dirección: menos overhead, más continuidad y más control para tareas largas. Y si todavía estás montando la base, Instala Tu Propio Agente de IA te da el contexto práctico para entender por qué el cambió de API importa tanto como el cambió de modelo.

La conclusión corta: la noticia no es que OpenAI publicara una guía; la noticia es que ya dejó por escrito cómo espera que los builders usen GPT-5 cuando el trabajo es agentico y no solo conversacional.