Guía de indicaciones para GPT Image 2: Cómo escribir mejores indicaciones + 35 ejemplos

Resumir con IA

Si ya has probado GPT Image 2, probablemente hayas notado algo de inmediato: puede hacer mucho más que los modelos de imagen anteriores, pero aún así funciona mejor cuando el mensaje es claro. Por eso, una imagen sólida Guía de indicaciones de la imagen 2 de GPT Es importante. Unas mejores indicaciones no solo te dan imágenes más bonitas, sino también resultados más útiles, más acordes con tu marca y mucho más cercanos a lo que realmente querías desde el principio.

La buena noticia es que GPT Image 2 es mucho más fácil de usar que muchos generadores de imágenes anteriores. Ofrece una mejor representación de texto, sigue mejor instrucciones detalladas, es más fiable para la edición y tiene mayor capacidad para elementos visuales estructurados como infografías, maquetas de interfaz de usuario y anuncios. Sin embargo, esto no significa que puedas escribir una frase vaga y esperar resultados perfectos siempre.

Esta guía desglosa cómo escribir indicaciones más efectivas para GPT Imagen 2, qué estructura de indicación funciona mejor, cómo manejar el texto y las ediciones, y qué patrones son más útiles para los flujos de trabajo comerciales y creativos. También incluí 35 indicaciones listas para usar Puedes adaptarlo para fotografías de productos, anuncios, gráficos para redes sociales, infografías, pantallas de interfaz de usuario y mucho más.

Si está creando flujos de trabajo creativos impulsados por IA con OpenClaw Ya sea para flujos de contenido dentro de IMA Studio, este es el tipo de marco de trabajo que convierte la generación aleatoria de imágenes en algo repetible y útil.

Por qué las indicaciones son más importantes con GPT Imagen 2

Mucha gente piensa que cuanto mejores sean los modelos, menos importante será la ayuda que se les dé. En la práctica, suele ser al revés. Un modelo más capaz puede seguir más instrucciones, conservar más restricciones y responder a más matices. Esto significa que la calidad de la ayuda que se le da influye más en el resultado final.

Con GPT Image 2, la diferencia entre una sugerencia débil y una fuerte es enorme. Una sugerencia vaga como "crear un anuncio de cuidado de la piel" puede generar algo atractivo pero genérico. Una sugerencia más estructurada le indica al modelo exactamente qué tipo de anuncio se desea, dónde debe ubicarse el producto, qué dice la etiqueta, cómo debe ser la iluminación, qué texto debe aparecer y qué elementos no deben modificarse.

Si quieres la versión corta, aquí la tienes: La herramienta GPT Image 2 funciona mejor cuando se utiliza como un brief creativo, no como una simple lluvia de ideas.

La fórmula básica de solicitud de imagen 2 de GPT

La forma más sencilla de redactar una buena consigna es utilizar una estructura repetible. No es necesario que sea demasiado complicada. En la mayoría de los casos, este esquema de seis partes es suficiente:

  1. Escena o fondo — donde se desarrolla la imagen
  2. Sujeto — ¿Quién o qué es el foco principal?
  3. Detalles clave — materiales, colores, texturas, estilo, elementos distintivos de la marca
  4. Composición — encuadre, ángulo, recorte, ubicación
  5. Iluminación y ambiente — suave, cinematográfico, editorial, brillante, melancólico, etc.
  6. Restricciones — qué conservar, qué evitar, qué texto debe aparecer

Aquí tienes un ejemplo sencillo:

Una taza de café expreso de cerámica sobre una mesa de madera desgastada. Composición en primer plano. Luz cálida de la mañana que entra desde la izquierda. Profundidad de campo reducida y suave. Fotorrealista. Sin texto, sin manos, sin objetos adicionales en el encuadre.

Esa indicación funciona porque le da al modelo la información suficiente para definir el resultado. Le indica dónde se desarrolla la escena, cuál es el sujeto principal, cómo debe encuadrarse, qué tipo de iluminación debe tener y qué debe evitar.

Cómo hacer que las indicaciones sean más precisas

Una vez que se comprende la estructura básica, el siguiente paso es la precisión. GPT Image 2 es lo suficientemente potente como para que los detalles específicos resulten realmente importantes.

1. Sea específico sobre el tema.

No digas "una mujer sosteniendo un producto" si en realidad quieres decir "una mujer de unos 30 años, con cabello oscuro y rizado, que lleva un suéter de punto color crema y sostiene un frasco cuentagotas de color ámbar para el cuidado de la piel a la altura del pecho". Cuanto más definido esté el sujeto, menos tendrá que adivinar la modelo.

2. Utiliza un lenguaje visual real.

Si buscas una imagen con aspecto fotográfico, escribe como un fotógrafo. Menciona el tipo de toma, el punto de vista, la sensación que produce el objetivo y el estilo de iluminación. Si buscas un anuncio limpio, escribe como un diseñador. Menciona el espaciado, la alineación, la ubicación del titular, el estilo tipográfico y el espacio en blanco.

3. Ponga el texto exacto entre comillas.

Este es uno de los consejos más importantes de GPT Imagen 2. Si la precisión del texto es crucial, coloque la frase literal entre comillas. Si el texto es inusual, escríbalo con cuidado. Si la ubicación es importante, indique con precisión dónde debe ir.

Por ejemplo:

La etiqueta dice “LUMIÈRE SERUM” en letra serif blanca y fina, centrada en la botella, totalmente legible, sin palabras adicionales ni sustituciones.

4. Tratar las ediciones de forma diferente a la generación

Si estás editando una imagen existente, la parte más importante de las instrucciones suele ser la regla de conservación. Debes especificar qué elementos deben permanecer exactamente iguales.

Una sugerencia de edición contundente suele sonar así:

Cambia únicamente el fondo por un fondo de estudio de color beige suave. Mantén la forma de la botella, el texto de la etiqueta, la dirección de la iluminación, el ángulo de la cámara y el tamaño del producto exactamente iguales.

5. No sobrecargues la primera solicitud.

Este es un error común. La gente intenta resolverlo todo de golpe. GPT Image 2 puede manejar mucho, pero los flujos de trabajo son más sencillos cuando se itera. Empieza con la composición y el sujeto. Luego, define el ambiente. Después, define el texto. Y finalmente, define los detalles específicos.

Mejores patrones de indicaciones para tareas comunes de GPT (Imagen 2)

Las distintas tareas requieren estilos de indicaciones diferentes. Una indicación para una fotografía de producto no debería sonar como una indicación para una interfaz de usuario. Una indicación para un logotipo no debería sonar como una indicación para una infografía. A continuación, se explica cómo pensar en las categorías principales.

Indicaciones fotorrealistas

Para lograr un fotorrealismo, utiliza el lenguaje de la cámara, las texturas y las imperfecciones del mundo real. Menciona la textura de la piel, el desgaste de la ropa, las sombras sutiles, la poca profundidad de campo y la iluminación natural si quieres que el resultado sea creíble en lugar de excesivamente pulido.

Mensajes del producto

En las imágenes de productos, especifique claramente la posición del producto, la superficie, la iluminación, la legibilidad de la etiqueta y si la imagen debe tener un aspecto limpio, propio del comercio electrónico, o un estilo editorial de alta calidad.

Indicaciones con mucho texto

Para carteles, anuncios, gráficos para redes sociales y etiquetas de envases, utilice un texto exacto, especifique el tipo de fuente o el tono y mencione la jerarquía. Si el titular debe ser grande y estar centrado, indíquelo. Si la llamada a la acción (CTA) debe ubicarse en el tercio inferior, también indíquelo.

Indicadores de infografía

En diagramas y explicaciones, la claridad es más importante que el estilo. Mencione el título, el número de pasos, la orientación del diseño, el estilo de los iconos y el público objetivo. Si está dirigido a clientes, ejecutivos o estudiantes, incluya ese contexto.

Mensajes de la interfaz de usuario

Para las pantallas de la interfaz, describa el diseño, las secciones, el tipo de producto en general y si el resultado debe parecer una aplicación terminada o un concepto preliminar. Frases como “parece un producto finalizado, no un prototipo” pueden ser útiles.

35 indicaciones GPT Image 2 listas para usar

A continuación, encontrará ejemplos de indicaciones que puede adaptar directamente. Sustituya los elementos entre corchetes con los detalles de su producto, marca o campaña.

1) Imágenes fotorrealistas

  1. Una mujer de veintitantos años sentada junto a la ventana de una cafetería, empañada por la lluvia, leyendo un libro de bolsillo. Luz ambiental suave, poca profundidad de campo, espontánea y natural, fotorrealista, con un aire a película de 35 mm.
  2. Un vendedor ambulante de comida al anochecer en un bullicioso mercado de Bangkok. Luz cálida de farol, vapor que sale de un wok, multitud a su alrededor ligeramente borrosa, estilo fotorrealista y documental.
  3. Primer plano de unas manos curtidas amasando pan sobre una superficie de madera enharinada. Luz cálida de cocina, textura de harina visible, detalles realistas de la piel, fotorrealista.
  4. Un marinero anciano, de pie en una pequeña barca de pesca, ajusta una red mientras un perro se sienta cerca. Luz diurna suave de la costa, plano medio corto, grano de película sutil, honesto y espontáneo, fotorrealista.
  5. Una escena realista de una multitud al aire libre en Bethel, Nueva York, el 16 de agosto de 1969. Vestimenta y puesta en escena fieles a la época, luz natural de verano, fotorrealista.

2) Fotografía de producto y maquetas

  1. [Frasco de perfume] sobre una superficie de mármol blanco con pétalos de rosa secos, luz suave difusa cenital, estilo editorial de cosméticos de lujo, sutil sombra de contacto, fotorrealista.
  2. [Botella de suplemento] centrada sobre un fondo blanco limpio, texto de la etiqueta nítido, sombra ligera en la base, sin bordes, fotografía de producto para comercio electrónico.
  3. [Bolsa de café] colocada verticalmente sobre tela de lino crudo con granos de café esparcidos, iluminación lateral natural cálida, sensación artesanal de primera calidad, fotorrealista.
  4. Auriculares inalámbricos apoyados sobre una superficie de hormigón, toma desde un ángulo bajo, iluminación de estudio azul tenue, estética de producto tecnológico de alta gama, fotorrealista.
  5. Fotografía editorial de un frasco de sérum facial sobre mármol negro pulido. Composición amplia y centrada. Luz direccional intensa desde la parte superior derecha. La etiqueta dice “LUMIÈRE SERUM” en letras blancas con serifa fina, totalmente legibles. Fondo gris oscuro. Sin accesorios.

3) Creatividades publicitarias y campañas en redes sociales

  1. Un anuncio de estilo de vida para una marca de botellas de agua premium. Una mujer camina por un sendero panorámico de montaña, sosteniendo la botella de agua de forma natural. Luz dorada del atardecer. El eslogan “DISeñalada para el largo camino” aparece en negrita, en fuente sans-serif blanca, en el tercio inferior. Fotorrealista.
  2. Un anuncio cuadrado para redes sociales de una marca de cuidado de la piel. Un solo producto centrado sobre un fondo rosa pálido. Estilo editorial minimalista. El texto “TU PIEL. SIMPLIFICADA.” aparece centrado debajo en una fuente negra fina sin serifa.
  3. Un anuncio llamativo para una aplicación de fitness. Fondo oscuro, silueta de un corredor a mitad de zancada iluminada en naranja. Titular: “COMIENZA HOY”. Texto blanco grande de alto contraste en la parte superior central.
  4. Un cartel de rebajas de verano con un fondo coral brillante. Gran titular centrado: “REBAJAS DE VERANO” en negrita blanca sin serifa. Debajo: “HASTA 501 TP3 T DE DESCUENTO — TERMINA EL 31 DE JULIO”. Minimalista, limpio, alto contraste.
  5. Un anuncio de Facebook para un servicio de entrega de comidas. Vista aérea de una comida en una caja con el logo de la marca sobre una encimera de mármol. Luz natural. Texto “CENA. LISTO.” en blanco y negrita en la parte inferior izquierda. Fotorrealista.

4) Infografías y explicaciones

  1. Infografía sencilla y minimalista titulada “Cómo funcionan los paneles solares”, con cinco pasos etiquetados en un flujo horizontal. Fondo blanco, estilo de iconos uniforme, etiquetas legibles en fuente sans-serif y amplio espacio en blanco.
  2. Infografía circular cronológica titulada "La historia de Internet" desde 1969 hasta 2024, con seis hitos, combinación de colores azul y blanco, diseño limpio y etiquetas claras.
  3. Diagrama didáctico que muestra las capas de la Tierra —corteza, manto, núcleo externo, núcleo interno— con flechas, etiquetas y códigos de color. Diseñado para estudiantes de secundaria.
  4. Un tutorial visual paso a paso titulado "Cómo preparar café frío" con cinco pasos ilustrados, subtítulos breves, tonos tierra cálidos, fondo blanco y tipografía sans-serif clara.
  5. Infografía detallada que muestra el funcionamiento de una cafetera automática, incluyendo el depósito de granos, el molinillo, el depósito de agua, la caldera, la unidad de preparación y la salida de la taza. Técnica pero fácil de entender, con un diseño claro y estructurado.

5) Maquetas de interfaz de usuario y pantallas de producto

  1. Pantalla de inicio de la aplicación móvil de finanzas personales "Luma". Tarjeta de saldo en la parte superior, cuadrícula de categorías de gastos, lista de transacciones recientes. Fondo blanco limpio, detalles en azul y morado, mostrado dentro de un marco de iPhone.
  2. Panel de control SaaS para una herramienta de gestión de proyectos. Navegación en la barra lateral izquierda, tres columnas Kanban en el área principal, modo claro, espaciado limpio, aspecto de producto final, no de prototipo.
  3. Panel de análisis de comercio electrónico para escritorio. Tarjetas de KPI para ingresos, pedidos y tasa de conversión, un gráfico de líneas en la parte inferior, tabla de productos más vendidos a la derecha, estética moderna de SaaS.
  4. Pantalla de bienvenida de una aplicación de meditación. Fondo azul marino oscuro a sangre completa con un suave degradado aurora boreal. Texto grande centrado: "¿Cómo te sientes hoy?" con cinco botones selectores de estado de ánimo debajo.
  5. Pantalla de una aplicación de recetas que muestra la imagen principal del plato, la lista de ingredientes, la calificación por estrellas, el tiempo de preparación y un botón destacado de llamada a la acción "Comenzar a cocinar". Tonos cálidos, interfaz móvil de alta calidad.

6) Logotipos, carteles y elementos visuales de marca

  1. Logotipo minimalista para la marca de café “ORIN”. Forma abstracta de llama u hoja que compone la letra O. Color marrón oscuro, típico del espresso. Diseño plano. Fuerte espacio negativo. Sin degradados.
  2. Logotipo geométrico para la empresa fintech “KOVE”. Letras angulares y llamativas. Solo en azul marino y blanco. Limpio, escalable, moderno, sin sombras.
  3. Un cartel oscuro para un evento de jazz llamado “MIDNIGHT SESSION”. Fondo negro con un suave foco ámbar. Gran titular con serifa. Subtítulo: “TODOS LOS VIERNES. 21:00. THE GRAND HALL”. Elegante, sobrio, sin texto adicional.
  4. Portada de la novela “LA OSCURIDAD TRANQUILA”. Fondo azul marino intenso con la ilustración de una sola llama de vela. Título en tipografía blanca con serifa de gran tamaño. Nombre del autor, “E. VALE”, debajo. Estilo literario y minimalista.
  5. Tarjeta de presentación para el lanzamiento de una marca de café. Fondo con textura de papel kraft. Ilustración centrada de una taza de café. El texto dice: “PRESENTAMOS ORIN BLEND NO.7” con el lema “Tostado para los curiosos”. Estética artesanal de alta calidad.

7) Editar indicaciones y cambios controlados

  1. Cambia únicamente el fondo por un fondo de estudio de color beige cálido. Mantén la forma de la botella, el texto de la etiqueta, el ángulo de la cámara, el tamaño del producto y la dirección de la iluminación sin cambios.
  2. Traduzca todo el texto de esta infografía al español. No modifique el diseño, la posición de los iconos, los colores, la jerarquía ni el estilo de las ilustraciones.
  3. Sustituye las flores que aparecen en el anuncio por rosas rojas y rosas. Mantén los mismos marcos, perspectiva, tipografía y composición general.
  4. Cambia únicamente el color de la chaqueta de negro a verde oscuro. Mantén el mismo sujeto, pose, expresión facial, fondo, iluminación y encuadre.
  5. Retire el objeto adicional de la mesa. Conserve la textura de la mesa, las sombras, la ubicación del producto y la profundidad de campo tal como están.

Cómo adaptar estas indicaciones para el trabajo real.

El error más común es copiar las indicaciones palabra por palabra y esperar que se ajusten a todas las situaciones. Una mejor opción es usarlas como plantillas.

Por ejemplo, una plantilla para fotos de productos podría verse así:

[Producto] sobre [superficie o entorno]. [Tipo o ángulo de toma]. [Estilo de iluminación]. [Indicadores de marca o ambiente]. [Requisitos de texto, si los hay]. Fotorrealista. [Restricciones].

Y una plantilla de anuncio para redes sociales podría verse así:

Un anuncio creativo [formato] para [marca o categoría]. [Imagen principal]. [Fondo]. Título “[texto del título]” en [estilo de fuente] ubicado en [ubicación]. [Ambiente o iluminación]. Sin marcas de agua ni texto adicional.

Al pensar en plantillas, puedes escalar las solicitudes a todo un equipo con mayor facilidad. Esto resulta especialmente útil si gestionas las solicitudes mediante OpenClaw, automatizaciones creativas o flujos de trabajo internos repetibles.

Errores comunes en las indicaciones de la imagen 2 de GPT

  • Ser demasiado vago: Indicaciones como "mejora esto" o "crea un anuncio atractivo" dejan demasiado margen a la interpretación.
  • Olvidar las restricciones: Si no especificas qué debe permanecer igual, el modelo podría cambiar más de lo que deseas.
  • No se especifica la ubicación del texto: La redacción exacta por sí sola no es suficiente cuando la jerarquía o la alineación son importantes.
  • Sobrecargar una solicitud: Demasiados requisitos a la vez pueden dificultar la depuración. Itera en su lugar.
  • Ignorando el uso previsto: Indica si el recurso es para un anuncio, una infografía, una pantalla de interfaz de usuario o un listado de comercio electrónico. Esto ayuda a configurar el modo correcto.

Reflexiones finales

Un fuerte Guía de indicaciones de la imagen 2 de GPT En realidad, se trata de una sola cosa: claridad. Cuanto más clara sea la consigna, más útil será el resultado. Y dado que GPT Image 2 es más potente que los modelos anteriores en cuanto a texto, estructura, realismo y edición, esa claridad resulta más valiosa que nunca.

Si solo recuerdas una idea clave, que sea esta: describe la escena, el sujeto, los detalles, la composición, el ambiente y las limitaciones. Luego, repite el proceso paso a paso. Esta sencilla disciplina te dará mejores resultados que intentar seguir una fórmula mágica.

Para equipos que utilizan OpenClaw Y para IMA Studio, esto es aún más importante. Una buena guía es lo que convierte la generación de imágenes de un experimento puntual en un sistema creativo repetible.

Referencias

Acerca del autor

Compartir publicación:

Mantente conectado

Más actualizaciones