Para usar Imagen en Vertex AI, debes proporcionar una descripción de texto de lo que deseas generar o editar. Estas descripciones se llaman mensajes y son las formas principales de comunicarte con la IA generativa en Vertex AI.
En esta guía, se muestra cómo la modificación de partes de una instrucción de texto a imagen puede producir resultados diferentes y se brindan ejemplos de imágenes que puedes crear. En esta guía, también se explica cómo editar imágenes con mensajes de texto y la iteración.
Uso de productos
Para ver los estándares de uso y las restricciones de contenido asociadas con Imagen en Vertex AI, consulta los lineamientos de uso.
Filtrado de contenido: texto de entrada, imágenes subidas e imágenes generadas
Las imágenes generadas se filtran para evitar contenido no deseado o dañino. Del mismo modo, se verifica si el contenido ofensivo está presente en cualquier entrada que recibe Imagen en Vertex AI. Esto incluye la instrucción de texto de entrada y las fotos subidas en el caso de la edición de imágenes. Para obtener más información, consulta IA responsable y lineamientos de uso de Imagen.
También puedes denunciar los presuntos abusos de Imagen en Vertex AI o cualquier resultado generado que contenga material inapropiado o información imprecisa a través del formulario para denunciar sospechas de abuso enGoogle Cloud.
Conceptos básicos de escritura de mensajes (asunto, contexto y estilo)
Si bien no hay una manera de escribir buenas instrucciones, agregar algunas palabras clave y modificadores te ayudará a acercarte a tu objetivo final. No es necesario que los mensajes sean largos o complejos, pero la mayoría de los buenos mensajes son descriptivos y claros.
Un buen punto de partida puede ser pensar en asunto, contexto y estilo.

Asunto: Lo primero que debes pensar en cualquier mensaje es el asunto: el objeto, la persona, el animal o el paisaje del que deseas una imagen.
Contexto y fondo: igual de importante es el segundo plano o el contexto en el que se colocará el asunto. Intenta ubicar al asunto en diferentes fondos. Por ejemplo, un estudio con un fondo blanco, exterior o entornos interiores.
Estilo: Por último, agrega el estilo de imagen que desees. Los estilos pueden ser generales (pintura, fotografías, esbozos) o muy específicos (pintura al pastel, carbón, 3D isométrico).
Después de escribir una primera versión de tu instrucción, agrega más detalles hasta que obtengas la imagen que deseas. La iteración es importante. Comienza por establecer tu idea principal y, luego, refínala y expándela hasta que la imagen generada se acerque a tu visión.
![]() |
![]() |
![]() |
Escritura de instrucciones de Imagen 3
Consulta la tarjeta del modelo de Imagen for Generation
Imagen 3 puede transformar tus ideas en imágenes detalladas, ya sean tus instrucciones cortas o largas y detalladas. Perfecciona tu visión a través de instrucciones iterativas, agregando detalles hasta lograr el resultado perfecto.
Las instrucciones breves te permiten generar una imagen rápidamente. ![]() |
Las instrucciones más largas te permiten agregar detalles específicos y crear tu imagen. ![]() |
Sugerencias adicionales para escribir instrucciones de Imagen 3:
- Usa un lenguaje descriptivo: Emplea adjetivos y adverbios detallados para pintar una imagen clara para Imagen 3.
- Proporciona contexto: Si es necesario, incluye información de referencia para ayudar a la IA a comprender mejor.
- Haz referencia a artistas o estilos específicos: Si tienes una estética particular en mente, puede ser útil hacer referencia a artistas o movimientos artísticos específicos.
- Usa herramientas de ingeniería de instrucciones: Considera explorar herramientas o recursos de ingeniería de instrucciones para ayudarte a definir mejor tus instrucciones y lograr resultados óptimos.
- Mejora los detalles faciales en tus imágenes personales y grupales:
- Especifica los detalles faciales como el enfoque de la foto (por ejemplo, usa la palabra "retrato" en la instrucción).
- Considera usar un modelo más grande, como Imagen 3, en lugar de Imagen 3 Fast para mejorar el detalle.
Genera texto en imágenes
La capacidad de Imagen 3 para agregar texto a tus imágenes abre posibilidades creativas de generación de imágenes. Sigue estas instrucciones para aprovechar al máximo esta función:
- Itera con confianza: Es posible que debas volver a generar imágenes hasta lograr el aspecto que deseas. La integración de texto de Imagen aún está en evolución, y, a veces, varios intentos producen los mejores resultados.
- Sé breve: Limita el texto a 25 caracteres o menos para una generación óptima.
Varias frases: Experimenta con dos o tres frases distintas para proporcionar información adicional. Evita superar las tres frases para lograr composiciones más claras.
Instrucción: Un póster con el texto "Summerland" en negrita como título. Debajo de este texto, se encuentra el lema "El verano nunca se sintió tan bien". Posicionamiento de la guía: Si bien Imagen puede intentar posicionar el texto según las indicaciones, es posible que haya variaciones ocasionales. Esta función mejora continuamente.
Inspire font style: Especifica un estilo de fuente general para influir sutilmente en las elecciones de Imagen. No confíes en la replicación precisa de fuentes, sino que espera interpretaciones creativas.
Tamaño de fuente: Especifica un tamaño de fuente o una indicación general del tamaño (por ejemplo, pequeño, mediano, grande) para influir en la generación del tamaño de fuente.
Parametrización de instrucciones
Para controlar mejor los resultados, puede ser útil parametrizar las entradas en Imagen cuando trabajes con la API de Imagen o el SDK de Vertex AI para Python. Por ejemplo, supongamos que deseas que tus clientes puedan generar logotipos para sus empresas y quieres asegurarte de que los logotipos siempre se generen sobre un fondo de color sólido. También quieres limitar las opciones que el cliente puede seleccionar en un menú.
En este ejemplo, puedes crear una instrucción parametrizada similar a la siguiente:
A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.
En tu interfaz de usuario personalizada, el cliente puede ingresar los parámetros a través de un menú, y el valor que elija completará la instrucción que recibe Imagen.
Por ejemplo:
Instrucción:
A minimalist logo for a health care company on a solid color background. Include the text Journey.
Instrucción:
A modern logo for a software company on a solid color background. Include the text Silo.
Instrucción:
A traditional logo for a baking company on a solid color background. Include the text Seed.
Estilo: fotografía
- El mensaje contiene: "Una foto de…"
Para usar este estilo, comienza por usar palabras clave que indiquen con claridad a Imagen en Vertex AI que buscas una fotografía. Comienza el mensaje con “Una foto de. . ". Por ejemplo:
![]() |
![]() |
![]() |
Fuente de la imagen: Cada imagen se generó con su mensaje de texto correspondiente con el modelo de Imagen 3.
Estilo: Ilustración y arte
- El mensaje incluye: “Un painting de…” “Un sketch de…”
Los estilos de arte varían desde estilos monocromáticos como esbozos de lápiz hasta arte digital hiperrealista. Por ejemplo, las siguientes imágenes usan el mismo mensaje con diferentes estilos:
“Un [art style or creation technique] de un sedán eléctrico deportivo angular con rascacielos en el fondo”
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Fuente de la imagen: Cada imagen se generó con su instrucción de texto correspondiente con el modelo Imagen 2.
Técnicas avanzadas de escritura de mensajes
Usa los siguientes ejemplos para crear mensajes más específicos basados en los atributos: descriptores de fotografía, formas y materiales, movimientos históricos de arte y modificadores de calidad de imagen.
Modificadores de fotografía
En los siguientes ejemplos, puedes ver varios modificadores y parámetros específicos de la fotografía.
Proximidad de la cámara: Acercamiento, tomado desde lejos
Mensaje: Una foto en primer plano de granos de café Mensaje: Una foto con alejamiento de una bolsa pequeña de
granos de café en una cocina desordenadaPosición de la cámara: aérea, desde abajo
Mensaje: Foto aérea de la ciudad urbana con edificios Mensaje: Una foto de un dosel arbóreo con cielo azul desde abajo Iluminación: natural, drástica, cálida, fría
Mensaje: Foto de estudio de una silla moderna, iluminación natural Mensaje: Foto de estudio de una silla moderna, iluminación dramática Configuración de la cámara - desenfoque de movimiento, enfoque suave, bokeh, vertical
Mensaje: Foto de una ciudad con edificios desde el interior de un automóvil con desenfoque de movimiento Mensaje: Foto con enfoque suave de un puente en una ciudad urbana por la noche Tipos de lentes: 35 mm, 50 mm, ojo de pez, gran angular, macro
Mensaje: Foto de una hoja, lente macro Mensaje: fotografía de una calle, ciudad de Nueva York, lente de ojo de pez Tipos de película: blanco y negro, polaroid
Mensaje: Un retrato polaroid de un perro con anteojos de sol Mensaje: Foto en blanco y negro de un perro que usa lentes de sol
Fuente de la imagen: Cada imagen se generó con su mensaje de texto correspondiente con el modelo de Imagen 3.
Formas y materiales
- El mensaje incluye: “…hecho de…”, “…en forma de…”
Una de las fortalezas de esta tecnología es que puedes crear imágenes que, de otro modo, serían difíciles o imposibles. Por ejemplo, puedes recrear el logotipo de tu empresa en diferentes materiales y texturas.
![]() |
![]() |
![]() |
Fuente de la imagen: Cada imagen se generó con su mensaje de texto correspondiente con el modelo de Imagen 3.
Referencias al arte histórico
- El mensaje incluye: "…en el estilo de…"
Algunos estilos se han convertido en íconos con el tiempo. A continuación, se presentan algunas ideas de estilos históricos de pintura o arte que puedes probar.
"genera una imagen al estilo de [art period or movement]: una granja eólica"
![]() |
![]() |
![]() |
Fuente de la imagen: Cada imagen se generó con su mensaje de texto correspondiente con el modelo de Imagen 3.
Modificadores de calidad de la imagen
Ciertas palabras clave pueden informarle al modelo que buscas un recurso de alta calidad. Algunos ejemplos de modificadores de calidad son los siguientes:
- Modificadores generales: Alta calidad, hermosa, estilizado
- Fotos: 4K, HDR, foto de estudio
- Ilustración y arte: de un profesional, detallada
A continuación, se muestran algunos ejemplos de mensajes sin modificadores de calidad y el mismo mensaje con modificadores de calidad.
![]() |
![]() de un tallo de maíz tomada por un fotógrafo profesional |
Fuente de la imagen: Cada imagen se generó con su mensaje de texto correspondiente con el modelo de Imagen 3.
Relaciones de aspecto
La generación de imágenes de Imagen 3 te permite establecer cinco relaciones de aspecto de imagen distintas.
- Cuadrada (1:1, predeterminada): es una foto cuadrada estándar. Los usos comunes de esta relación de aspecto incluyen las publicaciones en redes sociales.
Pantalla completa (4:3): esta relación de aspecto se suele usar en el contenido multimedia o las películas. También tienen las dimensiones de la mayoría de las TVs antiguas (no de pantalla ancha) y las cámaras de formato medio. Captura una mayor parte de la escena horizontal (en comparación con una imagen 1:1), por lo que se trata de una relación de aspecto preferida para la fotografía.
Mensaje: primer plano de los dedos de un músico tocando el piano, una película en blanco y negro, vintage (relación de aspecto de 4:3) Mensaje: una foto de estudio profesional de papas fritas para un restaurante refinado, al estilo de una revista gastronómica (relación de aspecto de 4:3) Pantalla completa vertical (3:4): esta es la relación de aspecto de la pantalla completa rotada 90 grados. Esto permite capturar más imágenes de la escena de manera vertical en comparación con la relación de aspecto de 1:1.
Mensaje: una mujer haciendo senderismo, cerca de sus botas reflejadas en un charco, grandes montañas en el fondo, al estilo de un anuncio, ángulos drásticos (relación de aspecto de 3:4) Mensaje: toma aérea de un río que fluye por un valle místico (relación de aspecto de 3:4) Pantalla ancha (16:9): esta proporción reemplazó a 4:3 y ahora es la relación de aspecto más común para TVs, monitores y pantallas de teléfonos celulares (horizontal). Usa esta relación de aspecto cuando quieras capturar más del fondo (por ejemplo, paisajes panorámicos).
Mensaje: un hombre con ropa blanca sentado en la playa, en primer plano, con la iluminación de la hora dorada (relación de aspecto de 16:9) Vertical (9:16): esta proporción es para la pantalla ancha, pero rotada. Esta es una relación de aspecto relativamente nueva que se popularizó en las apps de video de formato corto (por ejemplo, YouTube Shorts). Úsala para objetos altos con orientaciones verticales sólidas, como edificios, árboles, cascadas y otros objetos similares.
Mensaje: una renderización digital de un rascacielos enorme, moderno, grande, épico con una hermosa puesta de sol en el fondo (relación de aspecto de 9:16)
Mensajes negativos
Los ejemplos anteriores se enfocan en escribir mensajes para lo que deseas que Imagen cree, pero también puedes proporcionar un mensaje negativo junto con el mensaje original para ayudar al producto a generar o editar imágenes. Estos mensajes negativos pueden ser una herramienta potente que ayuda a especificar qué elementos omitir en la imagen. Simplemente describe lo que no deseas.
Recomendado: Describe claramente lo que no deseas ver. Por ejemplo, “muro, marco”.
Se recomienda evitar el lenguaje instructivo o las palabras como “no”. Por ejemplo, evita frases como “no paredes” o “no mostrar paredes”.
![]() |
![]() Mensaje negativo: vegetación, plantas, bosques, árboles |
![]() |
![]() Mensaje negativo: nieve, escarcha |
Imágenes fotorrealistas
Diferentes versiones del modelo de generación de imágenes pueden ofrecer una combinación de resultados artísticos y fotorrealistas. Usa las siguientes palabras en los mensajes para generar un resultado más fotorrealista, según el asunto que quieras generar.
Caso de uso | Tipo de lente | Longitudes focales | Detalles adicionales |
---|---|---|---|
Personas (retratos) | Prime, zoom | De 24 a 35 mm | película en blanco y negro, película noir, profundidad de campo, doble tono (mencionar dos colores) |
Alimentos, insectos, plantas (objetos, naturaleza muerta) | Macro | De 60 a105 mm | Iluminación controlada, enfoque preciso y de gran detalle |
Deportes y fauna (movimiento) | Acercar el teleobjetivo | De 100 a 400 mm | Velocidad rápida del obturador, acción o seguimiento de movimiento |
Astrómico, horizontal (gran angular) | Gran angular | De 10 a 24 mm | Tiempos de exposición largos, enfoque nítido, exposición larga, agua o nubes fluidas |
Retrato
Caso de uso | Tipo de lente | Longitudes focales | Detalles adicionales |
---|---|---|---|
Personas (retratos) | Prime, zoom | De 24 a 35 mm | película en blanco y negro, película noir, profundidad de campo, doble tono (mencionar dos colores) |
Con varias palabras clave de la tabla, Imagen puede generar los siguientes retratos.
![]() |
![]() |
![]() |
![]() |
Mensaje: Una mujer (retratos de 35 mm, tonos duales azules y grises)
Modelo: Imagen 3 (imagen-3.0-generate-002
)
![]() |
![]() |
![]() |
![]() |
Mensaje: Una mujer, retrato de 35 mm, modelo de cine
Modelo: Imagen 3 (imagen-3.0-generate-002
)
Objetos
Caso de uso | Tipo de lente | Longitudes focales | Detalles adicionales |
---|---|---|---|
Alimentos, insectos, plantas (objetos, naturaleza muerta) | Macro | De 60 a105 mm | Iluminación controlada, enfoque preciso y de gran detalle |
Con varias palabras clave de la tabla, Imagen puede generar las siguientes imágenes de objeto.
![]() |
![]() |
![]() |
![]() |
Mensaje: hoja de una planta de oración, lente macro, 60 mm
Modelo: Imagen 3 (imagen-3.0-generate-002
)
![]() |
![]() |
![]() |
![]() |
Mensaje: un plato de pasta, 100 mm con lente macro
Modelo: Imagen 3 (imagen-3.0-generate-002
)
Movimiento
Caso de uso | Tipo de lente | Longitudes focales | Detalles adicionales |
---|---|---|---|
Deportes y fauna (movimiento) | Acercar el teleobjetivo | De 100 a 400 mm | Velocidad rápida del obturador, acción o seguimiento de movimiento |
Con varias palabras clave de la tabla, Imagen puede generar las siguientes imágenes en movimiento.
![]() |
![]() |
![]() |
![]() |
Mensaje: una anotación ganadora, velocidad de obturador rápida y seguimiento del movimiento
Modelo: Imagen 3 (imagen-3.0-generate-002
)
![]() |
![]() |
![]() |
![]() |
Mensaje: Un ciervo corriendo en el bosque, velocidad rápida del obturador
Modelo: Imagen 3 (imagen-3.0-generate-002
)
Gran angular
Caso de uso | Tipo de lente | Longitudes focales | Detalles adicionales |
---|---|---|---|
Astrómico, horizontal (gran angular) | Gran angular | De 10 a 24 mm | Tiempos de exposición largos, enfoque nítido, exposición larga, agua o nubes fluidas |
Con varias palabras clave de la tabla, Imagen puede generar las siguientes imágenes con gran angular.
![]() |
![]() |
![]() |
![]() |
Mensaje: una porción extensa de montaña, gran angular horizontal de 10 mm
Modelo: Imagen 3 (imagen-3.0-generate-002
)
![]() |
![]() |
![]() |
![]() |
Mensaje: una foto de la luna, fotografías astrológicas, ángulo amplio de 10 mm
Modelo: Imagen 3 (imagen-3.0-generate-002
)
¿Qué sigue?
Lee artículos sobre Imagen y otros productos de IA generativa en Vertex AI:
- Guía para desarrolladores para comenzar a usar Imagen 3 en Vertex AI
- Nuevos modelos y herramientas de medios generativos creados con y para los creadores
- Novedades de Gemini: Gemas personalizadas y generación de imágenes mejorada con Imagen 3
- Google DeepMind: Imagen 3: nuestro modelo de texto a imagen de mayor calidad