Guía de atributos de imagen y peticiones

Para usar Imagen en Vertex AI, debes proporcionar una descripción de texto de lo que quieres generar o editar. Estas descripciones se denominan peticiones y son la forma principal de comunicarse con la IA generativa en Vertex AI.

En esta guía se explica cómo se pueden obtener resultados diferentes modificando partes de una petición de texto a imagen y se ofrecen ejemplos de imágenes que puedes crear. En esta guía también se explica cómo editar imágenes mediante peticiones de texto e iteraciones.

Para ver los estándares de uso y las restricciones de contenido asociados a Imagen en Vertex AI, consulta las directrices de uso.

Filtrado de contenido: texto introducido, imágenes subidas e imágenes generadas

Las imágenes generadas se filtran para evitar que incluyan contenido no deseado o dañino. Del mismo modo, cualquier entrada que reciba Imagen en Vertex AI se comprueba para detectar contenido ofensivo. Esto incluye la petición de texto y las fotos subidas en el caso de la edición de imágenes. Para obtener más información, consulta las directrices de uso y de IA responsable de Imagen.

También puedes denunciar el uso inadecuado de Imagen en Vertex AI o cualquier resultado generado que contenga material inapropiado o información imprecisa mediante el formulario Denunciar uso inadecuado enGoogle Cloud.

Aspectos básicos de la redacción de peticiones (tema, contexto y estilo)

Aunque no hay una única forma de escribir buenas peticiones, añadir algunas palabras clave y modificadores te ayudará a acercarte al objetivo final. Las peticiones no tienen por qué ser largas ni complejas, pero la mayoría de las buenas peticiones son descriptivas y claras.

Un buen punto de partida es pensar en el tema, el contexto y el estilo.

Petición con el tema, el contexto y el estilo destacados
Texto de la imagen: un boceto (estilo) de un edificio de apartamentos moderno (tema) rodeado de rascacielos (contexto y fondo).
  1. Sujeto: lo primero que debes tener en cuenta al escribir una petición es el sujeto, es decir, el objeto, la persona, el animal o el paisaje que quieres que aparezca en la imagen.

  2. Contexto y fondo: es igual de importante el fondo o el contexto en el que se colocará el sujeto. Prueba a colocar al sujeto en diferentes fondos. Por ejemplo, un estudio con un fondo blanco, un entorno exterior o un entorno interior.

  3. Estilo: por último, añade el estilo de imagen que quieras. Los estilos pueden ser generales (pintura, fotografía, bocetos) o muy específicos (pintura pastel, dibujo a carboncillo, 3D isométrico).

Después de escribir una primera versión de tu petición, perfecciona tu petición añadiendo más detalles hasta que obtengas la imagen que quieras. La iteración es importante. Empieza por definir tu idea principal y, después, perfecciona y amplía esa idea hasta que la imagen generada se acerque a tu visión.

Imagen de muestra fotorrealista 1
Petición: Un parque en primavera junto a un lago
Imagen de muestra fotorrealista 2
Petición: Un parque en primavera junto a un lago, el sol se pone sobre el lago, hora dorada
Imagen de muestra fotorrealista 3
Petición: Un parque en primavera junto a un lago, el sol se pone sobre el lago, hora dorada, flores silvestres rojas

Escribir peticiones de Imagen 3

Ver la tarjeta de modelo de Imagen para generación

Imagen 3 puede transformar tus ideas en imágenes detalladas, tanto si tus peticiones son cortas como largas y detalladas. Define tu visión mediante peticiones iterativas, añadiendo detalles hasta conseguir el resultado perfecto.

Las peticiones cortas te permiten generar una imagen rápidamente.

Ejemplo de petición breve de Imagen 3
Petición: primer plano de una mujer de unos 20 años, fotografía de calle, fotograma de una película, tonos cálidos naranjas tenues

Las peticiones más largas te permiten añadir detalles específicos y crear tu imagen.

Ejemplo de petición larga de Imagen 3
Petición: foto cautivadora de una mujer de unos 20 años con un estilo de fotografía callejera. La imagen debe parecer un fotograma de una película con tonos cálidos anaranjados tenues.

Consejos adicionales para escribir peticiones de Imagen 3:

  • Usa un lenguaje descriptivo: emplea adjetivos y adverbios detallados para describir claramente la imagen a Imagen 3.
  • Proporciona contexto: si es necesario, incluye información general para ayudar a la IA a entender la situación.
  • Hacer referencia a artistas o estilos concretos: si tienes una estética concreta en mente, puede ser útil hacer referencia a artistas o movimientos artísticos específicos.
  • Usa herramientas de ingeniería de peticiones: explora herramientas o recursos de ingeniería de peticiones para ayudarte a mejorar tus peticiones y conseguir resultados óptimos.
  • Mejorar los detalles faciales de tus imágenes personales y de grupo:
    • Especifica los detalles faciales como foco de la foto (por ejemplo, usa la palabra "retrato" en la petición).
    • Para mejorar los detalles, te recomendamos que uses un modelo más grande, como Imagen 3, en lugar de Imagen 3 Fast.

Generar texto en imágenes

La capacidad de Imagen 3 para añadir texto a tus imágenes abre un abanico de posibilidades creativas para generar imágenes. Sigue estas directrices para sacar el máximo partido a esta función:

  • Itera con confianza: es posible que tengas que volver a generar imágenes hasta conseguir el aspecto que quieras. La integración de texto de Imagen sigue evolucionando y, a veces, es necesario intentarlo varias veces para obtener los mejores resultados.
  • Sé breve: limita el texto a 25 caracteres o menos para que la generación sea óptima.
  • Varias frases: prueba con dos o tres frases distintas para proporcionar información adicional. No incluyas más de tres frases para que las composiciones sean más claras.

    Ejemplo de texto generado por Imagen 3
    Petición: un póster con el texto "Summerland" en negrita como título. Debajo de este texto, se encuentra el eslogan "Summer never felt so good".
  • Guía de colocación: aunque Imagen puede intentar colocar el texto como se indica, es posible que haya variaciones ocasionales. Esta función mejora continuamente.

  • Estilo de fuente de Inspira: especifica un estilo de fuente general para influir sutilmente en las opciones de Imagen. No esperes que la fuente se replique con precisión, sino que se interprete de forma creativa.

  • Tamaño de la fuente: especifica un tamaño de fuente o una indicación general del tamaño (por ejemplo, pequeño, medio o grande) para influir en la generación del tamaño de la fuente.

Parametrización de peticiones

Para controlar mejor los resultados, puede ser útil parametrizar las entradas de Imagen al trabajar con la API de Imagen o el SDK de Vertex AI para Python. Por ejemplo, supongamos que quiere que sus clientes puedan generar logotipos para sus empresas y que estos se generen siempre sobre un fondo de color sólido. También quieres limitar las opciones que el cliente puede seleccionar en un menú.

En este ejemplo, puedes crear una petición parametrizada similar a la siguiente:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

En tu interfaz de usuario personalizada, el cliente puede introducir los parámetros mediante un menú y el valor que elija se incluirá en la petición que reciba Imagen.

Por ejemplo:

  1. Petición: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    Ejemplo 1 de parametrización de peticiones de Imagen 3

  2. Petición: A modern logo for a software company on a solid color background. Include the text Silo.

    Ejemplo 2 de parametrización de la petición de Imagen 3

  3. Petición: A traditional logo for a baking company on a solid color background. Include the text Seed.

    Ejemplo de parametrización de petición de Imagen 3 (3)

Estilo: fotografía

  • La petición incluye: "Una foto de..."

Para usar este estilo, empieza usando palabras clave que indiquen claramente a Imagen en Vertex AI que buscas una fotografía. Empieza tus peticiones con "Una foto de. . .". Por ejemplo:

Imagen de muestra fotorrealista 1
Petición: Una foto de granos de café en una cocina sobre una superficie de madera
Imagen de muestra fotorrealista 2
Petición: Una foto de una tableta de chocolate en una encimera de cocina
Imagen de muestra fotorrealista 3
Petición: Una foto de un edificio moderno con agua al fondo

Fuente de la imagen: cada imagen se ha generado con su correspondiente petición de texto mediante el modelo Imagen 3.

Estilo: ilustración y arte

  • La petición incluye: "Un painting de...", "Un sketch de..."

Los estilos artísticos varían desde los monocromáticos, como los bocetos a lápiz, hasta el arte digital hiperrealista. Por ejemplo, en las siguientes imágenes se ha usado la misma petición con estilos diferentes:

"Un [art style or creation technique] de un sedán eléctrico deportivo y anguloso con rascacielos al fondo"

Imágenes de muestra de arte
Petición: Dibujo técnico a lápiz de un...
Imágenes de muestra de arte
Petición: Un dibujo al carboncillo de un...
Imágenes de muestra de arte
Petición: Un dibujo a lápiz de color de un...
Imágenes de muestra de arte
Petición: Pintura al pastel de un...
Imágenes de muestra de arte
Petición: arte digital de un...
Imágenes de muestra de arte
Petición: un póster art déco de un...

Fuente de la imagen: cada imagen se ha generado con su correspondiente petición de texto mediante el modelo Imagen 2.

Técnicas avanzadas para escribir peticiones

Usa los siguientes ejemplos para crear peticiones más específicas basadas en los atributos: descriptores de fotografía, formas y materiales, movimientos artísticos históricos y modificadores de calidad de imagen.

Modificadores de fotografía

En los siguientes ejemplos, puedes ver varios modificadores y parámetros específicos de fotografía.

  1. Proximidad de la cámara: primer plano tomado desde lejos

    Imagen de muestra de la cámara en primer plano
    Petición: Una foto de primer plano de granos de café
    Imagen de muestra de la cámara con el zoom alejado
    Petición: Una foto alejada de una bolsa pequeña de
    granos de café en una cocina desordenada

  2. Posición de la cámara: aérea, desde abajo

    Imagen de muestra de foto aérea
    Petición: foto aérea de una ciudad con rascacielos
    una vista desde abajo de una imagen de muestra
    Petición: Una foto de la copa de un bosque con el cielo azul desde abajo
  3. Iluminación: natural, dramática, cálida, fría

    imagen de muestra de iluminación natural
    Petición: foto de estudio de un sillón moderno, iluminación natural
    Imagen de muestra de iluminación espectacular
    Petición: foto de estudio de un sillón moderno, iluminación espectacular
  4. Ajustes de la cámara (desenfoque de movimiento, enfoque suave, bokeh y retrato)

    Imagen de muestra de desenfoque de movimiento
    Petición: foto de una ciudad con rascacielos desde el interior de un coche con desenfoque de movimiento
    Imagen de muestra con desenfoque
    Petición: fotografía desenfocada de un puente en una ciudad por la noche
  5. Tipos de lentes: 35 mm, 50 mm, ojo de pez, gran angular y macro

    Imagen de muestra de objetivo macro
    Petición: foto de una hoja, objetivo macro
    Imagen de muestra de objetivo de ojo de pez
    Petición: fotografía de calle, ciudad de Nueva York, objetivo ojo de pez
  6. Tipos de película: blanco y negro, polaroid

    Imagen de muestra de una foto polaroid
    Petición: un retrato polaroid de un perro con gafas de sol
    imagen de muestra de una foto en blanco y negro
    Petición: foto en blanco y negro de un perro con gafas de sol

Fuente de la imagen: cada imagen se ha generado con su correspondiente petición de texto mediante el modelo Imagen 3.

Formas y materiales

  • La petición incluye: "...hecho de...", "...con forma de..."

Una de las ventajas de esta tecnología es que puedes crear imágenes que, de otro modo, serían difíciles o imposibles de conseguir. Por ejemplo, puedes recrear el logotipo de tu empresa con diferentes materiales y texturas.

Imagen de ejemplo 1 de formas y materiales
Petición: una bolsa de lona hecha de queso
Imagen de ejemplo 2 de formas y materiales
Petición: tubos de neón con forma de pájaro
Imagen de ejemplo 3 de formas y materiales
Petición: un sillón de papel, foto de estudio, estilo origami

Fuente de la imagen: cada imagen se ha generado con su correspondiente petición de texto mediante el modelo Imagen 3.

Referencias de arte histórico

  • La petición incluye: "...con el estilo de..."

Algunos estilos se han convertido en iconos a lo largo de los años. A continuación, te proponemos algunas ideas de pintura histórica o estilos artísticos que puedes probar.

"genera una imagen con el estilo de [art period or movement]: un parque eólico"

Imagen de ejemplo de impresionismo
Petición: genera una imagen con el estilo de un cuadro impresionista: un parque eólico
Imagen de ejemplo del Renacimiento
Petición: genera una imagen con el estilo de una pintura renacentista: un parque eólico
Imagen de ejemplo de arte pop
Petición: genera una imagen con el estilo pop art: un parque eólico

Fuente de la imagen: cada imagen se ha generado con su correspondiente petición de texto mediante el modelo Imagen 3.

Modificadores de calidad de imagen

Algunas palabras clave pueden indicar al modelo que buscas un recurso de alta calidad. Estos son algunos ejemplos de modificadores de calidad:

  • Modificadores generales: alta calidad, bonito, estilizado
  • Fotos: 4K, HDR y Foto de estudio
  • Arte, ilustración: profesional y detallada

A continuación, se muestran algunos ejemplos de peticiones sin modificadores de calidad y la misma petición con modificadores de calidad.

Imagen de ejemplo de maíz sin modificadores
Petición (sin modificadores de calidad): una foto de una planta de maíz
imagen de ejemplo de maíz con modificadores
Petición (con modificadores de calidad): 4k HDR beautiful
photo of a corn stalk taken by a
professional photographer

Fuente de la imagen: cada imagen se ha generado con su correspondiente petición de texto mediante el modelo Imagen 3.

Relaciones de aspecto

La generación de imágenes de Imagen 3 te permite definir cinco relaciones de aspecto de imagen distintas.

  1. Cuadrada (1:1, predeterminada): una foto cuadrada estándar. Entre los usos habituales de esta relación de aspecto se incluyen las publicaciones en redes sociales.
  2. Pantalla completa (4:3): esta relación de aspecto se suele usar en medios o películas. También son las dimensiones de la mayoría de las televisiones antiguas (no panorámicas) y de las cámaras de formato medio. Abarca más espacio de la escena en horizontal (en comparación con 1:1), por lo que es una relación de aspecto preferida para la fotografía.

    ejemplo de relación de aspecto
    Petición: primer plano de los dedos de un músico tocando el piano, película en blanco y negro, vintage (relación de aspecto 4:3)
    ejemplo de relación de aspecto
    Petición: Una foto de estudio profesional de patatas fritas para un restaurante de alta cocina, con el estilo de una revista gastronómica (relación de aspecto 4:3)
  3. Pantalla completa vertical (3:4): es la relación de aspecto de pantalla completa girada 90 grados. De esta forma, se puede captar más parte de la escena en vertical que con una relación de aspecto de 1:1.

    ejemplo de relación de aspecto
    Petición: una mujer haciendo senderismo, primer plano de sus botas reflejadas en un charco, montañas grandes al fondo, con el estilo de un anuncio, ángulos dramáticos (relación de aspecto 3:4)
    ejemplo de relación de aspecto
    Petición: toma aérea de un río que fluye por un valle místico (relación de aspecto 3:4)
  4. Panorámico (16:9): esta relación ha sustituido a 4:3 y ahora es la más habitual en televisiones, monitores y pantallas de teléfonos móviles (en horizontal). Usa esta relación de aspecto cuando quieras captar más parte del fondo (por ejemplo, paisajes).

    ejemplo de relación de aspecto
    Petición: un hombre vestido de blanco sentado en la playa, primer plano, iluminación de la hora dorada (relación de aspecto 16:9)
  5. Vertical (9:16): esta relación de aspecto es panorámica, pero está girada. Se trata de una relación de aspecto relativamente nueva que se ha popularizado gracias a las aplicaciones de vídeos cortos (por ejemplo, YouTube Shorts). Úsala para objetos altos con una orientación vertical marcada, como edificios, árboles, cascadas u otros objetos similares.

    ejemplo de relación de aspecto
    Petición: una representación digital de un rascacielos enorme, moderno, grandioso y épico con una preciosa puesta de sol al fondo (relación de aspecto 9:16)

Peticiones negativas

En los ejemplos anteriores, nos hemos centrado en escribir peticiones para que Imagen cree lo que quieras, pero también puedes proporcionar una petición negativa junto con la petición original para ayudar al producto a generar o editar imágenes. Estas peticiones negativas pueden ser una herramienta eficaz para especificar qué elementos se deben omitir de la imagen. Solo tienes que describir lo que no quieres.

Recomendado: describe claramente lo que no quieres ver. Por ejemplo, "pared, marco".

No recomendado: evita el lenguaje instructivo o palabras como "no". Por ejemplo, evita frases como "sin paredes" o "no muestres paredes".

Imagen de ejemplo de pintura sin petición negativa
Petición (sin petición negativa): arte conceptual de un videojuego en 4K, jungla urbana, ciudad ciberpunk, renderizado detallado
Imagen de ejemplo de pintura con una petición negativa
Petición: arte conceptual de un videojuego en 4K, jungla urbana, ciudad ciberpunk, renderizado detallado
Petición negativa: vegetación, plantas, bosque, árboles
Imagen de ejemplo de pintura sin petición negativa
Petición (sin petición negativa): ilustración de un dragón mítico volando sobre montañas
Imagen de ejemplo de pintura con una petición negativa
Petición: Ilustración de un wyvern mítico volando sobre montañas
Petición negativa: nieve, escarcha

Imágenes fotorrealistas

Las diferentes versiones del modelo de generación de imágenes pueden ofrecer una combinación de resultados artísticos y fotorrealistas. Usa las siguientes palabras en las peticiones para generar resultados más fotorrealistas en función del tema que quieras generar.

Caso práctico Tipo de objetivo Distancias focales Información adicional
Personas (retratos) Prime, zoom 24-35mm Película en blanco y negro, cine negro, profundidad de campo, duotono (menciona dos colores)
Comida, insectos, plantas (objetos, bodegones) Macro 60-105mm Alto nivel de detalle, enfoque preciso e iluminación controlada
Deportes, vida salvaje (movimiento) Zoom teleobjetivo 100-400mm Velocidad de obturación rápida, seguimiento de la acción o del movimiento
Astronomía, paisaje (gran angular) Gran angular 10-24mm Tiempos de exposición largos, enfoque nítido, larga exposición, agua o nubes suaves

Retratos

Caso práctico Tipo de objetivo Distancias focales Información adicional
Personas (retratos) Prime, zoom 24-35mm Película en blanco y negro, cine negro, profundidad de campo, duotono (menciona dos colores)

Con varias palabras clave de la tabla, Imagen puede generar los siguientes retratos.

Ejemplo de fotografía de retrato Ejemplo de fotografía de retrato Ejemplo de fotografía de retrato Ejemplo de fotografía de retrato

Petición: Una mujer, retrato de 35 mm, duotono azul y gris
Modelo: Imagen 3 (imagen-3.0-generate-002)

Ejemplo de fotografía de retrato Ejemplo de fotografía de retrato Ejemplo de fotografía de retrato Ejemplo de fotografía de retrato

Petición: Una mujer, retrato de 35 mm, cine negro
Modelo: Imagen 3 (imagen-3.0-generate-002)

Objetos

Caso práctico Tipo de objetivo Distancias focales Información adicional
Comida, insectos, plantas (objetos, bodegones) Macro 60-105mm Alto nivel de detalle, enfoque preciso e iluminación controlada

Con varias palabras clave de la tabla, Imagen puede generar las siguientes imágenes de objetos.

Ejemplo de fotografía de objetos Ejemplo de fotografía de objetos Ejemplo de fotografía de objetos Ejemplo de fotografía de objetos

Petición: hoja de una planta de oración, objetivo macro, 60 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

Ejemplo de fotografía de objetos Ejemplo de fotografía de objetos Ejemplo de fotografía de objetos Ejemplo de fotografía de objetos

Petición: un plato de pasta, objetivo macro de 100 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

Movimiento

Caso práctico Tipo de objetivo Distancias focales Información adicional
Deportes, vida salvaje (movimiento) Zoom teleobjetivo 100-400mm Velocidad de obturación rápida, seguimiento de la acción o del movimiento

Con varias palabras clave de la tabla, Imagen puede generar las siguientes imágenes en movimiento.

Ejemplo de fotografía con movimiento Ejemplo de fotografía con movimiento Ejemplo de fotografía con movimiento Ejemplo de fotografía con movimiento

Petición: un touchdown ganador, velocidad de obturación rápida, seguimiento del movimiento
Modelo: Imagen 3 (imagen-3.0-generate-002)

Ejemplo de fotografía con movimiento Ejemplo de fotografía con movimiento Ejemplo de fotografía con movimiento Ejemplo de fotografía con movimiento

Petición: Un ciervo corriendo por el bosque, velocidad de obturación rápida, seguimiento del movimiento
Modelo: Imagen 3 (imagen-3.0-generate-002)

Gran angular

Caso práctico Tipo de objetivo Distancias focales Información adicional
Astronomía, paisaje (gran angular) Gran angular 10-24mm Tiempos de exposición largos, enfoque nítido, larga exposición, agua o nubes suaves

Con varias palabras clave de la tabla, Imagen puede generar las siguientes imágenes de gran angular.

Ejemplo de fotografía gran angular Ejemplo de fotografía gran angular Ejemplo de fotografía gran angular Ejemplo de fotografía gran angular

Petición: una cadena montañosa extensa, paisaje gran angular de 10 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

Ejemplo de fotografía gran angular Ejemplo de fotografía gran angular Ejemplo de fotografía gran angular Ejemplo de fotografía gran angular

Petición: una foto de la luna, astrofotografía, gran angular de 10 mm
Modelo: Imagen 3 (imagen-3.0-generate-002)

Siguientes pasos

Consulta artículos sobre Imagen y otros productos de IA generativa en Vertex AI: