La personnalisation de sujet proposée dans Imagen 3 vous permet de générer des images à partir d'une requête textuelle et d'une image de référence que vous fournissez. L'image de référence que vous fournissez permet de guider la génération d'images.
Cas d'utilisation
La personnalisation Imagen 3 propose un système de rédaction de requêtes libre, ce qui peut donner l'impression que ses capacités sont plus étendues que ce pour quoi il a été entraîné. Les sections suivantes décrivent les cas d'utilisation prévus pour la personnalisation Imagen 3 et une série non exhaustive d'exemples de cas d'utilisation non prévus.
Nous vous recommandons d'utiliser la personnalisation Imagen 3 pour les cas d'utilisation prévus, car nous avons entraîné le modèle pour ces cas précis et nous nous attendons à de bons résultats. À l'inverse, bien que vous puissiez pousser le modèle à effectuer des tâches en dehors des cas d'utilisation prévus, nous ne nous attendons pas à ce que vous obteniez de bons résultats.
Cas d'utilisation prévus
Voici les cas d'utilisation prévus pour la personnalisation de sujet avec Imagen 3 :
- Styliser une photo d'une personne
- Styliser une photo d'une personne tout en préservant ses expressions faciales
- (Faible taux de réussite) Placez un produit, comme un canapé ou un cookie, dans plusieurs scènes avec différents angles de vue.
- Générer des variantes d'un produit sans conserver les détails exacts
- Styliser une photo d'une personne tout en conservant son expression faciale
Exemples de cas d'utilisation non prévus
Voici une liste non exhaustive des cas d'utilisation pour lesquels la personnalisation Imagen 3 n'a pas été entraînée et génère des résultats médiocres :
- Placer plusieurs personnes dans différentes scènes tout en préservant leur identité
- Placer plusieurs personnes dans différentes scènes tout en préservant leur identité, en spécifiant le style de l'image de sortie à l'aide d'une image exemple fournie en entrée pour définir le style
- Styliser une photo de plusieurs personnes tout en préservant leur identité
- Placer un animal de compagnie dans différentes scènes tout en préservant son identité
- Styliser une photo d'animal de compagnie et la transformer en dessin
- Styliser une photo d'un animal de compagnie et la transformer en dessin, tout en conservant ou en spécifiant le style de l'image (par exemple, une aquarelle)
- Placer un animal de compagnie et une personne dans une scène différente, tout en conservant leur identité
- Styliser une photo d'un animal de compagnie et d'une ou plusieurs personnes et la transformer en dessin
- Placer deux produits dans plusieurs scènes avec des angles différents
- Placer un produit, comme un cookie ou un canapé, dans plusieurs scènes avec différentes angles, tout en adoptant un style d'image spécifique (photoréaliste avec des couleurs, des styles d'éclairage ou des animations spécifiques, par exemple)
- Placer un produit dans une autre scène, tout en conservant la composition de la scène telle que spécifiée par une image de contrôle
- Placer deux produits dans plusieurs scènes avec des angles différents, en utilisant une image spécifique en entrée (par exemple, photoréaliste avec des couleurs, des styles d'éclairage ou des animations spécifiques)
- Placer deux produits dans plusieurs scènes, tout en conservant la composition de la scène telle que spécifiée par une image de contrôle
Exemples de personnalisation de sujet
Les sections suivantes décrivent les cas d'utilisation compatibles avec la personnalisation de sujet d'Imagen 3 :
Personnalisation d'une personne
Exemple d'entrée | Exemple de résultat |
---|---|
|
![]() |
1 Image d'entrée de référence générée à l'aide de la génération d'images Imagen 3 à partir de la requête suivante : portrait d'une femme à Paris. Elle porte un pantalon noir et une chemise blanche.
Personnalisation d'un produit
Exemple d'entrée | Exemple de résultat |
---|---|
|
![]() |
Afficher la fiche de modèle Imagen pour la modification et la personnalisation
Avant de commencer
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
Configurez l'authentification pour votre environnement.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST
Pour utiliser les exemples d'API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à gcloud CLI.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .
Personnalisation d'un sujet
Vous pouvez fournir des images de référence de types de sujet lorsque vous utilisez la personnalisation Imagen 3. Plus précisément, les requêtes few-shot avec la personnalisation Imagen 3 sont compatibles avec les sujets suivants : produit, personne et animal de compagnie. Le sujet que vous choisissez a un impact sur la façon dont vous devez formuler votre requête de génération.
La requête que vous utilisez avec la personnalisation Imagen 3 peut avoir une incidence sur la qualité des images générées. Les sections suivantes décrivent les modèles de requête recommandés et présentent des exemples pour l'envoi de requêtes de personnalisation.
Personnalisation d'une personne
Le tableau suivant décrit les modèles de requête que nous vous recommandons d'utiliser pour commencer à écrire des requêtes de personnalisation de personne :
Cas d'utilisation Images de référence Modèle de requête Exemple Stylisation de l'image d'une personne avec ajout du maillage du visage en entrée Image du sujet (1)
Image de contrôle du maillage de visage (1)Génère une image de la SUBJECT_DESCRIPTION [1] avec le facemesh from the control image [2]. ${PROMPT} Génère une image de la the person [1] avec le facemesh from the control image [2]. La personne doit regarder droit devant elle avec une expression neutre. L'arrière-plan doit être… Stylisation de l'image d'une personne sans ajout du maillage du visage en entrée Image du sujet (1 à 4) Crée une image de SUBJECT_DESCRIPTION [1] correspondant à la description : un portrait de SUBJECT_DESCRIPTION [1] ${PROMPT} Crée une image de a woman with short hair[1] correspondant à la description : un portrait de a woman with short hair[1] dans un style de dessin animé 3D sur un fond flou. Un personnage mignon et adorable, un visage souriant, regardant la caméra, des tons pastel, une qualité élevée, 4K, un chef-d'œuvre, des détails superbes, une texture de peau, un mappage de texture, des ombres douces, un éclairage réaliste doux, des couleurs vives Stylisation de l'image d'une personne sans ajout du maillage du visage en entrée Image du sujet (1 à 4) Crée une image STYLE_DESCRIPTION [2] de SUBJECT_DESCRIPTION [1] correspondant à la description : un portrait de SUBJECT_DESCRIPTION [1] STYLE_PROMPT Crée une image 3d-cartoon style [2] de a woman with short hair [1] correspondant à la description : un portrait de a woman with short hair [1] dans un style de dessin animé 3D sur un fond flou. Un personnage mignon et adorable, un visage souriant, regardant la caméra, des tons pastel, une qualité élevée, 4K, un chef-d'œuvre, des détails superbes, une texture de peau, un mappage de texture, des ombres douces, un éclairage réaliste doux, des couleurs vives Stylisation de l'image d'une personne avec ajout du maillage du visage en entrée Image du sujet (1 à 3)
Image de contrôle avec maillage du visage (1)Crée une image de SUBJECT_DESCRIPTION [1] dans la pose de CONTROL_IMAGE [2] correspondant à la description : un portrait de SUBJECT_DESCRIPTION [1] ${PROMPT} Crée une image de a woman with short hair [1] dans la pose de control image [2] correspondant à la description : un portrait de a woman with short hair [1] dans un style de dessin animé 3D sur un fond flou. Un personnage mignon et adorable au visage souriant, regardant la caméra, des tons pastel, une qualité élevée, 4K, un chef-d'œuvre, des détails superbes, une texture de peau, un mappage de texture, des ombres douces, un éclairage réaliste doux, des couleurs vives Stylisation de l'image d'une personne avec ajout du maillage du visage en entrée Image du sujet (1 à 3)
Image de contrôle avec maillage du visage (1)Crée une image STYLE_DESCRIPTION [3] de SUBJECT_DESCRIPTION [1] dans la pose de CONTROL_IMAGE [2] correspondant à la description : un portrait de SUBJECT_DESCRIPTION [1] ${PROMPT} Crée une image 3d-cartoon style [3] de a woman with short hair [1] dans la pose de control image [2] correspondant à la description : un portrait de a woman with short hair [1] dans un style de dessin animé 3D sur un fond flou. Un personnage mignon et adorable au visage souriant, regardant la caméra, des tons pastel, une qualité élevée, 4K, un chef-d'œuvre, des détails superbes, une texture de peau, un mappage de texture, des ombres douces, un éclairage réaliste doux, des couleurs vives Nous vous recommandons de respecter les propriétés suivantes pour le visage de votre image de référence :
- Le visage est centré et occupe au moins la moitié de l'image.
- L'image est pivotée en vue de face dans toutes les directions (tangage, lacet et roulis).
- Le visage n'est pas occulté par des objets tels que des lunettes de soleil ou un masque.
Utilisez les exemples suivants pour envoyer une requête de personnalisation avec des images de référence de personnes servant à guider la génération d'images. Vous pouvez envoyer ce type de requête avec une image de contrôle du maillage du visage pour guider davantage la génération d'images, ou sans.
REST
Pour en savoir plus sur les requêtes envoyées au modèle
imagen-3.0-capability-001
, consultez la documentation de référence de l'API du modèleimagen-3.0-capability-001
.Cet exemple vous montre comment spécifier une zone de contrôle du maillage du visage pour guider la génération. Vous pouvez également omettre l'objet de référence de contrôle (
"referenceType": "REFERENCE_TYPE_CONTROL"
), auquel cas Imagen détectera automatiquement une zone de contrôle du maillage du visage.Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- LOCATION : région de votre projet (
us-central1
,europe-west2
ouasia-northeast3
, par exemple). Pour obtenir la liste des régions disponibles, consultez IA générative sur les emplacements Vertex AI. - TEXT_PROMPT : prompt textuel qui guide le modèle pour la génération d'images. Pour utiliser la personnalisation Imagen 3, incluez le
referenceId
de l'image ou des images de référence que vous fournissez au format [$referenceId]. Par exemple :- La requête textuelle suivante concerne une requête comportant deux images de référence avec
"referenceId": 1
. Les deux images sont associées à une description facultative de"subjectDescription": "man with short hair"
. De plus, une image de contrôle du maillage du visage est spécifiée avec"referenceId": 2
: Crée une image d'un man with short hair [1] dans la pose de l'image de contrôle [2] pour correspondre à la description : un croquis au crayon d'un portrait en pied d'un man with short hair [1] avec un dessin en hachures, dessin en hachures du portrait avec des crayons 6B et graphite, fond blanc, dessin au crayon, haute qualité, trait de crayon, regardant l'objectif, yeux humains naturels
- La requête textuelle suivante concerne une requête comportant deux images de référence avec
"referenceId"
: ID de l'image de référence ou ID d'une série d'images de référence correspondant au même sujet ou style. Dans cet exemple, les deux images de référence représentent la même personne. Elles partagent donc le mêmereferenceId
(1
), et l'image de contrôle du maillage du visage a unreferenceId
distinct (2
). L'image générée suit la structure du visage du maillage extrait de l'image de référence, ce qui améliore l'apparence du visage. Un seul contrôle du maillage du visage est pris en charge.- BASE64_REFERENCE_IMAGE : image de référence pour guider la génération d'images. L'image doit être spécifiée en tant que chaîne d'octets encodée en base64.
- SUBJECT_DESCRIPTION : facultatif. Description textuelle de l'image de référence que vous pouvez ensuite utiliser dans le champ
prompt
. Exemple :"prompt": "a full-body portrait of a man with short hair [1] with hatch-cross drawing", [...], "subjectDescription": "man with short hair"
- IMAGE_COUNT : nombre d'images générées. Valeurs entières acceptées : 1 à 4. Valeur par défaut : 4.
Méthode HTTP et URL :
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corps JSON de la requête :
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectDescription": "SUBJECT_DESCRIPTION", "subjectType": "SUBJECT_TYPE_PERSON" } }, { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectDescription": "SUBJECT_DESCRIPTION", "subjectType": "SUBJECT_TYPE_PERSON" } }, { "referenceType": "REFERENCE_TYPE_CONTROL", "referenceId": 2, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "controlImageConfig": { "controlType": "CONTROL_TYPE_FACE_MESH", "enableControlImageComputation": true } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé
request.json
, puis exécutez la commande suivante :curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Enregistrez le corps de la requête dans un fichier nommé
request.json
, puis exécutez la commande suivante :$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
. La réponse renvoie deux objets de prédiction, avec les octets d'image générés encodés en base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Python
Personnalisation d'un produit
Le tableau suivant décrit les modèles de requête que nous vous recommandons d'utiliser pour commencer à écrire des requêtes de personnalisation de personne :
Images de référence Modèle de requête Exemple Image du sujet (1 à 4) Crée une image de SUBJECT_DESCRIPTION [1] correspondant à la description : ${PROMPT} Crée une image de Luxe Elixir hair oil, golden liquid in glass bottle [1] correspondant à la description : Image en gros plan d'une main de femme tenant un Luxe Elixir hair oil, golden liquid in glass bottle [1] sur un fond blanc immaculé. La main de la femme est bien éclairée et le flacon est net, avec une faible profondeur de champ qui floute l'arrière-plan et met en valeur le produit. L'éclairage est doux et diffus, ce qui crée une lueur subtile autour du flacon et de la main. La composition globale est simple et élégante, ce qui met en avant le caractère luxueux du produit.
Image du sujet (1 à 4) Génère une image d'un SUBJECT_DESCRIPTION, mais ${PROMPT} Génère une image d'un Seiko watch [1], mais en bleu.
Utilisez les exemples suivants pour envoyer une requête de personnalisation avec des images de référence de produits utilisées pour guider la génération d'images.
Console
-
Dans la console Google Cloud , accédez à la page Vertex AI>Media Studio .
Accéder à Media Studio - Dans la section Modèle du volet Paramètres, sélectionnez Imagen 3 si ce n'est pas déjà fait.
- Facultatif. Choisissez un format autre que 1:1 (par défaut).
- Facultatif. Modifiez le nombre de résultats.
- Facultatif. Fournissez une requête négative pour indiquer au modèle ce qu'il ne doit pas générer.
- Facultatif. Modifiez les options avancées.
- Dans le champ de requête textuelle (Rédigez votre requête), cliquez sur Ajouter une référence.
- Dans le volet Ajouter une référence, sélectionnez le type de référence : Subject - product.
- Dans la section Images de référence, cliquez sur Importer.
- Sélectionnez une image stockée en local, puis cliquez sur Ouvrir.
- Facultatif. Ajoutez une description pour l'image de référence.
- Cliquez sur OK.
- Facultatif. Pour ajouter des images de référence, cliquez sur Ajouter une image et importez une ou plusieurs autres images.
- Une fois que vous avez ajouté toutes vos images de référence, cliquez sur Ajouter une référence.
Toutes les images de référence que vous ajoutez dans ce volet ont le même numéro de référence. Utilisez ce numéro lorsque vous ajoutez la requête textuelle.
- Dans le champ de requête textuelle (Rédigez votre requête), ajoutez une requête textuelle incluant le ou les numéros de référence des images de référence. Exemple :
- Salle blanche et lumineuse, le product [1] sur une table en verre
- L'animal [1] debout dans un vaste champ avec une forêt au loin
- Portrait en noir et blanc de la person [1] dans une rue avec le film noir style [2]
REST
Pour en savoir plus sur les requêtes envoyées au modèle
imagen-3.0-capability-001
, consultez la documentation de référence de l'API du modèleimagen-3.0-capability-001
.Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- LOCATION : région de votre projet (
us-central1
,europe-west2
ouasia-northeast3
, par exemple). Pour obtenir la liste des régions disponibles, consultez IA générative sur les emplacements Vertex AI. - TEXT_PROMPT : prompt textuel qui guide le modèle pour la génération d'images. Pour utiliser la personnalisation Imagen 3, incluez le
referenceId
de l'image ou des images de référence que vous fournissez au format [$referenceId]. Exemple :- Crée une image de Luxe Elixir hair oil, golden liquid in glass bottle [1] correspondant à la description : Image en gros plan d'une main de femme tenant un Luxe Elixir hair oil, golden liquid in glass bottle [1] sur un fond blanc immaculé. La main de la femme est bien éclairée et le flacon est net, avec une faible profondeur de champ qui floute l'arrière-plan et met en valeur le produit.
"referenceId"
: ID de l'image de référence ou ID d'une série d'images de référence correspondant au même sujet ou style. Dans cet exemple, les deux images de référence correspondent au même produit. Elles partagent donc le mêmereferenceId
(1
).- BASE64_REFERENCE_IMAGE : image de référence pour guider la génération d'images. L'image doit être spécifiée en tant que chaîne d'octets encodée en base64.
- SUBJECT_DESCRIPTION : facultatif. Description textuelle de l'image de référence que vous pouvez ensuite utiliser dans le champ
prompt
. Exemple :"prompt": "Luxe Elixir hair oil, golden liquid in glass bottle [1] against a pure white background.", [...], "subjectDescription": "Luxe Elixir hair oil, golden liquid in glass bottle"
- IMAGE_COUNT : nombre d'images générées. Valeurs entières acceptées : 1 à 4. Valeur par défaut : 4.
Méthode HTTP et URL :
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corps JSON de la requête :
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectType": "SUBJECT_TYPE_PRODUCT", "subjectDescription": "SUBJECT_DESCRIPTION" } }, { "referenceType": "REFERENCE_TYPE_SUBJECT", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "subjectImageConfig": { "subjectType": "SUBJECT_TYPE_PRODUCT", "subjectDescription": "SUBJECT_DESCRIPTION" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé
request.json
, puis exécutez la commande suivante :curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Enregistrez le corps de la requête dans un fichier nommé
request.json
, puis exécutez la commande suivante :$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
. La réponse renvoie deux objets de prédiction, avec les octets d'image générés encodés en base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Utilisation du produit
Pour afficher les normes d'utilisation et les restrictions de contenu associées à Imagen sur Vertex AI, consultez les consignes d'utilisation.
Versions de modèle
Vous pouvez utiliser plusieurs modèles de génération d'images. Pour en savoir plus, consultez Modèles Imagen.
Étapes suivantes
Consultez des articles concernant Imagen et d'autres produits d'IA générative sur Vertex AI :
- Guide du développeur pour bien démarrer avec Imagen 3 sur Vertex AI
- Nouveaux outils et modèles multimédias génératifs, conçus avec et pour les créateurs
- Nouveautés dans Gemini : Gems personnalisés et génération d'images améliorée avec Imagen 3
- Google DeepMind : Imagen 3 – Notre modèle texte-vers-image le plus puissant
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/07/15 (UTC).