Vous pouvez utiliser Imagen sur Vertex AI pour indiquer au modèle comment personnaliser et transformer les sujets d'une image dans un style que vous spécifiez dans une requête textuelle.
Afficher la fiche de modèle Imagen pour la modification et la personnalisation
Écrire une requête de personnalisation
La requête que vous utilisez avec la personnalisation Imagen 3 peut avoir une incidence sur la qualité des images générées. Utilisez les modèles de requêtes suivants comme point de départ pour écrire des requêtes de personnalisation. Vous devrez peut-être envoyer plusieurs requêtes pour obtenir le résultat souhaité.
Cas d'utilisation | Images de référence | Modèle de requête | Exemple |
---|---|---|---|
Personnalisation de l'instruction – Transfert de style | Image (1) | Transformer subject in image [1] pour lui attribuer le style ${STYLE_DESCRIPTION}. L'image représente ${IMAGE_DESCRIPTION}. | Transformer subject in image [1] pour obtenir le style suivant :aquarelle réalisée avec des techniques libres, des tons doux, des couleurs pastel, des coups de pinceau, un fond délicat et net, de la spontanéité, un dessin de style analogique, une peinture complexe et très détaillée. L'image représente le portrait d'une femme fière. |
Personnaliser à l'aide de la personnalisation d'instructions pour le transfert de style
Utilisez les exemples de code suivants pour spécifier le style des images de sortie en fonction du style décrit dans la requête textuelle.
REST
Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- LOCATION : région de votre projet (
us-central1
,europe-west2
ouasia-northeast3
, par exemple). Pour obtenir la liste des régions disponibles, consultez IA générative sur les emplacements Vertex AI. - TEXT_PROMPT : prompt textuel qui guide le modèle pour la génération d'images. Pour utiliser la personnalisation Imagen 3, incluez le
referenceId
de l'image ou des images de référence que vous fournissez au format [$referenceId]. Par exemple :- Transforme le sujet de l'image [1] pour obtenir un style d'image en vitrail numérique.
- Ajoute un chapeau de cow-boy rouge au chat de l'image [1].
- Supprime le corgi de l'image [1].
- Remplace la boule rouge de l'image [1] par une boîte bleue.
"referenceId"
: ID de l'image de référence ou ID d'une série d'images de référence correspondant au même sujet ou style.- BASE64_REFERENCE_IMAGE : image de référence pour guider la génération d'images. L'image doit être spécifiée en tant que chaîne d'octets encodés en base64.
- IMAGE_COUNT : nombre d'images générées. Valeurs entières acceptées : 1 à 4. Valeur par défaut : 4.
Méthode HTTP et URL :
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Corps JSON de la requête :
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
"sampleCount": 2
. La réponse renvoie deux objets de prédiction, avec les octets d'image générés encodés en base64.
{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Utilisation du produit
Pour afficher les normes d'utilisation et les restrictions de contenu associées à Imagen sur Vertex AI, consultez les consignes d'utilisation.
Versions de modèle
Vous pouvez utiliser plusieurs modèles de génération d'images. Pour en savoir plus, consultez Modèles Imagen.
Étapes suivantes
Consultez des articles concernant Imagen et d'autres produits d'IA générative sur Vertex AI :
- Guide du développeur pour bien démarrer avec Imagen 3 sur Vertex AI
- Nouveaux outils et modèles multimédias génératifs, conçus avec et pour les créateurs
- Nouveautés dans Gemini : Gems personnalisés et génération d'images améliorée avec Imagen 3
- Google DeepMind : Imagen 3 – Notre modèle texte-vers-image le plus puissant