Instruct Customization

Vous pouvez utiliser Imagen sur Vertex AI pour indiquer au modèle comment personnaliser et transformer les sujets d'une image dans un style que vous spécifiez dans une requête textuelle.

Afficher la fiche de modèle Imagen pour la modification et la personnalisation

Écrire une requête de personnalisation

La requête que vous utilisez avec la personnalisation Imagen 3 peut avoir une incidence sur la qualité des images générées. Utilisez les modèles de requêtes suivants comme point de départ pour écrire des requêtes de personnalisation. Vous devrez peut-être envoyer plusieurs requêtes pour obtenir le résultat souhaité.

Cas d'utilisation Images de référence Modèle de requête Exemple
Personnalisation de l'instruction – Transfert de style Image (1) Transformer subject in image [1] pour lui attribuer le style ${STYLE_DESCRIPTION}. L'image représente ${IMAGE_DESCRIPTION}. Transformer subject in image [1] pour obtenir le style suivant :aquarelle réalisée avec des techniques libres, des tons doux, des couleurs pastel, des coups de pinceau, un fond délicat et net, de la spontanéité, un dessin de style analogique, une peinture complexe et très détaillée. L'image représente le portrait d'une femme fière.

Personnaliser à l'aide de la personnalisation d'instructions pour le transfert de style

Utilisez les exemples de code suivants pour spécifier le style des images de sortie en fonction du style décrit dans la requête textuelle.

REST

Avant d'utiliser les données de requête, effectuez les remplacements suivants :

  • PROJECT_ID : ID de votre projet Google Cloud .
  • LOCATION : région de votre projet (us-central1, europe-west2 ou asia-northeast3, par exemple). Pour obtenir la liste des régions disponibles, consultez IA générative sur les emplacements Vertex AI.
  • TEXT_PROMPT : prompt textuel qui guide le modèle pour la génération d'images. Pour utiliser la personnalisation Imagen 3, incluez le referenceId de l'image ou des images de référence que vous fournissez au format [$referenceId]. Par exemple :
    • Transforme le sujet de l'image [1] pour obtenir un style d'image en vitrail numérique.
    • Ajoute un chapeau de cow-boy rouge au chat de l'image [1].
    • Supprime le corgi de l'image [1].
    • Remplace la boule rouge de l'image [1] par une boîte bleue.
  • "referenceId" : ID de l'image de référence ou ID d'une série d'images de référence correspondant au même sujet ou style.
  • BASE64_REFERENCE_IMAGE : image de référence pour guider la génération d'images. L'image doit être spécifiée en tant que chaîne d'octets encodés en base64.
  • IMAGE_COUNT : nombre d'images générées. Valeurs entières acceptées : 1 à 4. Valeur par défaut : 4.

Méthode HTTP et URL :

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Corps JSON de la requête :

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_RAW",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
L'exemple suivant représente la réponse à une requête avec "sampleCount": 2. La réponse renvoie deux objets de prédiction, avec les octets d'image générés encodés en base64.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Utilisation du produit

Pour afficher les normes d'utilisation et les restrictions de contenu associées à Imagen sur Vertex AI, consultez les consignes d'utilisation.

Versions de modèle

Vous pouvez utiliser plusieurs modèles de génération d'images. Pour en savoir plus, consultez Modèles Imagen.

Étapes suivantes

Consultez des articles concernant Imagen et d'autres produits d'IA générative sur Vertex AI :