Vous pouvez utiliser la fonctionnalité d'augmentation de la résolution d'Imagen sur Vertex AI pour augmenter la taille d'une image sans perdre en qualité.
Versions de modèle
La disponibilité de la fonctionnalité d'augmentation de la résolution dépend de la version du modèle :
Fonctionnalité | Imagen (v.002) | Imagen 2 (v.005) | Imagen 2 (v.006) |
---|---|---|---|
Augmentation de la résolution | ✔ | Non compatible | Non compatible |
Augmenter la résolution d'une image
Utilisez les exemples de code suivants pour augmenter la résolution d'une image existante, générée ou modifiée.
Console
Suivez les instructions expliquant comment générer une image avec du texte pour générer des images.
Sélectionnez l'image dont vous souhaitez augmenter la résolution.
Cliquez sur
Augmenter la résolution/Exporter.Sélectionnez Améliorer les images.
Choisissez une valeur pour Facteur d'échelle (
2x
ou4x
).Cliquez sur
Exporter pour enregistrer l'image améliorée.
REST
Pour en savoir plus sur les requêtes du modèle imagegeneration
, consultez la documentation de référence de l'API du modèle imagegeneration
.
Le mode d'augmentation de la résolution est un champ facultatif de l'objet parameters
du corps d'une requête JSON. Lorsque vous augmentez la résolution d'une image à l'aide de l'API, spécifiez "mode": "upscale"
et upscaleConfig
.
Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- LOCATION : région de votre projet (
us-central1
,europe-west2
ouasia-northeast3
, par exemple). Pour obtenir la liste des régions disponibles, consultez IA générative sur les emplacements Vertex AI. - PROJECT_ID : ID de votre projet Google Cloud .
- B64_BASE_IMAGE : image de base à modifier ou à améliorer. L'image doit être spécifiée en tant que chaîne d'octets encodés en base64. La taille maximale est de 10 Mo.
- IMAGE_SOURCE : emplacement Cloud Storage de l'image que vous souhaitez modifier ou améliorer. Exemple :
gs://output-bucket/source-photos/photo.png
. - UPSCALE_FACTOR : facultatif. Facteur d'amélioration de l'image. S'il n'est pas spécifié, il sera déterminé par le côté le plus long de l'image d'entrée et par
sampleImageSize
. Vous pouvez choisirx2
oux4
comme valeur.
Méthode HTTP et URL :
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict
Corps JSON de la requête :
{ "instances": [ { "prompt": "", "image": { // use one of the following to specify the image to upscale "bytesBase64Encoded": "B64_BASE_IMAGE" "gcsUri": "IMAGE_SOURCE" // end of base image input options }, } ], "parameters": { "sampleCount": 1, "mode": "upscale", "upscaleConfig": { "upscaleFactor": "UPSCALE_FACTOR" } } }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON de ce type :
{ "predictions": [ { "mimeType": "image/png", "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII=" } ] }
Étapes suivantes
Consultez des articles au sujet d'Imagen et d'autres produits d'IA générative sur Vertex AI :
- Guide du développeur pour bien démarrer avec Imagen 3 sur Vertex AI
- Nouveaux outils et modèles multimédias génératifs, conçus avec et pour les créateurs
- Nouveautés dans Gemini : Gems personnalisés et génération d'images améliorée avec Imagen 3
- Google DeepMind : Imagen 3 – Notre modèle texte-vers-image de la plus haute qualité