Ogni modello di immagine di IA generativa di Vertex AI è disponibile in versioni distinte. I modelli di immagini includono modelli di generazione e di testo, come
imagegeneration
e imagetext
. Le versioni differiscono in base alle funzionalità offerte.
Generazione e modifica di immagini
Per le attività di generazione e modifica delle immagini sono disponibili le seguenti versioni del modello di generazione di immagini.
Imagen 3 | Imagen 2 (v.006, predefinito) | Imagen 2 (v.005) | Imagen (v.002) | |
---|---|---|---|---|
Nome e versione del modello |
Imagen 3: imagen-3.0-generate-001 Imagen 3 Fast: imagen-3.0-fast-generate-001 Si tratta di una variante del modello a bassa latenza che puoi utilizzare per la prototipazione o per casi d'uso a bassa latenza. Personalizzazione e modifica di Imagen 3: imagen-3.0-capability-001
|
imagegeneration@006 |
imagegeneration@005 |
imagegeneration@002 |
Generazione di immagini | Disponibilità generale | Disponibilità generale (utenti approvati) | Disponibilità generale (utenti approvati) | Disponibilità generale (utenti approvati) |
Personalizzazione delle immagini (apprendimento few-shot) | Disponibilità generale (utenti approvati)
|
Non supportata | Non supportata | Non supportata |
Modifica delle immagini |
|
|
Non supportati. Il supporto delle funzionalità per questo modello è soggetto a modifiche e aggiornamenti futuri. |
|
Filigrana digitale e verifica (generazione di immagini) | Supportato (abilitato per impostazione predefinita) | Supportato (abilitato per impostazione predefinita) | Supportato (non abilitato per impostazione predefinita) | Supportato (non abilitato per impostazione predefinita) |
Impostazioni di sicurezza configurabili dall'utente |
|
|
Non supportata | Non supportata |
Upscaling delle immagini | Non supportata | Non supportata | Non supportata | Supportato (2x o 4x) |
Proporzioni e risoluzione |
|
|
|
|
Lingue | Disponibilità generale:
Anteprima:
|
Disponibilità generale:
Anteprima:
|
Disponibilità generale:
Anteprima:
|
Disponibilità generale:
|
Ottimizzazione del modello | Non supportati. Il supporto delle funzionalità per questo modello è soggetto a modifiche e aggiornamenti futuri. |
Non supportata | Non supportata | Disponibilità dell'ottimizzazione del modello:
|
Didascalie visive e Visual Question Answering (VQA)
Per le attività di trascrizione codificata delle immagini e di risposta a domande visive (VQA) sono disponibili le seguenti versioni del modello imagetext
.
Versione del modello:imagetext@001 (predefinita) |
|
---|---|
Didascalie visive (formato breve) | Token: 32 (~32 parole) Lingue: inglese, spagnolo, francese, tedesco, italiano |
Visual Question Answering, VQA (forma abbreviata) | Token (richiesta): 80 Token (risposta): 64 Lingue: inglese |
Come specificare la versione di un modello di immagini
Per utilizzare una versione di un modello di visione, aggiungi il numero di versione di tre cifre al
modello. Ad esempio, per specificare una versione del modello imagegeneration
, aggiungi la versione del modello (ad esempio @006
) al nome del modello:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@006:predict
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext@001:predict
Tuttavia, questo formato non si applica ai modelli Imagen 3.
Devi sempre specificare una versione del modello stabile per l'utilizzo in produzione, in quanto l'utilizzo dell'opzione predefinita senza una versione del modello specificata può comportare modifiche nel comportamento del modello.
Se ometti la versione del modello, Imagen utilizza la versione predefinita:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration:predict
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagetext:predict
Come best practice, specifica sempre una versione del modello. Se scegli di utilizzare il nome del modello senza una versione, assicurati che si trovi in un ambiente di test.
Passaggi successivi
- Scopri come inviare richieste a modelli specifici:
- Scopri di più sui parametri del modello utilizzando la documentazione di riferimento dell'API:
- Generazione di immagini (modello
imagegeneration
) - Didascalie delle immagini (modello
imagetext
) - Visual Question Answering (VQA) (modello
imagetext
)
- Generazione di immagini (modello