Esegui la migrazione dell'applicazione a Gemini 2 con l'API Gemini in Vertex AI

Questa guida mostra come eseguire la migrazione delle applicazioni di IA generativa dai modelli Gemini 1.x e PaLM ai modelli Gemini 2.

Perché eseguire la migrazione a Gemini 2?

Gemini 2 offre miglioramenti significativi delle prestazioni rispetto ai modelli Gemini 1.x e PaLM, oltre a nuove funzionalità. Inoltre, ogni versione del modello ha il proprio periodo di supporto e disponibilità.

L'upgrade della maggior parte delle applicazioni di AI generativa a Gemini 2 non dovrebbe richiedere una riprogettazione significativa dei prompt o del codice. Tuttavia, alcune applicazioni richiedono modifiche rapide e queste modifiche sono difficili da prevedere senza prima eseguire un prompt tramite Gemini 2. Pertanto, ti consigliamo di eseguire i test di Gemini 2 prima della migrazione.

Sono necessarie modifiche significative al codice solo per alcune modifiche non compatibili o per utilizzare le nuove funzionalità di Gemini 2.

A quale modello Gemini 2 devo eseguire la migrazione?

Quando scegli un modello Gemini 2 a cui eseguire la migrazione, devi prendere in considerazione le funzionalità richieste dalla tua applicazione, nonché il costo di queste funzionalità.

Per una panoramica delle funzionalità del modello Gemini 2, consulta Gemini 2. Per una panoramica di tutti i modelli Google, consulta Modelli Google.

Per un confronto dei modelli Gemini disponibili, consulta la tabella seguente.

Funzionalità Gemini 1.5 Pro Gemini 1.5 Flash Gemini 2.0 Flash Gemini 2.0 Flash-Lite Gemini 2.5 Pro Gemini 2.5 Flash
Modalità di input testo, documenti, immagine, video, audio testo, documenti, immagine, video, audio testo, documenti, immagine, video, audio testo, documenti, immagine, video, audio testo, documenti, immagine, video, audio testo, documenti, immagine, video, audio
Modalità di output testo testo testo testo testo testo
Finestra contestuale, limite di token totale 2.097.152 1.048.576 1.048.576 1.048.576 1.048.576 1.048.576
Lunghezza del contesto di output 8.192 8.192 8.192 8.192 64.192 64.192
Grounding con la Ricerca No
Chiamata di funzione
Esecuzione del codice No No No
Memorizzazione nella cache del contesto No
Previsione batch
API Live No No No No No No
Latenza Il più capace nel gruppo Famiglia 1.5 Più veloce nella famiglia 1.5 Velocità + buona efficienza in termini di costi Veloce e più conveniente Più lento di Flash, ma con un buon rapporto costi/benefici Veloce e più conveniente
Perfezionamento
SDK consigliato SDK Vertex AI SDK Vertex AI SDK Gen AI SDK Gen AI SDK Gen AI SDK Gen AI
Unità di prezzo Basato su caratteri Basato su caratteri Token Token Token Token

Panoramica del processo di migrazione

Questo documento illustra una procedura in otto passaggi per la migrazione dell'applicazione a Gemini 2. Utilizza il seguente diagramma per passare a ogni passaggio.

Processo

Prima di iniziare

Documentare i requisiti di test e valutazione del modello

Upgrade e test del codice

Valutazione offline

Valutare i risultati della valutazione e ottimizzare i prompt e gli iperparametri di Gemini 2

Test di carico

Valutazione online

Deployment in produzione

Migliorare le prestazioni del modello

Al termine della migrazione, segui questi suggerimenti per massimizzare il rendimento del modello Gemini 2:

  • Controlla le istruzioni di sistema, i prompt e gli esempi di apprendimento con pochi esempi per verificare la presenza di incoerenze, contraddizioni o istruzioni ed esempi non pertinenti.
  • Prova un modello più potente. Ad esempio, se hai valutato Gemini 2.0 Flash-Lite, prova Gemini 2.0 Flash.
  • Esamina i risultati della valutazione automatica per assicurarti che corrispondano al giudizio umano, in particolare i risultati che utilizzano un modello di giudice. Assicurati che le istruzioni del modello di valutazione non contengano incoerenze o ambiguità.
  • Un modo per migliorare le istruzioni del modello di valutazione è testarle in modo isolato con più persone e verificare se i loro giudizi sono coerenti. Se gli esseri umani interpretano le istruzioni in modo diverso e formulano giudizi diversi, le istruzioni del modello di giudice sono ambigue.
  • Ottimizza il modello Gemini 2.
  • Esamina gli output della valutazione per cercare schemi che mostrano tipi specifici di errori. Raggruppare gli errori in modelli, tipi o categorie diversi ti consente di ottenere dati di valutazione più mirati, il che semplifica la modifica dei prompt per risolvere questi errori.
  • Assicurati di valutare in modo indipendente i diversi componenti dell'AI generativa.
  • Prova a modificare i parametri di campionamento dei token.

Assistenza

Se hai bisogno di aiuto, Google Cloud offre pacchetti di assistenza per soddisfare le tue esigenze, come copertura 24 ore su 24, 7 giorni su 7, assistenza telefonica e accesso a un responsabile dell'assistenza tecnica. Per ulteriori informazioni, consulta l'assistenza Google Cloud.

Passaggi successivi

  • Leggi l'elenco delle domande frequenti.
  • Esegui la migrazione dall'API PaLM all'API Gemini in Vertex AI.