A partire dal 29 aprile 2025, i modelli Gemini 1.5 Pro e Gemini 1.5 Flash non sono disponibili nei progetti che non li hanno mai utilizzati, inclusi i nuovi progetti. Per maggiori dettagli, vedi Versioni e ciclo di vita dei modelli.

Questa pagina è stata tradotta dall'API Cloud Translation.

Introduzione alla messa a punto

L'ottimizzazione del modello è un processo cruciale per adattare Gemini all'esecuzione di attività specifiche con maggiore precisione e accuratezza. L'ottimizzazione fornisce al modello un set di dati di addestramento che contiene un insieme di esempi di attività downstream specifiche.

Questa pagina fornisce una panoramica dell'ottimizzazione dei modelli per Gemini, descrive le opzioni di ottimizzazione disponibili per Gemini e ti aiuta a determinare quando utilizzare ciascuna opzione di ottimizzazione.

Vantaggi dell'ottimizzazione del modello

L'ottimizzazione del modello è un modo efficace per personalizzare i modelli di grandi dimensioni in base alle tue attività. Si tratta di un passaggio fondamentale per migliorare la qualità e l'efficienza del modello. L'ottimizzazione del modello offre i seguenti vantaggi:

Qualità superiore per le tue attività specifiche
Maggiore robustezza del modello
Latenza e costi di inferenza inferiori grazie a prompt più brevi

Ottimizzazione rispetto alla progettazione dei prompt

Prompt con modelli Gemini preaddestrati: il prompt è l'arte di creare istruzioni efficaci per guidare i modelli di AI come Gemini nella generazione degli output che desideri. Si tratta di progettare prompt che trasmettano chiaramente l'attività, il formato che vuoi e qualsiasi contesto pertinente. Puoi utilizzare le funzionalità di Gemini con una configurazione minima. È più adatta a:
- Dati etichettati limitati: se disponi di una piccola quantità di dati etichettati o non puoi permetterti una lunga procedura di perfezionamento.
- Prototipazione rapida: quando devi testare rapidamente un concetto o ottenere una baseline delle prestazioni senza investire molto nell'ottimizzazione.
Ottimizzazione personalizzata dei modelli Gemini: per risultati più personalizzati, Gemini ti consente di ottimizzare i suoi modelli in base ai tuoi set di dati specifici. Per creare un modello di AI che eccella nel tuo dominio specifico, valuta la possibilità di eseguire il perfezionamento. Ciò comporta il riaddestramento del modello di base sul tuo set di dati etichettato, adattando i suoi pesi alla tua attività e ai tuoi dati. Puoi adattare Gemini ai tuoi casi d'uso. Il perfezionamento è più efficace quando:
- Disponi di dati etichettati: un set di dati di dimensioni considerevoli su cui eseguire l'addestramento (almeno 100 esempi), che consente al modello di apprendere in modo approfondito le specifiche dell'attività.
- Attività complesse o uniche: per scenari in cui le strategie di prompt avanzate non sono sufficienti ed è essenziale un modello personalizzato in base ai tuoi dati.

Ti consigliamo di iniziare con i prompt per trovare quello ottimale. Poi, passa alla messa a punto (se necessario) per migliorare ulteriormente il rendimento o correggere errori ricorrenti. Sebbene l'aggiunta di altri esempi possa essere utile, è importante valutare dove il modello commette errori prima di aggiungere altri dati. Dati di alta qualità ed etichettati correttamente sono fondamentali per un buon rendimento e sono più importanti della quantità. Inoltre, i dati che utilizzi per il fine-tuning devono riflettere la distribuzione, il formato e il contesto dei prompt che il modello incontrerà in produzione.

L'ottimizzazione offre i seguenti vantaggi rispetto alla progettazione dei prompt:

Consente una personalizzazione approfondita del modello e si traduce in prestazioni migliori per attività specifiche.
Allinea il modello a sintassi, istruzioni e regole semantiche specifiche del dominio personalizzate.
Offre risultati più coerenti e affidabili.
In grado di gestire più esempi contemporaneamente.
Risparmia sui costi di inferenza rimuovendo esempi few-shot e istruzioni lunghe nei prompt

Approcci di ottimizzazione

L'ottimizzazione efficiente dei parametri e l'ottimizzazione completa sono due approcci per personalizzare i modelli di grandi dimensioni. Entrambi i metodi presentano vantaggi e implicazioni in termini di qualità del modello ed efficienza delle risorse.

L'ottimizzazione efficiente dei parametri

L'ottimizzazione efficiente dei parametri, detta anche ottimizzazione dell'adattatore, consente l'adattamento efficiente di modelli di grandi dimensioni alle tue attività o al tuo dominio specifici. L'ottimizzazione efficiente dei parametri aggiorna un sottoinsieme relativamente piccolo dei parametri del modello durante il processo di ottimizzazione.

Per capire come Vertex AI supporta l'ottimizzazione e la pubblicazione degli adattatori, puoi trovare maggiori dettagli nel seguente white paper: Adaptation of Large Foundation Models.

Ottimizzazione completa

L'ottimizzazione completa aggiorna tutti i parametri del modello, rendendolo adatto all'adattamento a attività molto complesse, con il potenziale di ottenere una qualità superiore. Tuttavia, l'ottimizzazione completa richiede risorse di calcolo più elevate sia per l'ottimizzazione che per la pubblicazione, con conseguenti costi complessivi più elevati.

Ottimizzazione efficiente dei parametri rispetto all'ottimizzazione completa

L'ottimizzazione efficiente dei parametri è più efficiente in termini di risorse ed economica rispetto all'ottimizzazione completa. Utilizza risorse di calcolo notevolmente inferiori per l'addestramento. È in grado di adattare il modello più rapidamente con un set di dati più piccolo. La flessibilità dell'ottimizzazione efficiente in termini di parametri offre una soluzione per l'apprendimento multi-task senza la necessità di un ampio riaddestramento.

Metodi di ottimizzazione supportati

Vertex AI supporta l'ottimizzazione supervisionata per personalizzare i modelli di base.

Ottimizzazione supervisionata

Il perfezionamento supervisionato migliora le prestazioni del modello insegnandogli una nuova abilità. I dati che contengono centinaia di esempi etichettati vengono utilizzati per insegnare al modello a imitare un comportamento o un'attività desiderati. Ogni esempio etichettato mostra l'output che vuoi che il modello generi durante l'inferenza.

Quando esegui un job di ottimizzazione supervisionata, il modello apprende parametri aggiuntivi che lo aiutano a codificare le informazioni necessarie per eseguire l'attività desiderata o apprendere il comportamento desiderato. Questi parametri vengono utilizzati durante l'inferenza. L'output del job di ottimizzazione è un nuovo modello che combina i parametri appena appresi con il modello originale.

L'ottimizzazione supervisionata di un modello di testo è una buona opzione quando l'output del modello non è complesso ed è relativamente facile da definire. Il perfezionamento supervisionato è consigliato per classificazione, analisi del sentiment, estrazione delle entità, riepilogo di contenuti non complessi e scrittura di query specifiche per dominio. Per i modelli di codice, l'ottimizzazione supervisionata è l'unica opzione.

Modelli che supportano l'ottimizzazione supervisionata

I seguenti modelli Gemini supportano l'ottimizzazione supervisionata:

Per saperne di più sull'utilizzo dell'ottimizzazione supervisionata con ogni modello, consulta le seguenti pagine: Ottimizzare i tipi di dati testo, immagine, audio e documento.

Passaggi successivi

Per scoprire di più sulla funzionalità di comprensione dei documenti dei modelli Gemini, consulta la panoramica Comprensione dei documenti.
Per iniziare l'ottimizzazione, consulta Ottimizzare i modelli Gemini utilizzando il perfezionamento supervisionato
Per scoprire come è possibile utilizzare il fine-tuning supervisionato in una soluzione che crea una knowledge base di AI generativa, consulta Soluzione Jump Start: knowledge base di AI generativa.

Introduzione alla messa a punto Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.