Introduzione all'ottimizzazione

L'ottimizzazione del modello è un processo fondamentale per adattare Gemini a eseguire attività specifiche con maggiore precisione. L'ottimizzazione del modello funziona fornendo al modello un set di dati di addestramento contenente un insieme di esempi di attività successive specifiche.

Questa pagina fornisce una panoramica dell'ottimizzazione del modello per Gemini, descrive le opzioni di ottimizzazione disponibili per Gemini e ti aiuta a determinare quando utilizzare ciascuna opzione.

L'ottimizzazione del modello è un modo efficace per personalizzare modelli di grandi dimensioni in base alle tue attività. È una è il passaggio chiave per migliorare la qualità e l'efficienza del modello. L'ottimizzazione del modello fornisce i seguenti vantaggi:

  • Maggiore qualità per le tue attività specifiche
  • Maggiore robustezza del modello
  • Latenza e costi di inferenza inferiori grazie a prompt più brevi

Ottimizzazione rispetto alla progettazione dei prompt

  • Prompt con modelli Gemini preaddestrati: i prompt sono l'arte di creare prompt istruzioni per guidare modelli di AI come Gemini nella generazione degli output che vuoi. Si tratta di progettare prompt che comunichino chiaramente l'attività, il formato che vuoi e qualsiasi contesto pertinente. Puoi utilizzare le funzionalità di Gemini con una configurazione minima. È ideale per:
    • Dati etichettati limitati: se disponi di una piccola quantità di dati etichettati o non puoi permetterti lungo processo di ottimizzazione.
    • Prototipazione rapida: quando devi testare rapidamente un concetto o ottenere un benchmark delle prestazioni senza investire molto nella messa a punto.
  • Ottimizzazione personalizzata dei modelli Gemini: per risultati più personalizzati, Gemini ti consente di ottimizzare i suoi modelli sui tuoi set di dati specifici. Per creare un modello di IA che eccelle nel tuo dominio specifico, valuta la possibilità di eseguire il perfezionamento. Ciò comporta l'addestramento del modello di base sul tuo set di dati etichettato, adattando i relativi pesi all'attività e ai dati. Puoi adattare Gemini ai tuoi casi d'uso. La messa a punto è più efficace quando:
    • Hai etichettato i dati: un set di dati considerevole su cui eseguire l'addestramento (pensa a almeno 100 esempi). il che consente al modello di apprendere approfondite le specifiche dell'attività.
    • Attività complesse o uniche: per scenari in cui vengono adottate strategie di prompt avanzate non è sufficiente e un modello su misura per i tuoi dati è essenziale.

Ti consigliamo di iniziare con i prompt per trovare quello ottimale. Poi, passa alla messa a punto (se necessario) per migliorare ulteriormente il rendimento o correggere gli errori ricorrenti. Sebbene l'aggiunta di altri esempi possa essere utile, è importante valutare dove il modello commette errori prima di aggiungere altri dati. Dati di alta qualità ed etichettati correttamente sono fondamentali per un buon rendimento e sono superiori alla quantità. Inoltre, i dati che utilizzi per la messa a punto devono riflettere la distribuzione, il formato e il contesto dei prompt che il modello incontrerà in produzione.

L'ottimizzazione offre i seguenti vantaggi rispetto alla progettazione dei prompt:

  • Consente una personalizzazione approfondita del modello e offre prestazioni migliori per attività specifiche.
  • Allinea il modello a sintassi, istruzioni e regole semantiche personalizzate specifiche del dominio.
  • Offre risultati più coerenti e affidabili.
  • In grado di gestire più esempi contemporaneamente.
  • Risparmia sui costi durante l'inferenza rimuovendo esempi con pochi esempi e istruzioni lunghe nei prompt

Approcci di ottimizzazione

L'ottimizzazione efficiente dei parametri e la messa a punto completa sono due approcci per personalizzare i modelli di grandi dimensioni. Entrambi i metodi hanno i loro vantaggi e le loro implicazioni in termini di qualità del modello ed efficienza delle risorse.

L'ottimizzazione efficiente dei parametri

L'ottimizzazione efficiente dei parametri, chiamata anche ottimizzazione dell'adattatore, consente di adattare in modo efficiente i modelli di grandi dimensioni alle tue attività o al tuo dominio specifici. L'ottimizzazione efficiente dei parametri aggiorna un sottoinsieme relativamente piccolo dei parametri del modello durante il processo di ottimizzazione.

Per capire in che modo Vertex AI supporta l'ottimizzazione e l'erogazione degli adattatori, puoi trovare maggiori dettagli nel seguente white paper, Adaptation of Large Foundation Models.

Ottimizzazione completa

L'ottimizzazione completa aggiorna tutti i parametri del modello, il che lo rende adatto l'adattamento del modello a compiti molto complessi, con il potenziale di ottenere qualità. Tuttavia, l'ottimizzazione completa richiede risorse di calcolo più elevate sia per l'ottimizzazione sia per la pubblicazione, con un conseguente aumento dei costi complessivi.

Confronto tra l'ottimizzazione efficiente dei parametri e la messa a punto completa

L'ottimizzazione efficiente dei parametri è più efficiente in termini di risorse ed economicamente vantaggiosa fino all'ottimizzazione completa. Utilizza risorse di calcolo significativamente inferiori per l'addestramento. È in grado di adattare il modello più rapidamente con un set di dati più piccolo. La flessibilità l'ottimizzazione efficiente dei parametri offre una soluzione per l'apprendimento multitasking senza la necessità per un riaddestramento.

Metodi di ottimizzazione supportati

Vertex AI supporta l'ottimizzazione supervisionata per personalizzare i modelli di base.

Ottimizzazione supervisionata

Il perfezionamento supervisionato migliora le prestazioni del modello insegnandogli una nuova competenza. I dati che contengono centinaia di esempi etichettati vengono usati per insegnare ai del modello per imitare un comportamento o un'attività desiderati. Ogni esempio etichettato dimostra il risultato che il modello deve restituire durante l'inferenza.

Quando esegui un job di ottimizzazione supervisionato, il modello apprende parametri aggiuntivi che la aiutino a codificare le informazioni necessarie per eseguire l'attività desiderata apprendere il comportamento desiderato. Questi parametri vengono utilizzati durante l'inferenza. L'output del job di ottimizzazione è un nuovo modello che combina i parametri appena appresi con il modello originale.

L'ottimizzazione supervisionata di un modello di testo è una buona opzione quando l'output del modello non è complesso ed è relativamente facile da definire. È consigliata un'ottimizzazione supervisionata per classificazione, analisi del sentiment, estrazione di entità, riassunto di contenuti non complessi e scrivere query specifiche per il dominio. Per il codice personalizzati, l'ottimizzazione supervisionata è l'unica opzione.

Modelli che supportano il perfezionamento supervisionato

  • gemini-1.5-pro-002 (in GA)
  • gemini-1.5-flash-002(in GA)
  • gemini-1.0-pro-002 (in anteprima, supporta solo l'ottimizzazione del testo)

Per ulteriori informazioni sull'uso dell'ottimizzazione supervisionata con ogni rispettivo modello, consulta le pagine seguenti: Ottimizza i tipi di dati relativi a testo, immagine, audio e documento.

Passaggi successivi