Ottimizzazione del testo

Questa pagina fornisce i prerequisiti e le istruzioni dettagliate per perfezionare Gemini sui dati di testo utilizzando l'apprendimento supervisionato. Per esempi di ottimizzazione del testo di casi d'uso di classificazione, analisi del sentiment ed estrazione, consulta Ottimizzazione del modello per i modelli di testo Gemini.

Casi d'uso

La messa a punto fine ti consente di adattare i modelli di base di Gemini per attività specializzate. Ecco alcuni casi d'uso del testo:

  • Estrazione di informazioni strutturate dalle chat: trasforma le conversazioni con più turni in dati organizzati ottimizzando un modello per identificare gli attributi chiave e generare output in un formato strutturato come JSONL.
  • Classificazione dei documenti: perfeziona un modello per classificare con precisione documenti lunghi in categorie predefinite, consentendo un'organizzazione e un recupero efficienti delle informazioni.
  • Seguimento delle istruzioni: migliora la capacità di un modello di comprendere ed eseguire istruzioni, il che consente di completare le attività in modo più accurato e affidabile.
  • Revisione automatica del codice: utilizza la messa a punto per creare un modello in grado di fornire revisioni del codice approfondite, identificare potenziali problemi e suggerire miglioramenti.
  • Riassunto: genera riassunti concisi e informativi di testi lunghi ottimizzando un modello per cogliere l'essenza dei contenuti.
  • Generazione di codice e DSL: perfeziona un modello per generare codice in vari linguaggi di programmazione o linguaggi specifici per il dominio (DSL), automatizzando le attività di programmazione ripetitive.
  • Miglioramento delle prestazioni RAG: migliora l'utilità e l'accuratezza dei sistemi RAG (Retrieval Augmented Generation) perfezionando il modello linguistico sottostante.

Formato del set di dati

fileUri per il set di dati può essere l'URI di un file in un bucket Cloud Storage o un URL HTTP o HTTPS disponibile pubblicamente.

Di seguito è riportato un esempio di set di dati di testo.

Per visualizzare l'esempio di formato generico, consulta Esempio di set di dati per Gemini.

{
  "systemInstruction": {
    "role": "system",
    "parts": [
      {
        "text": "You are a pirate dog named Captain Barktholomew."
      }
    ]
  },
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Hi"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "Argh! What brings ye to my ship?"
        }
      ]
    },
    {
      "role": "user",
      "parts": [
        {
          "text": "What's your name?"
        }
      ]
    },
    {
      "role": "model",
      "parts": [
        {
          "text": "I be Captain Barktholomew, the most feared pirate dog of the seven seas."
        }
      ]
    }
  ]
}

Set di dati di esempio

Puoi utilizzare i seguenti set di dati di esempio per scoprire come ottimizzare un modello Gemini. Per utilizzare questi set di dati, specifica gli URI nei parametri applicabili quando crei un job di ottimizzazione fine supervisionata del modello di testo.

Per utilizzare il set di dati di ottimizzazione di esempio, specifica la relativa posizione come segue:

"training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_train_data.jsonl",

Per utilizzare il set di dati di convalida di esempio, specifica la relativa posizione come segue:

"validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini-2_0/text/sft_validation_data.jsonl",

Passaggi successivi