Questa pagina fornisce i prerequisiti e istruzioni dettagliate per il perfezionamento di Gemini sui dati dei documenti utilizzando l'apprendimento supervisionato.
Casi d'uso
Il fine-tuning ti consente di personalizzare potenti modelli linguistici in base alle tue esigenze specifiche. Ecco alcuni casi d'uso chiave in cui il perfezionamento con il tuo set di PDF può migliorare significativamente le prestazioni di un modello:
- Knowledge base interna: converti i tuoi documenti interni in una knowledge base basata sull'AI che fornisce risposte e approfondimenti immediati. Ad esempio, un rappresentante di vendita potrebbe accedere immediatamente alle specifiche del prodotto e ai dettagli sui prezzi dai materiali di formazione precedenti.
- Assistente di ricerca: crea un assistente di ricerca in grado di analizzare una raccolta di articoli, libri e documenti di ricerca. Un ricercatore che studia i cambiamenti climatici potrebbe analizzare rapidamente articoli scientifici per identificare le tendenze dell'innalzamento del livello del mare o valutare l'efficacia di diverse strategie di mitigazione.
- Conformità legale o normativa: il perfezionamento dei documenti legali può contribuire ad automatizzare la revisione dei contratti, segnalando potenziali incongruenze o aree di rischio. Ciò consente ai professionisti legali di concentrarsi su attività di livello superiore, garantendo al contempo la conformità.
- Generazione automatica di report: automatizza l'analisi di report finanziari complessi, estraendo gli indicatori chiave di prestazione e generando riepiloghi per gli stakeholder. In questo modo puoi risparmiare tempo e ridurre il rischio di errori rispetto all'analisi manuale.
- Riepilogo e analisi dei contenuti: riassumi documenti PDF lunghi, estrai informazioni chiave e analizza le tendenze. Ad esempio, un team di ricerche di mercato potrebbe analizzare una raccolta di sondaggi tra i clienti per identificare i temi e il sentiment principali.
- Confronto di documenti e controllo della versione: confronta diverse versioni di un documento per identificare le modifiche e monitorare le revisioni. Ciò può essere particolarmente utile in ambienti collaborativi in cui più autori contribuiscono a un documento.
Limitazioni
Gemini 2.5 Flash
Specifica | Valore |
---|---|
Numero massimo di pagine PDF per esempio | 300 |
Numero massimo di file PDF per esempio | 4 |
Dimensione massima del file PDF | 20MB |
Gemini 2.0 Flash Gemini 2.0 Flash-Lite
Specifica | Valore |
---|---|
Numero massimo di pagine PDF per esempio | 300 |
Numero massimo di file PDF per esempio | 4 |
Dimensione massima del file PDF | 20MB |
Per saperne di più sui requisiti di Document Understanding, consulta la sezione Document Understanding.
Formato del set di dati
Il fileUri
per il tuo set di dati può essere l'URI di un file in un bucket Cloud Storage oppure un URL HTTP o HTTPS disponibile pubblicamente.
Per visualizzare l'esempio di formato generico, vedi Esempio di set di dati per Gemini.
Di seguito è riportato un esempio di set di dati di documenti.
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist. Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
Passaggi successivi
- Per scoprire di più sulla funzionalità di comprensione dei documenti dei modelli Gemini, consulta la panoramica Comprensione dei documenti.
- Per iniziare l'ottimizzazione, consulta Ottimizzare i modelli Gemini utilizzando il perfezionamento supervisionato
- Per scoprire come è possibile utilizzare il fine-tuning supervisionato in una soluzione che crea una knowledge base di AI generativa, consulta Soluzione Jump Start: knowledge base di AI generativa.