Questa pagina fornisce i prerequisiti e le istruzioni dettagliate per perfezionare Gemini sui dati dei documenti utilizzando l'apprendimento supervisionato.
Casi d'uso
La messa a punto fine ti consente di personalizzare potenti modelli linguistici in base alle tue esigenze specifiche. Di seguito sono riportati alcuni casi d'uso principali in cui la messa a punto con il tuo set di PDF può migliorare notevolmente le prestazioni di un modello:
- Knowledge base interna: converti i tuoi documenti interni in una knowledge base basata sull'IA che fornisce risposte e approfondimenti immediati. Ad esempio, un rappresentante di vendita potrebbe accedere immediatamente alle specifiche e ai dettagli sui prezzi dei prodotti dai materiali di formazione precedenti.
- Assistente di ricerca: crea un assistente di ricerca in grado di analizzare una raccolta di articoli, libri e documenti di ricerca. Un ricercatore che studia i cambiamenti climatici potrebbe analizzare rapidamente articoli scientifici per identificare le tendenze relative all'innalzamento del livello del mare o valutare l'efficacia di diverse strategie di mitigazione.
- Conformità a norme o leggi: la messa a punto dei documenti legali può contribuire ad automatizzare la revisione dei contratti, segnalando potenziali incoerenze o aree di rischio. In questo modo, i professionisti legali possono concentrarsi su attività di livello superiore garantendo al contempo la conformità.
- Generare report automatici: automatizza l'analisi di report finanziari complessi, estrai gli indicatori chiave di prestazione e genera riepiloghi per gli stakeholder. In questo modo puoi risparmiare tempo e ridurre il rischio di errori rispetto all'analisi manuale.
- Sintesi e analisi dei contenuti: riassumi documenti PDF lunghi, estrai informazioni chiave e analizza le tendenze. Ad esempio, un team di ricerca di mercato potrebbe analizzare una raccolta di sondaggi dei clienti per identificare temi e sentiment chiave.
- Confronto dei documenti e controllo della versione: confronta le diverse versioni di un documento per identificare le modifiche e monitorare le revisioni. Questo può essere particolarmente utile in ambienti di collaborazione in cui più autori contribuiscono a un documento.
Limitazioni
Gemini 2.0 Flash
- Pagine PDF massime per esempio: 300
- File PDF massimi per esempio: 4
- Dimensioni massime del file PDF: 20 MB
Gemini 1.5 Flash
- Pagine PDF massime per esempio: 300
- File PDF massimi per esempio: 4
- Dimensioni massime del file PDF: 20 MB
Gemini 1.5 Pro
- Pagine PDF massime per esempio: 60
- File PDF massimi per esempio: 4
- Dimensioni massime del file PDF: 20 MB
Per saperne di più sui requisiti di comprensione dei documenti, consulta Comprensione dei documenti.
Formato del set di dati
fileUri
per il set di dati può essere l'URI di un file in un bucket Cloud Storage o un URL HTTP o HTTPS disponibile pubblicamente.
Per visualizzare l'esempio di formato generico, consulta Esempio di set di dati per Gemini.
Di seguito è riportato un esempio di set di dati di documenti.
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist. Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
Passaggi successivi
- Per scoprire di più sulla funzionalità di comprensione dei documenti dei modelli Gemini, consulta la panoramica della comprensione dei documenti.
- Per iniziare l'ottimizzazione, consulta Ottimizzare i modelli Gemini mediante l'ottimizzazione fine supervisionata
- Per scoprire come la regolazione fine supervisionata può essere utilizzata in una soluzione che crea una knowledge base di IA generativa, consulta la soluzione Jump Start: Knowledge base di IA generativa.