Esta página fornece pré-requisitos e instruções detalhadas para ajustar o Gemini em dados de documentos usando o aprendizado supervisionado.
Casos de uso
Com o ajuste fino, você pode personalizar modelos de linguagem avançados para suas necessidades específicas. Confira alguns casos de uso importantes em que o ajuste fino com seu próprio conjunto de PDFs pode melhorar significativamente a performance de um modelo:
- Base de conhecimento interna: converta seus documentos internos em uma base de conhecimento com tecnologia de IA que fornece respostas e insights instantâneos. Por exemplo, um representante de vendas pode acessar instantaneamente as especificações do produto e os detalhes de preços de materiais de treinamento anteriores.
- Assistente de pesquisa: crie um assistente de pesquisa capaz de analisar uma coleção de artigos, livros e trabalhos de pesquisa. Um pesquisador que estuda as mudanças climáticas pode analisar rapidamente artigos científicos para identificar tendências no aumento do nível do mar ou avaliar a eficácia de diferentes estratégias de mitigação.
- Conformidade regulatória ou jurídica: o ajuste fino em documentos jurídicos pode ajudar a automatizar a análise de contratos, sinalizando possíveis inconsistências ou áreas de risco. Isso permite que os profissionais do direito se concentrem em tarefas de nível mais alto, garantindo a conformidade.
- Geração automática de relatórios: automatize a análise de relatórios financeiros complexos, extraindo indicadores de desempenho principais e gerando resumos para as partes interessadas. Isso pode economizar tempo e reduzir o risco de erros em comparação com a análise manual.
- Resumo e análise de conteúdo: resuma documentos PDF longos, extraia insights importantes e analise tendências. Por exemplo, uma equipe de pesquisa de mercado pode analisar uma coleção de pesquisas com clientes para identificar temas e sentimentos principais.
- Comparação de documentos e controle de versões: compare diferentes versões de um documento para identificar mudanças e acompanhar revisões. Isso é muito útil em ambientes colaborativos em que vários autores contribuem para um documento.
Limitações
Gemini 2.5 Flash
Especificação | Valor |
---|---|
Número máximo de páginas de PDF por exemplo | 300 |
Número máximo de arquivos PDF por exemplo | 4 |
Tamanho máximo do arquivo PDF | 20MB |
Gemini 2.0 Flash Gemini 2.0 Flash-Lite
Especificação | Valor |
---|---|
Número máximo de páginas de PDF por exemplo | 300 |
Número máximo de arquivos PDF por exemplo | 4 |
Tamanho máximo do arquivo PDF | 20MB |
Para saber mais sobre os requisitos de compreensão de documentos, consulte Compreensão de documentos.
Formato do conjunto de dados
O fileUri
do conjunto de dados pode ser o URI de um arquivo em um bucket do Cloud Storage ou um URL HTTP ou HTTPS disponível publicamente.
Para conferir o exemplo de formato genérico, consulte Exemplo de conjunto de dados para o Gemini.
Confira a seguir um exemplo de conjunto de dados de documentos.
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist. Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
A seguir
- Para saber mais sobre a capacidade de compreensão de documentos dos modelos do Gemini, consulte a visão geral Compreensão de documentos.
- Para começar a ajustar, consulte Ajustar modelos do Gemini usando ajuste supervisionado de detalhes.
- Para saber como o ajuste supervisionado de detalhes pode ser usado em uma solução que cria uma base de conhecimento de IA generativa, consulte Solução de início rápido: base de conhecimento de IA generativa.