Migrar seu aplicativo para o Gemini 2 com a API Gemini na Vertex AI

Este guia mostra como migrar aplicativos de IA generativa dos modelos Gemini 1.x e PaLM para os modelos Gemini 2.

Por que migrar para o Gemini 2?

O Gemini 2 oferece melhorias significativas no desempenho em relação aos modelos Gemini 1.x e PaLM, além de novos recursos. Além disso, cada versão do modelo tem o próprio período de suporte e disponibilidade.

Atualizar a maioria dos aplicativos de IA generativa para o Gemini 2 não exige uma reengenharia significativa de comandos ou código. No entanto, alguns aplicativos exigem mudanças imediatas, e essas mudanças são difíceis de prever sem executar uma solicitação pelo Gemini 2 primeiro. Portanto, recomendamos testar o Gemini 2 antes da migração.

As mudanças significativas no código são necessárias apenas para determinadas mudanças importantes ou para usar novos recursos do Gemini 2.

Para qual modelo do Gemini 2 devo migrar?

Ao escolher um modelo do Gemini 2 para migrar, considere os recursos necessários para seu aplicativo e o custo deles.

Para conferir uma visão geral dos recursos do modelo do Gemini 2, consulte Gemini 2. Para ter uma visão geral de todos os modelos do Google, consulte Modelos do Google.

Para comparar os modelos disponíveis do Gemini, consulte a tabela a seguir.

Recurso Gemini 1.5 Pro Gemini 1.5 Flash Gemini 2.0 Flash Gemini 2.0 Flash-Lite Gemini 2.5 Pro Gemini 2.5 Flash
Modalidades de entrada texto, documentos, imagem, vídeo, áudio texto, documentos, imagem, vídeo, áudio texto, documentos, imagem, vídeo, áudio texto, documentos, imagem, vídeo, áudio texto, documentos, imagem, vídeo, áudio texto, documentos, imagem, vídeo, áudio
Modalidades de saída texto texto texto texto texto texto
Janela de contexto e limite total de tokens 2.097.152 1.048.576 1.048.576 1.048.576 1.048.576 1.048.576
Tamanho do contexto de saída 8.192 8.192 8.192 8.192 64.192 64.192
Embasamento com a Pesquisa Sim Sim Sim Não Sim Sim
Chamadas de função Sim Sim Sim Sim Sim Sim
Execução de código Não Não Sim Não Sim Sim
Cache de contexto Sim Sim Sim Não Sim Sim
Previsão em lote Sim Sim Sim Sim Sim Sim
API Live Não Não Não Não Não Não
Latência Mais capacidade na família 1.5 Mais rápido na família 1.5 Rápido e com boa economia Rápido e mais econômico Mais lenta que o Flash, mas com boa eficiência de custo Rápido e mais econômico
Ajuste de detalhes Sim Sim Sim Sim Sim Sim
SDK recomendado SDK da Vertex AI SDK da Vertex AI SDK da IA generativa SDK da IA generativa SDK da IA generativa SDK da IA generativa
Unidades de preço Baseado em caracteres Baseado em caracteres Token Token Token Token

Visão geral do processo de migração

Este documento descreve um processo de oito etapas para migrar seu aplicativo para o Gemini 2. Use o diagrama abaixo para navegar até cada etapa.

Processo

Antes de começar

Documentar os requisitos de avaliação e teste do modelo

Upgrades e testes de código

Avaliação off-line

Avalie os resultados da avaliação e ajuste os comandos e hiperparâmetros do Gemini 2

Teste de carga

Avaliação on-line

Implantação de produção

Como melhorar o desempenho do modelo

Ao concluir a migração, use as dicas a seguir para maximizar a performance do modelo Gemini 2:

  • Inspecione as instruções do sistema, os comandos e os exemplos de aprendizado de poucos exemplos para verificar se há inconsistências, contradições ou instruções e exemplos irrelevantes.
  • Teste um modelo mais eficiente. Por exemplo, se você avaliou o Gemini 2.0 Flash-Lite, teste o Gemini 2.0 Flash.
  • Examine os resultados da avaliação automatizada para garantir que eles correspondam ao julgamento humano, especialmente os resultados que usam um modelo de juiz. Verifique se as instruções do modelo de avaliação não contêm inconsistências ou ambiguidades.
  • Uma maneira de melhorar as instruções do modelo de julgamento é testar as instruções com vários humanos isoladamente e verificar se os julgamentos são consistentes. Se as pessoas interpretarem as instruções de forma diferente e emitirem julgamentos diferentes, as instruções do modelo de julgamento serão ambíguas.
  • Ajustar o modelo Gemini 2.
  • Examine as saídas de avaliação para procurar padrões que mostrem tipos específicos de falhas. O agrupamento de falhas em diferentes modelos, tipos ou categorias fornece dados de avaliação mais direcionados, o que facilita o ajuste das instruções para corrigir esses erros.
  • Avalie de forma independente os diferentes componentes de IA generativa.
  • Ajuste os parâmetros de amostragem de tokens.

Como receber ajuda

Se precisar de ajuda, o Google Cloud oferece pacotes de suporte para atender às suas necessidades, como cobertura 24 horas, suporte por telefone e acesso a um gerente de suporte técnico. Para mais informações, consulte o Suporte do Google Cloud.

A seguir