Versões e ciclo de vida do modelo de geração de respostas

Os aplicativos de IA oferecem várias versões de modelo para você escolher ao gerar respostas. Você pode escolher as versões do modelo ao usar resumos da pesquisa e respostas e acompanhamentos.

Modelos disponíveis

Os aplicativos de IA usam dois tipos de modelos para casos de uso de perguntas e respostas:

  • Modelos de LLM da Vertex AI testados em tarefas de perguntas e respostas
  • Modelos de aplicativos de IA baseados em modelos de LLM da Vertex AI e treinados para responder a perguntas

Os modelos de aplicativos de IA têm a mesma data de descontinuação dos modelos de LLM da Vertex AI em que se baseiam. O modelo LLM básico fica disponível por seis meses após a data de lançamento da próxima versão, de acordo com a política de ciclo de vida do modelo da Vertex AI. Deixe tempo suficiente para migrar para novos modelos antes das datas de descontinuação.

A tabela a seguir lista as especificações da versão do modelo. Quando você define uma especificação de modelo, a API usa o modelo especificado para gerar respostas.

Segmento do setor Personalizado Saúde
Versão do modelo Descrição Janela de contexto Data de desativação Descrição Janela de contexto Data de desativação
stable

A opção de modelo padrão se a versão do modelo não estiver definida.

A especificação do modelo stable aponta para gemini-2.0-flash-001/answer_gen/v1.

O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.

128 mil N/A

A opção de modelo padrão se a versão do modelo não estiver definida.

A especificação do modelo stable aponta para gemini-2.0-flash-001/answer_gen/v1.

O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.

128 mil N/A
gemini-2.0-flash-001/answer_gen/v1

Um modelo de aplicativos de IA baseado no modelo gemini-2.0-flash-001 com ajuste adicional para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 5 de fevereiro de 2026

Um modelo de aplicativos de IA baseado no modelo gemini-2.0-flash-001 com ajuste adicional para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 5 de fevereiro de 2026
gemini-1.5-flash-002/answer_gen/v1

Um modelo de aplicativos de IA baseado no modelo gemini-1.5-flash-002 com ajuste adicional para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de setembro de 2025 Não disponível
gemini-1.5-flash-001/answer_gen/v2

Um modelo de Aplicativos de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional (versão 2) em dados estruturados e não estruturados combinados para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025

Um modelo de Aplicativos de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional (versão 2) em dados estruturados e não estruturados combinados para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025
gemini-1.5-flash-001/answer_gen/v1

Um modelo de aplicativos de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025

Um modelo de aplicativos de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional para lidar com tarefas de perguntas e respostas.

O modelo é congelado após o lançamento.

128 mil 24 de maio de 2025
preview

A especificação do modelo de prévia aponta para o modelo gemini-1.5-pro-002 mais recente. O modelo de prévia está sujeito a mudanças sem aviso prévio. Se você usar o preview como modelo, poderá notar mudanças nas respostas quando o modelo mudar. Se você quiser consistência nas respostas, selecione um modelo específico.

128 mil N/A

A especificação do modelo de prévia aponta para o modelo gemini-1.5-pro-002 mais recente. O modelo de prévia está sujeito a mudanças sem aviso prévio. Se você usar o preview como modelo, poderá notar mudanças nas respostas quando o modelo mudar. Se você quiser consistência nas respostas, selecione um modelo específico.

128 mil N/A

A seguir