Versões e ciclo de vida do modelo de geração de respostas
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Os aplicativos de IA oferecem várias versões de modelo para você escolher ao
gerar respostas. Você pode escolher as versões do modelo ao usar resumos da pesquisa e respostas e acompanhamentos.
Modelos disponíveis
Os aplicativos de IA usam dois tipos de modelos para casos de uso de perguntas e respostas:
Modelos de LLM da Vertex AI testados em tarefas de perguntas e respostas
Modelos de aplicativos de IA baseados em modelos de LLM da Vertex AI e treinados para responder a perguntas
Os modelos de aplicativos de IA têm a mesma data de descontinuação dos modelos de LLM da Vertex AI em que se baseiam. O modelo LLM básico fica disponível por seis meses após a data de lançamento da próxima versão, de acordo com a política de ciclo de vida do modelo da Vertex AI.
Deixe tempo suficiente para migrar para novos modelos antes das datas de descontinuação.
A tabela a seguir lista as especificações da versão do modelo. Quando você define uma especificação de modelo, a API usa o modelo especificado para gerar respostas.
Segmento do setor
Personalizado
Saúde
Versão do modelo
Descrição
Janela de contexto
Data de desativação
Descrição
Janela de contexto
Data de desativação
stable
A opção de modelo padrão se a versão do modelo não estiver definida.
A especificação do modelo stable aponta para
gemini-2.5-flash/answer_gen/v1.
O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.
128 mil
N/A
A opção de modelo padrão se a versão do modelo não estiver definida.
A especificação do modelo stable aponta para
gemini-2.5-flash/answer_gen/v1.
O modelo designado como stable muda periodicamente à medida que novos modelos e versões ficam disponíveis.
128 mil
N/A
gemini-2.5-flash/answer_gen/v1
Um modelo de aplicativos de IA baseado no modelo gemini-2.5-flash com ajuste adicional para lidar com tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128 mil
17 de junho de 2026
Um modelo de aplicativos de IA baseado no modelo gemini-2.5-flash com ajuste adicional para lidar com tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128 mil
17 de junho de 2026
gemini-2.0-flash-001/answer_gen/v1
Um modelo de aplicativos de IA baseado no modelo gemini-2.0-flash-001 com ajuste adicional para lidar com tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128 mil
5 de fevereiro de 2026
Um modelo de aplicativos de IA baseado no modelo gemini-2.0-flash-001 com ajuste adicional para lidar com tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128 mil
5 de fevereiro de 2026
gemini-1.5-flash-002/answer_gen/v1
Um modelo de aplicativos de IA baseado no modelo gemini-1.5-flash-002 com ajuste adicional para lidar com tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128 mil
24 de setembro de 2025
Não disponível
gemini-1.5-flash-001/answer_gen/v2
Um modelo de Aplicativos de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional (versão 2) em dados estruturados e não estruturados combinados para lidar com tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128 mil
24 de maio de 2025
Um modelo de Aplicativos de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional (versão 2) em dados estruturados e não estruturados combinados para lidar com tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128 mil
24 de maio de 2025
gemini-1.5-flash-001/answer_gen/v1
Um modelo de aplicativos de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional para lidar com tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128 mil
24 de maio de 2025
Um modelo de aplicativos de IA baseado no modelo gemini-1.5-flash-001 com ajuste adicional para lidar com tarefas de perguntas e respostas.
O modelo é congelado após o lançamento.
128 mil
24 de maio de 2025
preview
A especificação do modelo de prévia aponta para o modelo gemini-1.5-pro-002 mais recente. O modelo de prévia está sujeito a mudanças sem aviso prévio. Se você usar o preview como modelo, poderá notar mudanças nas respostas quando o modelo mudar. Se você quiser consistência nas respostas, selecione um modelo específico.
128 mil
N/A
A especificação do modelo de prévia aponta para o modelo gemini-1.5-pro-002 mais recente. O modelo de prévia está sujeito a mudanças sem aviso prévio. Se você usar o preview como modelo, poderá notar mudanças nas respostas quando o modelo mudar. Se você quiser consistência nas respostas, selecione um modelo específico.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-19 UTC."],[[["\u003cp\u003eVertex AI Search offers a selection of model versions for generating answers, accessible when using search summaries and answers with follow-ups.\u003c/p\u003e\n"],["\u003cp\u003eThere are two main types of models used by Vertex AI Search for question-and-answer tasks: Vertex AI LLM models and Vertex AI Search models, the latter being further trained based on LLMs.\u003c/p\u003e\n"],["\u003cp\u003eThe \u003ccode\u003estable\u003c/code\u003e model designation in Vertex AI Search automatically updates to the most current model version available, whereas other model versions remain frozen after their release.\u003c/p\u003e\n"],["\u003cp\u003eVertex AI Search models share the same discontinuation date as their base Vertex AI LLM models, with the base LLM models being supported for six months after the release of the subsequent version.\u003c/p\u003e\n"],["\u003cp\u003eThe \u003ccode\u003epreview\u003c/code\u003e model specfication uses the latest \u003ccode\u003egemini-1.5-pro-002\u003c/code\u003e model, and is subject to change without notification.\u003c/p\u003e\n"]]],[],null,["# Answer generation model versions and lifecycle\n\nAI Applications offers multiple model versions for you to choose when\ngenerating answers. You can choose the model versions when using [search\nsummaries](/generative-ai-app-builder/docs/get-search-summaries) and [answers and\nfollow-ups](/generative-ai-app-builder/docs/answer).\n\nAvailable models\n----------------\n\nAI Applications uses two types of models for question and answering\nuse cases:\n\n- Vertex AI LLM models that have been tested on question and answering tasks\n- AI Applications models that are based on Vertex AI LLM models and further trained to address question and answering tasks\n\nAI Applications models share the same discontinuation date as their\nbase Vertex AI LLM models. The base LLM model is available for six\nmonths after the release date of the next version of the model, per the [Vertex\nAI model lifecycle\npolicy](/vertex-ai/generative-ai/docs/learn/model-versioning).\nLeave enough time to migrate to new models before the discontinuation dates.\n\nThe following table lists model version specifications. When you set a model\nspecification, the API uses the specified model to generate answers.\n\nWhat's next\n-----------\n\n- [Get search summaries](/generative-ai-app-builder/docs/get-search-summaries)"]]