A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estarão disponíveis em projetos que não os usaram antes, incluindo novos projetos. Para mais detalhes, consulte Versões e ciclo de vida do modelo.

Esta página foi traduzida pela API Cloud Translation.

Noções básicas sobre RagManagedDb

Nesta página, apresentamos o RagManagedDb, a tecnologia subjacente e como o RagManagedDb é usado no mecanismo de RAG da Vertex AI. Além disso, esta página descreve os diferentes níveis disponíveis para ajustar a performance, o que pode afetar seus custos, e fornece instruções para excluir os dados do mecanismo RAG da Vertex AI, o que interrompe o faturamento.

Visão geral

O mecanismo de RAG da Vertex AI usa RagManagedDb, que é uma instância do Google Spanner totalmente gerenciada e pronta para uso empresarial. Ela é usada para armazenamento de recursos pelo mecanismo de RAG da Vertex AI e pode ser usada como o banco de dados vetorial de sua escolha para seus corpus de RAG.

Com o Spanner, o mecanismo de RAG da Vertex AI oferece um banco de dados consistente, altamente disponível e escalonável para oferecer suporte ao seu aplicativo. Para saber mais sobre o Google Spanner, consulte Spanner.

O mecanismo de RAG da Vertex AI armazena os metadados do corpus e do recurso de arquivo de RAG em RagManagedDb, independente do banco de dados vetorial escolhido. Os bancos de dados de vetores são usados apenas para armazenamento e recuperação de embeddings. Além do armazenamento de recursos, o RagManagedDb também pode ser usado para armazenar e gerenciar representações vetoriais dos seus documentos. Em seguida, o banco de dados vetorial é usado para recuperar documentos relevantes com base na semelhança semântica do documento com uma determinada consulta.

Gerenciar níveis

O mecanismo de RAG da Vertex AI permite escalonar sua instância RagManagedDb com base nos requisitos de uso e desempenho usando dois níveis. Além disso, é possível excluir os dados do mecanismo de RAG da Vertex AI usando um terceiro nível.

O nível é uma configuração no nível do projeto disponível no recurso RagEngineConfig, que afeta os corpus de RAG usando RagManagedDb. Os seguintes níveis estão disponíveis no RagEngineConfig:

Nível escalonado: oferece desempenho em escala de produção e funcionalidade de escalonamento automático. É adequado para clientes com grandes quantidades de dados ou cargas de trabalho sensíveis ao desempenho. Internamente, esse nível define a instância do Spanner para a configuração de escalonamento automático com um mínimo de 1 nó (1.000 unidades de processamento) e um máximo de 10 nós (10.000 unidades de processamento).
Nível básico (padrão): oferece um nível econômico e de baixa computação, que pode ser adequado para alguns dos seguintes casos:
- Fazendo experimentos com RagManagedDb.
- Tamanho de dados pequeno.
- Carga de trabalho sem diferenciação de latência.
- Use o mecanismo RAG da Vertex AI apenas com outros bancos de dados de vetores.
Para oferecer o nível básico, o RagManagedDb define a instância do Spanner subjacente para uma configuração fixa de 100 unidades de processamento, o que equivale a 0,1 nós.
Nível não provisionado: exclui o RagManagedDb e a instância do Spanner subjacente. O nível não provisionado desativa o serviço do mecanismo de RAG da Vertex AI e exclui os dados mantidos nele, independente do banco de dados vetorial usado para seu RagCorpora. Isso interrompe a cobrança do serviço. Para mais informações sobre faturamento, consulte Faturamento do mecanismo de RAG da Vertex AI.

Depois que os dados são excluídos, não é possível recuperá-los. Para voltar a usar o mecanismo de RAG da Vertex AI, atualize o nível chamando a API UpdateRagEngineConfig.

Extrair a configuração do projeto

Os exemplos de código a seguir demonstram como usar a API GetRagEngineConfig para cada tipo de nível:

Versão 1 (v1) exemplos de código da API.
Exemplos de código da API v1beta1.

Atualizar a configuração do projeto

Os exemplos de código a seguir demonstram como usar a API UpdateRagEngineConfig para cada tipo de nível:

Versão 1 (v1) Exemplos de código da API.
Exemplos de código da API v1beta1.

A seguir

Para saber como usar a API RAG v1, que é a padrão, consulte API RAG v1.
Para saber como usar a API RAG v1beta1, consulte API RAG v1beta1.
Para saber mais sobre RagManagedDb e como gerenciar a configuração do seu nível e a estratégia de recuperação no nível do corpus da RAG, consulte Usar RagManagedDb com o mecanismo de RAG da Vertex AI.