Este guia mostra como criar um embedding de texto usando a API Text embeddings da Vertex AI. Nesta página, abordamos os seguintes tópicos: A API Text embeddings da Vertex AI usa representações vetoriais densas de texto. Esses embeddings são criados usando métodos de aprendizado profundo semelhantes aos usados por modelos de linguagem grandes. Ao contrário dos vetores esparsos, que tendem a mapear palavras diretamente para números, os vetores densos são projetados para representar o significado de um texto. Isso permite que você pesquise trechos que se alinham ao significado de uma consulta, mesmo que não usem as mesmas palavras. As principais características desses encodings incluem: Para saber mais, consulte os seguintes recursos: In the Google Cloud console, on the project selector page,
select or create a Google Cloud project.
Enable the Vertex AI API.
In the Google Cloud console, on the project selector page,
select or create a Google Cloud project.
Enable the Vertex AI API.
Você pode obter embeddings de texto usando os seguintes modelos: Para uma qualidade de incorporação superior, o Use apenas os nomes dos modelos listados na tabela de modelos compatíveis. Não especifique um nome de modelo sem o sufixo É possível receber embeddings de texto para um snippet de texto usando a API Vertex AI ou o SDK da Vertex AI para Python. Cada solicitação é limitada a 250 textos de entrada e um total de 20.000 tokens de entrada. Se uma solicitação exceder o limite de tokens, ela vai retornar um erro 400. Cada texto de entrada individual é limitado a 2.048 tokens, e qualquer excesso é truncado silenciosamente. Para desativar o truncamento silencioso, defina Para mais informações, consulte Limites de embeddings de texto. Por padrão, todos os modelos produzem um vetor de embedding de comprimento total. Para Os exemplos a seguir usam o modelo
Para saber mais, consulte a
documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com a Vertex AI:
Depois de gerar o embedding, adicione-o a um banco de dados de vetores, como o Vector Search. Isso permite a recuperação de baixa latência e é essencial à medida que o tamanho dos dados aumenta. Para saber mais sobre a pesquisa de vetor, consulte Visão geral da pesquisa de vetor.
Antes de começar
Modelos compatíveis
Nome do modelo
Descrição
Dimensões de saída
Comprimento máximo da sequência
Idiomas de texto compatíveis
gemini-embedding-001
Desempenho de ponta em tarefas de inglês, multilíngues e de código. Ele unifica os modelos especializados anteriores, como
text-embedding-005
e text-multilingual-embedding-002
, e alcança um desempenho melhor nos respectivos domínios. Leia nosso relatório técnico para mais detalhes.até 3072
2.048 tokens
Idiomas de texto compatíveis
text-embedding-005
Especializado em tarefas de inglês e programação.
até 768
2.048 tokens
Inglês
text-multilingual-embedding-002
Especializado em tarefas multilíngues.
até 768
2.048 tokens
Idiomas de texto compatíveis
gemini-embedding-001
é nosso modelo grande projetado para oferecer a melhor performance. O gemini-embedding-001
aceita uma instância por solicitação.@version
nem use @latest
, porque esses formatos não são válidos.Obter embeddings de texto para um snippet de texto
Limites da API
autoTruncate
como false
.Escolher uma dimensão de embedding
gemini-embedding-001
, esse vetor tem 3.072 dimensões, e para outros modelos, são 768 dimensões. Para controlar o tamanho do vetor de embedding de saída, use o parâmetro output_dimensionality
. Uma dimensionalidade de saída menor pode economizar espaço de armazenamento e aumentar a eficiência computacional para aplicativos downstream, com uma possível compensação na qualidade.gemini-embedding-001
.Python
Instalar
pip install --upgrade google-genai
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
Adicionar um embedding a um banco de dados de vetores
A seguir
text-embedding-005
e text-multilingual-embedding-002
no artigo Gecko: embeddings de texto versáteis extraídos de modelos de linguagem grandes.
Acessar incorporações de texto
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-08-19 UTC.