Este guia mostra como escolher o tipo de tarefa ideal ao gerar embeddings com a Vertex AI para melhorar a qualidade delas no seu caso de uso específico. Ele abrange os seguintes tópicos: Com os modelos de embeddings da Vertex AI, é possível gerar embeddings otimizados para várias tarefas, como recuperação de documentos, perguntas e respostas e verificação de fatos. Um tipo de tarefa é um parâmetro especificado para otimizar os embeddings que o modelo gera para seu caso de uso pretendido. Este documento descreve como escolher o tipo de tarefa ideal para suas embeddings. Os tipos de tarefa são compatíveis com os seguintes modelos: As limitações a seguir se aplicam ao uso desses modelos: Usar tipos de tarefa pode melhorar a qualidade dos embeddings gerados por um modelo. Por exemplo, ao criar sistemas de geração aumentada de recuperação (RAG), um design comum é usar embeddings de texto e a Pesquisa Vetorial para realizar uma pesquisa de similaridade. Em alguns casos, essa abordagem pode resultar em uma qualidade de pesquisa menor porque as perguntas e respostas não são semanticamente semelhantes. Por exemplo, uma pergunta como "Por que o céu é azul?" e a resposta "A dispersão da luz solar causa a cor azul" têm significados distintos como frases. Isso significa que um sistema RAG pode não reconhecer automaticamente a relação entre elas, conforme demonstrado na Figura 1. Sem os tipos de tarefas, um desenvolvedor RAG precisaria treinar o modelo para aprender a relação entre consultas e respostas, o que requer habilidades avançadas em ciência de dados, ou usar a expansão de consulta baseada em LLM ou o HyDE, que pode introduzir alta latência e custos. Os tipos de tarefa permitem gerar embeddings otimizados para tarefas específicas, o que economiza o tempo e o custo que seria necessário para desenvolver seus próprios embeddings específicos de tarefas. O embedding gerado para a consulta "Por que o céu é azul?" e sua resposta "A dispersão da luz solar faz com que a cor azul" estaria no espaço de embedding compartilhado que representa a relação entre eles, como mostrado na figura 2. Neste exemplo de RAG, os embeddings otimizados levariam a pesquisas de similaridade aprimoradas. Além do caso de uso de consulta e resposta, os tipos de tarefa também oferecem um espaço de embeddings otimizado para tarefas como classificação, agrupamento e verificação de fatos. A tabela a seguir descreve os tipos de tarefas compatíveis. O melhor tipo de tarefa para seu projeto depende do seu caso de uso. Para conferir todos os tipos de tarefas, consulte a referência do modelo. Os casos de uso de embeddings geralmente se enquadram em uma das quatro categorias: avaliar a similaridade de texto, classificar textos, agrupar textos ou recuperar informações com base em textos. Se o caso de uso não estiver alinhado com um caso de uso documentado, use o tipo de tarefa Os tipos de tarefas podem ser simétricos ou assimétricos. Dependendo do caso de uso, você usa um tipo de tarefa simétrica ou assimétrica. Casos de uso simétricos são quando os textos comparados têm comprimento e conteúdo semelhantes, como comparar duas frases para verificar a similaridade. Para classificar textos de acordo com rótulos predefinidos, use o tipo de tarefa Para agrupar textos com base nas semelhanças deles, use o tipo de tarefa Outros casos de uso para agrupamento incluem: Para avaliar a semelhança de texto, use o tipo de tarefa Um cenário real para avaliar a semelhança de entrada é um sistema de recomendação que identifica itens (por exemplo, produtos, artigos, filmes) semanticamente semelhantes aos itens preferidos de um usuário para fornecer recomendações personalizadas. Os casos de uso assimétricos são quando você compara um texto de consulta curto com um grande conjunto de documentos mais longos. Ao criar um sistema de pesquisa ou recuperação, você trabalha com dois tipos de texto: Para ter o melhor desempenho, use diferentes tipos de tarefa para gerar embeddings para seu corpus e suas consultas. Primeiro, gere embeddings para toda a sua coleção de documentos usando o tipo de tarefa Em seguida, quando um usuário envia uma pesquisa, gere um embedding para o texto da consulta em tempo real usando um tipo de tarefa que corresponda à intenção do usuário. Em seguida, seu sistema usa esse embedding de consulta para encontrar os embeddings de documentos mais semelhantes no banco de dados de vetores. Os seguintes tipos de tarefas são usados para consultas: O Veja um exemplo: Para saber como instalar o SDK da Vertex AI para Python, consulte Instalar o SDK da Vertex AI para Python.
Para mais informações, consulte a
documentação de referência da API Python.
Modelos compatíveis
text-embedding-005
text-multilingual-embedding-002
gemini-embedding-001
us-central1
.Benefícios dos tipos de tarefa
Tipos de tarefas com suporte
Categoria do tipo de tarefa
Tipos de tarefa
Descrição
Casos de uso comuns
Recuperação (assimétrica)
Para consultas:
RETRIEVAL_QUERY
, QUESTION_ANSWERING
, FACT_VERIFICATION
, CODE_RETRIEVAL_QUERY
Para corpus: RETRIEVAL_DOCUMENT
Gera embeddings para uma consulta curta e pesquisa em um grande corpus de documentos. As incorporações de consulta e documento são otimizadas para funcionar juntas.
Pesquisa de documentos, sistemas RAG, respostas a perguntas, verificação de fatos, recuperação de código.
Classificação (simétrica)
CLASSIFICATION
Gera um embedding para uma única entrada de texto, otimizado para modelos de classificação.
Análise de sentimento, classificação de tópicos, detecção de spam.
Clustering (simétrico)
CLUSTERING
Gera um embedding para uma única entrada de texto, otimizado para algoritmos de clusterização.
Modelagem de tópicos, segmentação de clientes, identificação de conteúdo duplicado.
Similaridade semântica (simétrica)
SEMANTIC_SIMILARITY
Gera embeddings para comparar dois trechos de texto e determinar a similaridade semântica deles. Não destinado à recuperação.
Cálculo de pontuações de similaridade para recomendações ou detecção de paráfrases.
Determinar seu caso de uso de embeddings
RETRIEVAL_QUERY
por padrão.Casos de uso simétricos
Classificação
CLASSIFICATION
. Esse tipo de tarefa gera embeddings otimizados para modelos de classificação. Por exemplo, se você gerar uma incorporação para a postagem de mídia social "Não gosto de viajar de avião", um modelo de classificação poderá usar a incorporação para classificar o sentimento como negativo.Clustering
CLUSTERING
. Esse tipo de tarefa gera embeddings otimizados para algoritmos de agrupamento. Por exemplo, depois de gerar e agrupar embeddings para artigos de notícias, você pode sugerir outros artigos relacionados a esportes para usuários que leem muito sobre o assunto.
Similaridade semântica
SEMANTIC_SIMILARITY
. Esse tipo de tarefa gera embeddings otimizados para comparar a similaridade semântica entre dois trechos de texto. Por exemplo, ao comparar embeddings de "O gato está dormindo" e "O felino está cochilando", a pontuação de similaridade seria alta porque os dois textos têm quase o mesmo significado.Casos de uso assimétricos
Recuperação de informações
RETRIEVAL_DOCUMENT
. Normalmente, essa etapa é realizada uma vez para indexar todo o corpus e armazenar os embeddings resultantes em um banco de dados de vetores.
RETRIEVAL_QUERY
: use isso para uma consulta de pesquisa padrão em que você quer encontrar documentos relevantes.QUESTION_ANSWERING
: use quando as consultas forem perguntas adequadas, como "Por que o céu é azul?".FACT_VERIFICATION
: use quando quiser recuperar um documento do seu corpus que prove ou rejeite uma declaração.Recuperação de código
text-embedding-005
oferece suporte ao tipo de tarefa CODE_RETRIEVAL_QUERY
, que pode ser usado para recuperar blocos de código relevantes usando consultas de texto simples. Para usar esse recurso, incorpore blocos de código com o tipo de tarefa RETRIEVAL_DOCUMENT
e consultas de texto com CODE_RETRIEVAL_QUERY
.REST
PROJECT_ID=PROJECT_ID
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/text-embedding-005:predict -d \
$'{
"instances": [
{
"task_type": "CODE_RETRIEVAL_QUERY",
"content": "Function to add two numbers"
}
],
}'
Python
A seguir
Escolher um tipo de tarefa de embeddings
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-08-19 UTC.