A Vertex AI no Google Distributed Cloud (GDC) isolado por ar tem uma lista crescente de modelos de IA generativa de base que podem ser testados, implantados e implementados para seus aplicativos isolados por ar. Os modelos de fundação são ajustados para casos de uso específicos e oferecidos com preços diferentes. Nesta página, resumimos as famílias de modelos disponíveis nas APIs de IA generativa no GDC e orientamos você sobre quais modelos escolher de acordo com o caso de uso.
Modelos de embeddings
Os embeddings convertem dados textuais escritos em uma linguagem natural em vetores numéricos. Essas representações vetoriais são projetadas para capturar o significado
semântico e o contexto das palavras que representam. Os modelos de embedding de texto podem
gerar embeddings otimizados para vários tipos de tarefas, como recuperação de
documentos, perguntas e respostas, classificação e verificação de fatos. Para
textos em inglês, use text-embedding-004
. Para textos multilíngues, use
text-multilingual-embedding-002
.
A tabela a seguir resume os modelos disponíveis na API Embeddings. Para mais informações sobre embeddings, consulte Embeddings de texto.
Modelo | Descrição | Especificações |
---|---|---|
Embeddings de texto ( text-embedding-004 ) |
Retorna embeddings para entradas de texto em inglês. | Entrada máxima de tokens:2.048. Dimensões de embedding:menos de 768. |
Incorporação de texto multilíngue ( text-multilingual-embedding-002 ) |
Retorna embeddings para entradas de texto de mais de 100 idiomas. | Entrada máxima de tokens:2.048. Dimensões de embedding:menos de 768. |