Modelos de IA generativa disponíveis

A Vertex AI no Google Distributed Cloud (GDC) isolado por ar tem uma lista crescente de modelos de IA generativa de base que podem ser testados, implantados e implementados para seus aplicativos isolados por ar. Os modelos de fundação são ajustados para casos de uso específicos e oferecidos com preços diferentes. Nesta página, resumimos as famílias de modelos disponíveis nas APIs de IA generativa no GDC e orientamos você sobre quais modelos escolher de acordo com o caso de uso.

Modelos de embeddings

Os embeddings convertem dados textuais escritos em uma linguagem natural em vetores numéricos. Essas representações vetoriais são projetadas para capturar o significado semântico e o contexto das palavras que representam. Os modelos de embedding de texto podem gerar embeddings otimizados para vários tipos de tarefas, como recuperação de documentos, perguntas e respostas, classificação e verificação de fatos. Para textos em inglês, use text-embedding-004. Para textos multilíngues, use text-multilingual-embedding-002.

A tabela a seguir resume os modelos disponíveis na API Embeddings. Para mais informações sobre embeddings, consulte Embeddings de texto.

Modelo Descrição Especificações
Embeddings de texto

(text-embedding-004)
Retorna embeddings para entradas de texto em inglês. Entrada máxima de tokens:2.048.

Dimensões de embedding:menos de 768.
Incorporação de texto multilíngue

(text-multilingual-embedding-002)
Retorna embeddings para entradas de texto de mais de 100 idiomas. Entrada máxima de tokens:2.048.

Dimensões de embedding:menos de 768.