Esta página foi traduzida pela API Cloud Translation.

Modelos Google

Modelos do Gemini em destaque

2.5 Pro

O nosso modelo Gemini de raciocínio mais avançado, criado para resolver problemas complexos

Ideal para compreensão multimodal
Capaz de processar comandos complexos e fornecer respostas abrangentes
Melhor para programação, particularmente para desenvolvimento Web

2.5 Flash

O nosso melhor modelo em termos de preço/desempenho, que oferece capacidades abrangentes

Suporte para a API Live incluído para alguns pontos finais
Veja o processo de raciocínio do modelo como parte da resposta
Equilibra o preço e o desempenho

2.5 Flash-Lite

O nosso modelo mais económico que suporta tarefas de elevado débito

O modelo mais rápido na linha de modelos 2.5
Apresenta uma capacidade de resposta de 1 milhão de tokens e entrada multimodal, como o 2.5 Flash
Supera o 2.0 Flash na maioria dos testes de avaliação

Modelos do Gemini disponíveis de forma geral

diamond Gemini 2.5 Pro O nosso modelo de raciocínio mais avançado até à data

spark Gemini 2.5 Flash O nosso melhor modelo em termos de relação preço/desempenho, que oferece capacidades abrangentes

photo_spark Gemini 2.5 Flash Image O nosso modelo padrão atualizado para fluxos de trabalho criativos rápidos com geração de imagens e capacidades de edição conversacionais e de várias interações

performance_auto Gemini 2.5 Flash-Lite O nosso modelo mais rentável que suporta tarefas de elevado débito

spark Gemini 2.0 Flash O nosso modelo multimodal mais recente, com funcionalidades de nova geração e capacidades melhoradas

performance_auto Gemini 2.0 Flash-Lite Um modelo Gemini 2.0 Flash otimizado para rentabilidade e baixa latência

Pré-visualize os modelos Gemini

mic_detect_auto API Gemini 2.5 Flash Live O nosso modelo padrão atualizado para experiências de conversação em tempo real com capacidades de streaming

Modelos Gemma

Gemma 3n Os modelos abertos mais recentes, concebidos para uma execução eficiente em dispositivos com poucos recursos, capazes de entrada multimodal, processamento de texto, imagem, vídeo e entrada de áudio, e geração de resultados de texto, e preparados com dados em mais de 140 idiomas falados

Gemma 3 A terceira geração dos nossos modelos abertos, com a capacidade de resolver uma grande variedade de tarefas com entrada de texto e imagem, suporte para mais de 140 idiomas e uma janela de contexto longa de 128 mil tokens

Gemma 2 A segunda geração dos nossos modelos abertos com geração, resumo e extração de texto

Gemma Um modelo aberto pequeno e leve que suporta a geração, o resumo e a extração de texto

ShieldGemma 2 Modelos ajustados por instruções para avaliar a segurança de texto e imagens em função de um conjunto de políticas de segurança definidas

PaliGemma O nosso modelo aberto de visão-linguagem que combina o SigLIP e o Gemma

CodeGemma Modelo aberto potente e leve que pode realizar uma variedade de tarefas de programação, como o preenchimento de código, a geração de código, a compreensão da linguagem natural, o raciocínio matemático e o seguimento de instruções

TxGemma Gera previsões, classificações ou texto com base em dados relacionados com terapêuticas e pode ser usado para criar eficientemente modelos de IA para tarefas relacionadas com terapêuticas com menos dados e menos computação

MedGemma Coleção de variantes do Gemma 3 preparadas para o desempenho na compreensão de texto e imagens médicas

MedSigLIP Variante do SigLIP preparada para codificar imagens e texto médicos num espaço de incorporação comum

T5Gemma Uma família de modelos de investigação de codificador-descodificador leves, mas potentes, da Google

Modelos de incorporações

width_normal Incorporações para texto Converte dados de texto em representações vetoriais para pesquisa semântica, classificação, agrupamento e tarefas semelhantes

width_normal Incorporações multimodais Gera vetores com base em imagens, que podem ser usados para tarefas posteriores, como classificação de imagens, pesquisa de imagens e muito mais

Modelos Imagen disponíveis de forma geral

photo_spark Imagen 4 para geração Use comandos de texto para gerar novas imagens com uma qualidade superior à dos nossos modelos de geração de imagens anteriores

photo_spark Imagen 4 para geração rápida Use comandos de texto para gerar novas imagens com uma qualidade superior e uma latência inferior à dos nossos modelos de geração de imagens anteriores

photo_spark Imagen 4 para geração ultra Use comandos de texto para gerar novas imagens com uma qualidade superior e uma melhor aderência aos comandos do que os nossos modelos de geração de imagens anteriores

photo_spark Imagen 3 para geração Use comandos de texto para gerar novas imagens

image_edit_auto Imagen 3 para edição e personalização Use comandos de texto para editar imagens de entrada existentes ou partes de uma imagem com uma máscara, ou gerar novas imagens com base no contexto fornecido pelas imagens de referência de entrada

photo_spark Imagen 3 para geração rápida Use comandos de texto para gerar novas imagens com uma latência inferior à dos nossos outros modelos de geração de imagens

subtitles Imagen para legendagem e VQA Use comandos de texto para gerar novas imagens, editar as existentes, editar partes de uma imagem com uma máscara e muito mais

Pré-visualize os modelos Imagen

photo_spark Experiência virtual Gere imagens de pessoas a usar produtos de vestuário.

image_edit_auto Recontextualização de produtos do Imagen na Vertex AI Use comandos de texto para editar imagens de produtos em diferentes cenas ou fundos.

Modelos Veo

filme Veo 2 Use comandos de texto e imagens para gerar vídeos originais

filme Veo 3 Use comandos de texto e imagens para gerar vídeos originais com uma qualidade superior à do nosso modelo de geração de vídeo anterior

filme Veo 3 Fast Use comandos de texto e imagens para gerar vídeos originais com uma qualidade superior e uma latência inferior à do nosso modelo de geração de vídeo anterior

Pré-visualize os modelos Veo

movie Pré-visualização do Veo 3 Use comandos de texto e imagens para gerar vídeos originais com uma qualidade superior à do nosso modelo de geração de vídeo anterior

movie Pré-visualização do Veo 3 Fast Use comandos de texto e imagens para gerar vídeos originais com uma qualidade superior e uma latência inferior à do nosso modelo de geração de vídeo anterior

movie Pré-visualização do Veo 3.1 Use comandos de texto e imagens para gerar vídeos originais com uma qualidade superior à do nosso modelo de geração de vídeo anterior

movie Pré-visualização do Veo 3.1 Fast Use comandos de texto e imagens para gerar vídeos originais com uma qualidade superior e uma latência inferior à do nosso modelo de geração de vídeo anterior

movie Pré-visualização do Veo 2 Use comandos de texto e imagens para gerar vídeos originais. Esta versão do modelo suporta o preenchimento e o preenchimento exterior.

Modelos Veo experimentais

filme Veo 2 experimental Um modelo experimental com funcionalidades em teste.

Modelos MedLM

medical_information MedLM-medium Conjunto de modelos ajustados medicamente em conformidade com a HIPAA concebidos para ajudar os profissionais de saúde com tarefas de perguntas e respostas médicas, e tarefas de resumo para documentos médicos e de cuidados de saúde

clinical_notes MedLM-large-large Conjunto de modelos ajustados medicamente em conformidade com a HIPAA concebidos para ajudar os profissionais de saúde com tarefas de perguntas e respostas médicas, e tarefas de resumo para documentos médicos e de cuidados de saúde

Suporte de idiomas

Gemini

Todos os modelos Gemini podem compreender e responder nos seguintes idiomas:

africâner (af), albanês (sq), amárico (am), árabe (ar), arménio (hy), assamês (as), azerbaijano (az), basco (eu), bielorrusso (be), bengali (bn), bósnio (bs), búlgaro (bg), catalão (ca), cebuano (ceb), chinês (simplificado e tradicional) (zh), corso (co), croata (hr), checo (cs), dinamarquês (da), divehi (dv), holandês (nl), inglês (en), esperanto (eo), estónio (et), filipino (tagalo) (fil), finlandês (fi), francês (fr), frísio (fy), galego (gl), georgiano (ka), alemão (de), grego (el), gujarati (gu), crioulo haitiano (ht), haúça (ha), havaiano (haw), hebraico (iw), hindi (hi), hmong (hmn), húngaro (hu), islandês (is), igbo (ig), indonésio (id), irlandês (ga), italiano (it), japonês (ja), javanês (jv), canarim (kn), cazaque (kk), khmer (km), coreano (ko), krio (kri), curdo (ku), quirguiz (ky), laosiano (lo), latim (la), letão (lv), lituano (lt), luxemburguês (lb), macedónio (mk), malgaxe (mg), malaio (ms), malaiala (ml), maltês (mt), maori (mi), marata (mr), meiteilon (manipuri) (mni-Mtei), mongol (mn), myanmar (birmanês) (my), nepalês (ne), norueguês (no), nianja (chichewa) (ny), oriya (odia) (or), pastó (ps), persa (fa), polaco (pl), português (pt), panjabi (pa), romeno (ro), russo (ru), samoano (sm), gaélico escocês (gd), sérvio (sr), sesoto (st), shona (sn), sindi (sd), cingalês (si), eslovaco (sk), esloveno (sl), somali (so), espanhol (es), sundanês (su), suaíli (sw), sueco (sv), tajique (tg), tâmil (ta), telugu (te), tailandês (th), turco (tr), ucraniano (uk), urdu (ur), uigures (ug), usbeque (uz), vietnamita (vi), galês (cy), xosa (xh), iídiche (yi), iorubá (yo) e zulu (zu).

Gemma

O Gemma e o Gemma 2 só suportam o idioma inglês (en). O Gemma 3 e o Gemma 3n oferecem suporte multilingue em mais de 140 idiomas.

Incorporações

Os modelos de incorporação de texto multilingues suportam os seguintes idiomas:

Africâner (af), albanês (sq), amárico (am), árabe (ar), arménio (hy), azerbaijano (az), basco (eu), bielorrusso (be), bengali (bn), búlgaro (bg), catalão (ca), cebuano (ceb), chinês (simplificado e tradicional) (zh), corso (co), checo (cs), dinamarquês (da), holandês (nl), inglês (en), esperanto (eo), estónio (et), filipino (tagalo) (fil), finlandês (fi), francês (fr), frísio (fy), galego (gl), georgiano (ka), alemão (de), grego (el), gujarati (gu), crioulo haitiano (ht), haúça (ha), havaiano (haw), hebraico (iw), hindi (hi), hmong (hmn), húngaro (hu), islandês (is), igbo (ig), indonésio (id), irlandês (ga), italiano (it), japonês (ja), javanês (jv), canarim (kn), cazaque (kk), khmer (km), coreano (ko), curdo (ku), quirguiz (), laosiano (), latim (), letão (), lituano (), luxemburguês (), macedónio (), malgaxe (), malaio (), malaiala (), maltês (), maori (), marata (), mongol (), myanmar (birmanês) (), nepalês (), nianja (chichewa) (af), norueguês (sq), pastó (am), persa (ar), polaco (hy), português (az), panjabi (eu), romeno (be), russo (bn), samoano (bg), gaélico escocês (ca), sérvio (ceb), sesoto (zh), shona (co), sindi (cs), sinhala (cingalês) (da), eslovaco (nl), esloveno (en), somali (eo), espanhol (et), sundanês (fil), suaíli (fi), sueco (fr), tajique (fy), tâmil (gl), telugo (ka), tailandês (de), turco (el), ucraniano (gu), urdu (ht), usbeque (ha), vietnamita (haw), galês (iw), xosa (hi), iídiche (hmn), iorubá (hu) e zulu (is).kylolalvltlbmkmgmsmlmtmimrmnmynenynopsfaplptparorusmgdsrstsnsdsiskslsoessuswsvtgtatethtrukuruzvicyxhyiyozu

Imagen 3

O Imagen 3 suporta os seguintes idiomas:

Inglês (en), chinês (simplificado e tradicional) (zh), hindi (hi), japonês (ja), coreano (ko), português (pt) e espanhol (es).

MedLM

O modelo MedLM é compatível com o idioma inglês (en).

Explore todos os modelos no Model Garden

O Model Garden é uma plataforma que ajuda a descobrir, testar, personalizar e implementar modelos e recursos proprietários da Google e de OSS selecionados. Para explorar os modelos e as APIs de IA generativa disponíveis no Vertex AI, aceda ao Model Garden na Google Cloud consola.

Aceda ao Model Garden

Para saber mais sobre o Model Garden, incluindo os modelos e as capacidades disponíveis, consulte o artigo Explore modelos de IA no Model Garden.

Versões do modelo

Para ver todas as versões do modelo, incluindo modelos antigos e desativados, consulte o artigo Versões e ciclo de vida do modelo.

O que se segue?

Experimente um tutorial de início rápido com o Vertex AI Studio ou a API Vertex AI.
Explore modelos pré-treinados no Model Garden.
Saiba como controlar o acesso a modelos específicos no Model Garden através de uma política de organização do Model Garden.
Saiba mais acerca dos preços.