Esta página foi traduzida pela API Cloud Translation.

Gemini 2.5 Flash

O Gemini 2.5 Flash é nosso melhor modelo em termos de preço e desempenho e oferece recursos abrangentes. O Gemini 2.5 Flash é nosso primeiro modelo Flash com capacidade de raciocínio, que permite ver o processo de pensamento do modelo ao gerar a resposta.

Para informações técnicas ainda mais detalhadas sobre o Gemini 2.5 Flash (como comparativos de performance, informações sobre nossos conjuntos de dados de treinamento, esforços de sustentabilidade, uso e limitações pretendidos e nossa abordagem de ética e segurança), consulte nosso relatório técnico sobre os modelos do Gemini 2.5 e a ficha do modelo do Gemini 2.5 Flash.

2.5 Flash

Testar na Vertex AI Ver no Model Garden (prévia) Implantar app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto do Google Cloud com o faturamento e a API Vertex AI ativados.

Especificações técnicas
ID do modelo	`gemini-2.5-flash`
Entradas e saídas compatíveis	Entradas: Texto, Código, Imagens, Áudio, Vídeo Saídas: Texto
Limites de tokens	Máximo de tokens de entrada: 1.048.576 Máximo de tokens de saída: 65.535 (padrão)
Recursos	Com suporte Embasamento com a Pesquisa Google Execução de código Ajuste Instruções do sistema Saída estruturada Chamadas de função Contar tokens API Live Recurso de prévia Pensar Cache de contexto Vertex AI RAG Engine Conclusões de chat Sem suporte
Tipos de uso	Com suporte Capacidade de processamento provisionada Cota compartilhada dinâmica Previsão em lote Sem suporte Cota fixa
Limite de tamanho da entrada	500 MB
	Imagens	Máximo de imagens por comando: 3.000 Tamanho máximo da imagem: 7 MB Tipos MIME compatíveis: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Número máximo de arquivos por comando: 3.000 Número máximo de páginas por arquivo: 1.000 Tamanho máximo de arquivo para importações da API ou do Cloud Storage: 50 MB Tamanho máximo por arquivo para uploads diretos pelo console: 7 MB Tipos MIME compatíveis: `application/pdf`, `text/plain`
	Vídeo	Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos Duração máxima do vídeo (sem áudio): aproximadamente 1 hora Número máximo de vídeos por comando: 10 Tipos MIME aceitos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Áudio	Duração máxima do áudio por solicitação: Aproximadamente 8, 4 horas ou até 1 milhão de tokens Número máximo de arquivos de áudio por comando: 1 Entendimento de fala para: Resumo, transcrição e tradução de áudio Tipos MIME aceitos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Padrões de parâmetros	Temperatura: 0,0 a 2,0 (padrão 1,0) topP: 0,0-1,0 (padrão 0,95) topK: 64 (corrigido) candidateCount: 1 a 8 (padrão: 1)
Regiões compatíveis
	Disponibilidade do modelo (Inclui cota compartilhada dinâmica e capacidade de transmissão provisionada)	Global global Estados Unidos us-central1 us-east1 us-east4 us-east5 us-south1 us-west1 us-west4 Europa europe-central2 europe-north1 europe-southwest1 europe-west1 europe-west4 europe-west8
	Processamento de ML	Estados Unidos Multirregional Canadá northamerica-northeast1⁺ Europa Multirregional europe-west2^{* +} europe-west3^{* +} europe-west9^{* +} Ásia-Pacífico asia-northeast1^{* +} asia-northeast3^{* +} asia-south1^{* +} asia-southeast1⁺ australia-southeast1^{* +}
	Consulte Residência de dados para mais informações.
Data de limite de conhecimento	Janeiro de 2025
Versões	`gemini-2.5-flash` Etapa do lançamento: GA Data de lançamento: 17 de junho de 2025 Data de descontinuação: 17 de junho de 2026 `gemini-live-2.5-flash` Etapa de lançamento: disponibilidade geral particular Data de lançamento: 17 de junho de 2025
Controles de segurança
Controles de segurança	Consulte Controles de segurança para mais informações.
Idiomas compatíveis	Consulte Idiomas aceitos.
Preços	Consulte a seção Preços.

+ O ajuste supervisionado não é compatível
* Disponível apenas para janela de contexto de 128 mil, o ajuste supervisionado não é compatível

2.5 Flash

Testar na Vertex AI (prévia) Implantar app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto do Google Cloud com o faturamento e a API Vertex AI ativados.

Especificações técnicas
ID do modelo	`gemini-2.5-flash-preview-09-2025`
Entradas e saídas compatíveis	Entradas: Texto, Código, Imagens, Áudio, Vídeo Saídas: Texto
Limites de tokens	Máximo de tokens de entrada: 1.048.576 Máximo de tokens de saída: 65.535 (padrão)
Recursos	Com suporte Embasamento com a Pesquisa Google Execução de código Instruções do sistema Saída estruturada Chamadas de função Contar tokens API Live Recurso de prévia Pensar Cache de contexto Vertex AI RAG Engine Conclusões de chat Sem suporte Ajuste
Tipos de uso	Com suporte Capacidade de processamento provisionada Cota compartilhada dinâmica Sem suporte Cota fixa Previsão em lote
	Imagens	Máximo de imagens por comando: 3.000 Tamanho máximo da imagem: 7 MB Tipos MIME compatíveis: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Número máximo de arquivos por comando: 3.000 Número máximo de páginas por arquivo: 1.000 Tamanho máximo de arquivo para importações da API ou do Cloud Storage: 50 MB Tamanho máximo por arquivo para uploads diretos pelo console: 7 MB Tipos MIME compatíveis: `application/pdf`, `text/plain`
	Vídeo	Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos Duração máxima do vídeo (sem áudio): aproximadamente 1 hora Número máximo de vídeos por comando: 10 Tipos MIME aceitos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Áudio	Duração máxima do áudio por solicitação: Aproximadamente 8, 4 horas ou até 1 milhão de tokens Número máximo de arquivos de áudio por comando: 1 Entendimento de fala para: Resumo, transcrição e tradução de áudio Tipos MIME aceitos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Padrões de parâmetros	Temperatura: 0,0 a 2,0 (padrão 1,0) topP: 0,0-1,0 (padrão 0,95) topK: 64 (corrigido) candidateCount: 1 a 8 (padrão: 1)
Regiões compatíveis
	Disponibilidade do modelo (Inclui cota compartilhada dinâmica e capacidade de transmissão provisionada)	Global global
	Consulte Residência de dados para mais informações.
Data de limite de conhecimento	Janeiro de 2025
Versões	`gemini-2.5-flash-preview-09-2025` Estágio de lançamento: acesso antecipado Data de lançamento: 25 de setembro de 2025
Controles de segurança
Controles de segurança	Consulte Controles de segurança para mais informações.
Idiomas compatíveis	Consulte Idiomas aceitos.
Preços	Consulte a seção Preços.

Imagem

Visualizar

Este produto ou recurso é uma oferta de pré-lançamento de IA generativa, sujeita aos "Termos de ofertas pré-GA" dos Termos específicos de serviço do Google Cloud, bem como aos Termos adicionais para produtos em pré-lançamento de IA generativa. Para esta oferta de prévia da IA generativa, os clientes podem optar por usá-la para fins de produção ou comerciais, ou divulgar a saída gerada a terceiros, e podem processar dados pessoais conforme descrito no Adendo sobre tratamento de dados do Cloud, sujeito às obrigações e restrições descritas no contrato que rege seu acesso ao Google Cloud. Os produtos pré-GA estão disponíveis "no estado em que se encontram" e podem ter suporte limitado. Para mais informações, consulte as descrições da fase de lançamento.

Testar na Vertex AI (prévia) Implantar app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto do Google Cloud com o faturamento e a API Vertex AI ativados.

Especificações técnicas
ID do modelo	`gemini-2.5-flash-image-preview`
Entradas e saídas compatíveis	Entradas: Texto, Imagens Saídas: Texto e imagem
Limites de tokens	Máximo de tokens de entrada: 32.768 Máximo de tokens de saída: 32.768
Recursos	Com suporte Instruções do sistema Contar tokens Sem suporte Embasamento com a Pesquisa Google Execução de código Ajuste Chamadas de função API Live Recurso de prévia Pensar Cache de contexto Vertex AI RAG Engine Conclusões de chat
Tipos de uso	Com suporte Capacidade de processamento provisionada Cota compartilhada dinâmica Sem suporte Cota fixa Previsão em lote
Limite de tamanho da entrada	500 MB
	Imagens	Máximo de imagens por comando: 3 Tamanho máximo da imagem: 7 MB Número máximo de imagens de saída por comando: 10 Tipos MIME compatíveis: `image/png`, `image/jpeg`, `image/webp`
	Documentos	Número máximo de arquivos por comando: 3 Número máximo de páginas por arquivo: 3 Tamanho máximo por arquivo: 50 MB Tipos MIME compatíveis: `application/pdf`, `text/plain`
	Padrões de parâmetros	Temperatura: 0,0 a 2,0 (padrão 1,0) topP: 0,0-1,0 (padrão 0,95) topK: 64 (corrigido) candidateCount: 1 a 8 (padrão: 1)
Regiões compatíveis
	Disponibilidade do modelo (Inclui cota compartilhada dinâmica e capacidade de transmissão provisionada)	Global global
	Consulte Residência de dados para mais informações.
Data de limite de conhecimento	Junho de 2025
Versões	`gemini-2.5-flash-image-preview` Estágio de lançamento: acesso antecipado Data de lançamento: 26 de agosto de 2025
Controles de segurança
Controles de segurança	Consulte Controles de segurança para mais informações.
Idiomas compatíveis	Consulte Idiomas aceitos.
Preços	Consulte a seção Preços.

Áudio nativo da API Live

Gemini 2.5 Flash com recursos de áudio nativo da API Live nossa funcionalidade de áudio nativo de ponta para API Live. Além dos recursos padrão da API Live, este modelo de prévia inclui:

Qualidade de áudio aprimorada:tenha uma qualidade de áudio muito melhor, como se estivesse falando com uma pessoa.
Qualidade e adaptabilidade de voz aprimoradas:o áudio nativo da API Live oferece interações de voz mais ricas e naturais com 30 vozes em HD em 24 idiomas.
Apresentamos o áudio proativo:quando o áudio proativo está ativado, o modelo só responde quando é relevante. O modelo gera transcrições de texto e respostas de áudio de forma proativa apenas para consultas direcionadas ao dispositivo e não responde a consultas não direcionadas ao dispositivo.
Apresentamos o diálogo afetivo:os modelos que usam o áudio nativo da API Live conseguem entender e responder adequadamente às expressões emocionais dos usuários para conversas mais sutis.
Melhoria da interrupção:interrompa o Gemini de forma mais natural e confiável, mesmo em ambientes barulhentos.
Chamada de função robusta:melhoramos a taxa de acionamento, permitindo que o Gemini execute com sucesso as funções definidas para oferecer suporte aos seus casos de uso.
Transcrição precisa:a precisão da transcrição de áudio em texto foi significativamente aprimorada.
Suporte multilíngue integrado:fale com o Gemini em vários idiomas, e ele vai alternar entre eles sem nenhuma pré-configuração. O idioma não é mais uma barreira.

Para mais informações sobre a API Live, consulte:

Nossa documentação independente da API Live.
Nossos formatos de áudio compatíveis com a API Live.
Nossos limites de sessões simultâneas da API Live.

Teste na Vertex AI

Especificações técnicas
ID do modelo	`gemini-live-2.5-flash-preview-native-audio-09-2025`
Entradas e saídas compatíveis	Entradas: Texto, Áudio, Vídeo Saídas: Texto, Áudio
Limites de tokens	Máximo de tokens de entrada: 128 mil Máximo de tokens de saída: 64 mil Janela de contexto: 32 mil (padrão), com upgrade para 128 mil
Recursos	Com suporte Embasamento com a Pesquisa Google Instruções do sistema Chamadas de função API Live Recurso de prévia Sem suporte Execução de código Ajuste Saída estruturada Pensar Cache de contexto Vertex AI RAG Engine Conclusões de chat
Tipos de uso	Com suporte Até 1.000 sessões simultâneas Sem suporte Capacidade de processamento provisionada Cota compartilhada dinâmica Previsão em lote
	Vídeo	Resolução padrão: 768 x 768 Tipos MIME aceitos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Áudio	Duração máxima da conversa: Padrão de 10 minutos, que pode ser estendido. Formato de entrada de áudio obrigatório: Áudio PCM bruto de 16 bits a 16 kHz, little endian Formato de saída de áudio obrigatório: Áudio PCM bruto de 16 bits a 24 kHz, little endian Tipos MIME aceitos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Padrões de parâmetros	Sensibilidade ao início da fala: baixa Sensibilidade ao fim da fala: alta Preenchimento de prefixo: 0 Tamanho máximo do contexto: 128 mil
Regiões compatíveis
	Disponibilidade do modelo	Estados Unidos us-central1
	Consulte Residência de dados para mais informações.
Data de limite de conhecimento	Janeiro de 2025
Versões	`gemini-live-2.5-flash-preview-native-audio-09-17` Estágio de lançamento: acesso antecipado Data de lançamento: 18 de setembro de 2025 `gemini-live-2.5-flash-preview-native-audio` Estágio de lançamento: acesso antecipado Data de lançamento: 17 de junho de 2025 Data de descontinuação: 18 de outubro de 2025
Controles de segurança
Controles de segurança	Consulte Controles de segurança para mais informações.
Idiomas compatíveis	Consulte Idiomas aceitos.
Preços	Consulte a seção Preços.

Gemini 2.5 Flash Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

2.5 Flash

2.5 Flash

Imagem

Áudio nativo da API Live

Gemini 2.5 Flash