Gemini 2.5 Flash

2.5 Flash

O Gemini 2.5 Flash é nosso melhor modelo em termos de preço e desempenho, e oferece recursos completos. O Gemini 2.5 Flash é o primeiro modelo Flash que tem capacidades de pensamento, o que permite que você veja o processo de pensamento pelo qual o modelo passa ao gerar a resposta.

Testar na Vertex AI Conferir o card do modelo no Model Garden (Pré-lançamento) Implantar o app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto do Google Cloud com o faturamento e a API Vertex AI ativados.
ID do modelo gemini-2.5-flash-preview-05-20
Entradas e saídas compatíveis
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo
  • Saídas:
    Texto
Limites de tokens
  • Máximo de tokens de entrada: 1.048.576
  • Máximo de tokens de saída: 65.535
Recursos
Tipos de uso
Especificações técnicas
Imagens
  • Máximo de imagens por comando: 3.000
  • Tamanho máximo da imagem: 7 MB
  • Tipos MIME aceitos:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de arquivos por comando: 3.000
  • Número máximo de páginas por arquivo: 1.000
  • Tamanho máximo por arquivo para importações da API ou do Cloud Storage: 50 MB
  • Tamanho máximo por arquivo para uploads diretos pelo console: 7 MB
  • Tipos MIME aceitos:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Tipos MIME aceitos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por comando de voz: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de arquivos de áudio por comando: 1
  • Compreensão de fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME aceitos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Padrões de parâmetro
  • Temperatura: 0 a 2
  • topP: 0,95
  • topK: 64 (fixado)
  • candidateCount: 1 a 8
Data limite de conhecimento Janeiro de 2025
Versões
  • gemini-2.5-flash-preview-05-20
    • Estágio de lançamento: visualização pública
    • Data de lançamento: 20 de maio de 2025
  • gemini-2.5-flash-preview-04-17
    • Estágio de lançamento: visualização pública
    • Data de lançamento: 17 de abril de 2025
Regiões compatíveis

Disponibilidade do modelo

  • Global
    • global
  • Estados Unidos
    • us-central1
Consulte Residência de dados para mais informações.
Controles de segurança
Consulte Controles de segurança para mais informações.
Preços Consulte a seção Preços.

Áudio nativo da API em tempo real

O Gemini 2.5 Flash com áudio nativo da API Live é um modelo de pré-lançamento que apresenta nossa funcionalidade de áudio nativo de última geração para a API Live. Além dos recursos padrão da API Live, esse modelo de pré-lançamento inclui:

  • Melhor qualidade e adaptabilidade da voz:o áudio nativo da API Live oferece interações de voz mais ricas e naturais com 30 vozes em HD e em 24 idiomas.
  • Introdução ao Proactive Audio:quando o Proactive Audio está ativado, o modelo só responde quando é relevante. O modelo gera transcrições de texto e respostas de áudio de forma proativa apenas para consultas direcionadas ao dispositivo e não responde a consultas não direcionadas ao dispositivo.
  • Introdução à caixa de diálogo afetiva:os modelos que usam áudio nativo da API Live podem entender e responder adequadamente às expressões emocionais dos usuários para conversas mais sutis.

Para mais informações sobre a API Live, consulte nossa documentação da API Live independente.

Testar na Vertex AI (Pré-lançamento) Implantar o app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto do Google Cloud com o faturamento e a API Vertex AI ativados.
ID do modelo gemini-2.5-flash-preview-native-audio-dialog
Entradas e saídas compatíveis
  • Entradas:
    Áudio, Vídeo
  • Saídas:
    Texto, Áudio
Limites de tokens
  • Máximo de tokens de entrada: 1.048.576
  • Máximo de tokens de saída: 128 KB
Recursos
Tipos de uso
Especificações técnicas
Vídeo
  • Duração máxima do compartilhamento de tela: aproximadamente 10 minutos
  • Tipos MIME aceitos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima da conversa: aproximadamente 10 minutos
  • Compreensão de fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME aceitos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Padrões de parâmetro
  • Temperatura: 0 a 2
  • topP: 0,95
  • topK: 64 (fixado)
  • candidateCount: 1 a 8
Data limite de conhecimento Janeiro de 2025
Versões
  • gemini-2.5-flash-preview-native-dialog
    • Estágio de lançamento: visualização particular
    • Data de lançamento: 20 de maio de 2025
Regiões compatíveis

Disponibilidade do modelo

  • Estados Unidos
    • us-central1
Consulte Residência de dados para mais informações.
Controles de segurança
Consulte Controles de segurança para mais informações.
Preços Consulte a seção Preços.