Gemini 2.5 Flash

O Gemini 2.5 Flash é nosso melhor modelo em termos de preço e desempenho e oferece recursos abrangentes. O Gemini 2.5 Flash é nosso primeiro modelo Flash com capacidade de raciocínio, que permite ver o processo de pensamento do modelo ao gerar uma resposta.

Para informações técnicas ainda mais detalhadas sobre o Gemini 2.5 Flash (como comparativos de performance, informações sobre nossos conjuntos de dados de treinamento, esforços de sustentabilidade, uso e limitações pretendidos e nossa abordagem de ética e segurança), consulte nosso relatório técnico sobre os modelos do Gemini 2.5 e a ficha do modelo do Gemini 2.5 Flash.

2.5 Flash

Testar na Vertex AI Ver no Model Garden (prévia) Implantar app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto do Google Cloud com o faturamento e a API Vertex AI ativados.
ID do modelo gemini-2.5-flash
Entradas e saídas compatíveis
  • Entradas:
    Texto, Código, Imagens, Áudio, Vídeo
  • Saídas:
    Texto
Limites de tokens
  • Máximo de tokens de entrada: 1.048.576
  • Máximo de tokens de saída: 65.535 (padrão)
Recursos
Tipos de uso
Limite de tamanho da entrada 500 MB
Especificações técnicas
Imagens
  • Máximo de imagens por comando: 3.000
  • Tamanho máximo da imagem: 7 MB
  • Tipos MIME compatíveis:
    image/png, image/jpeg, image/webp
Documentos
  • Número máximo de arquivos por comando: 3.000
  • Número máximo de páginas por arquivo: 1.000
  • Tamanho máximo de arquivo para importações da API ou do Cloud Storage: 50 MB
  • Tamanho máximo por arquivo para uploads diretos pelo console: 7 MB
  • Tipos MIME compatíveis:
    application/pdf, text/plain
Vídeo
  • Duração máxima do vídeo (com áudio): Aproximadamente 45 minutos
  • Duração máxima do vídeo (sem áudio): aproximadamente 1 hora
  • Número máximo de vídeos por comando: 10
  • Tipos MIME aceitos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima do áudio por solicitação: Aproximadamente 8, 4 horas ou até 1 milhão de tokens
  • Número máximo de arquivos de áudio por comando: 1
  • Entendimento de fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME aceitos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Padrões de parâmetros
  • Temperatura: 0,0 a 2,0 (padrão 1,0)
  • topP: 0,0-1,0 (padrão 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (padrão: 1)
Regiões compatíveis

Disponibilidade do modelo

(Inclui cota compartilhada dinâmica e capacidade de transmissão provisionada)

  • Global
    • global
  • Estados Unidos
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

Processamento de ML

  • Estados Unidos
    • Multirregional
  • Europa
    • Multirregional
Consulte Residência de dados para mais informações.
Data de limite de conhecimento Janeiro de 2025
Versões
  • gemini-2.5-flash
    • Etapa de lançamento: disponibilidade geral
    • Data de lançamento: 17 de junho de 2025
    • Data de descontinuação: 17 de junho de 2026
  • gemini-live-2.5-flash
    • Etapa do lançamento: disponibilidade geral particular
    • Data de lançamento: 17 de junho de 2025
  • gemini-2.5-flash-preview-05-20
    • Estágio de lançamento: acesso antecipado
    • Data de lançamento: 20 de maio de 2025
    • Data de descontinuação: 15 de julho de 2025
  • gemini-2.5-flash-preview-04-17
    • Estágio de lançamento: acesso antecipado
    • Data de lançamento: 17 de abril de 2025
    • Data de descontinuação: 15 de julho de 2025
Controles de segurança
Consulte Controles de segurança para mais informações.
Preços Consulte a seção Preços.

Áudio nativo da API Live

Gemini 2.5 Flash com recursos de áudio nativo da API Live nossa funcionalidade de áudio nativo de ponta para API Live. Além dos recursos padrão da API Live, este modelo de prévia inclui:

  • Qualidade e adaptabilidade de voz aprimoradas:o áudio nativo da API Live oferece interações de voz mais ricas e naturais com 30 vozes em HD em 24 idiomas.
  • Apresentamos o áudio proativo:quando o áudio proativo está ativado, o modelo só responde quando é relevante. O modelo gera transcrições de texto e respostas de áudio de forma proativa apenas para consultas direcionadas ao dispositivo e não responde a consultas não direcionadas ao dispositivo.
  • Apresentamos o diálogo afetivo:os modelos que usam o áudio nativo da API Live conseguem entender e responder de maneira adequada às expressões emocionais dos usuários para conversas mais sutis.

Para mais informações sobre a API Live, consulte a documentação independente da API Live.

Teste na Vertex AI

ID do modelo gemini-live-2.5-flash-preview-native-audio
Entradas e saídas compatíveis
  • Entradas:
    Áudio, Vídeo
  • Saídas:
    Áudio
Limites de tokens
  • Máximo de tokens de entrada: 1.048.576
  • Máximo de tokens de saída: 128 mil (padrão)
Recursos
Tipos de uso
Limite de tamanho da entrada 500 MB
Especificações técnicas
Vídeo
  • Duração máxima do compartilhamento de tela: Aproximadamente 10 minutos
  • Tipos MIME aceitos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Áudio
  • Duração máxima da conversa: Aproximadamente 10 minutos
  • Entendimento de fala para: Resumo, transcrição e tradução de áudio
  • Tipos MIME aceitos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Padrões de parâmetros
  • Temperatura: 0,0 a 2,0 (padrão 1,0)
  • topP: 0,0-1,0 (padrão 0,95)
  • topK: 64 (fixo)
  • candidateCount: 1 a 8 (padrão: 1)
Regiões compatíveis

Disponibilidade do modelo

  • Estados Unidos
    • us-central1
Consulte Residência de dados para mais informações.
Data de limite de conhecimento Janeiro de 2025
Versões
  • gemini-live-2.5-flash-preview-native-audio
    • Estágio de lançamento: acesso antecipado
    • Data de lançamento: 17 de junho de 2025
Controles de segurança
Consulte Controles de segurança para mais informações.
Preços Consulte a seção Preços.