Gemini 2.5 Flash

Gemini 2.5 Flash es nuestro mejor modelo en términos de precio y rendimiento, y ofrece capacidades integrales. Gemini 2.5 Flash es nuestro primer modelo Flash que incluye capacidades de razonamiento, lo que te permite ver el proceso de razonamiento que sigue el modelo cuando genera su respuesta.

Para obtener información técnica aún más detallada sobre Gemini 2.5 Flash (como comparativas de rendimiento, información sobre nuestros conjuntos de datos de entrenamiento, esfuerzos en materia de sustentabilidad, uso previsto y limitaciones, y nuestro enfoque en la ética y la seguridad), consulta nuestro informe técnico sobre nuestros modelos de Gemini 2.5 y la tarjeta del modelo de Gemini 2.5 Flash.

2.5 Flash

Probar en Vertex AI Ver en Model Garden (Vista previa) Implementar app de ejemplo

Nota: Para usar la función "Implementar app de ejemplo", necesitas un proyecto de Google Cloud con facturación y la API de Vertex AI habilitadas.
ID de modelo gemini-2.5-flash
Entradas y salidas compatibles
  • Entradas:
    Texto, Código, Imágenes, Audio, Video
  • Salidas:
    Texto
Límites de tokens
  • Cantidad máxima de tokens de entrada: 1,048,576
  • Cantidad máxima de tokens de salida: 65,535 (valor predeterminado)
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Imágenes
  • Cantidad máxima de imágenes por instrucción: 3,000
  • Tamaño máximo de la imagen: 7 MB
  • Tipos de MIME admitidos:
    image/png, image/jpeg, image/webp
Documentos
  • Cantidad máxima de archivos por instrucción: 3,000
  • Cantidad máxima de páginas por archivo: 1,000
  • Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB
  • Tamaño máximo de archivo para las cargas directas a través de la consola: 7 MB
  • Tipos de MIME admitidos:
    application/pdf, text/plain
Video
  • Duración máxima del video (con audio): Aproximadamente 45 minutos
  • Duración máxima del video (sin audio): Aproximadamente 1 hora
  • Cantidad máxima de videos por instrucción: 10
  • Tipos de MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima de audio por instrucción: Aproximadamente 8.4 horas o hasta 1 millón de tokens
  • Cantidad máxima de archivos de audio por instrucción: 1
  • Comprensión del habla para: Resumen, transcripción y traducción de audio
  • Tipos de MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0.0 a 2.0 (predeterminado 1.0)
  • topP: 0.0 a 1.0 (predeterminado 0.95)
  • topK: 64 (fijo)
  • candidateCount: 1 a 8 (el valor predeterminado es 1)
Regiones admitidas

Disponibilidad del modelo

(Incluye la cuota compartida dinámica y la capacidad de procesamiento aprovisionada)

  • Global
    • global
  • Estados Unidos
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

Procesamiento de AA

  • Estados Unidos
    • Multirregión
  • Europa
    • Multirregión
Consulta Residencia de datos para obtener más información.
Fecha límite de conocimiento Enero de 2025
Versiones
  • gemini-2.5-flash
    • Etapa de lanzamiento: DG
    • Fecha de lanzamiento: 17 de junio de 2025
    • Fecha de descontinuación: 17 de junio de 2026
  • gemini-live-2.5-flash
    • Etapa de lanzamiento: DG privada
    • Fecha de lanzamiento: 17 de junio de 2025
  • gemini-2.5-flash-preview-05-20
    • Etapa de lanzamiento: Versión preliminar pública
    • Fecha de lanzamiento: 20 de mayo de 2025
    • Fecha de descontinuación: 15 de julio de 2025
  • gemini-2.5-flash-preview-04-17
    • Etapa de lanzamiento: Versión preliminar pública
    • Fecha de lanzamiento: 17 de abril de 2025
    • Fecha de descontinuación: 15 de julio de 2025
Controles de seguridad
Consulta Controles de seguridad para obtener más información.
Precios Consulta la sección de precios.

Audio nativo de la API en vivo

Gemini 2.5 Flash con funciones de audio nativo de la API de Live Nuestra funcionalidad de audio nativo de vanguardia para la API de Live. Además de las funciones estándar de la API de Live, este modelo de vista previa incluye lo siguiente:

  • Calidad y adaptabilidad de voz mejoradas: El audio nativo de la API de Live proporciona interacciones de voz más naturales y enriquecidas con 30 voces en HD en 24 idiomas.
  • Presentamos el Audio Proactivo: Cuando el Audio Proactivo está habilitado, el modelo solo responde cuando es pertinente. El modelo genera transcripciones de texto y respuestas de audio de forma proactiva solo para las preguntas dirigidas al dispositivo, y no responde a las preguntas que no se dirigen al dispositivo.
  • Presentamos el diálogo afectivo: Los modelos que usan la API de Live Audio nativa pueden comprender y responder de manera adecuada a las expresiones emocionales de los usuarios para tener conversaciones más matizadas.

Para obtener más información sobre la API de Live, consulta nuestra documentación independiente de la API de Live.

Probar en Vertex AI

ID de modelo gemini-live-2.5-flash-preview-native-audio
Entradas y salidas compatibles
  • Entradas:
    Audio, Video
  • Salidas:
    Audio
Límites de tokens
  • Cantidad máxima de tokens de entrada: 1,048,576
  • Cantidad máxima de tokens de salida: 128 K (valor predeterminado)
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Video
  • Duración máxima de la pantalla compartida: Aproximadamente 10 minutos
  • Tipos de MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima de la conversación: Aproximadamente 10 minutos
  • Comprensión del habla para: Resumen, transcripción y traducción de audio
  • Tipos de MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0.0 a 2.0 (predeterminado 1.0)
  • topP: 0.0 a 1.0 (predeterminado 0.95)
  • topK: 64 (fijo)
  • candidateCount: 1 a 8 (el valor predeterminado es 1)
Regiones admitidas

Disponibilidad del modelo

  • Estados Unidos
    • us-central1
Consulta Residencia de datos para obtener más información.
Fecha límite de conocimiento Enero de 2025
Versiones
  • gemini-live-2.5-flash-preview-native-audio
    • Etapa de lanzamiento: Versión preliminar pública
    • Fecha de lanzamiento: 17 de junio de 2025
Controles de seguridad
Consulta Controles de seguridad para obtener más información.
Precios Consulta la sección de precios.