Gemini 2.5 Flash

Gemini 2.5 Flash est notre meilleur modèle en termes de prix et de performances. Il offre des capacités complètes. Gemini 2.5 Flash est notre premier modèle Flash doté de capacités de réflexion. Il vous permet de voir le processus de réflexion du modèle lorsqu'il génère sa réponse.

Pour obtenir des informations techniques encore plus détaillées sur Gemini 2.5 Flash (comme les benchmarks de performances, des informations sur nos ensembles de données d'entraînement, nos efforts en matière de durabilité, l'utilisation prévue et les limites, ainsi que notre approche de l'éthique et de la sécurité), consultez notre rapport technique sur nos modèles Gemini 2.5 et la fiche du modèle Gemini 2.5 Flash.

2.5 Flash

Essayer dans Vertex AI Afficher dans Model Garden (Preview) Déployer un exemple d'application

Remarque : Pour utiliser la fonctionnalité "Déployer un exemple d'application", vous devez disposer d'un projet Google Cloud avec la facturation et l'API Vertex AI activées.
ID du modèle gemini-2.5-flash
Entrées et sorties acceptées
  • Entrées :
    texte, code, images, audio, vidéo
  • Sorties :
    texte
Limites de jetons
  • Nombre maximal de jetons d'entrée : 1 048 576
  • Nombre maximal de jetons de sortie : 65 535 (par défaut)
Capacités
Types d'utilisation
Taille limite des entrées 500 Mo
Spécifications techniques
Images
  • Nombre maximal d'images par requête : 3 000
  • Taille d'image maximale : 7 Mo
  • Types MIME compatibles :
    image/png, image/jpeg, image/webp
Documents
  • Nombre maximal de fichiers par requête : 3 000
  • Nombre maximal de pages par fichier : 1 000
  • Taille maximale par fichier pour les importations avec l'API ou Cloud Storage : 50 Mo
  • Taille maximale par fichier pour les importations directes à l'aide de la console : 7 Mo
  • Types MIME compatibles :
    application/pdf, text/plain
Vidéo
  • Durée maximale d'une vidéo (avec audio) : environ 45 minutes
  • Durée maximale d'une vidéo (sans audio) : environ une heure
  • Nombre maximal de vidéos par requête : 10
  • Types MIME compatibles :
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durée audio maximale par requête : environ 8,4 heures ou jusqu'à un million de jetons
  • Nombre maximal de fichiers audio par requête : 1
  • Compréhension de la parole pour : résumé audio, transcription et traduction
  • Types MIME compatibles :
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Paramètres par défaut
  • Température : 0,0 à 2,0 (par défaut 1,0)
  • topP : 0,0-1,0 (valeur par défaut : 0,95)
  • Top-K : 64 (fixe)
  • candidateCount : 1 à 8 (par défaut : 1)
Régions où le service est disponible

Disponibilité du modèle

(y compris le quota partagé dynamique et le débit provisionné)

  • Monde
    • global
  • États-Unis
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europe
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

Traitement ML

  • États-Unis
    • Multirégional
  • Europe
    • Multirégional
Pour en savoir plus, consultez Résidence des données.
Date limite des connaissances Janvier 2025
Versions
  • gemini-2.5-flash
    • Étape de lancement : disponibilité générale
    • Date de disponibilité : 17 juin 2025
    • Date d'arrêt : 17 juin 2026
  • gemini-live-2.5-flash
    • Étape de lancement : disponibilité générale privée
    • Date de disponibilité : 17 juin 2025
  • gemini-2.5-flash-preview-05-20
    • Étape de lancement : version Preview publique
    • Date de disponibilité : 20 mai 2025
    • Date d'arrêt : 15 juillet 2025
  • gemini-2.5-flash-preview-04-17
    • Étape de lancement : version Preview publique
    • Date de disponibilité : 17 avril 2025
    • Date d'arrêt : 15 juillet 2025
Contrôles de sécurité
Pour en savoir plus, consultez Contrôles de sécurité.
Tarification Voir les tarifs

Audio natif de l'API Live

Gemini 2.5 Flash avec les fonctionnalités audio natives de l'API Live notre fonctionnalité audio native de pointe pour l'API Live. En plus des fonctionnalités standards de l'API Live, ce modèle Preview inclut :

  • Qualité et adaptabilité vocales améliorées : l'audio natif de l'API Live offre des interactions vocales plus riches et plus naturelles avec 30 voix HD dans 24 langues.
  • Présentation de l'audio proactif : lorsque l'audio proactif est activé, le modèle ne répond que lorsque cela est pertinent. Le modèle génère des transcriptions textuelles et des réponses audio de manière proactive uniquement pour les requêtes adressées à l'appareil. Il ne répond pas aux requêtes non adressées à l'appareil.
  • Découvrez le dialogue affectif : les modèles utilisant l'audio natif de l'API Live peuvent comprendre les expressions émotionnelles des utilisateurs et y répondre de manière appropriée pour des conversations plus nuancées.

Pour en savoir plus sur l'API Live, consultez notre documentation autonome sur l'API Live.

Essayer dans Vertex AI

ID du modèle gemini-live-2.5-flash-preview-native-audio
Entrées et sorties acceptées
  • Entrées :
    audio, vidéo
  • Sorties :
    audio
Limites de jetons
  • Nombre maximal de jetons d'entrée : 1 048 576
  • Nombre maximal de jetons de sortie : 128 000 (par défaut)
Capacités
Types d'utilisation
Taille limite des entrées 500 Mo
Spécifications techniques
Vidéo
  • Durée maximale du partage d'écran : environ 10 minutes
  • Types MIME compatibles :
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durée maximale d'une conversation : environ 10 minutes
  • Compréhension de la parole pour : résumé audio, transcription et traduction
  • Types MIME compatibles :
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Paramètres par défaut
  • Température : 0,0 à 2,0 (par défaut 1,0)
  • topP : 0,0-1,0 (valeur par défaut : 0,95)
  • Top-K : 64 (fixe)
  • candidateCount : 1 à 8 (par défaut : 1)
Régions où le service est disponible

Disponibilité du modèle

  • États-Unis
    • us-central1
Pour en savoir plus, consultez Résidence des données.
Date limite des connaissances Janvier 2025
Versions
  • gemini-live-2.5-flash-preview-native-audio
    • Étape de lancement : version Preview publique
    • Date de disponibilité : 17 juin 2025
Contrôles de sécurité
Pour en savoir plus, consultez Contrôles de sécurité.
Tarification Voir les tarifs