Gemini 2.5 Flash

2.5 Flash

Gemini 2.5 Flash è il nostro modello migliore in termini di prezzo e prestazioni e offre funzionalità complete. Gemini 2.5 Flash è il nostro primo modello Flash dotato di funzionalità di pensiero, che ti consente di vedere il processo di pensiero che il modello segue quando genera la sua risposta.

Prova in Vertex AI Visualizza la scheda del modello in Model Garden (Anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con la fatturazione e l'API Vertex AI abilitate.
ID modello gemini-2.5-flash
Ingressi e uscite supportati
  • Input:
    Testo, Codice, Immagini, Audio, Video
  • Output:
    Testo
Limiti di token
  • Token di input massimi: 1.048.576
  • Numero massimo di token di output: 65.535 (valore predefinito)
Funzionalità
Tipi di utilizzo
Limite di dimensione dell'input 500 MB
Specifiche tecniche
Immagini
  • Numero massimo di immagini per prompt: 3000
  • Dimensioni massime dell'immagine: 7 MB
  • Tipi MIME supportati:
    image/png, image/jpeg, image/webp
Documenti
  • Numero massimo di file per prompt: 3000
  • Numero massimo di pagine per file: 1000
  • Dimensioni massime per file per le importazioni API o Cloud Storage: 50 MB
  • Dimensioni massime per file per i caricamenti diretti tramite la console: 7 MB
  • Tipi MIME supportati:
    application/pdf, text/plain
Video
  • Durata massima del video (con audio): Circa 45 minuti
  • Durata massima del video (senza audio): Circa 1 ora
  • Numero massimo di video per prompt: 10
  • Tipi MIME supportati:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durata audio massima per prompt: Circa 8, 4 ore o fino a 1 milione di token
  • Numero massimo di file audio per prompt: 1
  • Comprensione vocale per: Riepilogo, trascrizione e traduzione dell'audio
  • Tipi MIME supportati:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Valori predefiniti dei parametri
  • Temperatura: 0.0-2.0 (valore predefinito 1.0)
  • topP: 0.0-1.0 (valore predefinito 0.95)
  • topK: 64 (fisso)
  • candidateCount: 1-8 (valore predefinito 1)
Data del knowledge cutoff Gennaio 2025
Versioni
  • gemini-2.5-flash
    • Fase di lancio: disponibilità generale
    • Data di rilascio: 17 giugno 2025
    • Data di ritiro: 17 giugno 2026
  • gemini-live-2.5-flash
    • Fase di lancio: GA privata
    • Data di rilascio: 17 giugno 2025
  • gemini-2.5-flash-preview-05-20
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 20 maggio 2025
    • Data di ritiro: 15 luglio 2025
  • gemini-2.5-flash-preview-04-17
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 17 aprile 2025
    • Data di ritiro: 15 luglio 2025
Aree geografiche supportate

Disponibilità del modello

  • Globale
    • globale
  • Stati Uniti
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

Elaborazione ML

  • Stati Uniti
    • Più regioni
  • Europa
    • Più regioni
Per saperne di più, consulta Residenza dei dati.
Controlli di sicurezza
Per ulteriori informazioni, consulta Controlli di sicurezza.
Prezzi Vedi Prezzi.

Audio nativo dell'API Live

Gemini 2.5 Flash con funzionalità audio native dell'API Live la nostra funzionalità audio nativa all'avanguardia per l'API Live. Oltre alle funzionalità standard dell'API Live, questo modello di anteprima include:

  • Qualità e adattabilità della voce migliorate: l'audio nativo dell'API Live offre interazioni vocali più ricche e naturali con 30 voci HD in 24 lingue.
  • Ti presentiamo l'audio proattivo: quando l'audio proattivo è attivo, il modello risponde solo quando è pertinente. Il modello genera trascrizioni di testo e risposte audio in modo proattivo solo per le query indirizzate al dispositivo e non risponde alle query non indirizzate al dispositivo.
  • Ti presentiamo il dialogo affettivo: i modelli che utilizzano l'audio nativo dell'API Live possono comprendere e rispondere in modo appropriato alle espressioni emotive degli utenti per conversazioni più sfumate.

Per saperne di più sull'API Live, consulta la documentazione dell'API Live autonoma.

Prova in Vertex AI

ID modello gemini-live-2.5-flash-preview-native-audio
Ingressi e uscite supportati
  • Input:
    Audio, Video
  • Output:
    Testo, Audio
Limiti di token
  • Token di input massimi: 1.048.576
  • Numero massimo di token di output: 128.000 (valore predefinito)
Funzionalità
Tipi di utilizzo
Limite di dimensione dell'input 500 MB
Specifiche tecniche
Video
  • Durata massima della condivisione dello schermo: Circa 10 minuti
  • Tipi MIME supportati:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durata massima della conversazione: Circa 10 minuti
  • Comprensione vocale per: Riepilogo, trascrizione e traduzione dell'audio
  • Tipi MIME supportati:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Valori predefiniti dei parametri
  • Temperatura: 0.0-2.0 (valore predefinito 1.0)
  • topP: 0.0-1.0 (valore predefinito 0.95)
  • topK: 64 (fisso)
  • candidateCount: 1-8 (valore predefinito 1)
Data del knowledge cutoff Gennaio 2025
Versioni
  • gemini-live-2.5-flash-preview-native-audio
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 17 giugno 2025
Aree geografiche supportate

Disponibilità del modello

  • Stati Uniti
    • us-central1
Per saperne di più, consulta Residenza dei dati.
Controlli di sicurezza
Per ulteriori informazioni, consulta Controlli di sicurezza.
Prezzi Vedi Prezzi.