Gemini 2.5 Flash

Gemini 2.5 Flash ist unser bestes Modell in Bezug auf Preis und Leistung und bietet umfassende Funktionen. Gemini 2.5 Flash ist unser erstes Flash-Modell mit Denkfunktionen. Damit können Sie den Denkprozess sehen, den das Modell bei der Generierung seiner Antwort durchläuft.

Noch detailliertere technische Informationen zu Gemini 2.5 Flash, z. B. Leistungsbenchmarks, Informationen zu unseren Trainingsdatensätzen, Bemühungen um Nachhaltigkeit, beabsichtigte Nutzung und Einschränkungen sowie unser Ansatz in Bezug auf Ethik und Sicherheit, finden Sie in unserem technischen Bericht zu unseren Gemini 2.5-Modellen und auf der Modellkarte für Gemini 2.5 Flash.

2.5 Flash

In Vertex AI testen Im Model Garden ansehen (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.
Modell-ID gemini-2.5-flash
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder, Audio, Video
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 1.048.576
  • Maximale Ausgabetokens: 65.535 (Standard)
Leistungsspektrum
Nutzungstypen
Maximale Eingabegröße 500 MB
Technische Spezifikationen
Bilder
  • Maximale Anzahl von Bildern pro Prompt: 3.000
  • Maximale Bildgröße: 7 MB
  • Unterstützte MIME-Typen:
    image/png, image/jpeg, image/webp
Dokumente
  • Maximale Anzahl von Dateien pro Prompt: 3.000
  • Maximale Anzahl von Seiten pro Datei: 1.000
  • Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB
  • Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB
  • Unterstützte MIME-Typen:
    application/pdf, text/plain
Video
  • Maximale Videolänge (mit Audio): ca. 45 Minuten
  • Maximale Videolänge (ohne Audio): ca. 1 Stunde
  • Maximale Anzahl von Videos pro Prompt: 10
  • Unterstützte MIME-Typen:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens
  • Maximale Anzahl von Audiodateien pro Prompt: 1
  • Sprachverständnis für: Audiozusammenfassung, Transkription und Übersetzung
  • Unterstützte MIME-Typen:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Parameterstandardwerte
  • Temperatur: 0,0–2,0 (Standardwert: 1,0)
  • topP: 0,0–1,0 (Standard 0,95)
  • topK: 64 (fest)
  • candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich dynamisch gemeinsam genutztem Kontingent und bereitgestelltem Durchsatz)

  • Global
    • global
  • USA
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

ML-Verarbeitung

  • USA
    • Mehrere Regionen
  • Europa
    • Mehrere Regionen
Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag Januar 2025
Versionen
  • gemini-2.5-flash
    • Markteinführungsphase: GA
    • Veröffentlichungsdatum: 17. Juni 2025
    • Einstellungsdatum: 17. Juni 2026
  • gemini-live-2.5-flash
    • Markteinführungsphase: Private GA
    • Veröffentlichungsdatum: 17. Juni 2025
  • gemini-2.5-flash-preview-05-20
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 20. Mai 2025
    • Einstellungsdatum: 15. Juli 2025
  • gemini-2.5-flash-preview-04-17
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 17. April 2025
    • Einstellungsdatum: 15. Juli 2025
Sicherheitskontrollen
Weitere Informationen finden Sie unter Sicherheitskontrollen.
Preise Weitere Informationen finden Sie unter Preise.

Native Audio in der Live API

Gemini 2.5 Flash mit nativen Audiofunktionen der Live API – unsere hochmodernen nativen Audiofunktionen für die Live API. Zusätzlich zu den Standardfunktionen der Live API bietet dieses Vorschau-Modell:

  • Verbesserte Sprachqualität und Anpassungsfähigkeit:Die Live API bietet mit 30 HD-Stimmen in 24 Sprachen natürlichere Sprachinteraktionen.
  • Proaktive Audioausgabe:Wenn die proaktive Audioausgabe aktiviert ist, antwortet das Modell nur, wenn es relevant ist. Das Modell generiert proaktiv Texttranskripte und Audioantworten nur für Anfragen, die an das Gerät gerichtet sind. Es reagiert nicht auf Anfragen, die nicht an das Gerät gerichtet sind.
  • Affektiver Dialog:Modelle, die die native Audio-Funktion der Live API verwenden, können die emotionalen Äußerungen von Nutzern verstehen und angemessen darauf reagieren, um nuanciertere Unterhaltungen zu ermöglichen.

Weitere Informationen zur Live API finden Sie in der eigenständigen Dokumentation zur Live API.

In Vertex AI ausprobieren

Modell-ID gemini-live-2.5-flash-preview-native-audio
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Audio, Video
  • Ausgaben:
    Audio
Token limits
  • Maximale Eingabetokens: 1.048.576
  • Maximale Ausgabetokens: 128.000 (Standard)
Leistungsspektrum
Nutzungstypen
Maximale Eingabegröße 500 MB
Technische Spezifikationen
Video
  • Maximale Länge der Bildschirmfreigabe: Ca. 10 Minuten
  • Unterstützte MIME-Typen:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Maximale Gesprächslänge: ca. 10 Minuten
  • Sprachverständnis für: Audiozusammenfassung, Transkription und Übersetzung
  • Unterstützte MIME-Typen:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Parameterstandardwerte
  • Temperatur: 0,0–2,0 (Standardwert: 1,0)
  • topP: 0,0–1,0 (Standard 0,95)
  • topK: 64 (fest)
  • candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen

Modellverfügbarkeit

  • USA
    • us-central1
Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag Januar 2025
Versionen
  • gemini-live-2.5-flash-preview-native-audio
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 17. Juni 2025
Sicherheitskontrollen
Weitere Informationen finden Sie unter Sicherheitskontrollen.
Preise Weitere Informationen finden Sie unter Preise.