Kosten für die Erstellung und Bereitstellung von KI-Modellen in Vertex AI
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Auf dieser Seite sind die Preise für Generative AI in Vertex AI beschrieben. Informationen zu allen anderen Preisen für Vertex AI, einschließlich der ML Platform- und MLOps-Dienste, finden Sie auf der Preisübersicht zu Vertex AI.
Google-Modelle
Gemini 2.5
Modell | Typ | Preis (/1 Mio. Tokens) <= 200.000 Eingabetokens | Preis (/1 Mio. Tokens) > 200.000 Eingabetokens |
---|---|---|---|
Gemini 2.5 Pro | |||
Eingabe (Text, Bild, Video, Audio) | 1,25 $ | 2,50 € | |
Textausgabe (Antwort und Begründung) | 10 $ | 15 $ | |
Gemini 2.5 Flash | |||
Eingabe (Text, Bild, Video) | 0,15 $ | 0,15 $ | |
Audioeingabe | 1 $ | 1 $ | |
Textausgabe (ohne Nachdenken) | 0,60 $ | 0,60 $ | |
Textausgabe (Denkprozesse, Antwort und Begründung) | 3,50 $ | 3,50 $ |
Gemini 2.0
Die Abrechnung für Gemini 2.0 erfolgt auf Basis von Tokens. Wenn Sie die Anzahl der Eingabetokens in Ihrer Anfrage vor dem Senden berechnen möchten, können Sie den SDK-Tokenizer oder die countTokens API verwenden. Wenn Ihre Anfrage mit einem Fehler 400 oder 500 fehlschlägt, werden Ihnen die verwendeten Tokens nicht in Rechnung gestellt.
Mit dem Schieberegler in der Preistabelle können Sie die tokenbasierten Preise mit den verfahrensbasierten Preisen vergleichen.
Tokenbasierte Preise
Modell | Typ | Preis | Preis mit Batch API |
---|---|---|---|
Gemini 2.0 Flash |
|||
1 Mio. Eingabetokens | 0,15 $ | 0,075 $ | |
1 Mio. Eingabeaudio-Tokens | 1,00 $ | 0,50 $ | |
1 Mio. Ausgabetext-Tokens | 0,60 $ | 0,30 $ | |
Optimierung für 1 Mio. Training-Tokens | 3,00 $ | ||
Gemini 2.0 Flash Live API |
|||
1 Mio. Eingabetext-Tokens | 0,50 $ | ||
1 Mio. Audio-Eingabe-Tokens | 3 $ | ||
1 Mio. Eingabe-Video-Tokens | 3 $ | ||
1 Mio. Ausgabetext-Tokens | 2 $ | ||
1 Mio. Ausgabeaudiotokens | 12 $ | ||
Gemini 2.0 Flash Lite |
|||
1 Mio. Eingabetokens | 0,075 $ | 0,0375 $ | |
1 Mio. Eingabeaudio-Tokens | 0,075 $ | 0,0375 $ | |
1 Mio. Ausgabetext-Tokens | 0,30 $ | 0,15 $ | |
Optimierung für 1 Mio. Training-Tokens | 1,00 $ | ||
Fundierung mit der Google Suche |
Gemini 2.0 Flash umfasst bis zu 1.500 Grounded-Anfragen pro Tag ohne Aufpreis. Für Grounded-Anfragen ,die 1.500 pro Tag überschreiten,wird ein Betrag von 35 $pro 1.000 Anfragen berechnet (bis zu 1 Million Anfragen pro Tag). Wenn Sie mehr als 1 Million Anfragen pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team. |
||
Fundierung mit eigenen Daten | 2,50 $ pro 1.000 Anfragen ab dem 16. Juni 2025. | ||
Web Grounding für Unternehmen |
45 $ pro 1.000 Anfragen (bis zu 1 Million Anfragen pro Tag) ab dem 5. Mai 2025. Wenn Sie mehr als 1 Million Anfragen pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team. |
Modalitätsbasierte Preise
Die unten aufgeführten Preise für Modalitäten basieren auf durchschnittlichen Anwendungsfällen und dienen nur der Orientierung. Die tatsächliche Abrechnung erfolgt nur auf der Grundlage von Tokens:
- 4 Zeichen ergeben ungefähr 1 Texttoken einschließlich Leerzeichen.
- Für ein Bild mit 1024 × 1024 Pixeln werden 1.290 Token verbraucht. Die Anzahl der Token pro Bild variiert je nach Bildauflösung. Weitere Informationen zur Berechnung von Tokens finden Sie in unserer Dokumentation.
- Der Videoeingang verbraucht bei einer Abtastrate von einem Frame pro Sekunde 258 Token pro Sekunde. Video mit Audiorechnungen für Video- und Audio-Token.
- Audioeingaben verbrauchen ohne Zeitstempel 25 Token pro Sekunde.
Modell | Typ | Preis | Preis mit Batch API |
---|---|---|---|
Gemini 2.0 Flash |
|||
Text eingeben (€/Mio. Zeichen) | 0,0375 $ | 0,01875 $ | |
Eingabebild ($/Bild) | 0,0001935 $ | 0,00009675 $ | |
Eingabevideo (€/Sek.) | 0,0000387$ | 0,00001935 $ | |
Eingabeaudio (€/Sek.) | 0,000025 $ | 0,0000125 $ | |
Text ausgeben ($/M-Zeichen) | 0,15 $ | 0,075 $ | |
Gemini 2.0 Flash Lite |
|||
Text eingeben (€/Mio. Zeichen) | 0,01875 $ | 0,009375 $ | |
Eingabebild ($/Bild) | 0,00009675 $ | 0,000048375 $ | |
Eingabevideo (€/Sek.) | 0,00001935 $ | 0,000009675 $ | |
Eingabeaudio (€/Sek.) | 0,000001875 $ | 0,000000938 $ | |
Text ausgeben ($/M-Zeichen) | 0,075 $ | 0,0375 $ | |
Fundierung mit der Google Suche |
Gemini 2.0 Flash umfasst bis zu 1.500 Grounded-Anfragen pro Tag ohne Aufpreis. Für Grounded-Anfragen ,die 1.500 pro Tag überschreiten,wird ein Betrag von 35 $pro 1.000 Anfragen berechnet (bis zu 1 Million Anfragen pro Tag). Wenn Sie mehr als 1 Million Anfragen pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team. |
||
Web Grounding für Unternehmen |
45 $ pro 1.000 Anfragen (bis zu 1 Million Anfragen pro Tag) ab dem 5. Mai 2025. Wenn Sie mehr als 1 Million Anfragen pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team. |
* Die Preise sind in US-Dollar (USD) angegeben.
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* PDFs werden als Bildeingaben abgerechnet, wobei eine PDF-Seite einem Bild entspricht.
* Für den Endpunkt des abgestimmten Modells gelten dieselben Preise für Vorhersagen wie für das Basismodell.
* Die Funktion „Grounding with Google Search“ wird nur für Anfragen abgerechnet, die Ergebnisse mit mindestens einer URL für Grounding-Support aus dem Web enthalten. Es gelten auch die üblichen Nutzungsgebühren für das Gemini-Modell.
* Gemini 2.0 Flash Live API: 25 Token pro Audiosekunde (Eingabe/Ausgabe), 258 Token pro Videosekunde (Eingabe). Die Fundierung mit der Google Suche bleibt kostenlos, während die Gemini 2.0 Flash Live API in der Vorabversion ist.
Preise für Vertex AI Model Optimizer (Experimental)*
Der Vertex AI Model Optimizer vereinfacht die Nutzung von Gemini für Unternehmenskunden, indem er einen einzelnen Meta-Endpunkt für Gemini-Modell-Anfragen bereitstellt. Kunden, die diesen Dienst nutzen, müssen nicht angeben, ob Flash, Pro oder eine bestimmte Version verwendet werden soll. Stattdessen geben sie einfach eine konfigurierbare Einstellung (Kosten, Qualität oder ausgewogen) an, um ihre Präferenzen anzugeben. Der Modelloptimierer wendet dann das richtige Maß an Intelligenz für die Aufgabe an, indem er jede Abfrage an das am besten geeignete Modell sendet.
Der Vertex AI Model Optimizer verwendet dynamische Preisgestaltung. Das bedeutet, dass der durchschnittliche Preis pro Token vom Intelligenzniveau des Modells abhängt, das für die Aufgabe verwendet wird. Daher finden Sie unten Preisbeispiele, die mögliche Szenarien basierend auf Ihren Konfigurationseinstellungen veranschaulichen (siehe Tabellen unten). Die SKUs für den Model Optimizer sind 1 $-SKUs, die als Kaufeinheit für Ihre Abrechnung dienen. Nach der Verwendung der Modelle werden Ihnen die Kosten weiterhin auf Basis des Verbrauchs in Rechnung gestellt.
I/O-Verhältnis von 5:1 | Beispiel 1: Chatbot |
HINWEIS: Diese Angaben sind keine Garantien. Die Ergebnisse können je nach Kunde variieren. | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Kundenpräferenz | Kundeneingaben an MO gesendet | Customer Output Tokens an MO gesendet | Durchschnittlicher Input-Preis pro Million Token (hoher Bereich) | Durchschnittlicher Output-Preis pro Million Token (hoher Bereich) | Durchschnittlicher Input-Preis pro Million Token (untere Grenze) | Durchschnittlicher Output-Preis pro Million Token (untere Grenze) | |||||
Kosten | 10.000.000 | 2.000.000 | 0,63 € | 2,50 $ | 0,16 $ | 0,63 € | |||||
Ausgeglichen | 10.000.000 | 2.000.000 | 1,26 $ | 5,00 $ | 0,63 € | 2,50 $ | |||||
Qualität | 10.000.000 | 2.000.000 | 1,89 € | 7,50 $ | 1,26 $ | 5,00 $ |
I/O-Verhältnis: 1:20 | Beispiel 2: Inhaltserstellung | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Kundenpräferenz | Kundeneingaben an MO gesendet | Customer Output Tokens an MO gesendet | Durchschnittlicher Input-Preis pro Million Token (hoher Bereich) | Durchschnittlicher Output-Preis pro Million Token (hoher Bereich) | Durchschnittlicher Input-Preis pro Million Token (untere Grenze) | Durchschnittlicher Output-Preis pro Million Token (untere Grenze) | |||||
Kosten | 1.000.000 | 20.000.000 | 0,63 € | 2,50 $ | 0,16 $ | 0,63 € | |||||
Ausgeglichen | 1.000.000 | 20.000.000 | 1,26 $ | 5,00 $ | 0,63 € | 2,50 $ | |||||
Qualität | 1.000.000 | 20.000.000 | 1,89 € | 7,50 $ | 1,26 $ | 5,00 $ |
Andere Gemini-Modelle
Alle Gemini-Modelle außer Gemini 2.0 werden auf der Grundlage von Modalitäten wie Zeichen, Bildern und Video-/Audiosekunden abgerechnet. Texteingaben werden pro 1.000 Eingabezeichen (Prompt) und pro 1.000 Ausgabezeichen (Antwort) abgerechnet. Alle Zeichen werden durch UTF-8-Codepunkte gezählt. Leerzeichen werden nicht berücksichtigt. Daraus ergibt sich eine Anzahl von etwa 4 Zeichen pro Token. Vorhersageanfragen, die zu gefilterten Antworten führen, werden nur für die Eingabe abgerechnet. Am Ende jedes Abrechnungszeitraums werden Bruchteile von einem Cent (0, 01 $) auf einen Cent aufgerundet. Die Medieneingabe wird pro Bild oder Sekunde (Video) berechnet. Wenn Ihre Anfrage mit einem Fehler 400 oder 500 fehlschlägt, werden Ihnen die verwendeten Tokens nicht berechnet.
Modell | Funktion | Typ | Preis ( =< 128.000 Eingabe-Token) |
Preis (> 128.000 Eingabe-Token) |
||
---|---|---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,00002 $ / Bild 0,00002 $ / Sekunde 0,00001875 $ / 1.000 Zeichen 0,000002 $ / Sekunde |
0,00004 $ / Bild 0,00004 $ / Sekunde 0,0000375 $ / 1.000 Zeichen 0,000004 $ / Sekunde |
||
Textausgabe | 0,000075 $ / 1.000 Zeichen | 0,00015 $ pro 1.000 Zeichen | ||||
Tuning* | Training Token | 8 $ / Mio. Tokens | ||||
Gemini 1.5 Pro, | Multimodal | Bildeingabe Videoeingabe Texteingabe Audioeingabe |
0,00032875 $ / Bild 0,00032875 $ / Sekunde 0,0003125 $ / 1.000 Zeichen 0,00003125 $ / Sekunde |
0,0006575 $ / Bild 0,0006575 $ / Sekunde 0,000625 $ / 1.000 Zeichen 0,0000625 $ / Sekunde |
||
Textausgabe | 0,00125 $ / 1.000 Zeichen | 0,0025 $ pro 1.000 Zeichen | ||||
Tuning* | Training Token | 80 $ pro Mio. Tokens | ||||
Gemini 1.0 Pro | Multimodal | Bildeingabe Videoeingabe Texteingabe |
0,0025 $ / Bild 0,002 $ / Sekunde 0,000125 $ / 1.000 Zeichen |
|||
Textausgabe | 0,000375 $ / 1.000 Zeichen | |||||
Fundierung mit der Google Suche | Text | Fundierte Anfragen | 35 $ pro 1.000 Anfragen (für bis zu 1 Mio. Anfragen pro Tag). Wenden Sie sich an Ihr Account-Management-Team, wenn Sie mehr als eine Million Anfragen pro Tag benötigen. |
|||
Web-Fundierung für Unternehmen | Text | 45 $ pro 1.000 Anfragen (bis zu 1 Million Anfragen pro Tag) ab dem 5. Mai 2025. Wenn Sie mehr als 1 Million Anfragen pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team. |
||||
Fundierung mit eigenen Daten | Text | 2,50 $ pro 1.000 Anfragen ab dem 16. Juni 2025. |
* Die Preise sind in US-Dollar (USD) angegeben.
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* Wenn der Abfragekontext länger als 128.000 Token ist, werden alle Tokens zum Preis für lange Kontexte berechnet.
* Gemini-Modelle sind im Batch-Modus mit 50% Rabatt verfügbar.
* Gemini 1.0 Pro unterstützt nur ein Kontextfenster von bis zu 32.000.
* PDFs werden als Bildeingaben abgerechnet, wobei eine PDF-Seite einem Bild entspricht.
* Für den Endpunkt des abgestimmten Modells wird derselbe Preis für Vorhersagen wie für das Basismodell berechnet.
* Mit der Google Suche fundieren: Wenn Sie die Funktion „Mit der Google Suche fundieren“ verwenden, um Kosten zu optimieren, werden nur Anfragen berechnet, die mindestens eine URL für die Unterstützung von Fundierungen aus dem Web enthalten. Für Gemini fallen immer Kosten an.
Imagen
Mit Imagen in Vertex AI können Sie neue Bilder generieren und Bilder basierend auf den von Ihnen bereitgestellten Text-Prompts bearbeiten oder nur Teile von Bildern mit einem Maskenbereich, den Sie zusammen mit einer Reihe anderer Funktionen definieren, bearbeiten.
Modell | Feature | Beschreibung | Eingabe | Ausgabe | Preis |
---|---|---|---|---|---|
Bild 3 | Bilderstellung | Bild generieren Bild bearbeiten Bild anpassen |
Text-Prompt | Bild | 0,04 $ pro Bild |
Imagen 3 Fast | Bilderstellung | Image generieren | Text-Prompt | Bild | 0,02 $ pro Bild |
Imagen 2, Imagen | Bilderstellung | Image generieren | Text-Prompt | Bild | 0,020 $ pro Bild |
Bildbearbeitung | Bild mit maskenfreiem Ansatz oder Maskenansatz bearbeiten | Bild-/Text-Prompt | Bild | 0,020 $ pro Bild | |
Auflösung wird erhöht | Auflösung eines generierten Bildes auf 2.000 und 4.000 erhöhen | Bild | Bild | 0,003 $ pro Bild | |
Optimierung | Aktivieren Sie einen "Betreff", der vom Nutzer für die Verwendung von Imagen-Prompts bereitgestellt wurde (weniger Aufnahmetraining). | Betreff mit Textkennung und 4–8 Bildern pro Betreff | Feinabstimmung des Modells (nach dem Training mit vom Nutzer bereitgestellten Betreff) | $ pro Knotenstunde Preise für benutzerdefiniertes Vertex AI-Training | |
Visuelle Untertitel | Kurze oder lange Textuntertitel für ein Bild generieren | Bild | Textunterschrift | 0,0015 $ pro Bild | |
Visual Fragen und Antworten | Eine Antwort basierend auf einer Frage bereitstellen, die auf ein Bild verweist | Bild-/Text-Prompt | Textantwort | 0,0015 $ pro Bild |
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Veo
Veo 2 erstellt Videos in unglaublich hoher Qualität für eine Vielzahl von Themen und Stilen. Dabei wird das Verständnis der realen Physik und der Nuancen menschlicher Bewegungen und Mimik verbessert.
Modell | Feature | Beschreibung | Eingabe | Ausgabe | Preis |
---|---|---|---|---|---|
Veo 2 | Videogenerierung | Videos aus einem Textprompt oder Referenzbild generieren | Text-/Bild-Prompt | Video | 0,50 $ pro Sekunde |
Einbettungskosten für KI-Anwendungen
Modell | Feature | Beschreibung | Eingabe | Ausgabe | Preis |
---|---|---|---|---|---|
Multimodale Einbettung | Einbettungen für multimodale Attribute: Text | Einbettungen mit Text als Eingabe generieren | Text | Einbettungen | 0,0002 $ pro 1.000 Zeichen Eingabe |
Einbettungen für multimodale Ausdrücke: Bild | Einbettungen mit Bild als Eingabe generieren | Bild | Einbettungen | 0,0001 $ pro Bildeingabe | |
Einbettungen für multimodal: Video Plus | Video Plus | Video | Einbettungen (bis zu 15 Einbettungen pro Minute Video) | 0,0020 $ pro Sekunde Video | |
Einbettungen für multimodale Ausdrücke: Video-Standard | Video – Standard | Video | Einbettungen (bis zu 8 Einbettungen pro Minute Video) | 0,0010 $ pro Sekunde Video | |
Einbettungen für multimodale Ausdrücke: Video – Grundlegend | Video Essentials | Video | Einbettungen (bis zu 4 Einbettungen pro Minute Video) | 0,0005 $ pro Sekunde Video |
Modell | Typ | Region | Preis pro 1.000 Zeichen |
---|---|---|---|
Einbettungen für Text | Eingabe | Global |
|
Ausgabe | Global |
|
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Preise für Codevervollständigung in Vertex AI
Die Generative AI in Vertex AI wird nach 1.000 Zeichen Eingabe (Eingabeaufforderung) und 1.000 Zeichen Ausgabe (Antwort) abgerechnet. Alle Zeichen werden durch UTF-8-Codepunkte gezählt. Leerzeichen werden nicht berücksichtigt. Während der Vorschauphase werden Gebühren zu 100 % reduziert. Vorhersageanfragen, die zu gefilterten Antworten führen, werden nur für die Eingabe abgerechnet. Am Ende jedes Abrechnungszeitraums werden Brüche von einem Cent (0,01 $) auf einen Cent aufgerundet.
Modell | Typ | Region | Preis pro 1.000 Zeichen |
---|---|---|---|
Codey für Codevervollständigung | Eingabe | Global |
|
Ausgabe | Global |
|
Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
Übersetzung (Text)
Verwenden Sie die Vertex AI API und Translation LLM, um Text zu übersetzen. LLM-Übersetzungen klingen im Vergleich zu klassischen Übersetzungsmodellen oft natürlicher und flüssiger, bieten aber eine eingeschränktere Sprachunterstützung (Weitere Informationen).
Modell | Methode | Nutzung | Preis pro 1 Million Zeichen |
---|---|---|---|
LLM | Textübersetzung* | Die Anzahl der Eingabezeichen pro Monat |
10 $ pro 1 Million Zeichen* |
Anzahl der Ausgabezeichen pro Monat |
10 $ pro 1 Million Zeichen* |
Preise sind in US-Dollar ($) angegeben.
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* Der Preis bezieht sich auf die Anzahl der vom Modell verarbeiteten Zeichen. Weitere Informationen zu gezählten Zeichen finden Sie unter Gebührenpflichtige Zeichen.
Kosten mit dem Kontext-Caching von Vertex AI optimieren
Mit dem Kontext-Caching können Sie die Kosten für die Verarbeitung von Gemini-Eingabetoken um 75% und die Latenzzeit bei der Inhaltserstellung reduzieren, indem Sie den Kontextteil Ihres Eingabetexts oder -mediums in Gemini-Modellen zwischenspeichern. Die Dauer, für die Daten im Cache gespeichert werden, kann vom Nutzer festgelegt werden. Sie bestimmt die Gebühren für „Context Cache Storage“. Beim Erstellen eines zwischengespeicherten Kontexts werden den Nutzern die Kosten für ein Standard-Eingabetoken in Rechnung gestellt. Cache-Treffer bei Eingabedaten werden mit einem reduzierten Satz, „Cached Input“, anstatt mit den normalen Eingabekosten berechnet. Die Datengröße für Speicher und Eingabe wird auf dieselbe Weise berechnet wie die Preise für Gemini-Eingabe.
Gemini 2.5-Modelle
Modell | Funktion | Typ | Preis (pro 1 Mio. Tokens) <= 200.000 Eingabetokens |
Preis (pro 1 Mio. Tokens) > 200.000 Eingabetokens |
---|---|---|---|---|
Gemini 2.5 Pro | Zwischengespeicherte Eingabe | Eingabe (Text, Bild, Video, Audio) | 0,31 $ (pro 1 Mio.Tokens) | 0,625 $ (pro 1 Mio.Tokens) |
Ausgabe | – | – | ||
Kontextcache-Speicher | Eingabe (Text, Bild, Video, Audio) | 4,50 $ (/M Tok/Stunde) | 4,50 $ (/M Tok/Stunde) | |
Gemini 2.5 Flash | Zwischengespeicherte Eingabe | Eingabe (Text, Bild, Video, Audio) | 0,0375 $ (pro 1 Mio.Tokens) | 0,0375 $ (pro 1 Mio.Tokens) |
Ausgabe | – | – | ||
Kontextcache-Speicher | Eingabe (Text, Bild, Video, Audio) | 1 $ (/M Tok/h) | 1 $ (/M Tok/h) |
Gemini 2.0-Modelle
Tokenbasierte Preise
Modell |
Typ |
Speicherplatz (Mio. Tok-Stunden) |
Preis |
---|---|---|---|
Gemini 2.0 Flash |
|||
1 Mio. Eingabetokens | 1,00 $ | 0,0375 $ | |
1 Mio. Eingabeaudio-Tokens | 1,00 $ | 0,25 $ | |
1 Mio. Ausgabetext-Tokens | – | – | |
Gemini 2.0 Flash Lite |
|||
1 Mio. Eingabetokens | 1,00 $ | 0,01875 $ | |
1 Mio. Eingabeaudio-Tokens | 1,00 $ | 0,01875 $ | |
1 Mio. Ausgabetext-Tokens | – | – |
Modalitätsbasierte Preise
Die unten aufgeführten Preise für Modalitäten basieren auf durchschnittlichen Anwendungsfällen und dienen nur der Orientierung. Die tatsächliche Abrechnung erfolgt nur auf der Grundlage von Tokens:
- 4 Zeichen ergeben ungefähr 1 Texttoken einschließlich Leerzeichen.
- Für ein Bild mit 1024 × 1024 Pixeln werden 1.290 Token verbraucht. Die Anzahl der Tokens pro Bild variiert je nach Bildauflösung. Weitere Informationen zur Berechnung von Tokens finden Sie in unserer Dokumentation.
- Der Videoeingang verbraucht bei einer Abtastrate von einem Frame pro Sekunde 258 Token pro Sekunde. Video mit Audiorechnungen für Video- und Audio-Token.
- Audioeingaben verbrauchen ohne Zeitstempel 25 Token pro Sekunde.
Modell |
Typ |
Speicher (Modality-Stunde) |
Preis |
---|---|---|---|
Gemini 2.0 Flash |
|||
Text eingeben (€/Mio. Zeichen) | 0,25 $ | 0,009375 $ | |
Eingabebild ($/Bild) | 0,00129 $ | 0,000048375 $ | |
Eingabevideo (€/Sek.) | 0,000258 $ | 0,000009675 $ | |
Eingabeaudio (€/Sek.) | 0,000025 $ | 0,00000625 $ | |
Text ausgeben ($/M-Zeichen) | – | – | |
Gemini 2.0 Flash Lite |
|||
Text eingeben (€/Mio. Zeichen) | 0,25 $ | 0,0046875 $ | |
Eingabebild ($/Bild) | 0,00129 $ | 0,0000241875 $ | |
Eingabevideo (€/Sek.) | 0,000258 $ | 0,000009675 $ | |
Eingabeaudio (€/Sek.) | 0,000258 $ | 0,0000048375 $ | |
Text ausgeben ($/M-Zeichen) | – | – | |
Fundierung mit der Google Suche |
Gemini 2.0 Flash umfasst bis zu 1.500 Grounded-Anfragen pro Tag ohne Aufpreis. Für Grounded-Anfragen ,die 1.500 pro Tag überschreiten,wird ein Betrag von 35 $pro 1.000 Anfragen berechnet (bis zu 1 Million Anfragen pro Tag). Wenn Sie mehr als 1 Million Anfragen pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team. |
||
Web Grounding für Unternehmen |
45 $ pro 1.000 Anfragen (bis zu 1 Million Anfragen pro Tag) ab dem 5. Mai 2025. Wenn Sie mehr als 1 Million Anfragen pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team. |
* Die Preise sind in US-Dollar (USD) angegeben.
Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* PDFs werden als Bildeingaben abgerechnet, wobei eine PDF-Seite einem Bild entspricht.
* Für den Endpunkt des abgestimmten Modells gelten dieselben Preise für Vorhersagen wie für das Basismodell.
* Die Funktion „Grounding with Google Search“ wird nur für Anfragen abgerechnet, die Ergebnisse mit mindestens einer URL für Grounding-Support aus dem Web enthalten. Es gelten auch die üblichen Nutzungsgebühren für das Gemini-Modell.
Bereitgestellter Durchsatz
Bereitgestellter Durchsatz gewährleistet den Durchsatz für Ihre Anforderungen an Generative AI und wird über Skalierungseinheiten der Generative AI (GSU) abgewickelt. Weitere Informationen dazu, wie viel Durchsatz jede GSU bietet, finden Sie hier und mit unserem Online-Schätzer können Sie das berechnen.
Dauer | Preis pro GSU | Pro |
---|---|---|
1 Woche* | 1.200 € | Woche |
Mindestlaufzeit: 1 Monat | 2.700 € | Monat |
Mindestlaufzeit: 3 Monate | 2.400 $ | Monat |
Zusicherung für 1 Jahr | 2.000 $ | Monat |
*Hinweis: 1-Wochen-Commit ist ein kostenpflichtiges Angebot in der privaten Vorschau.
Beispiel für die Kostenberechnung
Ein Nutzer muss sicherstellen,dass er 10 Abfragen pro Sekunde (QPS) einer Abfrage mit einer Eingabe von 1.000 Text-Tokens und 500 Audio-Tokens unterstützen kann und eine Ausgabe von 300 Text-Tokens mithilfe von gemini-2.0-flash erhält.
Aus der Tabelle mit Durchsatz und Burndown-Rate für gemini-2.0-flash geht hervor, dass die Burndown-Rate eines Eingabetext-Tokens 1 Token beträgt, die eines Eingabeaudio-Tokens 7 Token und die eines Ausgabetext-Tokens 4 Token.
Die Gesamtzahl der Eingabetokens des Nutzers beträgt 1.000* (1 Token pro Eingabetext-Token) + 500* (7 Token pro Eingabeaudio-Token) = 4.500 angepasste Eingabetokens. Die Gesamtzahl der Ausgabetokens des Nutzers beträgt 300* (4 Token pro Ausgabetexttoken) = 1.200 angepasste Ausgabetokens. Zusammen ergibt das 4.500 angepasste Eingabetokens + 1.200 angepasste Ausgabetokens = 5.700 Tokens pro Abfrage.
Wenn wir die Gesamtzahl der Token pro Abfrage mit der Anzahl der Abfragen pro Sekunde multiplizieren, erhalten wir 5.700 Gesamt-Token pro Abfrage * 10 Abfragen pro Sekunde = 57.000 Gesamt-Token pro Sekunde.
Dividiert man dies durch den Gesamtdurchsatz pro Sekunde pro GSU,erhält man 57.000 Token pro Sekunde ÷ 3.360 Durchsatz pro Sekunde pro GSU = 16,96 GSUs. Die Mindestkaufsteigerung für dieses Modell beträgt 1 GSU, sodass der Nutzer 17 GSUs benötigt.
Wenn der Nutzer diesen Durchsatz eine Woche lang aufrechterhalten möchte, würde das 1.200 $ * 17 GSUs = 20.400 $pro Woche kosten. Wenn sie diesen Durchsatz einen Monat lang aufrechterhalten wollten, würde das 2.700 $ * 17 GSUs = 45.900 $pro Monat kosten. Wenn sie diesen Durchsatz drei Monate lang aufrechterhalten wollten, würde das 2.400 $ * 17 GSUs = 40.800 $pro Monat kosten. Wenn das Unternehmen diesen Durchsatz ein Jahr lang aufrechterhalten möchte, würde das 2.000 $ * 17 GSUs = 34.000 $pro Monat kosten.
Preise für Partnermodelle auf Vertex AI vergleichen
Partnermodelle sind eine ausgewählte Liste generativer KI-Modelle, die von Google-Partnern entwickelt wurden. Partnermodelle werden als verwaltete APIs angeboten. Weitere Informationen finden Sie unter Übersicht über Partnermodelle. In den folgenden Abschnitten finden Sie die Preisdetails für Google-Partnermodelle.
Modelle von AI21 Lab
Modell | Preise |
---|---|
Jamba 1.5 Large | Eingabe: 2 $ pro Million Tokens Ausgabe: 8 $ pro Million Tokens |
Jamba 1.5 Mini | Eingabe: 0,20 $ / Million Token Ausgabe: 0,40 $ / Million Token |
Claude-Modelle von Anthropic
Modell | Preise |
---|---|
Claude 3.7 Sonnet | Eingabe: 3 $ pro Million Token Ausgabe: 15 $ pro Million Token Batch-Eingabe: 1,50 $ pro Million Token Batch-Ausgabe: 7,50 $ pro Million Token Cache-Schreibvorgang: 3,75 $ pro Million Token Cache-Treffer: 0,30 $ pro Million Token Batch-Cache-Schreibvorgang: 1,875 $ pro Million Token Batch-Cache-Treffer: 0,15 $ pro Million Token |
Claude 3.5 Haiku | Eingabe: 0,80 $ / Million Token Ausgabe: 4 $ / Million Token Batch-Eingabe: 0,40 $ / Million Token Batch-Ausgabe: 2 $ / Million Token Cache-Schreibvorgang: 1 $ / Million Token Cache-Treffer: 0,08 $ / Million Token Batch-Cache-Schreibvorgang: 0,50 $ / Million Token Batch-Cache-Treffer: 0,04 $ / Million Token |
Claude 3.5 Sonnet v2 | Eingabe: 3 $ pro Million Token Ausgabe: 15 $ pro Million Token Batch-Eingabe: 1,50 $ pro Million Token Batch-Ausgabe: 7,50 $ pro Million Token Cache-Schreibvorgang: 3,75 $ pro Million Token Cache-Treffer: 0,30 $ pro Million Token Batch-Cache-Schreibvorgang: 1,875 $ pro Million Token Batch-Cache-Treffer: 0,15 $ pro Million Token |
Claude 3.5 Sonett | Eingabe: 3 $ pro Million Token Ausgabe: 15 $ pro Million Token Cache-Write: 3,75 $ pro Million Token Cache-Hit: 0,30 $ pro Million Token |
Claude 3 Haiku | Eingabe: 0,25 $ / Million Token Ausgabe: 1,25 $ / Million Token Cache-Schreibvorgang: 0,30 $ / Million Token Cache-Treffer: 0,03 $ / Million Token |
Claude 3 Sonnet (deprecated) | Eingabe: 3 $ pro Million Tokens Ausgabe: 15 $ pro Million Tokens |
Claude 3 Opus | Eingabe: 15 $ / Million Token Ausgabe: 75 $ / Million Token Cache-Schreibvorgang: 18,75 $ / Million Token Cache-Treffer: 1,50 $ / Million Token |
Llama-Modelle von Meta
Modell | Preise |
---|---|
Llama 3.1 405B | Eingabe: 5,00 $ pro Million Tokens Ausgabe: 16,00 $ pro Million Tokens |
Llama 3.3 70 Mrd. * | Eingabe: 0,72 $ / Million Token Ausgabe: 0,72 $ / Million Token |
Llama 4 Scout * | Eingabe: 0,25 $ / Million Tokens Ausgabe: 0,70 $ / Million Tokens |
Llama 4 Maverick * | Eingabe: 0,35 $ pro Million Token Ausgabe: 1,15 $ pro Million Token |
- Kostenlos verfügbar bis 1. Mai 2025.
Mistral AI-Modelle
Modell | Preise |
---|---|
Mistral Small 3.1 (25.03) | Eingabe: 0,10 $ / Million Tokens Ausgabe: 0,30 $ / Million Tokens |
Mistral Large (24.11) | Eingabe: 2,00 $ / Million Tokens Ausgabe: 6,00 $ / Million Tokens |
Mistral Nemo | Eingabe: 0,15 $ / Million Tokens Ausgabe: 0,15 $ / Million Tokens |
Codestral (25.01.) | Eingabe: 0,30 $ / Million Tokens Ausgabe: 0,90 $ / Million Tokens |