Diese Seite wurde von der Cloud Translation API übersetzt.

Kosten für die Erstellung und Bereitstellung von KI-Modellen in Vertex AI

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Sie zahlen nur für Anfragen, die einen Antwortcode 200 zurückgeben. Anfragen, die andere Antwortcodes wie 4xx und 5xx zurückgeben, werden nicht für Eingaben oder Ausgaben berechnet.

Auf dieser Seite sind die Preise für Generative AI in Vertex AI beschrieben. Informationen zu allen anderen Preisen für Vertex AI, einschließlich der ML Platform- und MLOps-Dienste, finden Sie auf der Preisübersicht zu Vertex AI.

Google-Modelle

Gemini 2.5

Modell	Typ	Preis (/1 Mio. Tokens) <= 200.000 Eingabetokens	Preis (/1 Mio. Tokens) > 200.000 Eingabetokens	Preis (/1 Mio. Tokens) <= 200.000 Eingabetokens mit Batch-API	Preis (/1 Mio. Tokens) > 200.000 Eingabetokens mit Batch-API
Gemini 2.5 Pro
	Eingabe (Text, Bild, Video, Audio)	1,25 $	2,50 $	0,625 $	1,25 $
	Textausgabe (Antwort und Begründung)	10 $	15 $	5 $	7,50 $
Gemini 2.5 Flash GA
	Eingabe (Text, Bild, Video)	0,30 $	0,30 $	0,15 $	0,15 $
	Audioeingabe	1 $	1 $	0,50 $	0,50 $
	Textausgabe	2,50 $	2,50 $	1,25 $	1,25 $
	Optimierung für 1 Mio. Training-Tokens	5,00 $	–	–	–
Gemini 2.5 Flash Preview (Endpunkte am 15.07.2025 eingestellt)
	Eingabe (Text, Bild, Video)	0,15 $	0,15 $	0,075 $	0,075 $
	Audioeingabe	1 $	1 $	0,50 $	0,50 $
	Textausgabe (ohne Nachdenken)	0,60 $	0,60 $	0,30 $	0,30 $
	Textausgabe (Denkprozesse, Antwort und Begründung)	3,50 $	3,50 $	$1.75	$1.75
Gemini 2.5 Flash Live API
	1 Mio. Eingabetext-Tokens	0,50 $	0,50 $	–	–
	1 Mio. Eingabe-Audio-Tokens	3 $	3 $	–	–
	1 Mio. Eingabe-Video-Tokens	3 $	3 $	–	–
	1 Mio. Ausgabetext-Tokens	2 $	2 $	–	–
	1 Mio. Ausgabe-Audiotokens	12 $	12 $	–	–
Gemini 2.5 Flash Lite
	Eingabe (Text, Bild, Video)	0,1 $	0,1 $	–	–
	Audioeingabe	0,50 $	0,50 $	–	–
	Textausgabe (Antwort und Begründung)	0,40 €	0,40 €	–	–
Fundierung mit der Google Suche	Gemini 2.0 Flash, 2.5 Flash und 2.5 Flash-Lite bieten zusammen 1.500 Prompts pro Tag ohne Aufpreis. Gemini 2.5 Pro umfasst 10.000 Prompts pro Tag ohne Aufpreis. Grounded-Prompts, die diese Limits überschreiten, werden mit 35$pro 1.000 Prompts abgerechnet. Ein Grounded Prompt ist eine Anfrage an Gemini, die eine oder mehrere Suchanfragen an die Google Suche sendet.&ast;&ast; Auch wenn mehrere Suchanfragen an die Google Suche gesendet werden, wird für eine prompte Antwort nur einmal eine Gebühr erhoben. Wenden Sie sich an Ihr Account-Management-Team, wenn Sie mehr als 1 Million Grounded Prompts pro Tag benötigen.
Web Grounding für Unternehmen	45$pro 1.000 Grounded Prompts. Ein Prompt mit Informationen zur Website ist eine an Gemini gesendeten Anfrage, die eine oder mehrere Abfragen an Web Grounding for Enterprise** stellt. Auch wenn mehrere Suchanfragen an die Google Suche gesendet werden, wird für eine prompte Antwort nur eine Gebühr erhoben. Wenden Sie sich an Ihr Account-Management-Team, wenn Sie mehr als 1 Million Grounded Prompts pro Tag benötigen.
Fundierung mit eigenen Daten	2,50 $ pro 1.000 Anfragen ab dem 16. Juni 2025.

* Wenn der Kontext für die Abfrageeingabe länger als 200.000 Token ist, werden alle Token (Eingabe und Ausgabe) zu den Preisen für lange Kontexte abgerechnet.
** Die Funktionen „Grounding with Google Search“ und „Web Grounding for Enterprise“ werden nur dann abgerechnet, wenn eine Aufforderung erfolgreich Webergebnisse zurückgibt (d.h. Ergebnisse, die mindestens eine URL für die Unterstützung von Grounding aus dem Web enthalten). Nutzungsgebühren für Gemini-Modelle werden separat berechnet.

Gemini 2.0

Gemini 2.0 wird auf Basis von Tokens abgerechnet. Um die Anzahl der Eingabetokens in Ihrer Anfrage vor dem Senden zu berechnen, können Sie den SDK-Tokenizer oder die countTokens API verwenden. Wenn Ihre Anfrage mit einem Fehler 400 oder 500 fehlschlägt, werden Ihnen die verwendeten Tokens nicht in Rechnung gestellt.

Mit dem Schieberegler in der Preistabelle können Sie die tokenbasierten Preise mit den verfahrensbasierten Preisen vergleichen.

Tokenbasierte Preise

Modell	Typ	Preis	Preis mit Batch API
Gemini 2.0 Flash
	1 Mio. Eingabetokens	0,15 $	0,075 $
	1 Mio. Eingabeaudio-Tokens	1,00 $	0,50 $
	1 Mio. Ausgabetext-Tokens	0,60 $	0,30 $
	Optimierung für 1 Mio. Training-Tokens	3,00 $
Gemini 2.0 Flash Image Generation
	1 Mio. Eingabe-Tokens	0,15 $
	1 Mio. Audio-Input-Tokens	1,00 $
	1 Mio. Eingabe-Video-Tokens	3 $
	1 Mio. Ausgabetext-Tokens	0,60 $
	1 Mio. Ausgabe-Image-Tokens	30,00 $
Gemini 2.0 Flash Live API
	1 Mio. Eingabetext-Tokens	0,50 $
	1 Mio. Eingabe-Audio-Tokens	3 $
	1 Mio. Eingabe-Video-Tokens	3 $
	1 Mio. Ausgabetext-Tokens	2 $
	1 Mio. Ausgabe-Audiotokens	12 $
Gemini 2.0 Flash Lite
	1 Mio. Eingabetokens	0,075 $	0,0375 $
	1 Mio. Eingabeaudio-Tokens	0,075 $	0,0375 $
	1 Mio. Ausgabetext-Tokens	0,30 $	0,15 $
	Optimierung für 1 Mio. Trainingstokens	1,00 $
Fundierung mit der Google Suche	Gemini 2.0 Flash und 2.5 Flash bieten zusammen 1.500 Prompts pro Tag ohne Aufpreis. Für Grounded-Prompts, die diese Limits überschreiten, wird ein Betrag von 35$pro 1.000 Prompts in Rechnung gestellt. Ein Prompt mit Bezugsdaten ist eine Anfrage an Gemini, die eine oder mehrere Suchanfragen an die Google Suche* sendet. Auch wenn mehrere Suchanfragen an die Google Suche gesendet werden, wird für eine prompte Antwort nur eine Gebühr erhoben. Wenn Sie mehr als 1 Million Grounded Prompts pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team.
Web Grounding für Unternehmen	45$pro 1.000 Grounded Prompts. Ein Prompt mit Informationen zur Website ist eine an Gemini gesendeten Anfrage, die eine oder mehrere Abfragen an Web Grounding for Enterprise* stellt. Auch wenn mehrere Suchanfragen an die Google Suche gesendet werden, wird für eine prompte Antwort nur eine Gebühr erhoben. Wenn Sie mehr als 1 Million Grounded Prompts pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team.
Fundierung mit eigenen Daten	2,50 $ pro 1.000 Anfragen ab dem 16. Juni 2025.

Modalitätsbasierte Preise

Die unten aufgeführten Modalitätspreise basieren auf durchschnittlichen Anwendungsfällen und dienen nur der Orientierung. Die tatsächliche Abrechnung erfolgt nur auf der Grundlage von Tokens:

4 Zeichen ergeben ungefähr 1 Texttoken einschließlich Leerzeichen.

Für ein Bild mit 1024 × 1024 Pixeln werden 1.290 Token verbraucht. Die Anzahl der Token pro Bild variiert je nach Bildauflösung. Weitere Informationen zur Berechnung von Tokens finden Sie in unserer Dokumentation.

Der Videoeingang verbraucht bei einer Abtastrate von einem Frame pro Sekunde 258 Token pro Sekunde. Video mit Audiorechnungen für Video- und Audio-Token.

Audioeingaben verbrauchen ohne Zeitstempel 25 Token pro Sekunde.

Modell	Typ	Preis	Preis mit Batch API
Gemini 2.0 Flash
	Text eingeben ($/Mio. Zeichen)	0,0375 $	0,01875 $
	Eingabebild ($/Bild)	0,0001935 $	0,00009675 $
	Eingabevideo ($/Sek.)	0,0000387$	0,00001935 $
	Eingabeaudio ($/Sek.)	0,000025 $	0,0000125 $
	Ausgabetext ($/Mio. Zeichen)	0,15 $	0,075 $
Gemini 2.0 Flash Image Generation
	Text eingeben ($/Mio. Zeichen)	0,0375 $
	Eingabebild ($/Bild)	0,0001935 $
	Eingabevideo ($/Sek.)	0,0000387$
	Eingabeaudio ($/Sek.)	0,000025 $
	Ausgabetext ($/Mio. Zeichen)	0,15 $
	Ausgabebild ($/Bild)	0,04 $
Gemini 2.0 Flash Lite
	Text eingeben ($/Mio. Zeichen)	0,01875 $	0,009375 $
	Eingabebild ($/Bild)	0,00009675 $	0,000048375 $
	Eingabevideo ($/Sek.)	0,00001935 $	0,000009675 $
	Eingabeaudio ($/Sek.)	0,000001875 $	0,000000938 $
	Ausgabetext ($/Mio. Zeichen)	0,075 $	0,0375 $
Fundierung mit der Google Suche	Gemini 2.0 Flash und 2.5 Flash bieten zusammen 1.500 Prompts pro Tag ohne Aufpreis. Für Grounded-Prompts, die diese Limits überschreiten, wird ein Betrag von 35$pro 1.000 Prompts in Rechnung gestellt. Ein Prompt mit Bezugsdaten ist eine Anfrage an Gemini, die eine oder mehrere Suchanfragen an die Google Suche* sendet. Auch wenn mehrere Suchanfragen an die Google Suche gesendet werden, wird für eine prompte Antwort nur eine Gebühr erhoben. Wenn Sie mehr als 1 Million Grounded Prompts pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team.
Web Grounding für Unternehmen	45$pro 1.000 Grounded Prompts. Ein Prompt mit Informationen zur Website ist eine an Gemini gesendeten Anfrage, die eine oder mehrere Abfragen an Web Grounding for Enterprise* stellt. Auch wenn mehrere Suchanfragen an die Google Suche gesendet werden, wird für eine prompte Antwort nur eine Gebühr erhoben. Wenn Sie mehr als 1 Million Grounded Prompts pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team.

* Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* Trainingstokens werden anhand der Gesamtzahl der Tokens in Ihrem Trainings-Dataset multipliziert mit der Anzahl der Epochen berechnet.
* PDFs werden als Bildeingaben abgerechnet, wobei eine PDF-Seite einem Bild entspricht.
* Für den Endpunkt des abgestimmten Modells wird derselbe Preis für Vorhersagen wie für das Basismodell berechnet.
* Die Funktionen „Grounding with Google Search“ und „Web Grounding for Enterprise“ werden nur dann in Rechnung gestellt, wenn eine Aufforderung erfolgreich Webergebnisse zurückgibt (d.h. Ergebnisse, die mindestens eine URL für die Unterstützung von Grounding aus dem Web enthalten). Nutzungsgebühren für Gemini-Modelle werden separat berechnet.
* Gemini 2.0 Flash Live API: 25 Token pro Sekunde Audio (Eingabe/Ausgabe), 258 Token pro Sekunde Video (Eingabe). Die Fundierung mit der Google Suche bleibt kostenlos, während die Gemini 2.0 Flash Live API in der Vorabversion ist.

Preise für Vertex AI Model Optimizer (Experimental)*

Der Vertex AI Model Optimizer vereinfacht die Nutzung von Gemini für Unternehmenskunden, indem er einen einzelnen Meta-Endpunkt für Gemini-Modell-Anfragen bereitstellt. Kunden, die diesen Dienst nutzen, müssen nicht angeben, ob Flash, Pro oder eine bestimmte Version verwendet werden soll. Stattdessen geben sie einfach eine konfigurierbare Einstellung (Kosten, Qualität oder ausgewogen) an, um ihre Präferenzen anzugeben. Der Modelloptimierer wendet dann das richtige Maß an Intelligenz für die Aufgabe an, indem er jede Abfrage an das am besten geeignete Modell sendet.

Der Vertex AI Model Optimizer verwendet dynamische Preisgestaltung. Das bedeutet, dass der durchschnittliche Preis pro Token vom Intelligenzniveau des Modells abhängt, das für die Aufgabe verwendet wird. Daher finden Sie unten Preisbeispiele, die mögliche Szenarien basierend auf Ihren Konfigurationseinstellungen veranschaulichen (siehe Tabellen unten). Die SKUs für den Model Optimizer sind 1 $-SKUs, die als Kaufeinheit für Ihre Abrechnung dienen. Nach der Verwendung der Modelle werden Ihnen die Kosten weiterhin auf der Grundlage des Verbrauchs in Rechnung gestellt.

I/O-Verhältnis von 5:1	Beispiel 1: Chatbot	HINWEIS: Diese Angaben sind keine Garantien. Die Ergebnisse können je nach Kunde variieren.
Kundenpräferenz	Kundeneingaben an MO gesendet	Customer Output Tokens an MO gesendet	Durchschnittlicher Input-Preis pro Million Token (hoher Bereich)	Durchschnittlicher Output-Preis pro Million Token (hoher Bereich)	Durchschnittlicher Input-Preis pro Million Token (untere Grenze)	Durchschnittlicher Output-Preis pro Million Token (untere Grenze)
Kosten	10.000.000	2.000.000	0,63 $	2,50 $	0,16 $	0,63 $
Ausgeglichen	10.000.000	2.000.000	1,26 $	5,00 $	0,63 $	2,50 $
Qualität	10.000.000	2.000.000	1,89 $	7,50 $	1,26 $	5,00 $

I/O-Ratio: 1:20	Beispiel 2: Erstellung von Inhalten
Kundenpräferenz	Kundeneingaben an MO gesendet	Customer Output Tokens an MO gesendet	Durchschnittlicher Input-Preis pro Million Token (hoher Bereich)	Durchschnittlicher Output-Preis pro Million Token (hoher Bereich)	Durchschnittlicher Input-Preis pro Million Token (untere Grenze)	Durchschnittlicher Output-Preis pro Million Token (untere Grenze)
Kosten	1.000.000	20.000.000	0,63 $	2,50 $	0,16 $	0,63 $
Ausgeglichen	1.000.000	20.000.000	1,26 $	5,00 $	0,63 $	2,50 $
Qualität	1.000.000	20.000.000	1,89 $	7,50 $	1,26 $	5,00 $

* Model Optimizer ist ein experimentelles kostenpflichtiges Angebot und leitet Anfragen möglicherweise an experimentelle Versionen von Gemini auf Vertex weiter.

Andere Gemini-Modelle

Alle anderen Gemini-Modelle als Gemini 2.0 werden basierend auf Modalitäten wie Zeichen, Bildern, Video-/Audiosekunden abgerechnet. Texteingaben werden pro 1.000 Eingabezeichen (Prompt) und pro 1.000 Ausgabezeichen (Antwort) abgerechnet. Alle Zeichen werden durch UTF-8-Codepunkte gezählt. Leerzeichen werden nicht berücksichtigt. Das ergibt etwa 4 Zeichen pro Token. Vorhersageanfragen, die zu gefilterten Antworten führen, werden nur für die Eingabe abgerechnet. Am Ende jedes Abrechnungszeitraums werden Brüche von einem Cent (0, 01 $) auf einen Cent aufgerundet. Die Medieneingabe wird pro Bild oder Sekunde (Video) berechnet. Wenn Ihre Anfrage mit einem Fehler 400 oder 500 fehlschlägt, werden Ihnen die verwendeten Tokens nicht berechnet.

Modell	Funktion	Typ	Preis ( =< 128.000 Eingabe-Token)	Preis (> 128.000 Eingabe-Token)
Gemini 1.5 Flash	Multimodal	Bildeingabe Videoeingabe Texteingabe Audioeingabe	0,00002 $ / Bild 0,00002 $ / Sekunde 0,00001875 $ / 1.000 Zeichen 0,000002 $ / Sekunde	0,00004 $ / Bild 0,00004 $ / Sekunde 0,0000375 $ / 1.000 Zeichen 0,000004 $ / Sekunde
		Textausgabe	0,000075 $ / 1.000 Zeichen	0,00015 $ pro 1.000 Zeichen
	Tuning*	Training Token	8 $ / Mio. Tokens
Gemini 1.5 Pro,	Multimodal	Bildeingabe Videoeingabe Texteingabe Audioeingabe	0,00032875 $ / Bild 0,00032875 $ / Sekunde 0,0003125 $ / 1.000 Zeichen 0,00003125 $ / Sekunde	0,0006575 $ / Bild 0,0006575 $ / Sekunde 0,000625 $ / 1.000 Zeichen 0,0000625 $ / Sekunde
		Textausgabe	0,00125 $ / 1.000 Zeichen	0,0025 $ pro 1.000 Zeichen
	Tuning*	Training Token	80 $ pro Mio. Tokens
Gemini 1.0 Pro	Multimodal	Bildeingabe Videoeingabe Texteingabe	0,0025 $ / Bild 0,002 $ / Sekunde 0,000125 $ / 1.000 Zeichen
Gemini 1.0 Pro		Textausgabe	0,000375 $ / 1.000 Zeichen
Fundierung mit der Google Suche	Text	35$pro 1.000 Grounded Prompts. Ein Prompt mit Bezugsdaten ist eine an Gemini gesendeten Anfrage, die eine oder mehrere Anfragen an die Google Suche* sendet. Auch wenn mehrere Suchanfragen an die Google Suche gesendet werden, wird für eine prompte Antwort nur eine Gebühr erhoben. Wenden Sie sich an Ihr Account-Management-Team, wenn Sie mehr als 1 Million Grounded Prompts pro Tag benötigen.
Web-Fundierung für Unternehmen	Text	45$pro 1.000 Grounded Prompts. Ein Prompt mit Informationen aus dem Web ist eine an Gemini gesendete Anfrage, die eine oder mehrere Abfragen an Web Grounding for Enterprise* stellt. Auch wenn mehrere Suchanfragen an die Google Suche gesendet werden, wird für eine prompte Antwort nur eine Gebühr erhoben. Wenden Sie sich an Ihr Account-Management-Team, wenn Sie mehr als 1 Million Grounded Prompts pro Tag benötigen.
Fundierung mit eigenen Daten	Text	2,50 $ pro 1.000 Anfragen ab dem 16. Juni 2025.

* Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* Wenn der Abfragekontext länger als 128.000 Token ist, werden alle Tokens zum Preis für lange Kontexte berechnet.
* Gemini-Modelle sind im Batch-Modus mit 50% Rabatt verfügbar.
* Gemini 1.0 Pro unterstützt nur ein Kontextfenster von bis zu 32.000.
* PDFs werden als Bildeingaben abgerechnet, wobei eine PDF-Seite einem Bild entspricht.
* Für den Endpunkt des abgestimmten Modells wird derselbe Preis für Vorhersagen wie für das Basismodell berechnet.
* Die Funktionen „Grounding with Google Search“ und „Web Grounding for Enterprise“ werden nur dann in Rechnung gestellt, wenn eine Aufforderung erfolgreich Webergebnisse zurückgibt (d.h. Ergebnisse, die mindestens eine URL für die Unterstützung von Grounding aus dem Web enthalten). Gebühren für die Nutzung von Gemini-Modellen werden separat berechnet.

Imagen

Mit Imagen in Vertex AI können Sie neue Bilder generieren und Bilder basierend auf den von Ihnen bereitgestellten Text-Prompts bearbeiten oder nur Teile von Bildern mit einem Maskenbereich, den Sie zusammen mit einer Reihe anderer Funktionen definieren, bearbeiten.

Modell	Feature	Beschreibung	Eingabe	Ausgabe	Preis
Imagen 4 Ultra	Bildgenerierung	Image generieren	Text-Prompt	Bild	0,06 $ pro Bild
Bild 4	Bildgenerierung	Image generieren	Text-Prompt	Bild	0,04 $ pro Bild
Imagen 4 Fast	Bildgenerierung	Image generieren	Text-Prompt	Bild	0,02 $ pro Bild
Bild 3	Bildgenerierung	Bild generieren Bild bearbeiten Bild anpassen	Text-Prompt	Bild	0,04 $ pro Bild
Imagen 3 Fast	Bildgenerierung	Image generieren	Text-Prompt	Bild	0,02 $ pro Bild
Imagen 2, Imagen	Bildgenerierung	Image generieren	Text-Prompt	Bild	0,020 $ pro Bild
	Bildbearbeitung	Bild mit maskenfreiem Ansatz oder Maskenansatz bearbeiten	Bild-/Text-Prompt	Bild	0,020 $ pro Bild
	Auflösung wird erhöht	Auflösung eines generierten Bildes auf 2.000 und 4.000 erhöhen	Bild	Bild	0,003 $ pro Bild
	Optimierung	Aktivieren Sie einen "Betreff", der vom Nutzer für die Verwendung von Imagen-Prompts bereitgestellt wurde (weniger Aufnahmetraining).	Betreff mit Textkennung und 4–8 Bildern pro Betreff	Feinabstimmung des Modells (nach dem Training mit vom Nutzer bereitgestellten Betreff)	$ pro Knotenstunde Preise für benutzerdefiniertes Vertex AI-Training
	Visuelle Untertitel	Kurze oder lange Textuntertitel für ein Bild generieren	Bild	Textunterschrift	0,0015 $ pro Bild
	Visual Fragen und Antworten	Eine Antwort basierend auf einer Frage bereitstellen, die auf ein Bild verweist	Bild-/Text-Prompt	Textantwort	0,0015 $ pro Bild

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Veo

Veo 2 erstellt Videos in unglaublich hoher Qualität für eine Vielzahl von Themen und Stile. Es versteht die physikalischen Gesetze und menschliche Bewegungen besser und kann so Nuancen in der Mimik und Gestik besser darstellen.

Modell	Funktion	Beschreibung	Eingabe	Ausgabe	Preis
Veo 3	Videogenerierung	Videos aus einem Textprompt oder Referenzbild generieren	Text-/Bild-Prompt	Video	0,50 $/Sekunde
Veo 3	Video + Audio-Generation	Video mit synchronisierten Sprach-/Toneffekten aus einem Textprompt oder Referenzbild erstellen	Text-/Bild-Prompt	Video + Audio	0,75 $ pro Sekunde
Veo 2	Videogenerierung	Videos aus einem Textprompt oder Referenzbild generieren	Text-/Bild-Prompt	Video	0,50 $/Sekunde
Veo 2	Erweiterte Einstellungen	Videos durch Interpolation von Anfangs- und Endbild erstellen, generierte Videos verlängern und Kamerasteuerungen anwenden	Text-/Bild-/Video-Prompt	Video	0,50 $/Sekunde

Lyria

Lyria 2 bietet eine hochwertige Musikgenerierung für Instrumentalmusik, die sich ideal für anspruchsvolle Kompositionen und detaillierte kreative Erkundungen eignet, bei denen eine differenzierte Ausgabe im Vordergrund steht.

Modell	Funktion	Beschreibung	Eingabe	Ausgabe	Preis
Lyria 2	Musikgenerierung	Musik aus einem Text-Prompt generieren	Text-Prompt	Musik	0,06 $ pro 30 Sekunden

Einbettungskosten für KI-Anwendungen

Modell	Typ	Region	Preis pro 1.000 Eingabe-Token
Einbetten von Gemini	Eingabe	Global	Onlineanfragen: 0,00015 $ Batchanfragen: 0,00012 $
Einbetten von Gemini	Ausgabe	Global	Onlineanfragen: kostenlos Batchanfragen: kostenlos

Modell	Typ	Region	Preis pro 1.000 Zeichen
Einbettungen für Text (ohne Gemini-Einbettung)	Eingabe	Global	Onlineanfragen: 0,000025 $ Batchanfragen: 0,00002 $
Einbettungen für Text (ohne Gemini-Einbettung)	Ausgabe	Global	Onlineanfragen: kostenlos Batchanfragen: kostenlos

Modell	Feature	Beschreibung	Eingabe	Ausgabe	Preis
Multimodale Einbettung	Einbettungen für multimodale Attribute: Text	Einbettungen mit Text als Eingabe generieren	Text	Einbettungen	0,0002 $ pro 1.000 Zeichen Eingabe
	Einbettungen für multimodale Ausdrücke: Bild	Einbettungen mit Bild als Eingabe generieren	Bild	Einbettungen	0,0001 $ pro Bildeingabe
	Einbettungen für multimodal: Video Plus	Video Plus	Video	Einbettungen (bis zu 15 Einbettungen pro Minute Video)	0,0020 $ pro Sekunde Video
	Einbettungen für multimodale Ausdrücke: Video-Standard	Video – Standard	Video	Einbettungen (bis zu 8 Einbettungen pro Minute Video)	0,0010 $ pro Sekunde Video
	Einbettungen für multimodale Ausdrücke: Video – Grundlegend	Video Essentials	Video	Einbettungen (bis zu 4 Einbettungen pro Minute Video)	0,0005 $ pro Sekunde Video

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Preise für Codevervollständigung in Vertex AI

Die Generative AI in Vertex AI wird nach 1.000 Zeichen Eingabe (Eingabeaufforderung) und 1.000 Zeichen Ausgabe (Antwort) abgerechnet. Alle Zeichen werden durch UTF-8-Codepunkte gezählt. Leerzeichen werden nicht berücksichtigt. Während der Vorschauphase werden Gebühren zu 100 % reduziert. Vorhersageanfragen, die zu gefilterten Antworten führen, werden nur für die Eingabe abgerechnet. Am Ende jedes Abrechnungszeitraums werden Brüche von einem Cent (0,01 $) auf einen Cent aufgerundet.

Modell	Typ	Region	Preis pro 1.000 Zeichen
Codey für Codevervollständigung	Eingabe	Global	Onlineanfragen: 0,00025 $
Codey für Codevervollständigung	Ausgabe	Global	Onlineanfragen: 0,0005 $

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.

Übersetzung (Text)

Verwenden Sie die Vertex AI API und Translation LLM, um Text zu übersetzen. LLM-Übersetzungen klingen im Vergleich zu klassischen Übersetzungsmodellen oft natürlicher und flüssiger, bieten aber eine eingeschränktere Sprachunterstützung (Weitere Informationen).

Modell	Methode	Nutzung	Preis pro 1 Million Zeichen
LLM	Textübersetzung^*	Die Anzahl der Eingabezeichen pro Monat	10 $ pro 1 Million Zeichen^*
	Textübersetzung^*	Anzahl der Ausgabezeichen pro Monat	10 $ pro 1 Million Zeichen^*

Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
^* Der Preis bezieht sich auf die Anzahl der vom Modell verarbeiteten Zeichen. Weitere Informationen zu gezählten Zeichen finden Sie unter Gebührenpflichtige Zeichen.

Kosten mit dem Kontext-Caching von Vertex AI optimieren

Mit dem Kontext-Caching können Sie die Kosten für die Verarbeitung von Gemini-Eingabetoken um 75% und die Latenzzeit bei der Inhaltserstellung reduzieren, indem Sie den Kontextteil Ihres Eingabetexts oder -mediums in Gemini-Modellen zwischenspeichern. Die Kosten für den Kontext-Cache-Speicher werden durch die Zeit bestimmt, die Daten im Cache gespeichert werden. Diese Zeit kann vom Nutzer festgelegt werden. Beim Erstellen eines zwischengespeicherten Kontexts werden den Nutzern die Kosten für ein Standard-Eingabetoken in Rechnung gestellt. Cache-Treffer bei Eingabedaten werden mit einem reduzierten Satz, „Cached Input“, anstatt mit den normalen Eingabekosten berechnet. Die Datengröße für Speicher und Eingabe wird auf dieselbe Weise berechnet wie die Preise für Gemini-Eingabe.

Gemini 2.5-Modelle

Modell	Funktion	Typ	Preis (pro 1 Mio. Tokens) <= 200.000 Eingabetokens	Preis (pro 1 Mio. Tokens) > 200.000 Eingabetokens
Gemini 2.5 Pro	Zwischengespeicherte Eingabe	Eingabe (Text, Bild, Video, Audio)	0,31 $ (pro 1 Mio.Tokens)	0,625 $ (pro 1 Mio.Tokens)
		Ausgabe	–	–
	Kontextcache-Speicher	Eingabe (Text, Bild, Video, Audio)	4,50 $ (/M Tok/Stunde)	4,50 $ (/M Tok/Stunde)
Gemini 2.5 Flash	Zwischengespeicherte Eingabe	Eingabe (Text, Bild, Video, Audio)	0,0375 $ (pro 1 Mio.Tokens)	0,0375 $ (pro 1 Mio.Tokens)
		Ausgabe	–	–
	Kontextcache-Speicher	Eingabe (Text, Bild, Video, Audio)	1 $ (/M Tok/h)	1 $ (/M Tok/h)

Gemini 2.0-Modelle

Tokenbasierte Preise

Modell	Typ	Speicherplatz (Mio. Tok-Stunden)	Preis
Gemini 2.0 Flash
	1 Mio. Eingabetokens	1,00 $	0,0375 $
	1 Mio. Eingabeaudio-Tokens	1,00 $	0,25 $
	1 Mio. Ausgabetext-Tokens	–	–
Gemini 2.0 Flash Lite
	1 Mio. Eingabetokens	1,00 $	0,01875 $
	1 Mio. Eingabeaudio-Tokens	1,00 $	0,01875 $
	1 Mio. Ausgabetext-Tokens	–	–

Modalitätsbasierte Preise

Die unten aufgeführten Modalitätspreise basieren auf durchschnittlichen Anwendungsfällen und dienen nur der Orientierung. Die tatsächliche Abrechnung erfolgt nur auf der Grundlage von Tokens:

4 Zeichen ergeben ungefähr 1 Texttoken einschließlich Leerzeichen.

Für ein Bild mit 1024 × 1024 Pixeln werden 1.290 Token verbraucht. Die Anzahl der Tokens pro Bild variiert je nach Bildauflösung. Weitere Informationen zur Berechnung von Tokens finden Sie in unserer Dokumentation.

Der Videoeingang verbraucht bei einer Abtastrate von einem Frame pro Sekunde 258 Token pro Sekunde. Video mit Audiorechnungen für Video- und Audio-Token.

Audioeingaben verbrauchen ohne Zeitstempel 25 Token pro Sekunde.

Modell	Typ	Speicher (Modality-Stunde)	Preis
Gemini 2.0 Flash
	Text eingeben ($/Mio. Zeichen)	0,25 $	0,009375 $
	Eingabebild ($/Bild)	0,00129 $	0,000048375 $
	Eingabevideo ($/Sek.)	0,000258 $	0,000009675 $
	Eingabeaudio ($/Sek.)	0,000025 $	0,00000625 $
	Ausgabetext ($/Mio. Zeichen)	–	–
Gemini 2.0 Flash Lite
	Text eingeben ($/Mio. Zeichen)	0,25 $	0,0046875 $
	Eingabebild ($/Bild)	0,00129 $	0,0000241875 $
	Eingabevideo ($/Sek.)	0,000258 $	0,000009675 $
	Eingabeaudio ($/Sek.)	0,000258 $	0,0000048375 $
	Ausgabetext ($/Mio. Zeichen)	–	–
Fundierung mit der Google Suche	Gemini 2.0 Flash umfasst bis zu 1.500 Grounded-Anfragen pro Tag ohne Aufpreis. Für Grounded-Anfragen ,die 1.500 pro Tag überschreiten,wird ein Betrag von 35 $pro 1.000 Anfragen berechnet (bis zu 1 Million Anfragen pro Tag). Wenn Sie mehr als 1 Million Anfragen pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team.
Web Grounding für Unternehmen	45 $ pro 1.000 Anfragen (bis zu 1 Million Anfragen pro Tag) ab dem 5. Mai 2025. Wenn Sie mehr als 1 Million Anfragen pro Tag benötigen, wenden Sie sich bitte an Ihr Account-Management-Team.

* Preise sind in US-Dollar ($) angegeben. Wenn Sie in einer anderen Währung als US-Dollar bezahlen, gelten die Preise, die unter Cloud Platform SKUs für Ihre Währung angegeben sind.
* PDFs werden als Bildeingaben abgerechnet, wobei eine PDF-Seite einem Bild entspricht.
* Für den Endpunkt des abgestimmten Modells wird derselbe Preis für Vorhersagen wie für das Basismodell berechnet.
* Die Funktion „Grounding“ in der Google Suche wird nur für Anfragen abgerechnet, die Ergebnisse mit mindestens einer URL für Grounding-Unterstützung aus dem Web enthalten. Es gelten auch die üblichen Nutzungsgebühren für das Gemini-Modell.

Bereitgestellter Durchsatz

Bereitgestellter Durchsatz gewährleistet den Durchsatz für Ihre Anforderungen an Generative AI und wird über Skalierungseinheiten der Generative AI (GSU) abgewickelt. Weitere Informationen dazu, wie viel Durchsatz jede GSU bietet, finden Sie hier und mit unserem Online-Schätzer können Sie die Leistung Ihrer GSU-Konfiguration ermitteln.

Dauer	Preis pro GSU	Pro
1 Woche Commit	1.200 $	Woche
Mindestlaufzeit: 1 Monat	2.700 $	Monat
3-Monats-Verpflichtung	2.400 €	Monat
Zusicherung für 1 Jahr	2.000 $	Monat

Beispiel für die Kostenberechnung

Ein Nutzer muss sicherstellen,dass er 10 Abfragen pro Sekunde (QPS) einer Abfrage mit einer Eingabe von 1.000 Text-Tokens und 500 Audio-Tokens unterstützt und eine Ausgabe von 300 Text-Tokens mithilfe von gemini-2.0-flash erhält.

Aus der Tabelle mit Durchsatz und Burndown-Rate für gemini-2.0-flash geht hervor, dass die Burndown-Rate eines Eingabetext-Tokens 1 Token beträgt, die eines Eingabeaudio-Tokens 7 Token und die eines Ausgabetext-Tokens 4 Token.

Die Gesamtzahl der Eingabetokens des Nutzers beträgt 1.000* (1 Token pro Eingabetext-Token) + 500* (7 Token pro Eingabeaudio-Token) = 4.500 angepasste Eingabetokens. Die Gesamtzahl der Ausgabetokens des Nutzers beträgt 300* (4 Tokens pro Ausgabetexttoken) = 1.200 angepasste Ausgabetokens. Zusammen ergibt das 4.500 Input-Token nach Burndown-Anpassung + 1.200 Output-Token nach Burndown-Anpassung = 5.700 Token pro Abfrage.

Wenn wir die Gesamtzahl der Token pro Abfrage mit der Anzahl der Abfragen pro Sekunde multiplizieren, erhalten wir 5.700 Gesamt-Token pro Abfrage * 10 Abfragen pro Sekunde = 57.000 Gesamt-Token pro Sekunde.

Dividiert man dies durch den Gesamtdurchsatz pro Sekunde pro GSU,erhält man 57.000 Token pro Sekunde ÷ 3.360 Durchsatz pro Sekunde pro GSU = 16,96 GSUs. Die Mindestkaufsteigerung für dieses Modell beträgt 1 GSU, sodass der Nutzer 17 GSUs benötigt.

Wenn der Nutzer diesen Durchsatz eine Woche lang aufrechterhalten möchte, würde das 1.200 $ * 17 GSUs = 20.400 $pro Woche kosten. Wenn sie diesen Durchsatz einen Monat lang aufrechterhalten wollten, würde das 2.700 $ * 17 GSUs = 45.900 $pro Monat kosten. Wenn sie diesen Durchsatz drei Monate lang aufrechterhalten wollten, würde das 2.400 $ * 17 GSUs = 40.800 $pro Monat kosten. Wenn das Unternehmen diesen Durchsatz ein Jahr lang aufrechterhalten möchte, würde das 2.000 $ * 17 GSUs = 34.000 $pro Monat kosten.

Preise für Partnermodelle auf Vertex AI vergleichen

Partnermodelle sind eine ausgewählte Liste generativer KI-Modelle, die von Google-Partnern entwickelt wurden. Partnermodelle werden als verwaltete APIs angeboten. Weitere Informationen finden Sie unter Partnermodelle – Übersicht. In den folgenden Abschnitten finden Sie die Preisdetails für Google-Partnermodelle.

Modelle von AI21 Lab

Modell	Preise
Jamba 1.5 Large	Eingabe: 2 $ pro Million Tokens Ausgabe: 8 $ pro Million Tokens
Jamba 1.5 Mini	Eingabe: 0,20 $ / Million Token Ausgabe: 0,40 $ / Million Token

Claude-Modelle von Anthropic

Modell	Preise
Claude Opus 4	Eingabe: 15 $ pro Million Token Ausgabe: 75 $ pro Million Token Batch-Eingabe: 7,50 $ pro Million Token Batch-Ausgabe: 37,50 $ pro Million Token Cache-Schreibvorgang: 18,75 $ pro Million Token Cache-Treffer: 1,50 $ pro Million Token Batch-Cache-Schreibvorgang: 9,375 $ pro Million Token Batch-Cache-Treffer: 0,75 $ pro Million Token
Claude Sonnet 4	Eingabe: 3 $ pro Million Token Ausgabe: 15 $ pro Million Token Batch-Eingabe: 1,50 $ pro Million Token Batch-Ausgabe: 7,50 $ pro Million Token Cache-Schreibvorgang: 3,75 $ pro Million Token Cache-Treffer: 0,30 $ pro Million Token Batch-Cache-Schreibvorgang: 1,875 $ pro Million Token Batch-Cache-Treffer: 0,15 $ pro Million Token
Claude 3.7 Sonnet	Eingabe: 3 $ pro Million Token Ausgabe: 15 $ pro Million Token Batch-Eingabe: 1,50 $ pro Million Token Batch-Ausgabe: 7,50 $ pro Million Token Cache-Schreibvorgang: 3,75 $ pro Million Token Cache-Treffer: 0,30 $ pro Million Token Batch-Cache-Schreibvorgang: 1,875 $ pro Million Token Batch-Cache-Treffer: 0,15 $ pro Million Token
Claude 3.5 Haiku	Eingabe: 0,80 $ / Million Token Ausgabe: 4 $ / Million Token Batch-Eingabe: 0,40 $ / Million Token Batch-Ausgabe: 2 $ / Million Token Cache-Schreibvorgang: 1 $ / Million Token Cache-Treffer: 0,08 $ / Million Token Batch-Cache-Schreibvorgang: 0,50 $ / Million Token Batch-Cache-Treffer: 0,04 $ / Million Token
Claude 3.5 Sonnet v2	Eingabe: 3 $ pro Million Token Ausgabe: 15 $ pro Million Token Batch-Eingabe: 1,50 $ pro Million Token Batch-Ausgabe: 7,50 $ pro Million Token Cache-Schreibvorgang: 3,75 $ pro Million Token Cache-Treffer: 0,30 $ pro Million Token Batch-Cache-Schreibvorgang: 1,875 $ pro Million Token Batch-Cache-Treffer: 0,15 $ pro Million Token
Claude 3.5 Sonett	Eingabe: 3 $ pro Million Token Ausgabe: 15 $ pro Million Token Cache-Write: 3,75 $ pro Million Token Cache-Hit: 0,30 $ pro Million Token
Claude 3 Haiku	Eingabe: 0,25 $ / Million Token Ausgabe: 1,25 $ / Million Token Cache-Schreibvorgang: 0,30 $ / Million Token Cache-Treffer: 0,03 $ / Million Token
Claude 3 Sonnet (deprecated)	Eingabe: 3 $ pro Million Tokens Ausgabe: 15 $ pro Million Tokens
Claude 3 Opus	Eingabe: 15 $ / Million Token Ausgabe: 75 $ / Million Token Cache-Schreibvorgang: 18,75 $ / Million Token Cache-Treffer: 1,50 $ / Million Token

Llama-Modelle von Meta

Modell	Preise
Llama 3.1 405B	Eingabe: 5,00 $ pro Million Tokens Ausgabe: 16,00 $ pro Million Tokens
Llama 3.3 70 Mrd. *	Eingabe: 0,72 $ / Million Token Ausgabe: 0,72 $ / Million Token
Llama 4 Scout *	Eingabe: 0,25 $ / Million Tokens Ausgabe: 0,70 $ / Million Tokens
Llama 4 Maverick *	Eingabe: 0,35 $ / Million Tokens Ausgabe: 1,15 $ / Million Tokens

Kostenlos verfügbar bis 1. Mai 2025.

Mistral AI-Modelle

Modell	Preise
Mistral OCR (25.05)	Eingabe: 0,0005 $ / Million Tokens (oder 0,0005 $/Seite) Ausgabe: 0,0005 $ / Million Tokens (oder 0,0005 $/Seite)
Mistral Small 3.1 (25.03)	Eingabe: 0,10 $ / Million Tokens Ausgabe: 0,30 $ / Million Tokens
Mistral Large (24.11)	Eingabe: 2,00 $ / Million Tokens Ausgabe: 6,00 $ / Million Tokens
Mistral Nemo	Eingabe: 0,15 $ / Million Tokens Ausgabe: 0,15 $ / Million Tokens
Codestral (25.01.)	Eingabe: 0,30 $ / Million Tokens Ausgabe: 0,90 $ / Million Tokens

Individuelles Angebot einholen

Mit den „Pay as you go“-Preisen von Google Cloud bezahlen Sie nur für die Dienste, die Sie nutzen. Wenden Sie sich an unser Vertriebsteam, wenn Sie ein individuelles Angebot für Ihr Unternehmen erhalten möchten.

Vertrieb kontaktieren