Was Sie vor dem Kauf beachten sollten
Hier finden Sie einige Punkte, die Ihnen bei der Entscheidung helfen sollen, ob Sie Provisioned Throughput kaufen möchten:
Sie können Ihre Bestellung nicht mitten in der Laufzeit stornieren.
Der Kauf von Provisioned Throughput ist eine Zusicherung. Das bedeutet, dass Sie die Bestellung nicht während der Laufzeit stornieren können. Sie können jedoch die Anzahl der gekauften GSUs erhöhen. Wenn Sie versehentlich eine Zusicherung erworben haben oder ein Problem mit Ihrer Konfiguration vorliegt, wenden Sie sich an IhrenGoogle Cloud Kundenbetreuer.
Sie können Ihr Abo automatisch verlängern.
Wenn Sie Ihre Bestellung aufgeben, können Sie festlegen, dass Ihr Abo am Ende der Laufzeit automatisch verlängert wird oder ausläuft. Sie können die automatische Verlängerung kündigen. Wenn Sie Ihr Abo vor der automatischen Verlängerung kündigen möchten, müssen Sie die automatische Verlängerung 30 Tage vor Beginn des nächsten Zeitraums kündigen.
Sie können monatliche Abos so konfigurieren, dass sie sich jeden Monat automatisch verlängern. Wöchentliche Laufzeiten unterstützen keine automatische Verlängerung.
Weitere Informationen finden Sie unter Reihenfolge des bereitgestellten Durchsatzes ändern. Sie können sich auch an Ihren Google Cloud Kundenbetreuer wenden.
Sie können das Verhalten bei der automatischen Verlängerung, das Modell, die Modellversion oder die Region innerhalb einer Frist ändern.
Nachdem Sie Ihr Projekt, Ihre Region, Ihr Modell, Ihre Modellversion und das Verhalten bei automatischer Verlängerung ausgewählt haben und Ihre Bestellung genehmigt und aktiviert wurde, wird Provisioned Throughput aktiviert, sofern Kapazität verfügbar ist. Sie können das Verhalten bei der automatischen Verlängerung, das Modell, die Modellversion oder die Region ändern, indem Sie Ihre bestehende Bestellung für bereitgestellten Durchsatz über die Google Cloud Console ändern.
Alle Änderungen werden auf Best-Effort-Basis bearbeitet und in der Regel innerhalb von 10 Arbeitstagen nach der ursprünglichen Anfrage umgesetzt.
Modelländerungen sind auf einen bestimmten Publisher beschränkt. Sie können beispielsweise die Modellzuweisung von Provisioned Throughput von Google Gemini 2.0 Pro zu Google Gemini 2.0 Flash ändern, aber nicht von Google Gemini 2.0 Flash zu Claude 3.5 Sonnet v2 von Anthropic.
Standardmäßig wird die Überschreitung nach dem Pay-as-you-go-Modell abgerechnet.
Wenn Ihr Durchsatz den bestellten Bereitgestellten Durchsatz übersteigt, werden Überschreitungen verarbeitet und als standardmäßiges „Pay-as-you-go“ abgerechnet. Sie können Überschreitungen pro Anfrage steuern. Weitere Informationen finden Sie unter Bereitgestellten Durchsatz verwenden.
Informationen zu den Preisen finden Sie unter Bereitgestellter Durchsatz.
Provisioned Throughput für Modelle in der Vorabversion kaufen
Sie können bereitgestellten Durchsatz für Google-Modelle in der Vorabversion erwerben, sofern noch keine allgemein verfügbare Version des Modells veröffentlicht wurde.
Wenn Sie eine aktive Bestellung für bereitgestellten Durchsatz für ein Vorschau-Modell haben und eine allgemein verfügbare Version des Modells veröffentlicht wird, haben Sie folgende Möglichkeiten:
Stellen Sie die Bestellung auf die allgemein verfügbare Version des Modells um. Nachdem Sie Ihre Bestellung auf das allgemein verfügbare Modell umgestellt haben, können Sie sie nicht mehr auf das Vorschau-Modell zurückstellen. Weitere Informationen zum Ändern einer Bestellung finden Sie unter Bestellung für bereitgestellten Durchsatz ändern.
Alternativ können Sie den bereitgestellten Durchsatz für die Preview-Version eines Modells weiterhin verwenden, solange die Preview-Version stabil ist. Weitere Informationen zu stabilen und eingestellten Modellen finden Sie unter Modellversionen und Lebenszyklus.
Rollen und Berechtigungen
Die folgende Rolle gewährt vollständigen Zugriff zum Verwalten von über Vertex AI bereitgestelltem Durchsatz:
roles/aiplatform.provisionedThroughputAdmin
: Sie können auf Vertex AI Provisioned Throughput-Ressourcen zugreifen.
Diese Rolle umfasst die folgenden Berechtigungen:
Berechtigungen | Beschreibung |
---|---|
aiplatform.googleapis.com/provisionedThroughputs.create |
Geben Sie eine neue Bestellung für Provisioned Throughput auf. |
aiplatform.googleapis.com/provisionedThroughputs.get |
Eine bestimmte Bestellung von Provisioned Throughput ansehen |
aiplatform.googleapis.com/provisionedThroughputs.list |
Alle Bestellungen von Provisioned Throughput ansehen. |
aiplatform.googleapis.com/provisionedThroughputs.update |
Provisioned Throughput-Bestellung ändern |
aiplatform.googleapis.com/provisionedThroughputs.cancel |
Ausstehende Bestellungen oder Updates abbrechen |
Provisioned Throughput bestellen
Einige Imagen-Funktionen sind möglicherweise nicht öffentlich verfügbar. Weitere Informationen finden Sie unter Eingeschränkte GA- und Vorschau-Features.
Bevor Sie eine Bestellung für die Verwendung von MedLM-large-1.5 aufgeben, wenden Sie sich an Ihren Google Cloud Kundenbetreuer, um Zugriff anzufordern.
Wenn Ihr QPM-Wert voraussichtlich 30.000 überschreitet, können Sie für das Vertex AI-Standardsystemkontingent eine Kontingentanpassung anfordern und so Ihre Bestellung von bereitgestelltem Durchsatz maximieren. Verwenden Sie dafür folgende Informationen:
- Dienst: Die Vertex AI API.
- Name:
Online prediction requests per minute per region
- Diensttyp: Ein Kontingent.
- Dimensionen: Die Region, in der Sie bereitgestellten Durchsatz bestellt haben.
- Wert: Dies ist das von Ihnen ausgewählte Limit für den Onlinevorhersagetraffic.
Bestellungen für bereitgestellten Durchsatz werden basierend auf der Größe der Bestellung und der verfügbaren Kapazität verarbeitet. Je nach Anzahl der angeforderten GSUs und der verfügbaren Kapazität kann es einige Minuten bis einige Wochen dauern, bis Ihre Bestellung bearbeitet wird.
So kaufen Sie Provisioned Throughput:
Console
- Rufen Sie in der Google Cloud Console die Seite „Bereitgestellter Durchsatz“ auf.
- Wenn Sie eine neue Bestellung aufgeben möchten, klicken Sie auf Neue Bestellung.
- Geben Sie den Namen einer Bestellung ein.
- Wählen Sie das Modell aus.
- Wählen Sie die Region aus.
Geben Sie die Anzahl von Skalierungseinheiten der generativen KI (GSUs) ein, die Sie kaufen müssen.
Optional: Mit dem Schätzungstool für Skalierungseinheiten der generativen KI können Sie die Anzahl der benötigten GSUs schätzen. So verwenden Sie das Tool:
- Klicken Sie auf Schätztool.
- Wählen Sie Ihr Modell aus.
Geben Sie basierend auf dem ausgewählten Modell die Details ein, um die Anzahl der benötigten GSUs zu schätzen.
Geben Sie für die Gemini 2.5-Modelle Folgendes ein:
- Geschätzte Anzahl der Anfragen pro Sekunde, die eine Zusicherung erfordern
- Eingabetexttokens pro Anfrage
- Eingabebildtokens pro Anfrage
- Eingabevideotokens pro Anfrage
- Eingabeaudiotokens pro Anfrage
- Tokens für Ausgabeantworttext pro Anfrage
- Tokens für Ausgabebegründungstext pro Anfrage
Geben Sie für das Modell Gemini 2.5 Flash-Lite (Vorschau) Folgendes ein:
- Geschätzte Anzahl der Anfragen pro Sekunde, die eine Zusicherung erfordern
- Eingabetexttokens pro Anfrage
- Eingabebildtokens pro Anfrage
- Eingabevideotokens pro Anfrage
- Eingabeaudiotokens pro Anfrage
- Ausgabetexttokens pro Anfrage
Geben Sie für Gemini 2.0-Modelle Folgendes ein:
- Geschätzte Anzahl der Anfragen pro Sekunde, die eine Zusicherung erfordern
- Eingabetokens pro Anfrage
- Eingabebildtokens pro Anfrage
- Eingabevideotokens pro Anfrage
- Eingabeaudiotokens pro Anfrage
- Ausgabetexttokens pro Anfrage
Geben Sie für Imagen-Modelle Folgendes ein:
- Abfragen pro Sekunde
- Ausgabebilder pro Anfrage
Wenn Sie die Werte verwenden möchten, die Sie in das Schätzungstool eingegeben haben, klicken Sie auf Berechnung verwenden.
Wählen Sie die Laufzeit aus. Die Gebühren für die Laufzeit sind während der Laufzeit nicht kündbar und gelten unabhängig von der tatsächlichen Nutzung oder der Außerbetriebnahme des Modells. Google empfiehlt, das zugewiesene Modell vor seinem Datum der Außerbetriebnahme zu ändern. Die automatische Verlängerung für verworfene Modelle wird von Google nicht proaktiv beendet.
Folgende Optionen sind verfügbar:
- 1 Woche
- 1 Monat
- 3 Monate
- 1 Jahr
Optional: Wählen Sie das Startdatum und die Startzeit für den Zeitraum aus (Vorabversion).
Sie können ein Startdatum und eine Startzeit innerhalb von zwei Wochen nach der Bestellung angeben. Wenn Sie kein Startdatum und keine Startzeit angeben, wird die Bestellung verarbeitet, sobald die Kapazität verfügbar ist. Die Bearbeitung der gewünschten Startdaten und ‑zeiten erfolgt auf Best-Effort-Basis. Es kann nicht garantiert werden, dass Bestellungen bis zu diesen Terminen erfüllt sind. Dies ist erst dann sicher, wenn der Bestellstatus auf Genehmigt gesetzt ist.
Wenn das von Ihnen angegebene Startdatum zu nah am aktuellen Datum liegt, wird Ihre Bestellung möglicherweise erst nach dem von Ihnen angegebenen Startdatum genehmigt und aktiviert. In diesem Fall wird das Enddatum basierend auf der Dauer des ausgewählten Zeitraums ab dem Aktivierungsdatum angepasst. Informationen zum Abbrechen einer ausstehenden Bestellung finden Sie unter Bestellung für bereitgestellten Durchsatz ändern.
Geben Sie in der Liste Verlängerung an, ob der Auftrag am Ende der Laufzeit automatisch verlängert werden soll. Sie können die Verlängerungsoption nur angeben, wenn Sie 1 Monat, 3 Monate oder 1 Jahr als Laufzeit auswählen.
Klicken Sie auf Weiter.
Sehen Sie sich im Abschnitt Zusammenfassung die Preis- und Durchsatzschätzungen für Ihre Bestellung an. Lesen Sie die im Formular aufgeführten und verlinkten Bedingungen.
Klicken Sie auf Bestätigen, um die Bestellung abzuschließen.
Die Bearbeitung einer Bestellung kann je nach Bestellgröße und verfügbarer Kapazität einige Minuten bis einige Wochen dauern. Nachdem die Bestellung bearbeitet wurde, ändert sich ihr Status in der Google Cloud -Konsole in Aktiv. Die Bestellung wird erst abgerechnet, wenn sie aktiv wird.
Provisioned Throughput-Bestellung ändern
In dieser Tabelle wird beschrieben, wie Sie Ihre Bestellungen für bereitgestellten Durchsatz über die Google Cloud -Konsole ändern können, je nach Status Ihrer Bestellung und vorhandenen Bedingungen. Das Ändern von Bestellungen ist eine Vorschaufunktion und nur für Onlinebestellungen verfügbar, die über die Console aufgegeben wurden. Wenn Sie Änderungen an Offlinebestellungen vornehmen möchten, wenden Sie sich an Ihren Google Cloud Kundenbetreuer.
Wenn Sie das Modell oder die Modellversion über die Google Cloud Konsole ändern, wird die bestehende Bestellung geändert, das Ablaufdatum des Abos bleibt jedoch gleich.
Bestellstatus | Aktion | Hinweis | Schritte in der Google Cloud Console |
---|---|---|---|
Überprüfung steht aus | Sie können Ihre Bestellung stornieren. |
Wenn Sie weitere Änderungen an Ihrer Bestellung vornehmen möchten, stornieren Sie die ausstehende Bestellung und geben Sie eine neue Bestellung auf. Wenn Sie mehrere Modelle haben, kann für jedes Modell jeweils nur eine ausstehende Auftragsüberarbeitung oder ein ausstehender Auftrag vorhanden sein. |
So stornieren Sie Ihre ausstehende Bestellung in der Google Cloud -Konsole:
|
Genehmigt | Sie können Ihre Bestellung nicht ändern. | Die Bestellung wartet auf die Aktivierung. Derzeit können Sie keine Änderungen an Ihrer Bestellung vornehmen. | Nicht zutreffend |
Aktiv |
Die folgenden Änderungen können Sie nur vornehmen, wenn die Bestellung nicht innerhalb der nächsten fünf Tage abläuft oder sich automatisch verlängert:
|
Sie können eine aktive Bestellung nicht ändern, wenn sie in weniger als fünf Tagen abläuft und nicht für die automatische Verlängerung eingerichtet ist. | Wenn Sie Ihre aktive Bestellung in der Google Cloud Konsole ändern möchten, verwenden Sie eine der folgenden Methoden:
|
Bestellstatus prüfen
Nachdem Sie Ihre Bestellung für Provisioned Throughput eingereicht haben, kann der Bestellstatus einen der folgenden Werte haben:
- Überprüfung ausstehend: Sie haben Ihre Bestellung aufgegeben. Da die Genehmigung von der verfügbaren Kapazität zur Bereitstellung Ihrer Bestellung abhängt, wird Ihre Bestellung noch geprüft und genehmigt. Weitere Informationen zum Status Ihrer ausstehenden Bestellung erhalten Sie von Ihrem Google Cloud -Kundenbetreuer.
- Genehmigt: Google hat Ihre Bestellung genehmigt und sie wartet auf die Aktivierung. Nachdem die Bestellung genehmigt wurde, können Sie keine Änderungen mehr vornehmen.
- Aktiv: Google hat Ihre Bestellung aktiviert und die Abrechnung beginnt.
- Abgelaufen: Ihre Bestellung ist abgelaufen.
Bestellungen von Provisioned Throughput ansehen
So rufen Sie Ihre Bestellungen für Provisioned Throughput auf:
Console
- Rufen Sie in der Google Cloud Console die Seite „Bereitgestellter Durchsatz“ auf.
- Wählen Sie die Region aus. Ihre Bestellliste wird angezeigt.