Was Sie vor dem Kauf beachten sollten
Folgende Aspekte können Ihnen bei der Entscheidung helfen, ob Sie Provisioned Throughput erwerben möchten:
Sie können Ihre Bestellung nicht während der Laufzeit stornieren.
Der Kauf von Provisioned Throughput ist eine Zusicherung. Das bedeutet, dass Sie die Bestellung nicht während der Laufzeit stornieren können. Sie können jedoch die Anzahl der gekauften GSUs erhöhen. Wenn Sie versehentlich eine Zusicherung erwerben oder ein Problem mit Ihrer Konfiguration vorliegt, wenden Sie sich bitte an IhrenGoogle Cloud Kundenbetreuer.
Sie können Ihr Abo automatisch verlängern lassen.
Wenn Sie Ihre Bestellung aufgeben, können Sie festlegen, dass Ihr Abo am Ende der Laufzeit automatisch verlängert wird, oder es auslaufen lassen. Sie können die automatische Verlängerung abbrechen. Wenn Sie Ihr Abo kündigen möchten, bevor es automatisch verlängert wird, müssen Sie die automatische Verlängerung 30 Tage vor Beginn des nächsten Abozeitraums kündigen.
Sie können monatliche Abos so konfigurieren, dass sie jeden Monat automatisch verlängert werden. Bei wöchentlichen Laufzeiten ist keine automatische Verlängerung möglich.
Weitere Informationen finden Sie unter Bestellten Durchsatzauftrag ändern. Sie können sich auch an Ihren Google Cloud Account Manager wenden.
Sie können das automatische Verlängerungsverhalten, das Modell, die Modellversion oder die Region innerhalb einer Frist ändern.
Nachdem Sie das Projekt, die Region, das Modell, die Modellversion und das automatische Verlängerungsverhalten ausgewählt haben und Ihre Bestellung genehmigt und aktiviert wurde, wird Provisioned Throughput aktiviert, sofern die Kapazität verfügbar ist. Sie können das Verhalten der automatischen Verlängerung, das Modell oder die Modellversion über die Google Cloud Console ändern. Dort können Sie auch Ihre bestehende Bestellung ändern. Weitere Informationen finden Sie unter Bestellten Durchsatzauftrag ändern.
Wenn Sie Ihre Region ändern möchten, wenden Sie sich bitte an Ihren Google Cloud Kundenbetreuer. Möglicherweise ist eine neue Bestellung mit einem neuen Ablaufdatum erforderlich.
Alle Änderungen werden nach dem Best-Effort-Prinzip bearbeitet und normalerweise innerhalb von 10 Arbeitstagen nach der ursprünglichen Anfrage ausgeführt.
Modelländerungen sind auf einen bestimmten Verlag beschränkt. Sie können beispielsweise die Modellzuweisung für den bereitgestellten Durchsatz von Google Gemini 2.0 Pro zu Google Gemini 2.0 Flash ändern, aber nicht von Google Gemini 2.0 Flash zu Claude 3.5 Sonnet v2 von Anthropic.
Standardmäßig wird die Überschreitung als „Pay-as-you-go“ abgerechnet.
Wenn Ihr Durchsatz den bestellten Betrag für Provisioned Throughput übersteigt, werden Überschreitungen verarbeitet und als standardmäßige „Pay-as-you-go“-Abrechnung abgerechnet. Sie können Überschreitungen pro Anfrage steuern. Weitere Informationen finden Sie unter Vorab bereitgestellten Durchsatz verwenden.
Provisioned Throughput für eine Woche kaufen
Anstatt eines Monatsabos können Sie einen bereitgestellten Durchsatz für einen Zeitraum von einer Woche erwerben. Sie können dann nach dem Einreichen des Antrags auf Zugriffssteuerung für bereitgestellten Durchsatz ein Startdatum innerhalb von zwei Wochen in der Zukunft angeben.
Informationen zu den Preisen finden Sie unter Vorab bereitgestellter Durchsatz.
Rollen und Berechtigungen
Die folgende Rolle gewährt vollen Zugriff auf die Verwaltung des über Vertex AI bereitgestellten Durchsatzes:
roles/aiplatform.provisionedThroughputAdmin
: Sie können auf Vertex AI-Ressourcen mit bereitgestelltem Durchsatz zugreifen.
Diese Rolle umfasst die folgenden Berechtigungen:
Berechtigungen | Beschreibung |
---|---|
aiplatform.googleapis.com/provisionedThroughputs.create |
Reichen Sie eine neue Bestellung für Provisioned Throughput ein. |
aiplatform.googleapis.com/provisionedThroughputs.get |
Eine bestimmte Bestellung für Provisioned Throughput ansehen |
aiplatform.googleapis.com/provisionedThroughputs.list |
Alle Bestellungen für Provisioned Throughput ansehen |
aiplatform.googleapis.com/provisionedThroughputs.update |
Eine Bestellung für Provisioned Throughput ändern |
aiplatform.googleapis.com/provisionedThroughputs.cancel |
Sie können eine ausstehende Bestellung oder ein ausstehendes Update stornieren. |
Provisioned Throughput bestellen
Einige Imagen-Funktionen sind möglicherweise nicht öffentlich verfügbar. Weitere Informationen finden Sie unter Eingeschränkte GA- und Vorschau-Features.
Bevor Sie eine Bestellung für MedLM-large-1.5 aufgeben, wenden Sie sich an Ihren Google Cloud Account Manager, um Zugriff anzufordern. Wenn Ihr QPM-Wert voraussichtlich 30.000 überschreitet, können Sie für das Vertex AI-Standardsystemkontingent eine Erhöhung anfordern und so Ihre Bestellung von bereitgestelltem Durchsatz maximieren. Verwenden Sie dafür folgende Informationen:
- Dienst: Die Vertex AI API.
- Name:
Online prediction requests per minute per region
- Diensttyp: Ein Kontingent.
- Dimensionen: Die Region, in der Sie bereitgestellten Durchsatz bestellt haben.
- Wert: Dies ist das von Ihnen ausgewählte Limit für den Onlinevorhersagetraffic.
Bestellungen für bereitgestellten Durchsatz werden basierend auf der Größe der Bestellung und der verfügbaren Kapazität verarbeitet. Je nach Anzahl der angeforderten GSUs und der verfügbaren Kapazität kann die Bearbeitung Ihrer Bestellung einige Minuten bis einige Wochen dauern.
So kaufen Sie Provisioned Throughput:
Console
- Rufen Sie in der Google Cloud Console die Seite „Bereitgestellter Durchsatz“ auf.
- Klicken Sie auf Neue Bestellung, um eine neue Bestellung zu starten.
- Geben Sie den Namen einer Bestellung ein.
- Wählen Sie das Modell aus.
- Wählen Sie die Region aus.
Geben Sie die Anzahl der Skalierungseinheiten der generativen KI (GSUs) ein, die Sie erwerben müssen.
Optional: Mit dem Schätzungstool für Skalierungseinheiten der generativen KI können Sie die Anzahl der benötigten Skalierungseinheiten der generativen KI schätzen. So verwenden Sie dieses Tool:
- Klicken Sie auf Schätztool.
- Wählen Sie Ihr Modell aus.
Geben Sie je nach ausgewähltem Modell die Details ein, um die benötigte Anzahl von GSUs zu schätzen.
Geben Sie für Gemini 2.0-Modelle Folgendes ein:
- Geschätzte Anzahl der Anfragen pro Sekunde, die eine Zusicherung erfordern
- Eingabetokens pro Abfrage
- Eingabebildtokens pro Anfrage
- Eingabevideotokens pro Anfrage
- Eingabeaudiotokens pro Anfrage
- Ausgabetexttokens pro Anfrage
Geben Sie für Imagen-Modelle Folgendes ein:
- Abfragen pro Sekunde
- Bilder pro Abfrage ausgeben
Wenn Sie die Werte verwenden möchten, die Sie in das Schätzungstool eingegeben haben, klicken Sie auf Berechnung verwenden.
Wählen Sie die Laufzeit aus. Folgende Optionen sind verfügbar:
- 1 Woche (in der nicht öffentlichen Vorabversion verfügbar)
- 1 Monat
- 3 Monate
- 1 Jahr
Optional: Wählen Sie das Startdatum und die Startzeit für den Zeitraum aus (Vorabversion).
Sie können ein Startdatum und eine Startzeit innerhalb von zwei Wochen nach der Bestellung angeben. Wenn Sie kein Startdatum und keine Startzeit angeben, wird die Bestellung sobald die Kapazität verfügbar ist verarbeitet. Die Bearbeitung der gewünschten Startdaten und ‑zeiten erfolgt auf Best-Effort-Basis. Es kann nicht garantiert werden, dass Bestellungen bis zu diesen Terminen erfüllt sind. Dies ist erst dann sicher, wenn der Bestellstatus auf Genehmigt gesetzt ist.
Wenn das gewünschte Startdatum zu nah am aktuellen Datum liegt, wird Ihre Bestellung möglicherweise erst nach dem gewünschten Startdatum genehmigt und aktiviert. In diesem Fall wird das Enddatum basierend auf der Dauer des ausgewählten Zeitraums ab dem Aktivierungsdatum angepasst. Informationen zum Stornieren einer ausstehenden Bestellung finden Sie unter Bestellung für bereitgestellten Durchsatz ändern.
Geben Sie in der Liste Verlängerung an, ob der Auftrag am Ende der Laufzeit automatisch verlängert werden soll. Sie können die Verlängerungsoption nur angeben, wenn Sie 1 Monat, 3 Monate oder 1 Jahr als Laufzeit auswählen.
Klicken Sie auf Weiter.
Sehen Sie sich im Abschnitt Zusammenfassung die Preis- und Durchsatzschätzungen für Ihre Bestellung an. Lesen Sie die im Formular aufgeführten und verlinkten Nutzungsbedingungen.
Klicken Sie auf Bestätigen, um die Bestellung abzuschließen.
Je nach Größe der Bestellung und verfügbarer Kapazität kann die Bearbeitung einige Minuten bis einige Wochen dauern. Nach der Bearbeitung der Bestellung ändert sich ihr Status in der Google Cloud Console zu Aktiv. Die Bestellung wird Ihnen erst in Rechnung gestellt, wenn sie aktiv ist.
Bestellung für bereitgestellten Durchsatz ändern
In dieser Tabelle wird beschrieben, wie Sie Ihre Bestellungen für bereitgestellten Durchsatz über die Google Cloud Console entsprechend dem Status Ihrer Bestellung und den vorhandenen Bedingungen ändern können. Die Änderung von Bestellungen ist eine Vorschaufunktion und nur für Onlinebestellungen verfügbar, die über die Konsole aufgegeben wurden. Wenn Sie Änderungen an Offlinebestellungen vornehmen möchten, wenden Sie sich bitte an Ihren Google Cloud Kundenbetreuer.
Änderungen, die Sie mit der Google Cloud Console an Ihrem Modell oder Ihrer Modellversion vornehmen, wirken sich auch auf die bestehende Bestellung aus, wobei das Enddatum des Abos unverändert bleibt.
Bestellstatus | Aktion | Hinweis | Schritte in der Google Cloud Console |
---|---|---|---|
Überprüfung steht aus | Sie können Ihre Bestellung stornieren. |
Wenn Sie weitere Änderungen an Ihrer Bestellung vornehmen möchten, stornieren Sie die ausstehende Bestellung und geben Sie eine neue Bestellung auf. Wenn Sie mehrere Modelle haben, kann jedes Modell jeweils nur eine ausstehende Bestellüberprüfung oder eine ausstehende Bestellung haben. |
So stornierst du eine ausstehende Bestellung in der Google Cloud Console:
|
Aktiv |
Sie können die Anzahl der GSUs bei bestehenden Bestellungen erhöhen. Sie können automatische Verlängerungen aktivieren oder deaktivieren. Sie können das Modell oder die Modellversion ändern. |
Wenn diese beiden Bedingungen erfüllt sind, können Sie Ihre Bestellung nicht ändern:
|
So ändern Sie Ihre aktive Bestellung in der Google Cloud Console:
|
Bestellstatus prüfen
Nachdem Sie Ihre Bestellung für Provisioned Throughput eingereicht haben, kann der Bestellstatus einen der folgenden Werte haben:
- Überprüfung ausstehend: Sie haben Ihre Bestellung aufgegeben. Da die Genehmigung von der verfügbaren Kapazität für die Bereitstellung Ihrer Bestellung abhängt, wird Ihre Bestellung derzeit geprüft und genehmigt. Weitere Informationen zum Status Ihrer ausstehenden Bestellung erhalten Sie von Ihrem Google Cloud Kundenbetreuer.
- Genehmigt: Google hat Ihren Auftrag genehmigt.
- Aktiv: Google hat Ihre Bestellung aktiviert und die Abrechnung beginnt.
- Abgelaufen: Ihre Bestellung ist abgelaufen.
Bestellungen von Provisioned Throughput ansehen
So rufen Sie Ihre Bestellungen für Provisioned Throughput auf:
Console
- Rufen Sie in der Google Cloud Console die Seite „Bereitgestellter Durchsatz“ auf.
- Wählen Sie die Region aus. Ihre Bestellliste wird angezeigt.