Reservierungen mit Vertex AI Workbench-Instanzen verwenden
In diesem Dokument wird beschrieben, wie Sie Compute Engine-Reservierungen verwenden, um sicherzustellen, dass Ihre Vertex AI Workbench-Instanzen über genügend VM-Ressourcen verfügen, um ausgeführt zu werden.
Reservierungen sind eine Compute Engine-Funktion. Sie sorgen dafür, dass Sie die Ressourcen haben, um VMs mit derselben Hardware (Arbeitsspeicher und vCPUs) und optionalen Ressourcen (GPUs und lokale SSD-Laufwerke) zu erstellen, wann immer Sie sie benötigen.
Wenn Sie eine Reservierung erstellen, prüft Compute Engine, ob die angeforderte Kapazität in der angegebenen Zone verfügbar ist. Wenn ja, reserviert Compute Engine die Ressourcen, erstellt die Reservierung und es passiert Folgendes:
Die reservierten Ressourcen stehen Ihnen sofort zur Verfügung und bleiben so lange verfügbar, bis Sie die Reservierung löschen.
Die reservierten Ressourcen werden bis zum Löschen der Reservierung zum gleichen On-Demand-Tarif wie laufende VMs berechnet, einschließlich aller anwendbaren Rabatte. Während der Nutzung einer Reservierung fallen für eine VM keine doppelten Ressourcengebühren an, da der Reservierung die Kosten für die reservierten Ressourcen bereits in Rechnung gestellt werden. Weitere Informationen finden Sie unter Zonale Reservierungen von Compute Engine-Ressourcen.
Beschränkungen und Anforderungen
Alle Einschränkungen von Compute Engine-Reservierungen gelten, wenn Vertex AI Workbench-Instanzen Reservierungen aufnehmen. Siehe Funktionsweise von Reservierungen.
Wenn Sie Reservierungen mit Vertex AI Workbench-Instanzen verwenden, gelten außerdem die folgenden Einschränkungen und Anforderungen:
Ihre Reservierung muss eine der folgenden sein:
- Im selben Projekt wie Ihre Vertex AI Workbench-Instanz.
- Sie werden für dasselbe Projekt freigegeben wie Ihre Vertex AI Workbench-Instanz.
Die VM-Attribute einer Reservierung müssen genau mit Ihrer Vertex AI Workbench-Instanz übereinstimmen, damit die Reservierung verwendet werden kann. Wenn in einer Reservierung beispielsweise der Maschinentyp
e2-standard-8
angegeben ist, kann die Vertex AI Workbench-Instanz die Reservierung nur nutzen, wenn sie ebenfalls den Maschinentype2-standard-8
verwendet. Weitere Informationen zu den Anforderungen
Hinweise
- Informationen zu den Anforderungen und Einschränkungen für Reservierungen
- Informationen zu den Kontingentanforderungen und -einschränkungen für freigegebene Reservierungen.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
Compute-Administrator (
roles/compute.admin
) -
Notebooks-Administrator (
roles/notebooks.admin
) PROJECT_ID
: Ihre Projekt-ID.LOCATION
: Zone, in der sich Ihre Instanz befindet.INSTANCE_NAME
: durch den Namen der InstanzMACHINE_TYPE
: den Maschinentyp Ihrer InstanzRESERVATION_TYPE
: der Reservierungstyp; mussRESERVATION_ANY
oderRESERVATION_SPECIFIC
seinRESERVATION_NAME
: der Name Ihrer Reservierung, wenn Sie den TypRESERVATION_SPECIFIC
verwenden- Bei Reservierungen im selben Projekt können Sie die Reservierungs-ID verwenden.
- Für Reservierungen in einem anderen Projekt müssen Sie den vollständigen Reservierungspfad verwenden.
Die Compute Engine-Ressourcen, einschließlich aller anwendbaren Rabatte für zugesicherte Nutzung (Committed Use Discount, CUD), zu Compute Engine-Preisen. Diese Gebühren haben das Label
goog-vertex-ai-product: workbench-instances
für die SKU. Weitere Informationen finden Sie unter Compute Engine-Preise.Zusätzlich zur Nutzung der Infrastruktur fallen die in den nachstehenden Tabellen aufgeführten Gebühren für die Verwaltung von Vertex AI Workbench an. Weitere Informationen finden Sie unter Vertex AI Workbench-Preise.
- Weitere Informationen zu Compute Engine-Reservierungen finden Sie unter Reservierungen von zonalen Compute Engine-Ressourcen.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zur Verwendung von Reservierungen mit Vertex AI Workbench-Instanzen benötigen:
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Reservierung erstellen
Erstellen Sie eine Compute Engine-Reservierung. Es kann sich um eine Reservierung für ein einzelnes Projekt oder eine freigegebene Reservierung handeln. Weitere Informationen finden Sie in folgenden Dokumenten:
Die Reservierung kann GPU-Beschleuniger enthalten.
Reservierung mit einer neuen Instanz verwenden
Sie können Ihre Reservierung beim Erstellen einer neuen Vertex AI Workbench-Instanz mithilfe der REST API hinzufügen.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
HTTP-Methode und URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
JSON-Text der Anfrage:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Reservierung nicht mehr verwenden
Wenn Sie Ihre Reservierung nicht mehr verwenden möchten, können Sie sie löschen.
Wenn Sie Ihre Reservierung weiterhin mit anderen Ressourcen verwenden möchten, sie aber nicht von Ihrer vorhandenen Vertex AI Workbench-Instanz verwendet werden soll, müssen Sie die Instanz löschen.
Abrechnung
Wenn Sie eine Compute Engine-Reservierung nutzen, werden Ihnen folgende Kosten in Rechnung gestellt:
Fehlerbehebung
Methoden zur Diagnose und Behebung von Fehlern im Zusammenhang mit der Verwendung von Reservierungen mit Vertex AI Workbench-Instanzen finden Sie unter Fehlerbehebung bei Vertex AI Workbench-Instanzen.