Reservierung nutzen
Wenn Sie eine TPU-Reservierung haben, können Sie mit Ihren reservierten Ressourcen TPUs erstellen, die den Attributen der Reservierung entsprechen. Diese Aktion wird als Inanspruchnahme einer Reservierung bezeichnet. Informationen zum Verbrauch einer TPU-Reservierung bei Verwendung von GKE finden Sie in der GKE-Dokumentation unter TPU-Reservierung.
Eine bestimmte Reservierung nutzen
Wenn Sie Ressourcen mit dem Befehl gcloud alpha compute tpus queued-resources
create
erstellen, verwenden Sie das Flag --reservation
, um den Namen der zu verwendenden Reservierung anzugeben. Bei zukünftigen Reservierungen, die im Kalendermodus erstellt wurden, müssen Sie außerdem das --provisioning-model
-Flag auf reservation-bound
setzen:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reservation=RESERVATION_URL \ --provisioning-model=reservation-bound # Only required for calendar mode
Ersetzen Sie folgende Platzhaltervariablen:
- QUEUED_RESOURCE_ID: Eine vom Nutzer zugewiesene ID für die anstehende Ressourcenanfrage.
- TPU_NAME: Eine vom Nutzer zugewiesene ID (Name) für die TPU, die erstellt wird, wenn die anstehende Ressourcenanfrage zugewiesen wird.
- ZONE: Die Zone, in der die TPU-VM erstellt werden soll. Weitere Informationen zu unterstützten Zonen finden Sie unter Regionen und Zonen.
- ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
- SOFTWARE_VERSION: Die Softwareversion von Cloud TPU.
- RESERVATION_URL: Die URL der Reservierung. Geben Sie einen der folgenden Werte an:
- Wenn sich die Reservierung in Ihrem Projekt befindet:
RESERVATION_NAME
- Wenn sich die Reservierung in einem anderen Projekt befindet und Ihr Projekt sie nutzen kann:
projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME
- Wenn sich die Reservierung in Ihrem Projekt befindet:
Jede übereinstimmende Reservierung nutzen
Mit dem Flag --reserved
können Sie die zu verwendende Reservierung automatisch anhand des Accelerator-Typs, der Projekt-ID und der Zone bestimmen.
CreateNode
Wenn Sie mit der CreateNode API eine übereinstimmende Reservierung verwenden möchten, verwenden Sie den Befehl gcloud
alpha compute tpus tpu-vm create
mit dem Flag --reserved
:
gcloud alpha compute tpus tpu-vm create TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --version=SOFTWARE_VERSION \ --reserved
Ersetzen Sie folgende Platzhaltervariablen:
- TPU_NAME: Ein Name für die TPU.
- ZONE: Die Zone, in der die TPU-VM erstellt werden soll. Sie muss mit der Reservierungszone übereinstimmen.
- ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
- SOFTWARE_VERSION: Die Softwareversion von Cloud TPU.
Ressourcen in Warteschlange
Wenn Sie alle übereinstimmenden Reservierungen mit in der Warteschlange befindlichen Ressourcen nutzen möchten, verwenden Sie den Befehl gcloud alpha compute tpus
queued-resources create
mit dem Flag --reserved
:
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reserved
Ersetzen Sie folgende Platzhaltervariablen:
- QUEUED_RESOURCE_ID: Eine vom Nutzer zugewiesene ID für die anstehende Ressourcenanfrage.
- TPU_NAME: Eine vom Nutzer zugewiesene ID (Name) für die TPU, die erstellt wird, wenn die anstehende Ressourcenanfrage zugewiesen wird.
- ZONE: Die Zone, in der die TPU-VM erstellt werden soll und in der die Reservierung vorhanden ist.
- ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
- SOFTWARE_VERSION: Die Softwareversion von Cloud TPU.
Reservierungsnutzung prüfen
Sie können die Nutzung einer freigegebenen Reservierung nur über das Inhaberprojekt prüfen. Wenn Sie sich in einem Nutzerprojekt befinden, müssen Sie zum Inhaberprojekt wechseln, um die Reservierungsnutzung zu prüfen.
Mit dem Befehl gcloud compute
reservations describe
können Sie sehen, wie viel der Reservierung belegt ist:
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID --zone=ZONE
Ersetzen Sie folgende Platzhaltervariablen:
- RESERVATION_NAME: Der Name der Reservierung.
- PROJECT_ID: Die ID des Projekts, das die Reservierung enthält.
- ZONE: Die Zone, in der sich die Reservierung befindet.
Verwenden Sie den Befehl gcloud compute reservations
list
, um alle Reservierungen in einem Projekt aufzulisten:
gcloud compute reservations list --project=PROJECT_ID
Ersetzen Sie die folgende Platzhaltervariable:
- PROJECT_ID: ID des Projekts
Nächste Schritte
- Weitere Informationen zu Cloud TPU-Reservierungen
- Reservierung projektübergreifend freigeben
- TPUs verwalten