Reservierung nutzen

Wenn Sie eine TPU-Reservierung haben, können Sie mit Ihren reservierten Ressourcen TPUs erstellen, die den Attributen der Reservierung entsprechen. Diese Aktion wird als Inanspruchnahme einer Reservierung bezeichnet. Informationen zum Verbrauch einer TPU-Reservierung bei Verwendung von GKE finden Sie in der GKE-Dokumentation unter TPU-Reservierung.

Eine bestimmte Reservierung nutzen

Wenn Sie Ressourcen mit dem Befehl gcloud alpha compute tpus queued-resources create erstellen, verwenden Sie das Flag --reservation, um den Namen der zu verwendenden Reservierung anzugeben. Bei zukünftigen Reservierungen, die im Kalendermodus erstellt wurden, müssen Sie außerdem das --provisioning-model-Flag auf reservation-bound setzen:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

Ersetzen Sie folgende Platzhaltervariablen:

  • QUEUED_RESOURCE_ID: Eine vom Nutzer zugewiesene ID für die anstehende Ressourcenanfrage.
  • TPU_NAME: Eine vom Nutzer zugewiesene ID (Name) für die TPU, die erstellt wird, wenn die anstehende Ressourcenanfrage zugewiesen wird.
  • ZONE: Die Zone, in der die TPU-VM erstellt werden soll. Weitere Informationen zu unterstützten Zonen finden Sie unter Regionen und Zonen.
  • ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
  • SOFTWARE_VERSION: Die Softwareversion von Cloud TPU.
  • RESERVATION_URL: Die URL der Reservierung. Geben Sie einen der folgenden Werte an:
    • Wenn sich die Reservierung in Ihrem Projekt befindet: RESERVATION_NAME
    • Wenn sich die Reservierung in einem anderen Projekt befindet und Ihr Projekt sie nutzen kann: projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

Jede übereinstimmende Reservierung nutzen

Mit dem Flag --reserved können Sie die zu verwendende Reservierung automatisch anhand des Accelerator-Typs, der Projekt-ID und der Zone bestimmen.

CreateNode

Wenn Sie mit der CreateNode API eine übereinstimmende Reservierung verwenden möchten, verwenden Sie den Befehl gcloud alpha compute tpus tpu-vm create mit dem Flag --reserved:

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

Ersetzen Sie folgende Platzhaltervariablen:

  • TPU_NAME: Ein Name für die TPU.
  • ZONE: Die Zone, in der die TPU-VM erstellt werden soll. Sie muss mit der Reservierungszone übereinstimmen.
  • ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
  • SOFTWARE_VERSION: Die Softwareversion von Cloud TPU.

Ressourcen in Warteschlange

Wenn Sie alle übereinstimmenden Reservierungen mit in der Warteschlange befindlichen Ressourcen nutzen möchten, verwenden Sie den Befehl gcloud alpha compute tpus queued-resources create mit dem Flag --reserved:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

Ersetzen Sie folgende Platzhaltervariablen:

  • QUEUED_RESOURCE_ID: Eine vom Nutzer zugewiesene ID für die anstehende Ressourcenanfrage.
  • TPU_NAME: Eine vom Nutzer zugewiesene ID (Name) für die TPU, die erstellt wird, wenn die anstehende Ressourcenanfrage zugewiesen wird.
  • ZONE: Die Zone, in der die TPU-VM erstellt werden soll und in der die Reservierung vorhanden ist.
  • ACCELERATOR_TYPE: Gibt die Version und Größe der zu erstellenden Cloud TPU an. Weitere Informationen zu den unterstützten Beschleunigertypen für jede TPU-Version finden Sie unter TPU-Versionen.
  • SOFTWARE_VERSION: Die Softwareversion von Cloud TPU.

Reservierungsnutzung prüfen

Sie können die Nutzung einer freigegebenen Reservierung nur über das Inhaberprojekt prüfen. Wenn Sie sich in einem Nutzerprojekt befinden, müssen Sie zum Inhaberprojekt wechseln, um die Reservierungsnutzung zu prüfen.

Mit dem Befehl gcloud compute reservations describe können Sie sehen, wie viel der Reservierung belegt ist:

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

Ersetzen Sie folgende Platzhaltervariablen:

  • RESERVATION_NAME: Der Name der Reservierung.
  • PROJECT_ID: Die ID des Projekts, das die Reservierung enthält.
  • ZONE: Die Zone, in der sich die Reservierung befindet.

Verwenden Sie den Befehl gcloud compute reservations list, um alle Reservierungen in einem Projekt aufzulisten:

gcloud compute reservations list --project=PROJECT_ID

Ersetzen Sie die folgende Platzhaltervariable:

  • PROJECT_ID: ID des Projekts

Nächste Schritte