In die Warteschlange gestellte Ressourcen verwalten
Mit in die Warteschlange gestellten Ressourcen können Sie Cloud TPU-Ressourcen über eine Warteschlange anfordern. Wenn Sie in die Warteschlange gestellte Ressourcen anfordern, wird die Anfrage einer vom Cloud TPU-Dienst verwalteten Warteschlange hinzugefügt. Wenn die angeforderte Ressource verfügbar wird, wird sie Ihrem Google Cloud Projekt zugewiesen und steht Ihnen sofort zur exklusiven Nutzung zur Verfügung. Sie bleibt Ihrem Projekt zugewiesen, bis Sie sie löschen oder sie unterbrochen wird. Nur TPU-Spot-VMs und vorzeitig beendbare TPUs können vorzeitig beendet werden.
Sie können in einer in die Warteschlange eingereihten Ressourcenanfrage optional eine Start- und Endzeit angeben. Die Startzeit gibt den frühesten Zeitpunkt an, zu dem die Anfrage erfüllt werden kann. Wenn eine Anfrage bis zum angegebenen Endzeitpunkt nicht erfüllt wurde, läuft sie ab. Die Anfrage verbleibt in der Warteschlange, nachdem sie abgelaufen ist.
In die Warteschlange eingereihte Ressourcenanfragen können einen der folgenden Status haben:
WAITING_FOR_RESOURCES
- Die Anfrage wurde bei der ersten Validierung als gültig eingestuft und der Warteschlange hinzugefügt. Der Status bleibt so, bis genügend freie Ressourcen verfügbar sind, um mit der Bereitstellung Ihrer Anfrage zu beginnen, oder bis das Zuweisungsintervall abläuft. Bei hoher Nachfrage können nicht alle Anfragen sofort bereitgestellt werden. Wenn Sie eine zuverlässigere Verfügbarkeit von TPUs benötigen, sollten Sie eine Reservierung erwerben.
PROVISIONING
- Die Anfrage wurde aus der Warteschlange ausgewählt und die Ressourcen werden zugewiesen.
ACTIVE
- Die Anfrage wurde zugewiesen. Wenn sich Anfragen für in die Warteschlange gestellte Ressourcen im Status
ACTIVE
befinden, können Sie Ihre TPU-VMs wie unter TPUs verwalten beschrieben verwalten. FAILED
- Die Anfrage konnte nicht abgeschlossen werden, da entweder ein Problem mit der Anfrage vorliegt oder die angeforderten Ressourcen im Zuweisungsintervall nicht verfügbar waren. Die Anfrage verbleibt in der Warteschlange, bis sie explizit gelöscht wird.
SUSPENDING
- Die mit der Anfrage verknüpften Ressourcen werden gelöscht.
SUSPENDED
- Die in der Anfrage angegebenen Ressourcen wurden gelöscht. Wenn sich eine Anfrage im Status
SUSPENDED
befindet, kann sie nicht mehr zugewiesen werden.
Vorbereitung
Bevor Sie die Befehle in dieser Anleitung ausführen, müssen Sie die Google Cloud CLI installieren, ein Google Cloud -Projekt erstellen und die Cloud TPU API aktivieren. Eine Anleitung finden Sie unter Cloud TPU-Umgebung einrichten.
Wenn Sie eine der Cloud-Clientbibliotheken verwenden, folgen Sie der Einrichtungsanleitung für die verwendete Sprache:
On-Demand-Ressource in der Warteschlange anfordern
On-Demand-Ressourcen werden nicht unterbrochen. Das On-Demand-Kontingent garantiert jedoch nicht, dass genügend Cloud TPU-Ressourcen verfügbar sind, um Ihre Anfrage zu erfüllen. Weitere Informationen zu On-Demand-Ressourcen finden Sie unter Kontingenttypen.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die in die Warteschlange eingereihte Ressourcenanfrage zugewiesen wird.
project
- Ihr Google Cloud Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die in die Warteschlange eingereihte Ressourcenanfrage zugewiesen wird.
project
- Ihr Google Cloud Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf TPU erstellen.
Geben Sie im Feld Name einen Namen für Ihre TPU ein.
Wählen Sie im Feld Zone die Zone aus, in der Sie die TPU erstellen möchten.
Wählen Sie im Feld TPU-Typ einen Beschleunigertyp aus. Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
Wählen Sie im Feld TPU-Softwareversion eine Softwareversion aus. Beim Erstellen einer Cloud TPU-VM gibt die TPU-Softwareversion die Version der zu installierenden TPU-Laufzeit an. Weitere Informationen finden Sie unter TPU-Softwareversionen.
Klicken Sie auf den Schalter Warteschlangen aktivieren.
Geben Sie im Feld Name der Ressource in der Warteschlange einen Namen für die Anfrage für die Ressource in der Warteschlange ein.
Klicken Sie auf Erstellen, um Ihre in die Warteschlange eingereihte Ressourcenanfrage zu erstellen.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
In die Warteschlange gestellte Ressource mit einer Reservierung anfordern
Sie können eine Ressource in der Warteschlange mit einer Reservierung anfordern. Wenn Sie eine Reservierung kaufen möchten, wenden Sie sich an Ihr Google Cloud Account-Management-Team.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --reserved
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die in die Warteschlange eingereihte Ressourcenanfrage zugewiesen wird.
project
- Ihr Google Cloud Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
reserved
- Verwenden Sie dieses Flag, wenn Sie in die Warteschlange gestellte Ressourcen im Rahmen einer Cloud TPU-Reservierung anfordern.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die in die Warteschlange eingereihte Ressourcenanfrage zugewiesen wird.
project
- Ihr Google Cloud Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
reserved
- Verwenden Sie dieses Flag, wenn Sie in die Warteschlange gestellte Ressourcen im Rahmen einer Cloud TPU-Reservierung anfordern.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf TPU erstellen.
Geben Sie im Feld Name einen Namen für Ihre TPU ein.
Wählen Sie im Feld Zone die Zone aus, in der Sie die TPU erstellen möchten.
Wählen Sie im Feld TPU-Typ einen Beschleunigertyp aus. Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
Wählen Sie im Feld TPU-Softwareversion eine Softwareversion aus. Beim Erstellen einer Cloud TPU-VM gibt die TPU-Softwareversion die Version der zu installierenden TPU-Laufzeit an. Weitere Informationen finden Sie unter TPU-Softwareversionen.
Klicken Sie auf den Schalter Warteschlangen aktivieren.
Geben Sie im Feld Name der Ressource in der Warteschlange einen Namen für die Anfrage für die Ressource in der Warteschlange ein.
Maximieren Sie den Bereich Verwaltung.
Aktivieren Sie das Kästchen Vorhandene Reservierung verwenden.
Klicken Sie auf Erstellen, um Ihre in die Warteschlange eingereihte Ressourcenanfrage zu erstellen.
Ressource in der Warteschlange für eine TPU-Spot-VM anfordern
Eine Spot-VM ist eine Ressource, die jederzeit vorzeitig beendet und einer anderen Arbeitslast zugewiesen werden kann. Spot-VM-Ressourcen kosten weniger und Sie erhalten möglicherweise schneller Zugriff auf Ressourcen als bei einer Anfrage für eine Nicht-Spot-VM. Weitere Informationen zu TPU-Spot-VMs finden Sie unter TPU-Spot-VMs verwalten.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --spot
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
spot
- Ein boolesches Flag, das angibt, dass die in die Warteschlange eingereihte Ressource eine Spot-VM ist.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
spot
- Ein boolesches Flag, das angibt, dass die in die Warteschlange eingereihte Ressource eine Spot-VM ist.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf TPU erstellen.
Geben Sie im Feld Name einen Namen für Ihre TPU ein.
Wählen Sie im Feld Zone die Zone aus, in der Sie die TPU erstellen möchten.
Wählen Sie im Feld TPU-Typ einen Beschleunigertyp aus. Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
Wählen Sie im Feld TPU-Softwareversion eine Softwareversion aus. Beim Erstellen einer Cloud TPU-VM gibt die TPU-Softwareversion die Version der zu installierenden TPU-Laufzeit an. Weitere Informationen finden Sie unter TPU-Softwareversionen.
Klicken Sie auf den Schalter Warteschlangen aktivieren.
Geben Sie im Feld Name der Ressource in der Warteschlange einen Namen für die Anfrage für die Ressource in der Warteschlange ein.
Maximieren Sie den Bereich Verwaltung.
Markieren Sie das Kästchen Daraus eine TPU-Spot-VM machen.
Klicken Sie auf Erstellen.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Zuweisung einer in die Warteschlange eingereihten Ressource vor oder nach einem bestimmten Zeitpunkt anfordern
Sie können in einer in die Warteschlange eingereihten Ressourcenanfrage optional eine Startzeit oder Endzeit angeben. Die Startzeit oder Startdauer gibt den frühesten Zeitpunkt an, zu dem die Anfrage erfüllt werden soll. Die Endzeit oder Enddauer gibt an, wie lange die Anfrage gültig bleibt. Wenn eine Anfrage nicht bis zum angegebenen Endzeitpunkt oder innerhalb der angegebenen Dauer erfüllt wurde, läuft sie ab. Nach Ablauf der Anfrage verbleibt sie in der Warteschlange, kann aber nicht mehr zugewiesen werden.
Sie können auch ein Zuweisungsintervall angeben, indem Sie eine Startzeit oder ‑dauer und eine Endzeit oder ‑dauer festlegen.
Eine Liste der unterstützten Zeitstempel- und Zeitdauerformate finden Sie unter Datum/Uhrzeit.
Anfordern, dass eine in die Warteschlange gestellte Ressource nach einem bestimmten Zeitpunkt bereitgestellt wird
In einer in die Warteschlange eingereihten Ressourcenanfrage können Sie einen Zeitpunkt oder eine Dauer angeben, nach der eine Ressource zugewiesen werden soll.
gcloud
Mit dem folgenden Befehl wird eine v5p-4096-TPU angefordert, die nach 9:00 Uhr am 14. Dezember 2022 zugewiesen werden soll.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-time 2022-12-14T09:00:00Z
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-after-time
- Die Zeit, nach der die Ressource zugewiesen werden soll. Weitere Informationen zu Dauerformaten finden Sie im Google Cloud CLI-Thema „datetime“.
curl
Mit dem folgenden Befehl wird eine v5p-4096-TPU angefordert, die nach 9:00 Uhr am 14. Dezember 2022 zugewiesen werden soll.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-after-time
- Die Zeit, nach der die Ressource zugewiesen werden soll. Weitere Informationen zu Dauerformaten finden Sie im Google Cloud CLI-Thema „datetime“.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf TPU erstellen.
Geben Sie im Feld Name einen Namen für Ihre TPU ein.
Wählen Sie im Feld Zone die Zone aus, in der Sie die TPU erstellen möchten.
Wählen Sie im Feld TPU-Typ einen Beschleunigertyp aus. Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
Wählen Sie im Feld TPU-Softwareversion eine Softwareversion aus. Beim Erstellen einer Cloud TPU-VM gibt die TPU-Softwareversion die Version der zu installierenden TPU-Laufzeit an. Weitere Informationen finden Sie unter TPU-Softwareversionen.
Klicken Sie auf den Schalter Warteschlangen aktivieren.
Geben Sie im Feld Name der Ressource in der Warteschlange einen Namen für die Anfrage für die Ressource in der Warteschlange ein.
Geben Sie im Feld Anfrage starten am die Uhrzeit ein, nach der die Ressource zugewiesen werden soll.
Klicken Sie auf Erstellen, um Ihre in die Warteschlange eingereihte Ressourcenanfrage zu erstellen.
Im folgenden Beispiel wird angefordert, dass nach sechs Stunden eine v5p-32 zugewiesen wird.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 6h
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-after-duration
- Die Dauer, vor der die TPU nicht bereitgestellt werden darf. Weitere Informationen zu Dauerformaten finden Sie im Google Cloud CLI-Thema „datetime“.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-after-duration
- Die Dauer, vor der die TPU nicht bereitgestellt werden darf. Weitere Informationen zu Dauerformaten finden Sie im Google Cloud CLI-Thema „datetime“.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Eine in die Warteschlange gestellte Ressource anfordern, die nach einer bestimmten Zeit abläuft
In einer Ressourcenanfrage in der Warteschlange können Sie angeben, wie lange eine solche Anfrage gültig bleibt. Wenn die Anfrage bis zum von Ihnen angegebenen Zeitpunkt oder innerhalb des von Ihnen angegebenen Zeitraums nicht erfüllt wurde, läuft sie ab.
gcloud
Mit dem folgenden Befehl wird eine v5p-4096-TPU angefordert. Wenn die Anfrage nicht bis zum 14. Dezember 2022 um 9:00 Uhr erfüllt wird, läuft sie ab.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-time 2022-12-14T09:00:00Z
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-until-time
- : Die Zeit, nach der die Anfrage abgebrochen wird. Weitere Informationen zu Zeitformaten finden Sie unter Google Cloud CLI-Thema „datetime“.
curl
Mit dem folgenden Befehl wird eine v5p-4096-TPU angefordert. Wenn die Anfrage nicht bis zum 14. Dezember 2022 um 9:00 Uhr erfüllt wird, läuft sie ab.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-until-time
- : Die Zeit, nach der die Anfrage abgebrochen wird. Weitere Informationen zu Zeitformaten finden Sie unter Google Cloud CLI-Thema „datetime“.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf TPU erstellen.
Geben Sie im Feld Name einen Namen für Ihre TPU ein.
Wählen Sie im Feld Zone die Zone aus, in der Sie die TPU erstellen möchten.
Wählen Sie im Feld TPU-Typ einen Beschleunigertyp aus. Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
Wählen Sie im Feld TPU-Softwareversion eine Softwareversion aus. Beim Erstellen einer Cloud TPU-VM gibt die TPU-Softwareversion die Version der zu installierenden TPU-Laufzeit an. Weitere Informationen finden Sie unter TPU-Softwareversionen.
Klicken Sie auf den Schalter Warteschlangen aktivieren.
Geben Sie im Feld Name der Ressource in der Warteschlange einen Namen für die Anfrage für die Ressource in der Warteschlange ein.
Geben Sie im Feld Anfrage abbrechen am die Uhrzeit ein, zu der die in der Warteschlange befindliche Ressourcenanfrage ablaufen soll, wenn sie nicht erfüllt wird.
Klicken Sie auf Erstellen, um Ihre in die Warteschlange eingereihte Ressourcenanfrage zu erstellen.
Im folgenden Beispiel wird ein v5p-32 angefordert. Die Anfrage läuft ab, wenn sie nicht innerhalb von sechs Stunden ausgefüllt wird.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-duration 6h
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-until-duration
- Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Dauerformaten finden Sie im Google Cloud CLI-Thema „datetime“.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-until-duration
- Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Dauerformaten finden Sie im Google Cloud CLI-Thema „datetime“.
Python
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Anfordern, dass eine in der Warteschlange befindliche Ressource innerhalb eines bestimmten Intervalls zugewiesen wird
Sie können ein Zuweisungsintervall angeben, indem Sie sowohl die Startzeit oder ‑dauer als auch die Endzeit oder ‑dauer angeben.
gcloud
Mit dem folgenden Befehl wird eine v5p-32-Version angefordert, die in 5 Stunden und 30 Minuten ab der aktuellen Uhrzeit erstellt werden soll, spätestens jedoch am 14. Dezember 2022 um 9:00 Uhr.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-until-time
- : Die Zeit, nach der die Anfrage abgebrochen wird. Weitere Informationen zu Zeitformaten finden Sie unter Google Cloud CLI-Thema „datetime“.
valid-after-duration
- Die Dauer, vor der die TPU nicht bereitgestellt werden darf. Weitere Informationen zu Zeitformaten finden Sie unter Google Cloud CLI-Thema „datetime“.
curl
Mit dem folgenden Befehl wird eine v5p-32-Version angefordert, die in 5 Stunden und 30 Minuten ab der aktuellen Uhrzeit erstellt werden soll, spätestens jedoch am 14. Dezember 2022 um 9:00 Uhr.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
valid-until-timw
- : Die Zeit, nach der die Anfrage abgebrochen wird. Weitere Informationen zu Zeitformaten finden Sie unter Google Cloud CLI-Thema „datetime“.
valid-until-duration
- Die Dauer, für die die Anfrage gültig ist. Weitere Informationen zu Zeitformaten finden Sie unter Google Cloud CLI-Thema „datetime“.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf TPU erstellen.
Geben Sie im Feld Name einen Namen für Ihre TPU ein.
Wählen Sie im Feld Zone die Zone aus, in der Sie die TPU erstellen möchten.
Wählen Sie im Feld TPU-Typ einen Beschleunigertyp aus. Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
Wählen Sie im Feld TPU-Softwareversion eine Softwareversion aus. Beim Erstellen einer Cloud TPU-VM gibt die TPU-Softwareversion die Version der zu installierenden TPU-Laufzeit an. Weitere Informationen finden Sie unter TPU-Softwareversionen.
Klicken Sie auf den Schalter Warteschlangen aktivieren.
Geben Sie im Feld Name der Ressource in der Warteschlange einen Namen für die Anfrage für die Ressource in der Warteschlange ein.
Geben Sie im Feld Anfrage starten am die Uhrzeit ein, nach der die Ressource zugewiesen werden soll.
Geben Sie im Feld Anfrage abbrechen am die Uhrzeit ein, zu der die in der Warteschlange befindliche Ressourcenanfrage ablaufen soll, wenn sie nicht erfüllt wird.
Klicken Sie auf Erstellen, um Ihre in die Warteschlange eingereihte Ressourcenanfrage zu erstellen.
In die Warteschlange gestellte Ressource mit einem Startskript anfordern
Sie können ein Skript angeben, das für eine Ressource in der Warteschlange ausgeführt werden soll, nachdem sie bereitgestellt wurde.
gcloud
Wenn Sie den Befehl gcloud
verwenden, können Sie entweder das Flag --metadata
oder --metadata-from-file
verwenden, um einen Skriptbefehl bzw. eine Datei mit dem Skriptcode anzugeben. Im folgenden Beispiel wird eine in die Warteschlange eingereihte Ressourcenanfrage erstellt, mit der das Skript startup-script.sh
ausgeführt wird.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --metadata-from-file='startup-script=startup-script.sh'
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
validInterval
- Die Zeit, während der die Anfrage gültig ist. Danach wird die Anfrage abgebrochen. Weitere Informationen zu Zeitformaten finden Sie unter Google Cloud CLI-Thema „datetime“.
metadata-from-file
- Gibt eine Datei mit Metadaten an. Wenn Sie keinen vollständig qualifizierten Pfad zur Metadatendatei angeben, geht der Befehl davon aus, dass sie sich im aktuellen Verzeichnis befindet. In diesem Beispiel enthält die Datei ein Startskript, das ausgeführt wird, wenn die in die Warteschlange eingereihte Ressource bereitgestellt wird.
metadata
- Gibt Metadaten für die Anfrage an. In diesem Beispiel sind die Metadaten ein Startskriptbefehl, der ausgeführt wird, wenn die in die Warteschlange eingereihte Ressource bereitgestellt wird.
curl
Wenn Sie curl
verwenden, müssen Sie den Skriptcode in den JSON-Inhalt einfügen.
Das folgende Beispiel enthält ein Inline-Script im JSON-Text.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central1-a', node_id: 'your-node-id', node: { accelerator_type: 'v5e-8', runtime_version: 'v2-alpha-tpuv5-lite', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die benutzerdefinierte ID der TPU, die als Reaktion auf die Anfrage erstellt wurde.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
validInterval
- Die Zeit, während der die Anfrage gültig ist. Danach wird die Anfrage abgebrochen. Weitere Informationen zu Zeitformaten finden Sie unter Google Cloud CLI-Thema „datetime“.
metadata-from-file
- Gibt eine Datei mit Metadaten an. Wenn Sie keinen vollständig qualifizierten Pfad zur Metadatendatei angeben, geht der Befehl davon aus, dass sie sich im aktuellen Verzeichnis befindet. In diesem Beispiel enthält die Datei ein Startskript, das ausgeführt wird, wenn die in die Warteschlange eingereihte Ressource bereitgestellt wird.
metadata
- Gibt Metadaten für die Anfrage an. In diesem Beispiel sind die Metadaten ein Startskriptbefehl, der ausgeführt wird, wenn die in die Warteschlange eingereihte Ressource bereitgestellt wird.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
In die Warteschlange eingereihte Ressource mit einem angegebenen Netzwerk und Subnetzwerk anfordern
In einer Anfrage für in die Warteschlange gestellte Ressourcen können Sie ein Netzwerk und ein Subnetzwerk angeben, mit dem Sie Ihre TPU verbinden möchten.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5e-8 \ --runtime-version v2-alpha-tpuv5-lite \ --network network-name \ --subnetwork subnetwork-name
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die in die Warteschlange eingereihte Ressourcenanfrage zugewiesen wird.
project
- Ihr Google Cloud Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
reserved
- Verwenden Sie dieses Flag, wenn Sie in die Warteschlange gestellte Ressourcen im Rahmen einer Cloud TPU-Reservierung anfordern.
network
- Ein Netzwerk, zu dem die in die Warteschlange gestellte Ressource gehören soll.
subnetwork
- Ein Subnetzwerk, zu dem die in die Warteschlange gestellte Ressource gehören soll.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5e-8', 'runtime_version': 'v2-alpha-tpuv5-lite', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Beschreibungen der Befehlsparameter
queued-resource-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
node-id
- Die vom Nutzer zugewiesene ID der TPU, die erstellt wird, wenn die in die Warteschlange eingereihte Ressourcenanfrage zugewiesen wird.
project
- Ihr Google Cloud Projekt.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
accelerator-type
- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
runtime-version
- Die Version der Cloud TPU-Software.
reserved
- Verwenden Sie dieses Flag, wenn Sie in die Warteschlange gestellte Ressourcen im Rahmen einer Cloud TPU-Reservierung anfordern.
network
- Ein Netzwerk, zu dem die in die Warteschlange gestellte Ressource gehören soll.
subnetwork
- Ein Subnetzwerk, zu dem die in die Warteschlange gestellte Ressource gehören soll.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf TPU erstellen.
Geben Sie im Feld Name einen Namen für Ihre TPU ein.
Wählen Sie im Feld Zone die Zone aus, in der Sie die TPU erstellen möchten.
Wählen Sie im Feld TPU-Typ einen Beschleunigertyp aus. Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen möchten. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
Wählen Sie im Feld TPU-Softwareversion eine Softwareversion aus. Beim Erstellen einer Cloud TPU-VM gibt die TPU-Softwareversion die Version der zu installierenden TPU-Laufzeit an. Weitere Informationen finden Sie unter TPU-Softwareversionen.
Klicken Sie auf den Schalter Warteschlangen aktivieren.
Geben Sie im Feld Name der Ressource in der Warteschlange einen Namen für die Anfrage für die Ressource in der Warteschlange ein.
Maximieren Sie den Bereich Netzwerk.
Wählen Sie in den Feldern Netzwerk und Subnetzwerk das gewünschte Netzwerk und Subnetzwerk aus.
Klicken Sie auf Erstellen, um Ihre in die Warteschlange eingereihte Ressourcenanfrage zu erstellen.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
In die Warteschlange gestellte Ressourcenanfrage löschen
Sie können eine in die Warteschlange gestellte Ressourcenanfrage und die mit der Anfrage verknüpfte TPU löschen, indem Sie die in die Warteschlange gestellte Ressourcenanfrage löschen:
gcloud
Übergeben Sie das Flag --force
an den Befehl queued-resource delete
:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a \ --force \ --async
Beschreibung der Befehls-Flags
your-queued-resource-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone der zu löschenden Cloud TPU.
force
- Löschen Sie sowohl die TPU-VM als auch die in die Warteschlange gestellte Ressourcenanfrage.
curl
Verwenden Sie den Abfrageparameter force=true
in Ihrer curl
-Anfrage:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id?force=true
Beschreibung der Befehls-Flags
your-queued-resource-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone der zu löschenden Cloud TPU.
force
- Löschen Sie sowohl die TPU-VM als auch die in die Warteschlange gestellte Ressourcenanfrage.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf den Tab In die Warteschlange gestellte Ressourcen.
Klicken Sie das Kästchen neben Ihrem in der Warteschlange befindlichen Ressourcenantrag an.
Klicken Sie auf
Löschen.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Wenn Sie die TPU direkt löschen, müssen Sie auch die in die Warteschlange gestellte Ressource löschen, wie im folgenden Beispiel gezeigt. Wenn Sie die TPU löschen, wechselt die in die Warteschlange gestellte Ressourcenanfrage in den Status SUSPENDED
. Danach kann die in die Warteschlange gestellte Ressourcenanfrage gelöscht werden.
gcloud
Löschen Sie die TPU:
$ gcloud compute tpus tpu-vm delete your-node-id \ --project=your-project-id \ --zone=us-central1-a \ --quiet
Beschreibung der Befehls-Flags
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone der zu löschenden Cloud TPU.
your-node-id
- Der Name der TPU, die Sie löschen möchten.
Wenn Sie Ihre TPU löschen, wechselt die zugehörige in die Warteschlange gestellte Ressource in den Status SUSPENDING
und dann in den Status SUSPENDED
. Wenn sich Ihre in die Warteschlange gestellte Ressource im Status SUSPENDED
befindet, können Sie sie löschen:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone der zu löschenden Cloud TPU.
curl
Löschen Sie die TPU:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project/locations/us-central1-a/nodes?node_id=your-node-id
Beschreibung der Befehls-Flags
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone der zu löschenden Cloud TPU.
your-node-id
- Der Name der TPU, die Sie löschen möchten.
Wenn Sie Ihre TPU löschen, wechselt die zugehörige in die Warteschlange gestellte Ressource in den Status SUSPENDING
und dann in den Status SUSPENDED
. Wenn sich Ihre in die Warteschlange gestellte Ressource im Status SUSPENDED
befindet, können Sie sie löschen:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone der zu löschenden Cloud TPU.
Console
Löschen Sie Ihre TPU:
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf das Kästchen neben Ihrer TPU.
Klicken Sie auf
Löschen.
Wenn Sie Ihre TPU löschen, wechselt die zugehörige in die Warteschlange gestellte Ressource in den Status Wird angehalten und dann in den Status Angehalten. Wenn sich Ihre Ressource in der Warteschlange im Status Gesperrt befindet, können Sie sie löschen:
- Klicken Sie auf den Tab In die Warteschlange gestellte Ressourcen.
- Klicken Sie das Kästchen neben Ihrem in der Warteschlange befindlichen Ressourcenantrag an.
- Klicken Sie auf Löschen.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Wenn Sie Ihre TPU löschen, wechselt die zugehörige in die Warteschlange gestellte Ressource in den Status SUSPENDING
und dann in den Status SUSPENDED
. Wenn sich Ihre Ressource in der Warteschlange im Status SUSPENDED
befindet, können Sie sie löschen:
Python
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Wenn Sie Ihre TPU löschen, wechselt die zugehörige in die Warteschlange gestellte Ressource in den Status SUSPENDING
und dann in den Status SUSPENDED
. Wenn sich Ihre Ressource in der Warteschlange im Status SUSPENDED
befindet, können Sie sie löschen:
Status- und Diagnoseinformationen zu einer in der Warteschlange befindlichen Ressourcenanfrage abrufen
Rufen Sie den Status und die Diagnoseinformationen zu einer Ressourcenanfrage in der Warteschlange ab:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central1-a
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
Beschreibung der Befehls-Flags
queued-resource-request-id
- Die vom Nutzer zugewiesene ID der in die Warteschlange eingereihten Ressourcenanfrage.
project
- Die ID des Projekts, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf den Tab In die Warteschlange gestellte Ressourcen.
Klicken Sie auf den Namen Ihrer in die Warteschlange eingereihten Ressourcenanfrage.
Nachdem Ihre TPU bereitgestellt wurde, können Sie auch Details zu Ihrer in die Warteschlange gestellten Ressourcenanfrage auf der Seite TPUs aufrufen. Suchen Sie dazu nach Ihrer TPU und klicken Sie auf den Namen der entsprechenden in die Warteschlange gestellten Ressourcenanfrage.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Wenn die Anfrage fehlschlägt, enthält die Ausgabe Fehlerinformationen. Bei einer Anfrage, die auf Ressourcen wartet, sieht die Ausgabe in etwa so aus:
gcloud
name: projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central1-a/queuedResources/your-queued-resource-id runtimeVersion: v2-alpha-tpuv5-lite schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central1-a
Console
Im Feld Status der Ressource in der Warteschlange wird Wartet auf Ressourcen angezeigt.
In die Warteschlange gestellte Ressourcenanfragen in Ihrem Projekt auflisten
So listen Sie die in die Warteschlange eingereihten Ressourcenanfragen in Ihrem Projekt auf:
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central1-a
Beschreibung der Befehls-Flags
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/your-zone/queuedResources
Beschreibung der Befehls-Flags
project
- Das Google Cloud Projekt, dem die in die Warteschlange eingereihte Ressource zugewiesen ist.
zone
- Die Zone, in der Sie die Cloud TPU erstellen möchten.
Console
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf den Tab In die Warteschlange gestellte Ressourcen.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.