TPU-Softwareversionen
In diesem Dokument finden Sie eine Anleitung zum Auswählen der richtigen TPU-Softwareversion beim Erstellen von Cloud TPUs.
Wenn Sie TPU-Ressourcen erstellen, geben Sie die Softwareversion an, auch Laufzeitversion genannt. Diese bezieht sich auf die Softwareumgebung, die auf Ihrer TPU-VM vorinstalliert ist. Dazu gehören das Ubuntu-Betriebssystem, Docker und andere Software, die zum Ausführen Ihres Codes auf TPUs erforderlich ist.
Wenn Sie die Google Cloud CLI verwenden, geben Sie die TPU-Softwareversion mit dem Parameter --version
oder --runtime-version
an. Wenn Sie die Google Cloud Console verwenden, wählen Sie in der Liste TPU-Softwareversion eine TPU-Softwareversion aus.
PyTorch und JAX
Verwenden Sie die folgenden gängigen TPU-Softwareversionen für PyTorch und JAX und installieren Sie dann das gewünschte Framework.
TPU-Version | Version der TPU-Software |
---|---|
Trillium (v6e) | v2-alpha-tpuv6e |
v5p | v2-alpha-tpuv5 |
v5e | v2-alpha-tpuv5-lite |
Version 4 und älter | tpu-ubuntu2204-base |
Weitere Informationen zur Installation und zum Einstieg in PyTorch oder JAX finden Sie unter Berechnung mit PyTorch auf einer Cloud TPU-VM ausführen und Berechnung mit JAX auf einer Cloud TPU-VM ausführen.
TensorFlow
Der Name der TPU-Softwareversion besteht aus:
tpu-vm-tf
- Die TensorFlow-Version
-pod
(bei Verwendung eines TPU-Slices mit mehreren Hosts)-pjrt
(wenn Sie die PJRT API verwenden)
Weitere Informationen zum Angeben einer TPU-Softwareversion finden Sie in den folgenden Abschnitten.
Für jede TensorFlow-Version gibt es eine spezifische TPU-Softwareversion. In der folgenden Tabelle sind die unterstützten TensorFlow-Versionen und die zugehörigen libtpu-Versionen aufgeführt:
TensorFlow-Version | libtpu.so-Version |
---|---|
2.18.0 | 1.12.0 |
2.17.1 | 1.11.1 |
2.17.0 | 1.11.0 |
2.16.2 | 1.10.1 |
2.16.1 | 1.10.1 |
2.15.1 | 1.9.0 |
2.15.0 | 1.9.0 |
2.14.1 | 1.8.1 |
2.14.0 | 1.8.0 |
2.13.1 | 1.7.1 |
2.13.0 | 1.7.0 |
2.12.1 | 1.6.1 |
2.12.0 | 1.6.0 |
2.11.1 | 1.5.1 |
2.11.0 | 1.5.0 |
2.10.1 | 1.4.1 |
2.10.0 | 1.4.0 |
2.9.3 | 1.3.2 |
2.9.1 | 1.3.0 |
2.8.3 | 1.2.3 |
2.8.0 | 1.2.0 |
2.7.3 | 1.1.2 |
Weitere Informationen zu TensorFlow-Patchversionen finden Sie unter Unterstützte TensorFlow-Patchversionen.
TPU v6e, v5p und v5e
TPU v6e, v5e und v5p unterstützen TensorFlow 2.15.0 und höher. Die TPU-Softwareversion wird in folgendem Format angegeben: tpu-vm-tf-x.y.z-{pod}-pjrt
. Dabei ist x
die Hauptversion von TensorFlow, y
die Nebenversion und z
die Patchversion von TensorFlow. Fügen Sie nach der TensorFlow-Version pod
hinzu, wenn Sie eine TPU mit mehreren Hosts verwenden. Wenn Sie beispielsweise TensorFlow 2.16.0 auf einer TPU mit mehreren Hosts verwenden, verwenden Sie die TPU-Softwareversion tpu-vm-tf-2.16.0-pod-pjrt
. Ersetzen Sie für andere TensorFlow-Versionen 2.16.0
durch die von Ihnen verwendete Haupt- und Patchversion von TensorFlow. Wenn Sie eine TPU mit einem einzelnen Host verwenden, lassen Sie pod
weg.
TPU v4
Wenn Sie TPU v4 und TensorFlow 2.10.1 oder höher verwenden, folgen Sie der Anleitung für TPU v2 und v3. Wenn Sie TensorFlow 2.10.0 oder niedriger verwenden, verwenden Sie eine TPU-Softwareversion, die für Version 4 spezifisch ist:
TensorFlow-Version | Version der TPU-Software |
---|---|
2.10.0 | tpu-vm-tf-2.10.0-v4 tpu-vm-tf-2.10.0-pod-v4 |
2.9.3 | tpu-vm-tf-2.9.3-v4 tpu-vm-tf-2.9.3-pod-v4 |
2.9.2 | tpu-vm-tf-2.9.2-v4 tpu-vm-tf-2.9.2-pod-v4 |
2.9.1 | tpu-vm-tf-2.9.1-v4 tpu-vm-tf-2.9.1-pod-v4 |
TPU v2 und v3
Wenn Sie TPU v2 oder v3 verwenden, verwenden Sie die TPU-Softwareversion, die der von Ihnen verwendeten TensorFlow-Version entspricht. Wenn Sie beispielsweise TensorFlow 2.14.1 verwenden, verwenden Sie die TPU-Softwareversion tpu-vm-tf-2.14.1
. Ersetzen Sie bei anderen TensorFlow-Versionen 2.14.1
durch die von Ihnen verwendete TensorFlow-Version. Wenn Sie eine TPU mit mehreren Hosts verwenden, fügen Sie am Ende der TPU-Softwareversion den Zusatz „pod“ hinzu, z. B. tpu-vm-tf-2.14.1-pod
.
Ab TensorFlow 2.15.0 müssen Sie auch eine Geräte-API als Teil des Softwareversionsnamens angeben. Wenn Sie beispielsweise TensorFlow 2.16.1 mit der PJRT API verwenden, verwenden Sie die TPU-Softwareversion tpu-vm-tf-2.16.1-pjrt
. Wenn Sie die Stream Executor API mit derselben Version von TensorFlow verwenden, verwenden Sie die TPU-Softwareversion tpu-vm-tf-2.16.1-se
. TensorFlow-Versionen älter als 2.15.0 unterstützen nur den Stream-Executor.
Unterstützung für TensorFlow PJRT
Ab TensorFlow 2.15.0 können Sie die PJRT-Oberfläche für TensorFlow auf TPU verwenden. PJRT bietet eine automatische Defragmentierung des Gerätespeichers und vereinfacht die Einbindung von Hardware in Frameworks. Weitere Informationen zu PJRT finden Sie unter PJRT: Vereinfachte Integration von ML-Hardware und ‑Frameworks.
Beschleuniger | Funktion | PJRT-Unterstützung | Unterstützung für Stream-Executor |
---|---|---|---|
TPU v2 bis v4 | Dichte Berechnung (keine TPU-Embedding API) | Ja | Ja |
TPU v2 bis v4 | Dense Compute API + TPU Embedding API | Nein | Ja |
TPU v2 bis v4 | tf.summary/tf.print mit flexibler Geräteplatzierung | Nein | Ja |
TPU v5e | Dichte Berechnung (keine TPU-Embedding API) | Ja | Nein |
TPU v5e | TPU-Embedding API | – | Nein |
TPU v5p | Dichte Berechnung (keine TPU-Embedding API) | Ja | Nein |
TPU v5p | TPU-Embedding API | Ja | Nein |
Nächste Schritte
- Weitere Informationen zur TPU-Architektur finden Sie unter TPU-Architektur.
- Weitere Informationen zu den für Cloud TPU geeigneten Modellen finden Sie unter Verwendung von TPUs.