常见问题解答 - Cloud TPU

本文档包含有关 Cloud TPU 的常见问题解答列表。它分为以下几个部分:

  1. 与框架无关的常见问题解答 - 无论您使用的是哪种机器学习框架,都可以提出有关使用 Cloud TPU 的问题。
  2. JAX 常见问题解答 - 有关将 Cloud TPU 与 JAX 搭配使用的问题。
  3. PyTorch 常见问题解答 - 有关将 Cloud TPU 与 PyTorch 搭配使用的问题。

与框架无关的常见问题解答

如何检查哪个进程在 Cloud TPU 虚拟机上使用 TPU?

在 Cloud TPU 虚拟机上运行 sudo lsof -w /dev/accel*,以输出进程 ID 以及使用 TPU 的进程的其他信息。

如何将永久性磁盘卷添加到 Cloud TPU 虚拟机?

如需了解详情,请参阅将永久性磁盘添加到 TPU 虚拟机

使用 TPU 虚拟机进行训练时支持/建议使用哪些存储选项?

如需了解详情,请参阅 Cloud TPU 存储选项

JAX 常见问题解答

如何知道我的程序是否在使用 TPU?

您可以通过以下几种方式仔细检查 JAX 是否在使用 TPU:

  1. 使用 jax.devices() 函数。例如:

    assert jax.devices()[0].platform == 'tpu'
    
  2. 对程序进行性能分析,并验证性能分析是否包含 TPU 操作。如需了解详情,请参阅对 JAX 程序进行性能分析

如需了解详情,请参阅 JAX 常见问题解答

PyTorch 常见问题解答

如何知道我的程序是否在使用 TPU?

您可以运行以下 Python 命令:

>>> import torch_xla.core.xla_model as xm
>>> xm.get_xla_supported_devices(devkind="TPU")

并验证您是否可以看到任何 TPU 设备。