TPUs interrumpibles

Las TPU no garantizadas cuestan mucho menos que las TPU garantizadas. El servicio TPU de Cloud puede interrumpir (apagar) estas TPUs en cualquier momento si necesita recursos adicionales.

Crear una VM de TPU no garantizada

gcloud

$ gcloud compute tpus tpu-vm create demo-tpu \
  --zone=europe-west4-a \
  --accelerator-type=v3-8 \
  --version=tpu-vm-tf-2.17.1-pjrt \
  --preemptible
  

donde:

  • demo-tpu es el nombre de la TPU.
  • accelerator-type es el tipo de TPU. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
  • version es la versión de software de TPU de Cloud que se va a instalar.
  • preemptible permite que Cloud TPU interrumpa la TPU.

Precios y cuotas de las TPUs no garantizadas

Los precios de las TPU no garantizadas son considerablemente más bajos que los de las TPU normales. Para obtener más información, consulta la página de precios. No se te cobrará por las TPUs si se cancelan durante el primer minuto después de crearlas.

La cuota de las TPUs no garantizadas suele ser más alta y es independiente de la cuota de las TPUs normales. Consulta la página de cuotas.

Detectar si se ha interrumpido una TPU

Usa el siguiente comando gcloud para comprobar si el servicio TPU de Cloud ha desalojado tu TPU:

Lista de las TPUs disponibles:

gcloud compute tpus tpu-vm list
  --zone=us-central1-b
  

El resultado del comando muestra los detalles de las TPUs creadas en tu proyecto. Si se ha retirado una TPU, el estado cambia de READY a PREEMPTED.

Por ejemplo:

NAME       ZONE           ACCELERATOR_TYPE  NETWORK_ENDPOINT   NETWORK  RANGE          STATUS
demo-tpu   us-central1-b  v2-8              10.240.1.2:8470    default  10.240.1.0/29  PREEMPTED

Diseñar una aplicación de aprendizaje automático para que se ejecute en TPUs interrumpibles

Asegúrate de que tu aplicación sea resistente a los reinicios de la VM y la TPU guardando puntos de control del modelo con regularidad y configurando tu aplicación para que restaure el punto de control más reciente al reiniciarse.