Cómo solicitar una reserva a corto plazo con el modo de calendario

Para reservar TPUs para una hora de inicio y una duración específicas, entre 1 y 90 días, solicita una reserva futura en modo de calendario. Este modo, con la tecnología del Programador dinámico de cargas de trabajo, te permite verificar la disponibilidad de TPU con hasta 120 días de anticipación y solicitar capacidad según tu programa. Puedes solicitar una reserva futura en modo de calendario con la API de Compute Engine o la Google Cloud consola. Si se aprueba, Compute Engine creará automáticamente una reserva para la fecha y hora que elijas. Luego, puedes consumir la reserva aprovisionando TPU con la API de Create Node o la API de Queued Resources. Compute Engine borra automáticamente la reserva y cualquier TPU que la consuma al final del período de reserva.

Solicitar una reserva futura en el modo de calendario es una buena opción para las cargas de trabajo de entrenamiento y experimentación que requieren horas de inicio precisas y tienen una duración definida.

Para obtener más información, consulta Acerca de las solicitudes de reserva futuras en el modo de calendario.

Consulta la disponibilidad futura de las TPU

Puedes consultar la disponibilidad de las TPU de 1 a 120 días con anticipación. Para obtener más información, consulta Cómo ver la disponibilidad futura de los recursos.

Crea una solicitud de reserva futura en el modo de calendario

Puedes solicitar una reserva futura en modo de calendario con la API de Compute Engine o la Google Cloud consola. Para obtener más información, consulta Cómo crear una solicitud de reserva futura en modo de calendario.

Limitaciones

Solicitar una reserva futura en el modo de calendario para las TPU tiene las siguientes limitaciones:

  • No puedes modificar, cancelar ni borrar una solicitud de reserva futura.
  • Debes especificar una duración de la reserva de un mínimo de 1 día y un máximo de 90 días.
  • Solo puedes reservar las siguientes versiones de TPU en las zonas especificadas:
    • TPU v6e: asia-northeast1-b, us-east5-a, us-east5-b
    • TPU v5p: us-east5-a
    • TPU v5e: us-west4-b (BATCH), us-central1-a (SERVING)

Para conocer la cantidad permitida de chips de TPU por solicitud, consulta Limitaciones en la documentación de Compute Engine.

¿Qué sigue?