Solicitar uma reserva de curta duração usando o modo de calendário

Para reservar TPUs por um período específico, entre 1 e 90 dias, solicite uma reserva adiantada no modo de calendário. Esse modo, com tecnologia do Programador Dinâmico de Cargas de Trabalho, permite verificar a disponibilidade da TPU com até 120 dias de antecedência e solicitar capacidade com base na sua programação. É possível solicitar uma reserva adiantada no modo de calendário usando a API Compute Engine ou o console Google Cloud . Se aprovado, o Compute Engine cria automaticamente uma reserva para a data e hora escolhidas. Em seguida, consuma a reserva provisionando TPUs usando a API Create Node ou a API Queued Resources. O Compute Engine exclui automaticamente a reserva e todas as TPUs que a consomem ao final do período de reserva.

Solicitar uma reserva futura no modo de calendário é uma boa opção para cargas de trabalho de treinamento e experimentação que exigem horários de início precisos e têm uma duração definida.

Para mais informações, consulte Sobre solicitações de reserva adiantada no modo de calendário.

Ver a disponibilidade futura de TPUs

É possível conferir a disponibilidade de TPUs de 1 a 120 dias antes. Para mais informações, consulte Ver a disponibilidade futura de recursos.

Criar uma solicitação de reserva adiantada no modo de calendário

É possível solicitar uma reserva adiantada no modo de calendário usando a API Compute Engine ou o console Google Cloud . Para mais informações, consulte Criar uma solicitação de reserva adiantada no modo de calendário.

Limitações

Solicitar uma reserva adiantada no modo de agenda para TPUs tem as seguintes limitações:

  • Não é possível modificar, cancelar ou excluir uma solicitação de reserva adiantada.
  • Especifique uma duração de reserva com um mínimo de 1 dia e um máximo de 90 dias.
  • Só é possível reservar as seguintes versões de TPU nas zonas especificadas:
    • TPU v6e: asia-northeast1-b, us-east5-a, us-east5-b
    • TPU v5p: us-east5-a
    • TPU v5e: us-west4-b (BATCH), us-central1-a (SERVING)

Para saber o número permitido de chips de TPU por solicitação, consulte Limitações na documentação do Compute Engine.

A seguir