Neste documento, explicamos como criar uma solicitação de reserva adiantada no modo de calendário. Para saber mais sobre esse tipo de reserva, consulte Visão geral das solicitações de reserva adiantada no modo de calendário.
Crie uma solicitação de reserva adiantada no modo de calendário para reservar os seguintes recursos por até 90 dias:
Até 80 instâncias de máquina virtual (VM) com GPUs anexadas.
Até 1.024 chips de TPU.
Na data e hora de entrega escolhidas, é possível criar VMs de GPU ou TPU consumindo a capacidade reservada. Use solicitações de reserva adiantada no modo de calendário para conseguir recursos de alta demanda para as seguintes cargas de trabalho:
Jobs de pré-treinamento de modelo
Jobs de ajuste de modelo
Cargas de trabalho de simulação de computação de alto desempenho (HPC)
Aumentos de curto prazo nas cargas de trabalho de inferência
Para reservar mais de 80 VMs de GPU ou por mais de 90 dias em uma única solicitação, consulte Reservar capacidade na documentação do AI Hypercomputer.
Limitações
As seções a seguir explicam as limitações das solicitações de reserva adiantada no modo de calendário.
Limitações para todas as solicitações
Todas as solicitações de reserva adiantada no modo de calendário têm as seguintes limitações:
É possível reservar recursos por um período entre 1 e 90 dias.
Depois de criar e enviar uma solicitação, não é possível cancelar, excluir ou modificar o pedido.
Limitações para solicitações de VMs de GPU
Só é possível reservar VMs de GPU da seguinte maneira:
É possível reservar entre 1 e 80 VMs de GPU por solicitação.
É possível reservar as seguintes séries de máquinas:
É possível reservar VMs com GPU apenas em zonas específicas.
Limitações para solicitações de TPUs
Só é possível reservar TPUs da seguinte maneira:
É possível reservar 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1.024 chips de TPU por solicitação.
É possível reservar as seguintes versões de TPU:
Só é possível reservar 1, 4 ou 8 chips de TPU v5e para veiculação de tipos de carga de trabalho (
SERVING
).Só é possível reservar TPUs nas seguintes zonas:
Para a TPU v6e:
asia-northeast1-b
us-east5-a
us-east5-b
Para TPU v5p:
us-east5-a
Para a TPU v5e:
Para tipos de carga de trabalho em lote (
BATCH
):us-west4-b
Para tipos de carga de trabalho de veiculação (
SERVING
):us-central1-a
Antes de começar
- Se você não conseguir usar solicitações de reserva adiantada no modo de calendário, talvez não esteja qualificado para acessar e usar esse recurso. Nesse caso, entre em contato com sua equipe de contas ou a equipe de vendas.
- Para compartilhar sua capacidade reservada com outros projetos na sua organização, verifique se o projeto em que você quer criar solicitações de reserva adiantada no modo de calendário está autorizado a criar reservas compartilhadas. Caso contrário, você vai encontrar erros.
-
Configure a autenticação, caso ainda não tenha feito isso.
A autenticação é
o processo de verificação da sua identidade para acesso a serviços e APIs do Google Cloud .
Para executar códigos ou amostras de um ambiente de desenvolvimento local, autentique-se no
Compute Engine selecionando uma das seguintes opções:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
-
Para criar uma solicitação de reserva futura:
compute.futureReservations.create
no projeto -
Para permitir que o Compute Engine crie reservas automaticamente:
compute.reservations.create
no projeto -
Para especificar um modelo de instância:
compute.instanceTemplates.useReadOnly
no modelo de instância -
Para ver a disponibilidade futura de recursos:
compute.advice.calendarMode
no projeto Conferir a disponibilidade futura de recursos. Confira a disponibilidade futura das VMs com GPU ou TPUs que você quer reservar. Em seguida, ao criar uma solicitação, especifique o número, o tipo e a duração da reserva dos recursos que você confirmou como disponíveis. Google Cloud tem mais chances de aprovar sua solicitação se você fornecer essas informações.
Crie uma solicitação de reserva para VMs de GPU ou TPUs. Crie e envie um pedido de reserva futura no modo de agenda para VMs de GPU ou TPUs. Se você conseguir criar uma solicitação, o Google Cloud vai aprová-la em um minuto.
Para VMs de GPU, até 60 dias de antecedência
Para TPUs, até 120 dias de antecedência
Para conferir a disponibilidade de VMs de GPU, inclua as flags
--vm-count
e--machine-type
:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Para conferir a disponibilidade da TPU, inclua as flags
--chip-count
e--tpu-version
:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
NUMBER_OF_VMS
: o número de VMs com GPU a serem reservadas.MACHINE_TYPE
: o tipo de máquina de GPU a ser reservado.NUMBER_OF_CHIPS
: o número de chips de TPU a serem reservados.TPU_VERSION
: a versão da TPU a ser reservada. Especifique um dos seguintes valores:Para a TPU v6e:
V6E
Para TPU v5p:
V5P
Para a TPU v5e:
V5E
Se você especificar uma TPU v5e, inclua a flag
--workload-type
. Defina essa flag como o tipo de cargas de trabalho que você quer executar nas TPUs:Para cargas de trabalho que processam grandes quantidades de dados em uma ou várias operações, como treinamento de machine learning (ML), especifique
BATCH
.Para cargas de trabalho que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING
.
REGION
: a região em que as VMs de GPU ou TPUs serão reservadas. Para verificar quais regiões e zonas são compatíveis, consulte Limitações neste documento.FROM_START_TIME
eTO_START_TIME
: as datas mais antigas e mais recentes em que você quer reservar capacidade. Formate essas datas como carimbos de data/hora RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSET
Substitua:
YYYY-MM-DD
: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífens (-
).HH:MM:SS
: um horário formatado como uma hora de dois dígitos usando um horário de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:
).OFFSET
: o fuso horário formatado como um ajuste de Tempo Universal Coordenado (UTC). Por exemplo, para usar o horário padrão do Pacífico (PST), especifique-08:00
. Para não usar ajuste, especifiqueZ
.
FROM_END_TIME
eTO_END_TIME
: as datas de início e término da reserva de capacidade. Formate essas datas como carimbos de data/hora RFC 3339. Se você quiser especificar um intervalo de durações para o período de reserva em vez de horários de término, substitua a flag--end-time-range
pela--duration-range
.Para conferir a disponibilidade de VMs com GPU, inclua os campos
instanceCount
emachineType
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Para conferir a disponibilidade de TPUs, inclua os campos
acceleratorCount
evmFamily
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
PROJECT_ID
: o ID do projeto em que você quer reservar recursos.REGION
: a região em que você quer reservar VMs com GPU ou TPUs. Para conferir as regiões e zonas compatíveis, consulte Limitações neste documento.NUMBER_OF_VMS
: o número de VMs com GPU a serem reservadas.MACHINE_TYPE
: o tipo de máquina de GPU a ser reservado.NUMBER_OF_CHIPS
: o número de chips de TPU a serem reservados.TPU_VERSION
: a versão da TPU a ser reservada. Especifique um dos seguintes valores:Para a TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
Para TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
Para a TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Se você especificar uma TPU v5e, inclua o campo
workloadType
no campoaggregateResources
. Defina este campo como o tipo de cargas de trabalho que você quer executar nas TPUs:Para cargas de trabalho que processam grandes quantidades de dados em uma ou várias operações, como treinamento de machine learning (ML), especifique
BATCH
.Para cargas de trabalho que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING
.
FROM_START_TIME
eTO_START_TIME
: as datas mais antigas e mais recentes em que você quer reservar capacidade. Formate essas datas como carimbos de data/hora RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSET
Substitua:
YYYY-MM-DD
: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífens (-
).HH:MM:SS
: um horário formatado como uma hora de dois dígitos usando um horário de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:
).OFFSET
: o fuso horário formatado como um ajuste de Tempo Universal Coordenado (UTC). Por exemplo, para usar o horário padrão do Pacífico (PST), especifique-08:00
. Para não usar ajuste, especifiqueZ
.
FROM_END_TIME
eTO_END_TIME
: as datas de início e término da reserva de capacidade. Formate essas datas como carimbos de data/hora RFC 3339. Se você quiser especificar um intervalo de durações para o período de reserva em vez de horários de término, substitua os camposendTimeNotEarlierThan
eendTimeNotLaterThan
pelos camposminDuration
emaxDuration
.Horário de início: com base nos recursos que você quer reservar, especifique um horário de início que seja pelo menos um dos seguintes valores a partir do momento em que você cria e envia uma solicitação:
Para VMs de GPU, 87 horas (três dias e 15 horas)
Para TPUs, 24 horas
Horário de término: é possível reservar recursos por no máximo 90 dias.
No console Google Cloud , acesse a página Reservas.
Clique na guia Reservas adiantadas.
Clique em
Criar reserva adiantada. A página Criar uma reserva adiantada aparece e o painel Configuração de hardware é selecionado.Na seção Configuração, especifique as propriedades das VMs com GPU ou TPUs que você quer reservar fazendo uma das seguintes ações:
Para especificar diretamente as propriedades da VM com GPU ou da TPU, siga estas etapas:
Selecione Especificar tipo de máquina.
Clique na guia GPUs ou TPUs e selecione o tipo de máquina de GPU ou a versão da TPU que você quer reservar.
Para especificar as propriedades da VM de GPU usando um modelo de instância atual, selecione Modelo de instância e escolha o modelo.
Para especificar as propriedades da VM de GPU usando uma VM atual como referência, selecione Usar VM atual e escolha a VM.
Se você especificou uma TPU v5e (CT5LP) na etapa anterior, na lista Tipo de carga de trabalho da TPU v5, selecione uma das seguintes opções:
Para executar cargas de trabalho nas TPUs que processam grandes quantidades de dados em uma ou várias operações, como cargas de trabalho de treinamento de ML, selecione Lote.
Para executar cargas de trabalho nas TPUs que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, selecione Serviço.
Na seção Pesquisar capacidade, siga estas etapas:
Nas listas Região e Zona, especifique a região e a zona em que você quer reservar recursos. Para conferir as regiões e zonas compatíveis, consulte Limitações neste documento.
No campo Capacidade total necessária (ao reservar VMs com GPU) ou na lista Número de chips (ao reservar TPUs), especifique o número de VMs com GPU ou chips de TPU a serem reservados.
Na lista Horário de início, selecione o horário de início da sua solicitação.
Opcional: na lista Escolha a flexibilidade da data de início, selecione o nível de exatidão da data de início.
No campo Duração da reserva, especifique por quanto tempo você quer reservar recursos.
Clique em Pesquisar capacidade. Em seguida, na tabela Capacidade disponível, selecione uma das opções disponíveis que contenham o tipo, número e período de reserva das VMs de GPU ou TPUs a serem reservadas.
Clique em Próxima.
Na seção Tipo de compartilhamento, selecione os projetos com que você quer compartilhar a capacidade solicitada:
Para usar a capacidade reservada apenas no seu projeto, selecione Local.
Para compartilhar a capacidade reservada com outros projetos, selecione Compartilhada, clique em
Adicionar projetos e siga as instruções para selecionar os projetos.
Clique em Próxima.
No campo Nome da reserva adiantada, insira um nome para a solicitação.
No campo Nome da reserva, insira o nome da reserva que o Compute Engine cria automaticamente para provisionar a capacidade solicitada.
Clique em Criar.
Para reservar VMs com GPU, inclua as flags
--total-count
e--machine-type
:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Para reservar TPUs, inclua as flags
--chip-count
e--tpu-version
:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
FUTURE_RESERVATION_NAME
: o nome da solicitação.NUMBER_OF_VMS
: o número de VMs com GPU a serem reservadas.MACHINE_TYPE
: o tipo de máquina de GPU a ser reservado.NUMBER_OF_CHIPS
: o número de chips de TPU a serem reservados.TPU_VERSION
: a versão da TPU a ser reservada. Especifique um dos seguintes valores:Para a TPU v6e:
V6E
Para TPU v5p:
V5P
Para a TPU v5e:
V5E
Se você especificar uma TPU v5e, inclua a flag
--workload-type
. Defina a flag para o tipo de cargas de trabalho que você quer executar nas TPUs:Para cargas de trabalho que processam grandes quantidades de dados em uma ou várias operações, como treinamento de machine learning (ML), especifique
BATCH
.Para cargas de trabalho que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING
.
RESERVATION_NAME
: o nome da reserva que o Compute Engine cria automaticamente para provisionar a capacidade solicitada.SHARE_TYPE
: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:Para usar a capacidade apenas no seu projeto:
local
Para compartilhar capacidade com outros projetos:
projects
Se você especificar
projects
, inclua a flag--share-with
definida como uma lista separada por vírgulas de IDs de projetos, por exemplo,project-1,project-2
. É possível especificar até 100 projetos na sua organização. Não inclua o ID do projeto nessa lista. É possível consumir a capacidade reservada por padrão.START_TIME
: o horário de início da solicitação, formatado como um carimbo de data/hora RFC 3339.END_TIME
: o horário de término do período de reserva, formatado como um carimbo de data/hora RFC 3339. Se você quiser especificar uma duração, em segundos, para o período de reserva em vez de um horário de término, substitua a flag--end-time
pela--duration
.ZONE
: a zona em que você quer reservar recursos.Para reservar VMs com GPU, inclua os campos
totalCount
emachineType
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Para reservar TPUs, inclua os campos
acceleratorCount
evmFamily
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
PROJECT_ID
: o ID do projeto em que você quer criar a solicitação.ZONE
: a zona em que você quer reservar recursos.FUTURE_RESERVATION_NAME
: o nome da solicitação.RESERVATION_NAME
: o nome da reserva que o Compute Engine cria automaticamente para provisionar a capacidade solicitada.SHARE_TYPE
: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:Para usar a capacidade apenas no seu projeto:
LOCAL
Para compartilhar capacidade com outros projetos:
SPECIFIC_PROJECTS
Se você especificar
SPECIFIC_PROJECTS
, no camposhareSettings
, inclua o campoprojectMap
para especificar os projetos com que compartilhar a capacidade. É possível especificar até 100 projetos na sua organização. Não especifique o ID do projeto. Você pode consumir a capacidade reservada por padrão.Por exemplo, para compartilhar a capacidade solicitada com dois outros projetos, inclua o seguinte:
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }
Substitua
CONSUMER_PROJECT_ID_1
eCONSUMER_PROJECT_ID_2
pelos IDs de dois projetos que você quer permitir que consumam a capacidade solicitada.NUMBER_OF_VMS
: o número de VMs com GPU a serem reservadas.MACHINE_TYPE
: o tipo de máquina de GPU a ser reservado.NUMBER_OF_CHIPS
: o número de chips de TPU a serem reservados.TPU_VERSION
: a versão da TPU a ser reservada. Especifique um dos seguintes valores:Para a TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
Para TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
Para a TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Se você especificar uma TPU v5e, inclua o campo
workloadType
no campoaggregateResources
. Defina o campo com o tipo de cargas de trabalho que você quer executar nas TPUs:Para cargas de trabalho que processam grandes quantidades de dados em uma ou várias operações, como cargas de trabalho de treinamento de ML, especifique
BATCH
.Para cargas de trabalho que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING
.
START_TIME
: o horário de início da solicitação, formatado como um carimbo de data/hora RFC 3339.END_TIME
: o horário de término do período de reserva, formatado como um carimbo de data/hora RFC 3339. Se você quiser especificar uma duração, em segundos, para o período de reserva em vez de um horário de término, substitua o campoendTime
pelo campoduration
.Consumir uma reserva criada automaticamente para VMs de GPU no Compute Engine
Consumir uma reserva criada automaticamente para TPUs no Cloud TPU
Consumir uma reserva criada automaticamente usando jobs de previsão da Vertex AI
Consumir uma reserva criada automaticamente usando jobs de treinamento da Vertex AI
REST
Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para a CLI gcloud.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Para mais informações, consulte Autenticar para usar REST na documentação de autenticação do Google Cloud .
Funções exigidas
Para receber as permissões necessárias para criar uma solicitação de reserva adiantada no modo de calendário, peça ao administrador para conceder a você o papel do IAM de Administrador da reserva adiantada do Compute (
roles/compute.futureReservationAdmin
) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.Esse papel predefinido contém as permissões necessárias para criar uma solicitação de reserva adiantada no modo de calendário. Para conferir as permissões exatas necessárias, expanda a seção Permissões necessárias:
Permissões necessárias
As seguintes permissões são necessárias para criar uma solicitação de reserva adiantada no modo de calendário:
Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.
Visão geral
Para criar uma solicitação de reserva adiantada no modo de calendário, siga estas etapas:
Ver a disponibilidade futura de recursos
É possível conferir a disponibilidade futura de VMs de GPU ou TPUs em uma região da seguinte maneira:
Para conferir a disponibilidade futura de VMs com GPU ou TPUs em uma região, selecione uma das seguintes opções:
Console
É possível conferir a disponibilidade futura de VMs de GPU ou TPUs em uma região ao criar uma solicitação de reserva adiantada no modo de calendário. Para mais informações, consulte Criar uma solicitação de reserva para VMs de GPU ou TPUs neste documento.
gcloud
Para conferir a disponibilidade futura de VMs de GPU ou TPUs em uma região, use um dos comandos
gcloud beta compute advice calendar-mode
a seguir. Com base nos recursos que você quer visualizar, inclua as seguintes flags:Substitua:
O resultado será assim:
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-east5-a otherLocations: zones/us-east5-b: details: this machine family is not supported in this zone status: NOT_SUPPORTED zones/us-east5-c: details: this machine family is not supported in this zone status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'
Se os recursos solicitados estiverem disponíveis, a saída vai conter os campos
startTime
,endTime
elocation
. Esses campos especificam o horário de início mais cedo, o horário de término mais tarde e as zonas em que os recursos estão disponíveis.REST
Para conferir a disponibilidade futura de VMs de GPU ou TPUs em uma região, faça uma solicitação
GET
para o método Betaadvice.calendarMode
. Com base nos recursos que você quer visualizar, inclua os seguintes campos no corpo da solicitação:Substitua:
O resultado será assim:
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-east5-b": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" }, "zones/us-east5-c": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" } }, "location": "zones/us-east5-a" } } } ] }
Se os recursos solicitados estiverem disponíveis, a saída vai conter os campos
startTime
,endTime
elocation
. Esses campos especificam o horário de início mais cedo, o horário de término mais tarde e as zonas em que os recursos estão disponíveis.Criar uma solicitação de reserva para VMs de GPU ou TPUs
Ao criar uma solicitação de reserva adiantada no modo de calendário, só é possível especificar um período de reserva da seguinte maneira:
Para criar uma solicitação usando uma VM de GPU atual como referência, use o consoleGoogle Cloud . Ou selecione uma destas opções:
Console
gcloud
Para criar uma solicitação de reserva adiantada no modo de calendário e enviar para análise, use um dos seguintes comandos
gcloud beta compute future-reservations create
. Com base nos recursos que você quer reservar, inclua as seguintes flags:Substitua:
REST
Para criar uma solicitação de reserva adiantada no modo de calendário e enviá-la para análise, envie a seguinte solicitação
POST
para o métodofutureReservations.insert
da versão Beta. Com base nos recursos que você quer reservar, inclua os seguintes campos no corpo da solicitação:Substitua:
A seguir
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-07-14 UTC.
-