Criar uma solicitação de reserva futura no modo de agenda


Neste documento, explicamos como criar uma solicitação de reserva adiantada no modo de calendário. Para saber mais sobre esse tipo de reserva, consulte Visão geral das solicitações de reserva adiantada no modo de calendário.

Crie uma solicitação de reserva adiantada no modo de calendário para reservar os seguintes recursos por até 90 dias:

  • Até 80 instâncias de máquina virtual (VM) com GPUs anexadas.

  • Até 1.024 chips de TPU.

Na data e hora de entrega escolhidas, é possível criar VMs de GPU ou TPU consumindo a capacidade reservada. Use solicitações de reserva adiantada no modo de calendário para conseguir recursos de alta demanda para as seguintes cargas de trabalho:

  • Jobs de pré-treinamento de modelo

  • Jobs de ajuste de modelo

  • Cargas de trabalho de simulação de computação de alto desempenho (HPC)

  • Aumentos de curto prazo nas cargas de trabalho de inferência

Para reservar mais de 80 VMs de GPU ou por mais de 90 dias em uma única solicitação, consulte Reservar capacidade na documentação do AI Hypercomputer.

Limitações

As seções a seguir explicam as limitações das solicitações de reserva adiantada no modo de calendário.

Limitações para todas as solicitações

Todas as solicitações de reserva adiantada no modo de calendário têm as seguintes limitações:

  • É possível reservar recursos por um período entre 1 e 90 dias.

  • Depois de criar e enviar uma solicitação, não é possível cancelar, excluir ou modificar o pedido.

Limitações para solicitações de VMs de GPU

Só é possível reservar VMs de GPU da seguinte maneira:

  • É possível reservar entre 1 e 80 VMs de GPU por solicitação.

  • É possível reservar as seguintes séries de máquinas:

  • É possível reservar VMs com GPU apenas em zonas específicas.

Limitações para solicitações de TPUs

Só é possível reservar TPUs da seguinte maneira:

  • É possível reservar 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1.024 chips de TPU por solicitação.

  • É possível reservar as seguintes versões de TPU:

  • Só é possível reservar 1, 4 ou 8 chips de TPU v5e para veiculação de tipos de carga de trabalho (SERVING).

  • Só é possível reservar TPUs nas seguintes zonas:

    • Para a TPU v6e:

      • asia-northeast1-b

      • us-east5-a

      • us-east5-b

    • Para TPU v5p:

      • us-east5-a
    • Para a TPU v5e:

      • Para tipos de carga de trabalho em lote (BATCH): us-west4-b

      • Para tipos de carga de trabalho de veiculação (SERVING): us-central1-a

Antes de começar

  • Se você não conseguir usar solicitações de reserva adiantada no modo de calendário, talvez não esteja qualificado para acessar e usar esse recurso. Nesse caso, entre em contato com sua equipe de contas ou a equipe de vendas.
  • Para compartilhar sua capacidade reservada com outros projetos na sua organização, verifique se o projeto em que você quer criar solicitações de reserva adiantada no modo de calendário está autorizado a criar reservas compartilhadas. Caso contrário, você vai encontrar erros.
  • Configure a autenticação, caso ainda não tenha feito isso. A autenticação é o processo de verificação da sua identidade para acesso a serviços e APIs do Google Cloud . Para executar códigos ou amostras de um ambiente de desenvolvimento local, autentique-se no Compute Engine selecionando uma das seguintes opções:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

      1. After installing the Google Cloud CLI, initialize it by running the following command:

        gcloud init

        If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

      2. Set a default region and zone.
      3. REST

        Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para a CLI gcloud.

          After installing the Google Cloud CLI, initialize it by running the following command:

          gcloud init

          If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

        Para mais informações, consulte Autenticar para usar REST na documentação de autenticação do Google Cloud .

Funções exigidas

Para receber as permissões necessárias para criar uma solicitação de reserva adiantada no modo de calendário, peça ao administrador para conceder a você o papel do IAM de Administrador da reserva adiantada do Compute (roles/compute.futureReservationAdmin) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esse papel predefinido contém as permissões necessárias para criar uma solicitação de reserva adiantada no modo de calendário. Para conferir as permissões exatas necessárias, expanda a seção Permissões necessárias:

Permissões necessárias

As seguintes permissões são necessárias para criar uma solicitação de reserva adiantada no modo de calendário:

  • Para criar uma solicitação de reserva futura: compute.futureReservations.create no projeto
  • Para permitir que o Compute Engine crie reservas automaticamente: compute.reservations.create no projeto
  • Para especificar um modelo de instância: compute.instanceTemplates.useReadOnly no modelo de instância
  • Para ver a disponibilidade futura de recursos: compute.advice.calendarMode no projeto

Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.

Visão geral

Para criar uma solicitação de reserva adiantada no modo de calendário, siga estas etapas:

  1. Conferir a disponibilidade futura de recursos. Confira a disponibilidade futura das VMs com GPU ou TPUs que você quer reservar. Em seguida, ao criar uma solicitação, especifique o número, o tipo e a duração da reserva dos recursos que você confirmou como disponíveis. Google Cloud tem mais chances de aprovar sua solicitação se você fornecer essas informações.

  2. Crie uma solicitação de reserva para VMs de GPU ou TPUs. Crie e envie um pedido de reserva futura no modo de agenda para VMs de GPU ou TPUs. Se você conseguir criar uma solicitação, o Google Cloud vai aprová-la em um minuto.

Ver a disponibilidade futura de recursos

É possível conferir a disponibilidade futura de VMs de GPU ou TPUs em uma região da seguinte maneira:

  • Para VMs de GPU, até 60 dias de antecedência

  • Para TPUs, até 120 dias de antecedência

Para conferir a disponibilidade futura de VMs com GPU ou TPUs em uma região, selecione uma das seguintes opções:

Console

É possível conferir a disponibilidade futura de VMs de GPU ou TPUs em uma região ao criar uma solicitação de reserva adiantada no modo de calendário. Para mais informações, consulte Criar uma solicitação de reserva para VMs de GPU ou TPUs neste documento.

gcloud

Para conferir a disponibilidade futura de VMs de GPU ou TPUs em uma região, use um dos comandos gcloud beta compute advice calendar-mode a seguir. Com base nos recursos que você quer visualizar, inclua as seguintes flags:

  • Para conferir a disponibilidade de VMs de GPU, inclua as flags --vm-count e --machine-type:

    gcloud beta compute advice calendar-mode \
        --vm-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    
  • Para conferir a disponibilidade da TPU, inclua as flags --chip-count e --tpu-version:

    gcloud beta compute advice calendar-mode \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --region=REGION \
        --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
        --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
    

Substitua:

  • NUMBER_OF_VMS: o número de VMs com GPU a serem reservadas.

  • MACHINE_TYPE: o tipo de máquina de GPU a ser reservado.

  • NUMBER_OF_CHIPS: o número de chips de TPU a serem reservados.

  • TPU_VERSION: a versão da TPU a ser reservada. Especifique um dos seguintes valores:

    • Para a TPU v6e: V6E

    • Para TPU v5p: V5P

    • Para a TPU v5e: V5E

    Se você especificar uma TPU v5e, inclua a flag --workload-type. Defina essa flag como o tipo de cargas de trabalho que você quer executar nas TPUs:

    • Para cargas de trabalho que processam grandes quantidades de dados em uma ou várias operações, como treinamento de machine learning (ML), especifique BATCH.

    • Para cargas de trabalho que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.

  • REGION: a região em que as VMs de GPU ou TPUs serão reservadas. Para verificar quais regiões e zonas são compatíveis, consulte Limitações neste documento.

  • FROM_START_TIME e TO_START_TIME: as datas mais antigas e mais recentes em que você quer reservar capacidade. Formate essas datas como carimbos de data/hora RFC 3339:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Substitua:

    • YYYY-MM-DD: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífens (-).

    • HH:MM:SS: um horário formatado como uma hora de dois dígitos usando um horário de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:).

    • OFFSET: o fuso horário formatado como um ajuste de Tempo Universal Coordenado (UTC). Por exemplo, para usar o horário padrão do Pacífico (PST), especifique -08:00. Para não usar ajuste, especifique Z.

  • FROM_END_TIME e TO_END_TIME: as datas de início e término da reserva de capacidade. Formate essas datas como carimbos de data/hora RFC 3339. Se você quiser especificar um intervalo de durações para o período de reserva em vez de horários de término, substitua a flag --end-time-range pela --duration-range.

O resultado será assim:

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-east5-a
      otherLocations:
        zones/us-east5-b:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
        zones/us-east5-c:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

Se os recursos solicitados estiverem disponíveis, a saída vai conter os campos startTime, endTime e location. Esses campos especificam o horário de início mais cedo, o horário de término mais tarde e as zonas em que os recursos estão disponíveis.

REST

Para conferir a disponibilidade futura de VMs de GPU ou TPUs em uma região, faça uma solicitação GET para o método Beta advice.calendarMode. Com base nos recursos que você quer visualizar, inclua os seguintes campos no corpo da solicitação:

  • Para conferir a disponibilidade de VMs com GPU, inclua os campos instanceCount e machineType:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "specificSkuResources": {
              "instanceCount": "NUMBER_OF_VMS",
              "machineType": "MACHINE_TYPE"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    
  • Para conferir a disponibilidade de TPUs, inclua os campos acceleratorCount e vmFamily:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode
    
    {
      "futureResourcesSpecs": {
        "spec": {
          "targetResources": {
            "aggregateResources": {
              "acceleratorCount": "NUMBER_OF_CHIPS",
              "vmFamily": "TPU_VERSION"
            }
          },
          "timeRangeSpec": {
            "startTimeNotEarlierThan": "FROM_START_TIME",
            "startTimeNotLaterThan": "TO_START_TIME",
            "endTimeNotEarlierThan": "FROM_END_TIME",
            "endTimeNotLaterThan": "TO_END_TIME"
          }
        }
      }
    }
    

Substitua:

  • PROJECT_ID: o ID do projeto em que você quer reservar recursos.

  • REGION: a região em que você quer reservar VMs com GPU ou TPUs. Para conferir as regiões e zonas compatíveis, consulte Limitações neste documento.

  • NUMBER_OF_VMS: o número de VMs com GPU a serem reservadas.

  • MACHINE_TYPE: o tipo de máquina de GPU a ser reservado.

  • NUMBER_OF_CHIPS: o número de chips de TPU a serem reservados.

  • TPU_VERSION: a versão da TPU a ser reservada. Especifique um dos seguintes valores:

    • Para a TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Para TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Para a TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Se você especificar uma TPU v5e, inclua o campo workloadType no campo aggregateResources. Defina este campo como o tipo de cargas de trabalho que você quer executar nas TPUs:

    • Para cargas de trabalho que processam grandes quantidades de dados em uma ou várias operações, como treinamento de machine learning (ML), especifique BATCH.

    • Para cargas de trabalho que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.

  • FROM_START_TIME e TO_START_TIME: as datas mais antigas e mais recentes em que você quer reservar capacidade. Formate essas datas como carimbos de data/hora RFC 3339:

    YYYY-MM-DDTHH:MM:SSOFFSET
    

    Substitua:

    • YYYY-MM-DD: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífens (-).

    • HH:MM:SS: um horário formatado como uma hora de dois dígitos usando um horário de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:).

    • OFFSET: o fuso horário formatado como um ajuste de Tempo Universal Coordenado (UTC). Por exemplo, para usar o horário padrão do Pacífico (PST), especifique -08:00. Para não usar ajuste, especifique Z.

  • FROM_END_TIME e TO_END_TIME: as datas de início e término da reserva de capacidade. Formate essas datas como carimbos de data/hora RFC 3339. Se você quiser especificar um intervalo de durações para o período de reserva em vez de horários de término, substitua os campos endTimeNotEarlierThan e endTimeNotLaterThan pelos campos minDuration e maxDuration.

O resultado será assim:

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-east5-b": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            },
            "zones/us-east5-c": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            }
          },
          "location": "zones/us-east5-a"
        }
      }
    }
  ]
}

Se os recursos solicitados estiverem disponíveis, a saída vai conter os campos startTime, endTime e location. Esses campos especificam o horário de início mais cedo, o horário de término mais tarde e as zonas em que os recursos estão disponíveis.

Criar uma solicitação de reserva para VMs de GPU ou TPUs

Ao criar uma solicitação de reserva adiantada no modo de calendário, só é possível especificar um período de reserva da seguinte maneira:

  • Horário de início: com base nos recursos que você quer reservar, especifique um horário de início que seja pelo menos um dos seguintes valores a partir do momento em que você cria e envia uma solicitação:

    • Para VMs de GPU, 87 horas (três dias e 15 horas)

    • Para TPUs, 24 horas

  • Horário de término: é possível reservar recursos por no máximo 90 dias.

Para criar uma solicitação usando uma VM de GPU atual como referência, use o consoleGoogle Cloud . Ou selecione uma destas opções:

Console

  1. No console Google Cloud , acesse a página Reservas.

    Acessar "Reservas"

  2. Clique na guia Reservas adiantadas.

  3. Clique em Criar reserva adiantada. A página Criar uma reserva adiantada aparece e o painel Configuração de hardware é selecionado.

  4. Na seção Configuração, especifique as propriedades das VMs com GPU ou TPUs que você quer reservar fazendo uma das seguintes ações:

    • Para especificar diretamente as propriedades da VM com GPU ou da TPU, siga estas etapas:

      1. Selecione Especificar tipo de máquina.

      2. Clique na guia GPUs ou TPUs e selecione o tipo de máquina de GPU ou a versão da TPU que você quer reservar.

    • Para especificar as propriedades da VM de GPU usando um modelo de instância atual, selecione Modelo de instância e escolha o modelo.

    • Para especificar as propriedades da VM de GPU usando uma VM atual como referência, selecione Usar VM atual e escolha a VM.

  5. Se você especificou uma TPU v5e (CT5LP) na etapa anterior, na lista Tipo de carga de trabalho da TPU v5, selecione uma das seguintes opções:

    • Para executar cargas de trabalho nas TPUs que processam grandes quantidades de dados em uma ou várias operações, como cargas de trabalho de treinamento de ML, selecione Lote.

    • Para executar cargas de trabalho nas TPUs que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, selecione Serviço.

  6. Na seção Pesquisar capacidade, siga estas etapas:

    1. Nas listas Região e Zona, especifique a região e a zona em que você quer reservar recursos. Para conferir as regiões e zonas compatíveis, consulte Limitações neste documento.

    2. No campo Capacidade total necessária (ao reservar VMs com GPU) ou na lista Número de chips (ao reservar TPUs), especifique o número de VMs com GPU ou chips de TPU a serem reservados.

    3. Na lista Horário de início, selecione o horário de início da sua solicitação.

    4. Opcional: na lista Escolha a flexibilidade da data de início, selecione o nível de exatidão da data de início.

    5. No campo Duração da reserva, especifique por quanto tempo você quer reservar recursos.

    6. Clique em Pesquisar capacidade. Em seguida, na tabela Capacidade disponível, selecione uma das opções disponíveis que contenham o tipo, número e período de reserva das VMs de GPU ou TPUs a serem reservadas.

  7. Clique em Próxima.

  8. Na seção Tipo de compartilhamento, selecione os projetos com que você quer compartilhar a capacidade solicitada:

    • Para usar a capacidade reservada apenas no seu projeto, selecione Local.

    • Para compartilhar a capacidade reservada com outros projetos, selecione Compartilhada, clique em Adicionar projetos e siga as instruções para selecionar os projetos.

  9. Clique em Próxima.

  10. No campo Nome da reserva adiantada, insira um nome para a solicitação.

  11. No campo Nome da reserva, insira o nome da reserva que o Compute Engine cria automaticamente para provisionar a capacidade solicitada.

  12. Clique em Criar.

gcloud

Para criar uma solicitação de reserva adiantada no modo de calendário e enviar para análise, use um dos seguintes comandos gcloud beta compute future-reservations create. Com base nos recursos que você quer reservar, inclua as seguintes flags:

  • Para reservar VMs com GPU, inclua as flags --total-count e --machine-type:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --total-count=NUMBER_OF_VMS \
        --machine-type=MACHINE_TYPE \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    
  • Para reservar TPUs, inclua as flags --chip-count e --tpu-version:

    gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
        --auto-delete-auto-created-reservations \
        --chip-count=NUMBER_OF_CHIPS \
        --tpu-version=TPU_VERSION \
        --deployment-type=DENSE \
        --planning-status=SUBMITTED \
        --require-specific-reservation \
        --reservation-mode=CALENDAR \
        --reservation-name=RESERVATION_NAME \
        --share-setting=SHARE_TYPE \
        --start-time=START_TIME \
        --end-time=END_TIME \
        --zone=ZONE
    

Substitua:

  • FUTURE_RESERVATION_NAME: o nome da solicitação.

  • NUMBER_OF_VMS: o número de VMs com GPU a serem reservadas.

  • MACHINE_TYPE: o tipo de máquina de GPU a ser reservado.

  • NUMBER_OF_CHIPS: o número de chips de TPU a serem reservados.

  • TPU_VERSION: a versão da TPU a ser reservada. Especifique um dos seguintes valores:

    • Para a TPU v6e: V6E

    • Para TPU v5p: V5P

    • Para a TPU v5e: V5E

    Se você especificar uma TPU v5e, inclua a flag --workload-type. Defina a flag para o tipo de cargas de trabalho que você quer executar nas TPUs:

    • Para cargas de trabalho que processam grandes quantidades de dados em uma ou várias operações, como treinamento de machine learning (ML), especifique BATCH.

    • Para cargas de trabalho que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.

  • RESERVATION_NAME: o nome da reserva que o Compute Engine cria automaticamente para provisionar a capacidade solicitada.

  • SHARE_TYPE: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:

    • Para usar a capacidade apenas no seu projeto: local

    • Para compartilhar capacidade com outros projetos: projects

    Se você especificar projects, inclua a flag --share-with definida como uma lista separada por vírgulas de IDs de projetos, por exemplo, project-1,project-2. É possível especificar até 100 projetos na sua organização. Não inclua o ID do projeto nessa lista. É possível consumir a capacidade reservada por padrão.

  • START_TIME: o horário de início da solicitação, formatado como um carimbo de data/hora RFC 3339.

  • END_TIME: o horário de término do período de reserva, formatado como um carimbo de data/hora RFC 3339. Se você quiser especificar uma duração, em segundos, para o período de reserva em vez de um horário de término, substitua a flag --end-time pela --duration.

  • ZONE: a zona em que você quer reservar recursos.

REST

Para criar uma solicitação de reserva adiantada no modo de calendário e enviá-la para análise, envie a seguinte solicitação POST para o método futureReservations.insert da versão Beta. Com base nos recursos que você quer reservar, inclua os seguintes campos no corpo da solicitação:

  • Para reservar VMs com GPU, inclua os campos totalCount e machineType:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "specificSkuProperties": {
        "totalCount": NUMBER_OF_VMS,
        "instanceProperties": {
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    
  • Para reservar TPUs, inclua os campos acceleratorCount e vmFamily:

    POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations
    
    {
      "name": "FUTURE_RESERVATION_NAME",
      "autoDeleteAutoCreatedReservations": true,
      "deploymentType": "DENSE",
      "planningStatus": "SUBMITTED",
      "reservationMode": "CALENDAR",
      "reservationName": "RESERVATION_NAME",
      "shareSettings": {
        "shareType": "SHARE_TYPE"
      },
      "specificReservationRequired": true,
      "aggregateReservation": {
        "reservedResources": [
          {
            "accelerator": {
              "acceleratorCount": NUMBER_OF_CHIPS
            }
          }
        ],
        "vmFamily": "TPU_VERSION"
      },
      "timeWindow": {
        "startTime": "START_TIME",
        "endTime": "END_TIME"
      }
    }
    

Substitua:

  • PROJECT_ID: o ID do projeto em que você quer criar a solicitação.

  • ZONE: a zona em que você quer reservar recursos.

  • FUTURE_RESERVATION_NAME: o nome da solicitação.

  • RESERVATION_NAME: o nome da reserva que o Compute Engine cria automaticamente para provisionar a capacidade solicitada.

  • SHARE_TYPE: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:

    • Para usar a capacidade apenas no seu projeto: LOCAL

    • Para compartilhar capacidade com outros projetos: SPECIFIC_PROJECTS

    Se você especificar SPECIFIC_PROJECTS, no campo shareSettings, inclua o campo projectMap para especificar os projetos com que compartilhar a capacidade. É possível especificar até 100 projetos na sua organização. Não especifique o ID do projeto. Você pode consumir a capacidade reservada por padrão.

    Por exemplo, para compartilhar a capacidade solicitada com dois outros projetos, inclua o seguinte:

    "shareSettings": {
      "shareType": "SPECIFIC_PROJECTS",
      "projectMap": {
        "CONSUMER_PROJECT_ID_1": {
          "projectId": "CONSUMER_PROJECT_ID_1"
        },
        "CONSUMER_PROJECT_ID_2": {
          "projectId": "CONSUMER_PROJECT_ID_2"
        }
      }
    }
    

    Substitua CONSUMER_PROJECT_ID_1 e CONSUMER_PROJECT_ID_2 pelos IDs de dois projetos que você quer permitir que consumam a capacidade solicitada.

  • NUMBER_OF_VMS: o número de VMs com GPU a serem reservadas.

  • MACHINE_TYPE: o tipo de máquina de GPU a ser reservado.

  • NUMBER_OF_CHIPS: o número de chips de TPU a serem reservados.

  • TPU_VERSION: a versão da TPU a ser reservada. Especifique um dos seguintes valores:

    • Para a TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E

    • Para TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P

    • Para a TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP

    Se você especificar uma TPU v5e, inclua o campo workloadType no campo aggregateResources. Defina o campo com o tipo de cargas de trabalho que você quer executar nas TPUs:

    • Para cargas de trabalho que processam grandes quantidades de dados em uma ou várias operações, como cargas de trabalho de treinamento de ML, especifique BATCH.

    • Para cargas de trabalho que processam solicitações simultâneas e exigem latência de rede mínima, como cargas de trabalho de inferência de ML, especifique SERVING.

  • START_TIME: o horário de início da solicitação, formatado como um carimbo de data/hora RFC 3339.

  • END_TIME: o horário de término do período de reserva, formatado como um carimbo de data/hora RFC 3339. Se você quiser especificar uma duração, em segundos, para o período de reserva em vez de um horário de término, substitua o campo endTime pelo campo duration.

A seguir