Esta página foi traduzida pela API Cloud Translation.

Criar solicitações de redimensionamento em um MIG

Neste documento, descrevemos como criar solicitações de redimensionamento em um grupo gerenciado de instâncias (MIG) de máquina virtual (VMs) com GPUs anexadas. Para saber mais sobre solicitações de redimensionamento, consulte Sobre solicitações de redimensionamento em um MIG.

Criar uma solicitação de redimensionamento do MIG ajuda a obter recursos com alta demanda, como GPUs, e otimizar custos criando o número exato de VMs de uma só vez. Para criar uma solicitação de redimensionamento de MIG que possa usar os recursos e serviços disponíveis no Cluster Director, consulte Criar um MIG e uma solicitação de redimensionamento na documentação do AI Hypercomputer.

Antes de começar

Para usar solicitações de redimensionamento do MIG e criar VMs assim que os recursos estiverem disponíveis para cargas de trabalho que são executadas por até sete dias, verifique se você tem cota padrão ou preemptiva suficiente para os recursos solicitados. Para mais informações, consulte como verificar a cota de GPU.
Configure a autenticação, caso ainda não tenha feito isso. A autenticação é o processo de verificação da sua identidade para acesso a serviços e APIs do Google Cloud . Para executar códigos ou amostras de um ambiente de desenvolvimento local, autentique-se no Compute Engine selecionando uma das seguintes opções:

Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Install the Google Cloud CLI. After installation, initialize the Google Cloud CLI by running the following command:
  gcloud init
  If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
  
  Note: If you installed the gcloud CLI previously, make sure you have the latest version by running gcloud components update.
2. Set a default region and zone.
REST

Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para a CLI gcloud.
Para mais informações, consulte Autenticar para usar REST na documentação de autenticação do Google Cloud .

Funções exigidas

Para receber as permissões necessárias para criar solicitações de redimensionamento de MIG, peça ao administrador para conceder a você o papel do IAM de Administrador da instância da computação (v1) (roles/compute.instanceAdmin.v1) no projeto. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Esse papel predefinido contém as permissões necessárias para criar solicitações de redimensionamento de MIG. Para conferir as permissões exatas necessárias, expanda a seção Permissões necessárias:

Permissões necessárias

As seguintes permissões são necessárias para criar solicitações de redimensionamento de MIG:

Para criar um modelo de instância: compute.instanceTemplates.create no projeto
Para criar um MIG zonal: compute.instanceGroupManagers.create no projeto
Para criar uma solicitação de redimensionamento de MIG: compute.instanceGroupManagers.update no projeto

Essas permissões também podem ser concedidas com funções personalizadas ou outros papéis predefinidos.

Preparar um MIG para solicitações de redimensionamento

Para criar solicitações de redimensionamento de MIG, configure um modelo de instância e o MIG conforme descrito nas seções a seguir.

Criar um modelo de instância

Com base no seu caso de uso para solicitações de redimensionamento de MIG, crie um modelo de instância usando um dos seguintes métodos:

Se você quiser criar VMs assim que os recursos estiverem disponíveis para cargas de trabalho que são executadas por até sete dias, crie um modelo de instância usando o modelo de provisionamento de início flexível.
Se você quiser criar VMs consumindo uma reserva criada automaticamente para uma reserva futura no modo de calendário, crie um modelo de instância usando o modelo de provisionamento vinculado à reserva.

Usar o modelo de provisionamento de início flexível

Para criar um modelo de instância configurado para solicitações de redimensionamento de MIG e para criar VMs assim que os recursos estiverem disponíveis, especifique o seguinte no modelo:

Use um tipo de máquina com GPU, exceto o tipo de máquina A4X.
Interrompa as VMs durante eventos de manutenção do host.
Exclua as VMs ao final da duração da execução usando os campos maxRunDuration e instanceTerminationAction.
Impedir o consumo de reservas.
Use o modelo de provisionamento de início flexível.

Para criar um modelo de instância, selecione uma das seguintes opções:

Console

No console Google Cloud , acesse a página Modelos de instância.

Acesse "Modelos de instância"
Clique em Criar modelo de instância. A página Criar um modelo de instância é aberta.
No campo Nome, insira um nome para o modelo de instância.
Na seção Local, selecione uma das seguintes opções:
- Para criar um modelo de instância regional, selecione Regional (recomendado) e escolha a região em que você quer criar o modelo.
- Para criar um modelo de instância global, selecione Global.
Na seção Configuração da máquina, faça o seguinte:
1. Clique na guia GPUs.
2. Na lista Tipo de GPU, selecione um tipo de GPU.
3. Na lista Número de GPUs, selecione o número de GPUs.
4. Opcional: se o tipo de GPU escolhido for compatível com estações de trabalho virtuais (vWS) NVIDIA RTX para cargas de trabalho de gráficos e você planeja executar cargas de trabalho com muitos gráficos, selecione Ativar estação de trabalho virtual (NVIDIA GRID).
5. Na lista Tipo de máquina, selecione um tipo de máquina.
Na seção Modelo de provisionamento, conclua as etapas a seguir:
1. No campo Modelo de provisionamento de VM, selecione Início flexível.
2. Expanda Configurações avançadas do modelo de provisionamento de VM.
3. Marque a caixa de seleção Definir um limite de tempo para a VM.
4. Para definir uma duração de execução para as VMs criadas com o modelo de instância, no campo Insira o número de horas, digite o número de horas. O valor precisa estar entre 36 segundos (0.01) e sete dias (168).
Opcional: para alterar o valor padrão do tipo ou da imagem do disco de inicialização, na seção Disco de inicialização, clique em Alterar. Depois, siga as instruções para alterar o disco de inicialização.
Clique em Criar.

gcloud

Para criar um modelo de instância, use o comando beta instance-templates create com as seguintes flags:

A flag --instance-termination-action definida como DELETE.
A flag --maintenance-policy definida como TERMINATE.
A sinalização --max-run-duration
A flag --provisioning-model definida como FLEX_START.
A flag --reservation-affinity definida como none.

Por exemplo, para criar um modelo de instância regional, execute o seguinte comando. Se quiser criar um modelo de instância global, use o mesmo comando sem a flag --instance-template-region.

gcloud beta compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --image-project=IMAGE_PROJECT \
    --image-family=IMAGE_FAMILY \
    --instance-template-region=REGION \
    --instance-termination-action=DELETE \
    --machine-type=MACHINE_TYPE \
    --maintenance-policy=TERMINATE \
    --max-run-duration=RUN_DURATION \
    --provisioning-model=FLEX_START \
    --reservation-affinity=none

Substitua:

INSTANCE_TEMPLATE_NAME: o nome do modelo de instância a ser criado.
IMAGE_PROJECT: o projeto de imagem que contém a imagem, por exemplo, debian-cloud. Para mais informações sobre os projetos de imagem com suporte, consulte Imagens públicas.
IMAGE_FAMILY: uma família de imagens. Especifica a imagem do SO mais recente e não descontinuada. Por exemplo, se você especificar debian-12, a versão mais recente na família de imagens do Debian 12 será usada. Para mais informações sobre o uso de famílias de imagens, consulte Práticas recomendadas para famílias de imagens.

Observação: se você quiser usar uma versão específica da imagem do SO, como debian-12-bookworm-v20240701, substitua a flag --image-family pela flag --image.
REGION: a região em que o modelo de instância será criado.
MACHINE_TYPE: o tipo de máquina com GPU a ser usado para as VMs. Se você especificar um tipo de máquina N1, inclua a flag --accelerator para definir o número e o tipo de GPUs a serem anexadas às VMs.
RUN_DURATION: a duração da execução das VMs solicitadas. Formate o valor como o número de dias, horas, minutos ou segundos, seguido por d, h, m e s, respectivamente. Por exemplo, especifique 30m para 30 minutos ou 1d2h3m4s para um dia, duas horas, três minutos e quatro segundos. O valor precisa estar entre 10 minutos e sete dias.

REST

Para criar um modelo de instância, faça uma solicitação POST para um dos seguintes métodos:

Para criar um modelo de instância regional: método regionInstanceTemplates.insert da versão Beta
Para criar um modelo de instância global: método instanceTemplates.insert da versão Beta

No corpo da solicitação, inclua os seguintes campos:

O campo reservationAffinity.consumeReservationType definido como NO_RESERVATION.
O campo scheduling.instanceTerminationAction definido como DELETE.
O campo scheduling.maxRunDuration.
O campo scheduling.onHostMaintenance definido como TERMINATE.
O campo scheduling.provisioningModel definido como FLEX_START.

Por exemplo, para criar um modelo de instância regional, faça uma solicitação da seguinte maneira:

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceTemplates

{
  "name": "INSTANCE_TEMPLATE_NAME",
  "properties": {
    "disks": [
      {
        "boot": true,
        "initializeParams": {
          "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE"
        }
      }
    ],
    "machineType": "MACHINE_TYPE",
    "networkInterfaces": [
      {
        "network": "global/networks/default"
      }
    ],
    "reservationAffinity": {
      "consumeReservationType": "NO_RESERVATION"
    },
    "scheduling": {
      "instanceTerminationAction": "DELETE",
      "maxRunDuration": {
        "seconds": RUN_DURATION
      },
      "onHostMaintenance": "TERMINATE",
      "provisioningModel": "FLEX_START"
    }
  }
}

Substitua:

PROJECT_ID: o ID do projeto em que o modelo de instância será criado.
REGION: a região em que o modelo de instância será criado.
INSTANCE_TEMPLATE_NAME: o nome do modelo de instância a ser criado.
IMAGE_PROJECT: o projeto de imagem que contém a imagem, por exemplo, debian-cloud. Para mais informações sobre os projetos de imagem com suporte, consulte Imagens públicas.
IMAGE: especifique uma destas opções:
- Uma versão específica da imagem do SO. Por exemplo: debian-12-bookworm-v20240617
- Uma família de imagens, que precisa ser formatada como family/IMAGE_FAMILY. Especifica a imagem do SO mais recente e não descontinuada. Por exemplo, se você especificar family/debian-12, a versão mais recente na família de imagens do Debian 12 será usada. Para mais informações sobre o uso de famílias de imagens, consulte Práticas recomendadas para famílias de imagens.
MACHINE_TYPE: o tipo de máquina com GPU a ser usado para as VMs. Se você especificar um tipo de máquina N1, inclua o campo guestAccelerators para definir o número e o tipo de GPUs a serem anexadas às VMs.
RUN_DURATION: a duração, em segundos, em que você quer que as VMs solicitadas sejam executadas. O valor precisa estar entre 600, que representa 600 segundos (10 minutos), e 604800, que é 604.800 segundos (sete dias).

Para mais informações sobre como criar um modelo de instância, consulte Criar modelos de instância.

Usar o modelo de provisionamento vinculado à reserva

Para criar um modelo de instância configurado para solicitações de redimensionamento de MIG e para consumir uma reserva, especifique o seguinte no modelo:

Use um tipo de máquina A4 ou A3 Ultra, conforme especificado na reserva.
Interrompa as VMs durante eventos de manutenção do host.
Exclua as VMs no final do período de reserva usando o campo instanceTerminationAction.
Segmentar a reserva para consumo.
Use o modelo de provisionamento vinculado à reserva.

Para criar um modelo de instância, selecione uma das seguintes opções:

Console

No console Google Cloud , acesse a página Modelos de instância.

Acesse "Modelos de instância"
Clique em Criar modelo de instância. A página Criar um modelo de instância é aberta.
No campo Nome, insira um nome para o modelo de instância.
Na seção Local, selecione uma das seguintes opções:
- Para criar um modelo de instância regional, selecione Regional (recomendado) e escolha a região em que você quer criar o modelo.
- Para criar um modelo de instância global, selecione Global.
Na seção Configuração da máquina, faça o seguinte:
1. Clique na guia GPUs.
2. Na lista Tipo de GPU, selecione uma das seguintes opções, conforme especificado na reserva que você quer consumir:
  - Para usar VMs A4: NVIDIA B200 180 GB
  - Para usar as VMs A3 Ultra: NVIDIA H200 141 GB
  Essa ação define automaticamente o modelo de provisionamento do modelo de instância como Vinculado à reserva.
3. Na lista Número de GPUs, selecione o número de GPUs.
4. Opcional: se o tipo de GPU escolhido for compatível com estações de trabalho virtuais (vWS) NVIDIA RTX para cargas de trabalho de gráficos e você planeja executar cargas de trabalho com muitos gráficos, selecione Ativar estação de trabalho virtual (NVIDIA GRID).
5. Na lista Tipo de máquina, selecione um tipo de máquina.
Na seção Modelo de provisionamento, conclua as etapas a seguir:
1. Expanda Configurações avançadas do modelo de provisionamento de VM.
2. Na lista No encerramento da VM, selecione Excluir.
Opcional: para alterar o valor padrão do tipo ou da imagem do disco de inicialização, na seção Disco de inicialização, clique em Alterar. Depois, siga as instruções para alterar o disco de inicialização.
Expanda a seção Opções avançadas e depois faça o seguinte:
1. Expanda a seção Gerenciamento.
2. Na seção Reservas, selecione Escolher uma reserva e clique em Escolher reserva. No painel exibido, siga as instruções para selecionar a reserva que você quer consumir.
Clique em Criar.

gcloud

Para criar um modelo de instância, use o comando instance-templates create com as seguintes flags:

A flag --instance-termination-action definida como DELETE.
A flag --maintenance-policy definida como TERMINATE.
A flag --provisioning-model definida como RESERVATION_BOUND.
A flag --reservation-affinity definida como specific.
A sinalização --reservation

Por exemplo, para criar um modelo de instância regional, execute o seguinte comando. Se quiser criar um modelo de instância global, use o mesmo comando sem a flag --instance-template-region.

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --image-project=IMAGE_PROJECT \
    --image-family=IMAGE_FAMILY \
    --instance-termination-action=DELETE \
    --instance-template-region=REGION \
    --machine-type=MACHINE_TYPE \
    --maintenance-policy=TERMINATE \
    --provisioning-model=RESERVATION_BOUND \
    --reservation-affinity=specific \
    --reservation=RESERVATION_URL

Substitua:

INSTANCE_TEMPLATE_NAME: o nome do modelo de instância a ser criado.
IMAGE_PROJECT: o projeto de imagem que contém a imagem, por exemplo, debian-cloud. Para mais informações sobre os projetos de imagem com suporte, consulte Imagens públicas.
IMAGE_FAMILY: uma família de imagens. Especifica a imagem do SO mais recente e não descontinuada. Por exemplo, se você especificar debian-12, a versão mais recente na família de imagens do Debian 12 será usada. Para mais informações sobre o uso de famílias de imagens, consulte Práticas recomendadas para famílias de imagens.

Observação: se você quiser usar uma versão específica da imagem do SO, como debian-12-bookworm-v20240701, substitua a flag --image-family pela flag --image.
REGION: a região em que o modelo de instância será criado.
MACHINE_TYPE: o tipo de máquina A4 ou A3 Ultra especificado na reserva que você quer consumir.
RESERVATION_URL: o URL da reserva criada automaticamente para uma reserva futura no modo de calendário que você quer usar. Especifique um dos seguintes valores:
- Se a reserva criada automaticamente existir no seu projeto: RESERVATION_NAME.
- Se a reserva criada automaticamente estiver em um projeto diferente: projects/PROJECT_ID/reservations/RESERVATION_NAME.

REST

Para criar um modelo de instância, faça uma solicitação POST para um dos seguintes métodos:

Para criar um modelo de instância regional: método regionInstanceTemplates.insert
Para criar um modelo de instância global: método instanceTemplates.insert

No corpo da solicitação, inclua os seguintes campos:

O campo reservationAffinity.consumeReservationType definido como SPECIFIC_RESERVATION.
O campo reservationAffinity.key definido como compute.googleapis.com/reservation-name.
O campo reservationAffinity.values definido como o URL da reserva criada automaticamente.
O campo scheduling.instanceTerminationAction definido como DELETE.
O campo scheduling.onHostMaintenance definido como TERMINATE.
O campo scheduling.provisioningModel definido como RESERVATION_BOUND.

Por exemplo, para criar um modelo de instância regional, faça uma solicitação da seguinte maneira:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates

{
  "name": "INSTANCE_TEMPLATE_NAME",
  "properties": {
    "disks": [
      {
        "boot": true,
        "initializeParams": {
          "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE"
        }
      }
    ],
    "machineType": "MACHINE_TYPE",
    "networkInterfaces": [
      {
        "network": "global/networks/default"
      }
    ],
    "reservationAffinity": {
      "consumeReservationType": "SPECIFIC_RESERVATION",
      "key": "compute.googleapis.com/reservation-name",
      "values": [
        "RESERVATION_URL"
      ]
    },
    "scheduling": {
      "instanceTerminationAction": "DELETE",
      "onHostMaintenance": "TERMINATE",
      "provisioningModel": "RESERVATION_BOUND"
    }
  }
}

Substitua:

PROJECT_ID: o ID do projeto em que o modelo de instância será criado.
REGION: a região em que o modelo de instância será criado.
INSTANCE_TEMPLATE_NAME: o nome do modelo de instância a ser criado.
IMAGE_PROJECT: o projeto de imagem que contém a imagem, por exemplo, debian-cloud. Para mais informações sobre os projetos de imagem com suporte, consulte Imagens públicas.
IMAGE: especifique uma destas opções:
- Uma versão específica da imagem do SO. Por exemplo: debian-12-bookworm-v20240617
- Uma família de imagens, que precisa ser formatada como family/IMAGE_FAMILY. Especifica a imagem do SO mais recente e não descontinuada. Por exemplo, se você especificar family/debian-12, a versão mais recente na família de imagens do Debian 12 será usada. Para mais informações sobre o uso de famílias de imagens, consulte Práticas recomendadas para famílias de imagens.
MACHINE_TYPE: o tipo de máquina A4 ou A3 Ultra especificado na reserva que você quer consumir.
RESERVATION_URL: o URL da reserva criada automaticamente para uma reserva futura no modo de calendário que você quer usar. Especifique um dos seguintes valores:
- Se a reserva criada automaticamente existir no seu projeto: RESERVATION_NAME
- Se a reserva criada automaticamente estiver em um projeto diferente: projects/PROJECT_ID/reservations/RESERVATION_NAME

Para mais informações sobre como criar um modelo de instância, consulte Criar modelos de instância.

Criar ou atualizar um MIG

Depois de criar o modelo de instância conforme descrito na seção anterior, use esse modelo para criar um MIG conforme a seguir ou atualizar um MIG. Além disso, faça o seguinte a fim de prepará-lo para as solicitações de redimensionamento:

Defina o tipo de atualização do MIG como oportunista (padrão).
Desativar reparos.
Se você tiver configurado o escalonamento automático no MIG, então exclua a configuração de escalonamento automático.
Se você estiver usando um MIG regional, defina o formato de distribuição de destino como ANY_SINGLE_ZONE.

Para criar um MIG compatível com solicitações de redimensionamento, selecione uma das seguintes opções:

Console

No console Google Cloud , acesse a página Grupos de instâncias.

Acesse grupo de instâncias
Clique em Criar grupo de instâncias. A página Criar grupo de instâncias é aberta.
No campo Nome, insira um nome para o MIG.
Antes de selecionar um modelo de instância, exclua a configuração de escalonamento automático e desative os reparos da seguinte maneira:
1. Para excluir a configuração de escalonamento automático, faça o seguinte:
  1. Na seção Escalonamento automático, clique na lista Modo de escalonamento automático e em Excluir configuração de escalonamento automático.
  2. Na caixa de diálogo de confirmação, clique em Excluir.
2. Para desativar os reparos, na seção Ciclo de vida da instância de VM, clique na lista Ação padrão em caso de falha e selecione Nenhuma ação.
Volte ao campo Modelo de instância. Na lista Modelo de instância, selecione o modelo de instância que você criou na seção anterior. Se você selecionar um modelo de instância regional, a lista Região será definida como a região do modelo.
Escolha uma destas opções:
- Para criar uma solicitação de redimensionamento ao criar o MIG, faça o seguinte:
  1. No campo Número de instâncias, insira o número de VMs que você quer criar de uma só vez.
  2. Marque a caixa de seleção Usar solicitação de redimensionamento para criar VMs de uma só vez.
  3. Opcional: se o modelo de instância do MIG especificar uma duração de execução, você poderá especificar uma duração diferente. Para isso, no campo Duração da execução solicitada e nas listas Unidade, especifique uma duração. Você precisa especificar uma duração entre uma hora e sete dias.
- Para criar uma solicitação de redimensionamento depois de criar o MIG, no campo Número de instâncias, insira 0.
Na seção Local, especifique se você quer criar um MIG zonal ou regional da seguinte maneira:
1. Para criar um MIG zonal, selecione Zona única. Ou, para criar um MIG regional, selecione Várias zonas.
2. Selecione a Região e as Zonas do MIG.
3. Se você estiver criando um MIG regional, faça o seguinte:
  1. No campo Forma de distribuição de destino, selecione Qualquer zona única.
  2. Na caixa de diálogo exibida, clique em Desativar redistribuição de instâncias.
Clique em Criar.

gcloud

Use o comando instance-groups managed create com a flag --default-action-on-vm-failure definida como do_nothing. Se você estiver criando um MIG regional, inclua também a flag --target-distribution-shape definida como any-single-zone e a flag --instance-redistribution-type definida como none.

Para criar um MIG zonal, execute o seguinte comando:

gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \
    --template=INSTANCE_TEMPLATE_URL \
    --size=0 \
    --zone=ZONE \
    --default-action-on-vm-failure=do_nothing

Para criar um MIG regional, execute o seguinte comando:

gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \
    --template=INSTANCE_TEMPLATE_URL \
    --size=0 \
    --region=REGION \
    --target-distribution-shape=any-single-zone \
    --instance-redistribution-type=none \
    --default-action-on-vm-failure=do_nothing

Substitua:

INSTANCE_GROUP_NAME: o nome do MIG que será criado.
INSTANCE_TEMPLATE_URL: o URL parcial do modelo de instância que você criou na seção anterior. Se você quiser usar um modelo de instância regional para criar o MIG, só será possível criar o MIG na região do modelo. Especifique um dos seguintes valores:
- Para um modelo de instância regional: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
- Para um modelo de instância global: INSTANCE_TEMPLATE_NAME
ZONE: a zona em que o MIG será criado.
REGION: a região em que o MIG será criado.

REST

Para criar um MIG zonal, envie uma solicitação POST usando o método instanceGroupManagers.insert da seguinte maneira:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers

{
  "versions": [
    {
      "instanceTemplate": "INSTANCE_TEMPLATE_URL"
    }
  ],
  "name": "INSTANCE_GROUP_NAME",
  "targetSize": 0,
  "instanceLifecyclePolicy": {
    "defaultActionOnFailure": "DO_NOTHING"
  }
}

Para criar um MIG regional, envie uma solicitação POST usando o método regionInstanceGroupManagers.insert da seguinte maneira:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers

{
  "versions": [
    {
      "instanceTemplate": "INSTANCE_TEMPLATE_URL"
    }
  ],
  "name": "INSTANCE_GROUP_NAME",
  "targetSize": 0,
  "distributionPolicy": {
    "targetShape": "ANY_SINGLE_ZONE"
  },
  "updatePolicy": {
    "instanceRedistributionType": "NONE"
  },
  "instanceLifecyclePolicy": {
    "defaultActionOnFailure": "DO_NOTHING"
  }
}

Substitua:

PROJECT_ID: o ID do projeto em que está o modelo de instância criado na seção anterior.
INSTANCE_TEMPLATE_URL: o URL parcial do modelo de instância que você criou na seção anterior. Se você quiser usar um modelo de instância regional para criar o MIG, só será possível criar o MIG na região do modelo. Especifique um dos seguintes valores:
- Para um modelo de instância regional: regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_NAME
- Para um modelo de instância global: global/instanceTemplates/INSTANCE_TEMPLATE_NAME
ZONE: a zona em que o MIG será criado.
REGION: a região em que o MIG será criado.
INSTANCE_GROUP_NAME: o nome do MIG que será criado.

Criar uma solicitação de redimensionamento em um MIG

Antes de criar solicitações de redimensionamento do MIG, verifique se você preparou o MIG conforme descrito na seção anterior.

Depois que você cria uma solicitação de redimensionamento e todos os recursos solicitados ficam disponíveis, o MIG cria o número solicitado de VMs de uma só vez. As VMs são executadas até que o MIG as exclua após o término da duração de execução especificada ou até você excluí-las.

Para criar uma solicitação de redimensionamento em um MIG, selecione uma das seguintes opções. Para adicionar VMs com nomes específicos ao MIG por uma solicitação de redimensionamento, use a CLI gcloud ou a API REST.

Console

No console Google Cloud , acesse a página Grupos de instâncias.

Acesse grupo de instâncias
Na coluna Nome, clique no nome do MIG em que você quer criar a solicitação de redimensionamento.

A página de visão geral do MIG será aberta.
Na linha Solicitações de redimensionamento, clique em Editar solicitações de redimensionamento.
Clique em Nova solicitação de redimensionamento.

O painel Novas solicitações de redimensionamento será exibido.
No campo Nome, digite o nome da solicitação de redimensionamento.
No campo Número de instâncias extras necessárias, insira o número de VMs a serem adicionadas ao MIG de uma só vez.
Opcional: se o modelo de instância do MIG especificar uma duração de execução, você poderá especificar uma duração diferente. Para fazer isso, no campo Duração da execução solicitada e nas listas Unidade, especifique uma duração de execução. Você precisa especificar uma duração entre uma hora e sete dias.
Clique em Criar.

gcloud

Para criar uma solicitação de redimensionamento em um MIG zonal, use o comando instance-groups managed resize-requests create.

gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \
    --resize-request=RESIZE_REQUEST_NAME \
    --resize-by=COUNT \
    --zone=ZONE

Para criar uma solicitação de redimensionamento em um MIG regional, use o comando beta instance-groups managed resize-requests create.

gcloud beta compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \
    --resize-request=RESIZE_REQUEST_NAME \
    --resize-by=COUNT \
    --region=REGION

Substitua:

INSTANCE_GROUP_NAME: o nome do MIG configurado para a criação de solicitações de redimensionamento.
RESIZE_REQUEST_NAME: o nome da solicitação de redimensionamento, que precisa ser exclusivo no MIG especificado. Caso contrário, a criação da solicitação de redimensionamento falha.
COUNT: o número de VMs a serem adicionadas ao MIG de uma só vez.
ZONE: a zona em que o MIG está.
REGION: a região em que o MIG existe.

Você também pode fazer o seguinte:

Se o modelo de instância do MIG especificar uma duração de execução, você poderá especificar uma duração diferente. Para isso, inclua a flag --requested-run-duration no comando. Você precisa especificar uma duração entre 10 minutos e sete dias.
Se a carga de trabalho exigir nomes de VM específicos, você poderá especificar uma lista de nomes de VMs a serem criadas usando o comando beta instance-groups managed resize-requests create. No comando, substitua a flag --resize-request pela flag --instances.

REST

Para criar uma solicitação de redimensionamento em um MIG zonal, envie uma solicitação POST usando o método instanceGroupManagerResizeRequests.insert.
```
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests
```
Para criar uma solicitação de redimensionamento em um MIG regional, envie uma solicitação POST usando o método beta.regionInstanceGroupManagerResizeRequests.insert.

No corpo da solicitação, inclua o seguinte:

{
  "name": "RESIZE_REQUEST_NAME",
  "resizeBy": COUNT
}

Substitua:

PROJECT_ID: o ID do projeto em que o MIG especificado está.
ZONE: a zona em que o MIG está.
REGION: a região em que o MIG existe.
INSTANCE_GROUP_NAME: o nome do MIG configurado para a criação de solicitações de redimensionamento.
RESIZE_REQUEST_NAME: o nome da solicitação de redimensionamento, que precisa ser exclusivo no MIG especificado. Caso contrário, a criação da solicitação de redimensionamento falha.
COUNT: o número de VMs a serem adicionadas de uma só vez ao MIG.

Você também pode fazer o seguinte:

Se o modelo de instância do MIG especificar uma duração de execução, você poderá especificar uma duração diferente. Para isso, inclua o campo requestedRunDuration no corpo da solicitação. É necessário especificar uma duração, em segundos, entre 10 minutos e sete dias.
Se a carga de trabalho exigir nomes de VM específicos, especifique uma lista de nomes de VMs a serem criadas. Para isso, envie uma solicitação POST ao método beta.regionInstanceGroupManagerResizeRequests.insert para um MIG regional ou ao método beta.instanceGroupManagerResizeRequests.insert para um MIG zonal. No corpo da solicitação, substitua o campo resizeBy pelo instanceNames.

A seguir

Saiba como visualizar, cancelar ou excluir solicitações de redimensionamento em um MIG.
Saiba como visualizar informações sobre MIGs e VMs gerenciadas.

Saiba como conferir o uso real e o uso previsto das suas VMs e GPUs.

Criar solicitações de redimensionamento em um MIG Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Antes de começar

Console

gcloud

REST

Funções exigidas

Permissões necessárias

Preparar um MIG para solicitações de redimensionamento

Criar um modelo de instância

Usar o modelo de provisionamento de início flexível

Console

gcloud

REST

Usar o modelo de provisionamento vinculado à reserva

Console

gcloud

REST

Criar ou atualizar um MIG

Console

gcloud

REST

Criar uma solicitação de redimensionamento em um MIG

Console

gcloud

REST

A seguir

Criar solicitações de redimensionamento em um MIG