Este documento descreve como criar solicitações de redimensionamento em um grupo de instâncias gerenciadas (MIG) de instâncias de máquinas virtuais (VM) que possuem GPUs anexadas. Para criar uma solicitação de redimensionamento em um MIG que possa usar os recursos e serviços disponíveis no Cluster Director, consulte Criar um MIG e uma solicitação de redimensionamento na documentação do AI Hypercomputer.
A criação de solicitações de redimensionamento em um MIG ajuda a obter recursos altamente demandados, como GPUs, e a otimizar custos criando o número exato de VMs de uma só vez.
Antes de começar
- Revise como funcionam as solicitações de redimensionamento .
- Para garantir que você tenha cota de GPU suficiente para os recursos solicitados, verifique sua cota de GPU .
- Se ainda não o fez, configure a autenticação. Autenticação é o processo pelo qual sua identidade é verificada para acesso a Google Cloud serviços e APIs. Para executar códigos ou amostras em um ambiente de desenvolvimento local, você pode se autenticar no Compute Engine selecionando uma das seguintes opções:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
- Para criar um modelo de instância:
compute.instanceTemplates.create
no projeto - Para criar um MIG zonal:
compute.instanceGroupManagers.create
no projeto - Para criar solicitações de redimensionamento em um MIG:
compute.instanceGroupManagers.update
no projeto Pare as VMs durante eventos de manutenção do host .
Não use reservas .
No console do Google Cloud, acesse a página Modelos de instância .
Clique em Criar modelo de instância .
No campo Nome , insira um nome para o modelo de instância.
Na seção Localização , selecione uma das seguintes opções:
Para criar um modelo de instância global, selecione Global , se ainda não estiver selecionado.
Para criar um modelo de instância regional, selecione Regional e selecione a região na qual deseja criar o modelo de instância.
Na seção Configuração da máquina , faça o seguinte:
Clique na guia GPUs .
Na lista de tipos de GPU , selecione o tipo de GPU.
Na lista Número de GPUs , selecione o número de GPUs.
Opcional: se o seu modelo de GPU suportar estações de trabalho virtuais NVIDIA RTX (vWS) para cargas de trabalho gráficas e você planeja executar cargas de trabalho com uso intensivo de gráficos, selecione Habilitar estação de trabalho virtual (NVIDIA GRID) .
Na seção Tipo de máquina , selecione um tipo de máquina.
Opcional: Para alterar o tipo ou imagem do disco de inicialização do valor padrão, na seção Disco de inicialização , clique em Alterar . Em seguida, siga as instruções para alterar o disco de inicialização.
Expanda a seção Opções avançadas e faça o seguinte:
Expanda a seção Gerenciamento .
Na lista Reservas , selecione Não usar .
Clique em Criar .
O sinalizador
--maintenance-policy
definido comoTERMINATE
.O sinalizador
--reservation-affinity
definido comonone
.INSTANCE_TEMPLATE_NAME
: o nome do modelo de instância a ser criado.IMAGE_PROJECT
: o projeto de imagem que contém a imagem; por exemplo,debian-cloud
. Para obter mais informações sobre os projetos de imagem suportados, consulte Imagens públicas .IMAGE_FAMILY
: uma família de imagens . Isso especifica a imagem do sistema operacional mais recente e não obsoleta. Por exemplo, se você especificardebian-12
, a versão mais recente da família de imagens Debian 12 será usada. Para obter mais informações sobre o uso de famílias de imagens, consulte Práticas recomendadas para famílias de imagens .Se você quiser usar uma versão específica da imagem do sistema operacional, como
debian-12-buster-v20240701
, substitua o sinalizador--image-family
pelo sinalizador--image
.REGION
: a região na qual o modelo de instância será criado.MACHINE_TYPE
: um tipo de máquina que suporta GPUs . Se você especificar um tipo de máquina N1, inclua o sinalizador--accelerator
para especificar o número e o tipo de GPUs a serem anexadas às suas VMs.Para criar um modelo de instância regional: método
regionInstanceTemplates.insert
Para criar um modelo de instância global: método
instanceTemplates.insert
Inclua o campo
scheduling.onHostMaintenance
e defina-o comoTERMINATE
.Inclua o campo
reservationAffinity.consumeReservationType
e configure-o comoNO_RESERVATION
.PROJECT_ID
: o ID do projeto no qual será criado o modelo de instância.REGION
: a região na qual o modelo de instância será criado.INSTANCE_TEMPLATE_NAME
: o nome do modelo de instância a ser criado.IMAGE_PROJECT
: o projeto de imagem que contém a imagem; por exemplo,debian-cloud
. Para obter mais informações sobre os projetos de imagem suportados, consulte Imagens públicas .IMAGE
: especifique um dos seguintes:Uma versão específica da imagem do sistema operacional — por exemplo,
debian-12-bookworm-v20240617
.Uma família de imagens , que deve ser formatada como
family/ IMAGE_FAMILY
. Isso especifica a imagem do sistema operacional mais recente e não obsoleta. Por exemplo, se você especificarfamily/debian-12
, a versão mais recente da família de imagens Debian 12 será usada. Para obter mais informações sobre o uso de famílias de imagens, consulte Práticas recomendadas para famílias de imagens .
MACHINE_TYPE
: um tipo de máquina que suporta GPUs . Se você especificar um tipo de máquina N1, inclua o campoguestAccelerators
no corpo da solicitação para especificar o número e o tipo de GPUs a serem anexadas às suas VMs.Defina o tipo de atualização do MIG como oportunista (padrão).
Se você configurou o escalonamento automático no MIG, exclua a configuração de escalonamento automático .
Se você estiver usando um MIG regional, defina o formato de distribuição de destino como
ANY_SINGLE_ZONE
.No console do Google Cloud, acesse a página Grupos de instâncias .
Clique em Criar grupo de instâncias .
A página Criar grupo de instâncias é aberta.
No campo Nome , insira um nome para o MIG.
Na lista Modelo de instância , selecione o modelo de instância criado na seção anterior. Se você selecionar um modelo de instância regional, a lista Região será definida como a região do modelo de instância.
Na seção Localização , especifique se deseja criar um MIG zonal ou regional da seguinte forma:
Para criar um MIG zonal, selecione Zona única . Ou, para criar um MIG regional, selecione Zonas múltiplas .
Selecione a região e zonas do MIG.
Se você estiver criando um MIG regional, faça o seguinte:
No campo Formato de distribuição de destino , selecione Qualquer zona única . Você poderá selecionar essa opção somente depois de excluir a configuração de escalonamento automático nas etapas seguintes.
Depois de selecionar a opção qualquer zona única, na caixa de diálogo exibida, clique em Desativar redistribuição de instância .
Exclua a configuração de escalonamento automático da seguinte maneira:
Na seção Escalonamento automático , clique na lista Modo de escalonamento automático e clique em Excluir configuração de escalonamento automático .
Na caixa de diálogo de confirmação, clique em Excluir .
Desligue os reparos da seguinte forma:
Na seção Ciclo de vida da instância de VM , clique na lista Ação padrão em caso de falha .
Selecione Nenhuma ação .
Faça um dos seguintes:
Para criar uma solicitação de redimensionamento neste momento, faça o seguinte:
No campo Número de instâncias , insira o número de VMs que você deseja criar de uma só vez.
Marque a caixa de seleção Usar solicitação de redimensionamento para criar VMs de uma só vez .
No campo Duração da execução solicitada e na lista Unidade , especifique a duração da execução das VMs. A duração deve ser entre 1 hora e 7 dias.
Caso contrário, no campo Número de instâncias , insira
0
. Posteriormente, você poderá adicionar VMs ao grupo criando solicitações de redimensionamento .
Clique em Criar .
Para criar um MIG zonal, execute o seguinte comando:
gcloud compute instance-groups managed create INSTANCE_GROUP_URL \ --template=INSTANCE_TEMPLATE_NAME \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
Para criar um MIG regional, execute o seguinte comando:
gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --region=REGION \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none \ --default-action-on-vm-failure=do_nothing
INSTANCE_GROUP_NAME
: o nome do MIG a ser criado.INSTANCE_TEMPLATE_URL
: o URL parcial do modelo de instância que você criou na seção anterior. Se quiser usar um modelo de instância regional para criar o MIG, você só poderá criar o MIG dentro da região do modelo. Especifique um dos seguintes valores:Para um modelo de instância regional:
projects/ PROJECT_ID /regions/ REGION /instanceTemplates/ INSTANCE_TEMPLATE_NAME
Para um modelo de instância global:
INSTANCE_TEMPLATE_NAME
ZONE
: a zona na qual criar o MIG.REGION
: a região na qual será criado o MIG.Para criar um MIG zonal, envie uma solicitação
POST
usando o métodoinstanceGroupManagers.insert
da seguinte maneira:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
Para criar um MIG regional, envie uma solicitação
POST
usando o métodoregionInstanceGroupManagers.insert
da seguinte forma:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE" }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
PROJECT_ID
: o ID do projeto onde está localizado o modelo de instância que você criou na seção anterior.INSTANCE_TEMPLATE_URL
: o URL parcial do modelo de instância que você criou na seção anterior. Se quiser usar um modelo de instância regional para criar o MIG, você só poderá criar o MIG dentro da região do modelo. Especifique um dos seguintes valores:Para um modelo de instância regional:
regions/ REGION /instanceTemplates/ INSTANCE_TEMPLATE_NAME
Para um modelo de instância global:
global/instanceTemplates/ INSTANCE_TEMPLATE_NAME
ZONE
: a zona na qual criar o MIG.REGION
: a região na qual será criado o MIG.INSTANCE_GROUP_NAME
: o nome do MIG a ser criado.No console do Google Cloud, acesse a página Grupos de instâncias .
Na coluna Nome , clique no nome do MIG no qual deseja criar a solicitação de redimensionamento.
A página de visão geral do MIG é aberta.
Na linha Solicitações de redimensionamento , clique em
Editar solicitações de redimensionamento .Clique em
nova solicitação de redimensionamento .O painel Novas solicitações de redimensionamento é exibido.
No campo Nome , insira o nome da solicitação de redimensionamento.
No campo Número de instâncias adicionais necessárias , insira o número de VMs a serem adicionadas ao MIG de uma só vez.
Nos campos Duração da execução solicitada e Unidade , especifique a duração que você deseja que as VMs solicitadas sejam executadas. A duração deve ser entre 1 hora e 7 dias.
Clique em Criar .
Para criar uma solicitação de redimensionamento em um MIG zonal, use o comando
instance-groups managed resize-requests create
.gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --requested-run-duration=RUN_DURATION \ --zone=ZONE
Para criar uma solicitação de redimensionamento em um MIG regional, use o comando
beta instance-groups managed resize-requests create
.gcloud beta compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --requested-run-duration=RUN_DURATION \ --region=REGION
INSTANCE_GROUP_NAME
: o nome do MIG configurado para criar solicitações de redimensionamento nele.RESIZE_REQUEST_NAME
: o nome da solicitação de redimensionamento, que deve ser exclusivo dentro do MIG especificado. Caso contrário, a criação da solicitação de redimensionamento falhará.COUNT
: o número de VMs a serem adicionadas ao MIG de uma só vez.RUN_DURATION
: a duração que você deseja que as VMs solicitadas sejam executadas. O valor deve ser formatado como o número de dias, horas, minutos ou segundos seguido pord
,h
,m
es
respectivamente. Por exemplo, especifique30m
para 30 minutos ou1d2h3m4s
para 1 dia, 2 horas, 3 minutos e 4 segundos. O valor deve estar entre 10 minutos e 7 dias.ZONE
: a zona onde o MIG está localizado.REGION
: região onde o MIG está localizado.Para criar uma solicitação de redimensionamento em um MIG zonal, envie uma solicitação
POST
usando o métodoinstanceGroupManagerResizeRequests.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests
Para criar uma solicitação de redimensionamento em um MIG regional, envie uma solicitação
POST
usando o métodobeta.regionInstanceGroupManagerResizeRequests.insert
.POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests
PROJECT_ID
: o ID do projeto onde o MIG especificado está localizado.ZONE
: a zona onde o MIG está localizado.REGION
: região onde o MIG está localizado.INSTANCE_GROUP_NAME
: o nome do MIG configurado para criar solicitações de redimensionamento nele.RESIZE_REQUEST_NAME
: o nome da solicitação de redimensionamento, que deve ser exclusivo dentro do MIG especificado. Caso contrário, a criação da solicitação de redimensionamento falhará.COUNT
: o número de VMs a serem adicionadas de uma só vez ao MIG.RUN_DURATION
: a duração, em segundos, que você deseja que as VMs solicitadas sejam executadas. O valor deve estar entre600
, que é 600 segundos (10 minutos), e604800
, que é 604.800 segundos (7 dias).Saiba como visualizar, cancelar ou excluir solicitações de redimensionamento em um MIG .
Saiba como visualizar informações sobre MIGs e VMs gerenciadas .
- Saiba como visualizar o uso real e previsto de suas VMs e GPUs .
REST
Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para gcloud CLI.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Para mais informações, consulte Autenticar para usar REST na documentação de autenticação do Google Cloud.
Funções obrigatórias
Para obter as permissões necessárias para criar solicitações de redimensionamento em um MIG, peça ao administrador para conceder a você a função do IAM Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) no projeto. Para obter mais informações sobre a concessão de funções, consulte Gerenciar acesso a projetos, pastas e organizações .Esta função predefinida contém as permissões necessárias para criar solicitações de redimensionamento em um MIG. Para ver as permissões exatas necessárias, expanda a seção Permissões necessárias :
Permissões necessárias
As seguintes permissões são necessárias para criar solicitações de redimensionamento em um MIG:
Você também poderá obter essas permissões com funções personalizadas ou outras funções predefinidas .
Prepare um MIG para solicitações de redimensionamento
Para criar solicitações de redimensionamento em um MIG, você deve configurar um modelo de instância e o MIG conforme descrito nas seções a seguir.
Crie um modelo de instância
Se você quiser criar solicitações de redimensionamento em um MIG, o MIG deverá usar um modelo de instância com as seguintes configurações:
Para criar um modelo de instância configurado para criar solicitações de redimensionamento em um MIG, selecione uma das seguintes opções:
Console
gcloud
Para criar um modelo de instância configurado para criar solicitações de redimensionamento em um MIG, use o comando
instance-templates create
com os seguintes sinalizadores:Por exemplo, use o comando a seguir para criar um modelo de instância regional. Se você deseja criar um modelo de instância global, use o mesmo comando sem o sinalizador
--instance-template-region
.gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \ --image-project=IMAGE_PROJECT \ --image-family=IMAGE_FAMILY \ --instance-template-region=REGION \ --machine-type=MACHINE_TYPE \ --maintenance-policy=TERMINATE \ --reservation-affinity=none
Substitua o seguinte:
DESCANSAR
Para criar um modelo de instância configurado para criar solicitações de redimensionamento em um MIG, faça uma solicitação
POST
para um dos seguintes métodos:No corpo da solicitação, faça o seguinte:
Por exemplo, para criar um modelo de instância regional, faça uma solicitação
POST
da seguinte forma:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "disks": [ { "boot": true, "initializeParams": { "sourceImage": "projects/IMAGE_PROJECT/global/images/IMAGE" } } ], "machineType": "MACHINE_TYPE", "networkInterfaces": [ { "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "onHostMaintenance": "TERMINATE" } } }
Substitua o seguinte:
Para obter mais informações sobre como criar um modelo de instância, consulte Criar modelos de instância .
Criar ou atualizar um MIG
Depois de criar o modelo de instância conforme descrito na seção anterior, use esse modelo de instância para criar um MIG conforme a seguir ou atualize um MIG . Além disso, você deve fazer o seguinte para preparar o MIG para solicitações de redimensionamento:
Para criar um MIG compatível com solicitações de redimensionamento, selecione uma das seguintes opções:
Console
gcloud
Use o comando
instance-groups managed create
com o sinalizador--default-action-on-vm-failure
definido comodo_nothing
. Se você estiver criando um MIG regional, também deverá incluir o sinalizador--target-distribution-shape
definido comoany-single-zone
e o sinalizador--instance-redistribution-type
definido comonone
.Substitua o seguinte:
DESCANSAR
Substitua o seguinte:
Crie uma solicitação de redimensionamento em um MIG
Antes de criar solicitações de redimensionamento, certifique-se de ter preparado o MIG conforme descrito na seção anterior.
Depois de criar uma solicitação de redimensionamento, a solicitação é aceita e todos os recursos solicitados ficam disponíveis, o MIG cria o número solicitado de VMs de uma só vez. As VMs serão executadas até que o MIG as exclua após o término da duração de execução especificada ou até que você as exclua .
Para criar uma solicitação de redimensionamento em um MIG, selecione uma das seguintes opções:
Console
gcloud
Substitua o seguinte:
DESCANSAR
No corpo da solicitação, inclua o seguinte:
{ "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT, "requestedRunDuration": { "seconds": "RUN_DURATION" } }
Substitua o seguinte:
Depois de criar uma solicitação de redimensionamento, você poderá visualizar seu status ou solucionar problemas visualizando os detalhes da solicitação de redimensionamento .
O que vem a seguir
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-04-21 UTC.
-