Este documento descreve os diferentes tipos de reserva que podem ser usados para reservar capacidade para instâncias do Compute Engine. Para saber mais sobre os recursos que podem ser usados para criar instâncias, consulte Instâncias do Compute Engine.
As reservas ajudam a garantir que você tenha os recursos disponíveis para criar instâncias com o mesmo hardware (memória e vCPUs) e recursos opcionais (GPUs, TPUs ou discos SSD locais) sempre que precisar deles. As reservas oferecem os seguintes benefícios:
Alta garantia de capacidade: você reserva recursos para acomodar aumentos futuros na demanda, como:
Crescimento
Picos de uso planejados ou não planejados
Migrações grandes
Backup e recuperação de desastres
Acesso exclusivo: as reservas impedem que outras pessoas usem seus recursos reservados.
Propriedades herdadas: as reservas herdam as mesmas propriedades da família de máquinas escolhida.
Depois de reservar capacidade, use-a para criar instâncias que correspondam à reserva. Não há cobranças extras ao criar essas instâncias. Você paga apenas pelos recursos que não fazem parte da reserva, como discos ou endereços IP.
Limitações
Todos os tipos de reserva têm as seguintes limitações:
As reservas são recursos específicos da zona.
Não é possível usar a capacidade reservada para criar os seguintes recursos do Compute Engine:
VMs spot ou instâncias preemptivas
Nós de locatário individual
Escolher um tipo de reserva
O diagrama a seguir ajuda você a escolher o tipo de reserva do Compute Engine mais adequado às necessidades da sua carga de trabalho:
As perguntas no diagrama anterior são as seguintes:
Você precisa de capacidade imediatamente?
Sim: vá para a próxima pergunta.
Não: vá para a pergunta 3.
Você precisa de flexibilidade em relação ao tempo de retenção da capacidade?
Sim: consulte Usar reservas imediatas.
Não: vá para a próxima pergunta.
Você precisa de recursos de alta demanda, como GPUs?
Sim: vá para a próxima pergunta.
Não: consulte Usar reservas adiantadas.
Você precisa de recursos por mais de 90 dias?
Sim: consulte Reservar capacidade no hipercomputador de IA.
Não: consulte Usar reservas adiantadas no modo de agenda.
Usar reservas imediatas
Com as reservas sob demanda, é possível reservar capacidade para instâncias de computação e recebê-la assim que a reserva for feita. Depois de criar uma reserva sob demanda, você pode consumir, modificar ou excluir quando precisar.
Para mais informações, consulte Sobre as reservas.
Usar reservas adiantadas
Para reservar instâncias por um período definido, use as reservas adiantadas. Depois de criar uma solicitação de reserva, envie-a para análise do Google Cloud . OGoogle Cloud leva cinco dias para analisar sua solicitação. Se o pedido for aprovado, o Compute Engine vai criar reservas sob demanda com a capacidade solicitada na data e hora escolhidas. Para consumir essas reservas, crie instâncias de computação que as usem. Depois que o período de reserva termina, é possível modificar ou excluir as reservas.
Para mais informações, consulte Sobre solicitações de reserva adiantada.
Usar reservas adiantadas no modo de agenda
Para reservar instâncias de GPU ou TPUs por até 90 dias, use as reservas adiantadas no modo de calendário. Para criar esse tipo de reserva, primeiro verifique quando o número e o tipo de recursos escolhidos estão disponíveis em uma região. Em seguida, crie e envie uma solicitação de reserva com as propriedades que você confirmou como disponíveis. Se você conseguir criar a solicitação, oGoogle Cloud vai aprová-la em um minuto. Depois que a solicitação é aprovada, o Compute Engine faz o seguinte:
O Compute Engine cria uma reserva imediata.
O Compute Engine reserva os recursos solicitados o mais próximo possível uns dos outros para minimizar a latência da rede.
No início do período de reserva, é possível consumir a reserva criando instâncias de GPU ou TPU. Ao final do período de reserva, o Compute Engine exclui a reserva e para ou exclui todas as instâncias que a consomem com base na ação de encerramento especificada para as instâncias.
Para mais informações, consulte Sobre solicitações de reserva adiantada no modo de calendário.
Reservar capacidade no AI Hypercomputer
Entre em contato com a equipe da sua conta e peça para reservar instâncias de GPU para cargas de trabalho de inteligência artificial (IA) e machine learning (ML) em grande escala. Depois que o Google criar um rascunho de solicitação de reserva para você, envie-o para análise se tudo estiver correto.O Google Cloud aprova imediatamente a solicitação, e o Compute Engine faz o seguinte:
O Compute Engine cria reservas sob demanda.
O Compute Engine reserva os recursos solicitados o mais próximo possível uns dos outros para minimizar a latência da rede.
O Compute Engine reserva recursos com programação compatível com topologia, além de monitoramento e manutenção aprimorados.
No início do período de reserva, você pode consumir a reserva criando instâncias de GPU. Ao final do período de reserva, o Compute Engine exclui a reserva e para ou exclui todas as instâncias que a consomem com base na ação de encerramento especificada para as instâncias.
Para mais informações, consulte Reservar capacidade na documentação do AI Hypercomputer.