Um grupo de instâncias é uma coleção de instâncias de máquinas virtuais (VM) que você pode gerenciar como uma única entidade.
O Compute Engine oferece dois tipos de grupos de instâncias de VM, gerenciados e não gerenciados:
Os grupos de instâncias gerenciadas (MIGs) permitem operar aplicativos em várias VMs idênticas. Você pode tornar suas cargas de trabalho escalonáveis e altamente disponíveis aproveitando os serviços MIG automatizados, incluindo: escalonamento automático, recuperação automática, implantação regional (zona múltipla) e atualização automática.
Os grupos de instâncias não gerenciadas permitem balancear a carga em uma frota de VMs gerenciadas por você mesmo.
Experimente você mesmo
Se você é novo no Google Cloud, crie uma conta para avaliar o desempenho do Compute Engine em cenários do mundo real. Novos clientes também recebem US$ 300 em créditos gratuitos para executar, testar e implantar cargas de trabalho.
Experimente o Compute Engine gratuitamenteGrupos de instâncias gerenciadas (MIGs)
Use um grupo gerenciado de instâncias (MIG) para cenários como estes:
- Cargas de trabalho de veiculação sem estado, como front-end de um site
- Cargas de trabalho de computação em lote sem estado, de alto desempenho ou de alto rendimento, como processamento de imagens de uma fila
- Aplicativos com estado, como bancos de dados, aplicativos legados e cálculos em lote de longa execução com pontos de verificação
O Compute Engine mantém cada uma das instâncias gerenciadas do MIG com base na configuração especificada em um modelo de instância e na configuração com estado opcional.
Para obter informações sobre como criar um MIG, consulte Criando grupos de instâncias gerenciadas .
Benefícios
Os MIGs oferecem as seguintes vantagens:
- Alta disponibilidade .
- Reparando automaticamente VMs com falha . Se uma VM no grupo parar, travar, for preemptada ( Spot VMs ) ou for excluída por uma ação não iniciada pelo MIG, o MIG recriará automaticamente essa VM com base em sua configuração original (mesmo nome de VM, mesmo modelo) para que a VM possa retomar seu trabalho.
- Autocorreção baseada em aplicativo . Você também pode configurar uma verificação de integridade baseada em aplicativo, que verifica periodicamente se seu aplicativo responde conforme o esperado em cada uma das instâncias do MIG. Se um aplicativo não estiver respondendo em uma VM, o MIG recriará automaticamente essa VM para você. Verificar se um aplicativo responde é mais preciso do que simplesmente verificar se uma VM está instalada e funcionando.
- Cobertura regional (zonas múltiplas) . Os MIGs regionais permitem distribuir a carga do aplicativo em várias zonas. Essa replicação protege contra falhas zonais. Se isso acontecer, seu aplicativo poderá continuar atendendo ao tráfego de instâncias em execução nas zonas disponíveis restantes na mesma região.
- Balanceamento de carga . Os MIGs trabalham com serviços de balanceamento de carga para distribuir o tráfego entre todas as instâncias do grupo.
- Escalabilidade . Quando seus aplicativos exigem recursos computacionais adicionais, os MIGs com escalonamento automático podem aumentar automaticamente o número de instâncias no grupo para atender à demanda. Se a demanda cair, os MIGs com escalonamento automático poderão diminuir automaticamente para reduzir seus custos.
- Atualizações automatizadas . O atualizador automático MIG permite implantar com segurança novas versões de software em instâncias do seu MIG e oferece suporte a uma variedade flexível de cenários de implementação, como atualizações contínuas e atualizações canário. Você pode controlar a velocidade e o escopo da implantação, bem como o nível de interrupção do seu serviço.
- Suporte para cargas de trabalho com estado . Você pode usar MIGs para criar implantações altamente disponíveis e automatizar a operação de aplicativos com dados ou configurações com estado, como bancos de dados, servidores DNS, aplicativos monolíticos legados ou cálculos em lote de longa execução com pontos de verificação. Os MIGs com estado preservam o estado exclusivo de cada instância (nome da instância, discos persistentes anexados e metadados) em eventos de reinicialização, recriação, recuperação automática e atualização da máquina.
- Crie VMs GPU de uma só vez . Quando você tem um trabalho em lote, como um treinamento de IA ou ML, que requer um número exato de VMs de GPU, a criação de uma solicitação de redimensionamento em um MIG pode ajudá-lo a criar as VMs todas de uma vez. Você pode especificar a duração durante a qual deseja que as VMs sejam executadas, melhorando assim a obtenção de recursos altamente demandados, como GPUs.
Reparo automático e autocura
Os grupos de instâncias gerenciadas mantêm a alta disponibilidade de seus aplicativos, mantendo suas instâncias disponíveis de forma proativa. Um MIG repara automaticamente instâncias com falha, recriando-as.
Você também pode reparar instâncias em que um aplicativo congela, trava ou fica sem memória. A recuperação automática baseada em aplicativos melhora a disponibilidade dos aplicativos, contando com um sinal de verificação de integridade que detecta problemas específicos do aplicativo, como congelamento, falha ou sobrecarga. Se uma verificação de integridade determinar que um aplicativo falhou em uma VM, o grupo recriará automaticamente essa instância de VM.
Para obter mais informações, consulte Sobre o reparo de VMs em um MIG .
Verificação de saúde
As verificações de funcionamento usadas para monitorar MIGs são semelhantes às verificações de funcionamento usadas para balanceamento de carga, com algumas diferenças de comportamento. As verificações de integridade do balanceamento de carga ajudam a direcionar o tráfego das instâncias que não respondem e para as instâncias íntegras; essas verificações de integridade não fazem com que o Compute Engine recrie instâncias. Por outro lado, as verificações de integridade do grupo de instâncias gerenciadas sinalizam proativamente para excluir e recriar instâncias que se tornam UNHEALTHY
.
Para a maioria dos cenários, utilize verificações de saúde separadas para equilíbrio de carga e para recuperação automática. A verificação de integridade para balanceamento de carga pode e deve ser mais agressiva porque essas verificações de integridade determinam se uma instância recebe tráfego de usuário. Como os clientes podem confiar em seus serviços, você deseja capturar rapidamente as instâncias que não respondem para poder redirecionar o tráfego, se necessário. Por outro lado, a verificação de integridade para recuperação automática faz com que os MIGs substituam proativamente as instâncias com falha, portanto, essa verificação de integridade deve ser mais conservadora do que uma verificação de integridade de balanceamento de carga.
Para obter mais informações, consulte Configurar uma verificação de integridade e recuperação automática do aplicativo .
Grupos regionais ou zonais
Você pode criar dois tipos de MIGs:
- Um MIG zonal , que implanta instâncias em uma única zona.
- Um MIG regional , que implanta instâncias em diversas zonas na mesma região.
Ambos os tipos oferecem todas as vantagens dos MIGs. Os MIGs regionais adicionam maior disponibilidade ao distribuir a carga de aplicativos por diversas zonas, o que protege sua carga de trabalho contra falhas zonais, e os MIGs regionais oferecem mais capacidade. Por padrão, você pode criar até 2.000 VMs em um MIG regional e 1.000 VMs em um MIG zonal. Se precisar de mais VMs, você pode aumentar o limite de tamanho do seu MIG ou entrar em contato com o suporte .
Balanceamento de carga
Google Cloud o balanceamento de carga pode usar grupos de instâncias para atender o tráfego. Dependendo do tipo de balanceador de carga escolhido , você pode adicionar grupos de instâncias a um pool de destino ou a um serviço de back-end.
Para obter mais informações, consulte Adicionar um grupo de instâncias a um balanceador de carga .
Escalonamento automático
Os MIGs oferecem suporte ao escalonamento automático que adiciona ou remove dinamicamente instâncias de VM do grupo em resposta a aumentos ou diminuições na carga. Você pode configurar uma política de escalonamento automático para especificar como deseja dimensionar o grupo. Na sua política de escalonamento automático, você pode definir um ou mais sinais para escalonar o grupo com base na utilização da CPU, na capacidade de balanceamento de carga, nas métricas do Cloud Monitoring, nas programações ou, para MIGs zonais, usando uma carga de trabalho baseada em fila, como o Pub/Sub .
Para obter mais informações, leia Escalonamento automático de grupos de instâncias .
Atualização automática
Você pode implantar novas versões de software com facilidade e segurança em instâncias de um MIG. A implementação de uma atualização acontece automaticamente com base nas suas especificações: você pode controlar a velocidade e o escopo da implementação da atualização para minimizar interrupções no seu aplicativo. Opcionalmente, você pode realizar implementações parciais, o que permite testes canário.
Consulte Atualização de MIGs .
Suporte para cargas de trabalho com estado
Você pode criar implantações altamente disponíveis de cargas de trabalho com estado em VMs usando grupos de instâncias gerenciadas com estado (MIGs com estado). Cargas de trabalho com estado incluem aplicativos com dados ou configuração com estado, como bancos de dados, aplicativos monolíticos legados e cálculos em lote de longa execução com pontos de verificação.
Você pode melhorar o tempo de atividade e a resiliência desses aplicativos com recuperação automática , atualizações controladas e implantações em várias zonas , preservando ao mesmo tempo o estado exclusivo de cada instância, incluindo nome de instância personalizável, discos permanentes e metadados.
Para obter mais informações, leia MIGs com estado .
Crie VMs GPU de uma só vez
Você pode criar uma solicitação de redimensionamento em um MIG com VMs de GPU para criar todas as VMs solicitadas de uma só vez quando a capacidade solicitada estiver disponível. Quando você cria uma solicitação de redimensionamento em um MIG, o Compute Engine programa a criação das VMs com base no número de VMs solicitadas, na duração da execução solicitada e na disponibilidade dos recursos solicitados nas zonas do MIG. Então, na entrega programada dos recursos, o MIG cria o número solicitado de VMs de uma só vez. As VMs são executadas até o final da duração da execução ou até você excluí-las.
Para obter mais informações, consulte Sobre solicitações de redimensionamento em um MIG .
Grupos de instâncias preemptivas
Para cargas de trabalho em que os custos mínimos são mais importantes que a velocidade de execução, você pode reduzir o custo da carga de trabalho usando instâncias de VM preemptivas no seu grupo de instâncias. As instâncias preemptivas duram até 24 horas e são preemptadas normalmente – seu aplicativo tem 30 segundos para sair corretamente. As instâncias preemptivas podem ser excluídas a qualquer momento, mas a recuperação automática trará as instâncias de volta quando a capacidade preemptiva estiver disponível novamente.
Recipientes
Você pode simplificar a implantação de aplicativos implantando contêineres em instâncias em grupos de instâncias gerenciadas. Quando você especifica uma imagem de contêiner em um modelo de instância e usa esse modelo para criar um grupo de instâncias gerenciadas, cada VM é criada com um sistema operacional otimizado para contêiner que inclui Docker, e seu contêiner é iniciado automaticamente em cada VM do grupo. Consulte Implantando contêineres em VMs e MIGs .
Rede e sub-rede
Ao criar um grupo de instâncias gerenciadas, você deve fazer referência a um modelo de instância existente. O modelo de instância define a rede VPC e a sub-rede que as instâncias membros usam. Se você omitir uma rede VPC,Google Cloud tenta usar a rede VPC denominada default
e a sub-rede criada automaticamente na região especificada no modelo.
Para obter mais informações, consulte Redes e sub-redes .
Se quiser que seu grupo de instâncias gerenciadas inclua instâncias de VM que usam endereçamento IPv6, você deverá usar a configuração de pilha dupla ao criar seu modelo de instância. Para obter mais informações, consulte Criar um modelo de instância com endereços IPv6 .
Demonstração de capacidades MIG
A seguinte apresentação em vídeo de 45 minutos, gravada em Google Cloud NEXT '18 contém demonstrações e práticas recomendadas para configurar, executar e atualizar implantações escalonáveis e altamente disponíveis usando MIGs do Compute Engine.
O vídeo mostra como implantar um contêiner em um MIG, configurar uma política de recuperação automática, usar um grupo regional para se proteger contra uma falha zonal, configurar o escalonamento automático para atender às metas de CPU e às demandas baseadas em fila e gerenciar atualizações canário e contínuas.
Grupos de instâncias não gerenciadas
Os grupos de instâncias não gerenciadas podem conter instâncias heterogêneas que você pode adicionar e remover arbitrariamente do grupo. Os grupos de instâncias não gerenciadas não oferecem escalonamento automático, recuperação automática, suporte a atualizações contínuas, suporte a várias zonas ou o uso de modelos de instância e não são adequados para implantar cargas de trabalho altamente disponíveis e escalonáveis. Use grupos de instâncias não gerenciadas se precisar aplicar balanceamento de carga a grupos de instâncias heterogêneas ou se precisar gerenciar as instâncias por conta própria. Você pode adicionar até 2.000 VMs a um grupo. Se quiser adicionar mais de 2.000 VMs ao grupo, entre em contato com o suporte .
Se você precisar criar grupos de instâncias não gerenciadas, consulte Grupos de instâncias não gerenciadas .
Preços
Não há cobrança adicional pelo uso de grupos de instâncias gerenciadas ou não gerenciadas. Você é cobrado com base nos recursos que seu grupo usa.Para informações sobre preços do Compute Engine, consulte Preços .
O que vem a seguir
Saiba mais sobre modelos de instância ou crie um modelo de instância que possa ser usado para configurar as VMs em um MIG.
Saiba mais sobre os cenários básicos para criar um MIG .
Saiba mais sobre como atualizar MIGs para usar uma nova configuração.
Experimente um tutorial: