Balanceamento de carga e escalonamento


Google Cloud oferece balanceamento de carga e escalonamento automático para grupos de instâncias .

Balanceamento de carga

Google Cloud oferece balanceamento de carga no lado do servidor para que você possa distribuir o tráfego de entrada em várias instâncias de máquinas virtuais (VM). O balanceamento de carga oferece os seguintes benefícios:

  • Dimensione seu aplicativo
  • Suporta tráfego intenso
  • Detecte e remova automaticamente instâncias de VM não íntegras usando verificações de integridade . As instâncias que se tornam íntegras novamente são automaticamente adicionadas novamente.
  • Direcione o tráfego para a máquina virtual mais próxima

Google Cloud o balanceamento de carga usa recursos de regra de encaminhamento para corresponder a determinados tipos de tráfego e encaminhá-lo para um balanceador de carga. Por exemplo, uma regra de encaminhamento pode corresponder ao tráfego TCP destinado à porta 80 no endereço IP 192.0.2.1 e, em seguida, encaminhá-lo para um balanceador de carga, que o direciona para instâncias de VM íntegras.

Google Cloud o balanceamento de carga é um serviço gerenciado, o que significa que seus componentes são redundantes e altamente disponíveis. Se um componente de balanceamento de carga falhar, ele será reiniciado ou substituído automática e imediatamente.

Google Cloud oferece vários tipos diferentes de balanceamento de carga que diferem em recursos, cenários de uso e como você os configura. Ver Google Cloud documentação de balanceamento de carga para descrições.

Escalonamento automático

O Compute Engine oferece escalonamento automático para adicionar ou remover automaticamente instâncias de VM de um grupo de instâncias gerenciadas (MIG) com base em aumentos ou diminuições na carga. O escalonamento automático permite que seus aplicativos lidem com facilidade com aumentos de tráfego e reduz custos quando a necessidade de recursos é menor. Você pode escalonar automaticamente um MIG com base na utilização da CPU, nas métricas do Cloud Monitoring, nas programações ou na capacidade de serviço de balanceamento de carga.

Quando você configura um escalonador automático para escalar com base na capacidade de serviço de balanceamento de carga, o escalonador automático monitora a capacidade de serviço de um grupo de instâncias e escala quando as instâncias de VM estão acima ou abaixo da capacidade. A capacidade de atendimento de uma instância pode ser definida no serviço de back-end do balanceador de carga e pode ser baseada na utilização ou nas solicitações por segundo. Para obter mais informações, consulte Dimensionamento baseado na capacidade de serviço de balanceamento de carga .

Para saber mais sobre escalonamento automático, consulte Dimensionamento automático de grupos de instâncias .

O que vem a seguir