Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
OGoogle Cloud oferece balanceamento de carga e escalonamento automático para
grupos de instâncias.
Balanceamento de carga
OGoogle Cloud oferece balanceamento de carga do servidor para que seja possível distribuir
o tráfego de entrada em várias instâncias de máquina virtual (VM). Com o balanceamento de carga, é possível:
oferecer escalabilidade para seu aplicativo;
aceitar tráfego pesado;
detectar e remover automaticamente instâncias não íntegras da VM usando verificações de integridade. Instâncias que se tornam íntegras novamente são automaticamente readicionadas;
encaminhar tráfego para a máquina virtual mais próxima.
O balanceamento de cargaGoogle Cloud usa recursos de regra de encaminhamento para corresponder a determinados tipos de tráfego e encaminhá-los a um balanceador de carga.
Por exemplo, uma regra de encaminhamento pode corresponder ao tráfego TCP destinado à porta 80 no endereço IP
192.0.2.1, em seguida, encaminhá-lo para um balanceador de carga, que o direciona
para instâncias de VM íntegras.
O balanceamento de cargaGoogle Cloud é um serviço gerenciado, o que significa que os
componentes dele são redundantes e altamente disponíveis. Se um componente do balanceamento de carga falhar, ele será reiniciado ou substituído de forma automática e imediata.
OGoogle Cloud oferece vários tipos diferentes de balanceamento de carga que
diferem em
capacidades, cenários de uso e como você os configura. Consulte a
documentação do balanceamento de cargaGoogle Cloud
para ver descrições.
Escalonamento automático
O Compute Engine oferece escalonamento automático para adicionar ou remover instâncias de VM
de um
grupo de instâncias gerenciadas (MIG)
com base em aumentos ou reduções na carga. Com o escalonamento automático, seus aplicativos lidam com o aumento do tráfego e reduzem o custo quando a necessidade de recursos é menor. É possível fazer o escalonamento automático de um MIG com base na utilização da CPU,
nas métricas do Cloud Monitoring, nas programações ou na capacidade de serviço do balanceamento de carga.
Quando você configura um autoescalonador para dimensionar com base na capacidade de serviço de balanceamento de carga, ele observa a capacidade de exibição de um grupo de instâncias, e dimensiona quando as instâncias da VM estão acima ou abaixo da capacidade. A capacidade de disponibilização de uma
instância pode ser definida no
serviço de back-end do balanceador de carga e pode
ser baseada em utilização ou solicitações por segundo. Para mais informações, consulte
Como fazer o escalonamento com base na capacidade de exibição do balanceamento de carga.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-19 UTC."],[[["\u003cp\u003eGoogle Cloud offers server-side load balancing to distribute incoming traffic across multiple virtual machine instances, ensuring high availability and scalability.\u003c/p\u003e\n"],["\u003cp\u003eThe load balancing service uses forwarding rules to direct specific types of traffic to a load balancer, which then routes it to healthy VM instances.\u003c/p\u003e\n"],["\u003cp\u003eAutoscaling in Compute Engine automatically adjusts the number of VM instances in a managed instance group based on various factors such as CPU utilization, Cloud Monitoring metrics, schedules, or load balancing serving capacity.\u003c/p\u003e\n"],["\u003cp\u003eGoogle Cloud's autoscaling feature can scale based on the serving capacity of the instance group, defined in the load balancer's backend service, which can use either utilization or requests per second as metrics.\u003c/p\u003e\n"]]],[],null,["# Load balancing and scaling\n\n*** ** * ** ***\n\nGoogle Cloud offers load balancing and autoscaling for\n[groups of instances](/compute/docs/instance-groups).\n\nLoad balancing\n--------------\n\nGoogle Cloud offers server-side load balancing so you can distribute\nincoming traffic across multiple virtual machine (VM) instances. Load\nbalancing provides the following benefits:\n\n- Scale your app\n- Support heavy traffic\n- Detect and automatically remove unhealthy VM instances using [health checks](/load-balancing/docs/health-check-concepts). Instances that become healthy again are automatically re-added.\n- Route traffic to the closest virtual machine\n\nGoogle Cloud load balancing uses forwarding rule\nresources to match certain types of traffic and forward it to a load balancer.\nFor example, a forwarding rule can match TCP traffic destined to port 80 on IP\naddress `192.0.2.1`, then forward it to a load balancer, which then directs\nit to healthy VM instances.\n\nGoogle Cloud load balancing is a managed service, which means its\ncomponents are redundant and highly available. If a load balancing component\nfails, it is restarted or replaced automatically and immediately.\n\nGoogle Cloud offers several different types of load balancing that\ndiffer in\ncapabilities, usage scenarios, and how you configure them. See\n[Google Cloud load balancing documentation](/load-balancing/docs)\nfor descriptions.\n\nAutoscaling\n-----------\n\nCompute Engine offers autoscaling to automatically add or remove VM\ninstances from a\n[managed instance group (MIG)](/compute/docs/instance-groups#managed_instance_groups)\nbased on increases or decreases in load. Autoscaling lets your apps gracefully\nhandle increases in traffic, and it reduces cost when the need for resources is\nlower. You can autoscale a MIG based on its CPU utilization, Cloud Monitoring\nmetrics, schedules, or load balancing serving capacity.\n\nWhen you set up an autoscaler to scale based on load balancing serving capacity,\nthe autoscaler watches the serving capacity of an instance group and scales\nwhen the VM instances are over or under capacity. The serving capacity of an\ninstance can be defined in the load balancer's\n[backend service](/load-balancing/docs/backend-service) and can be\nbased on either utilization or requests per second. For more information, see\n[Scaling based on load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing).\n\nTo learn more about autoscaling, see [Autoscaling groups of instances](/compute/docs/autoscaler).\n\nWhat's next\n-----------\n\n- Learn more about [instance groups](/compute/docs/instance-groups).\n- Learn how to [autoscale managed instance groups](/compute/docs/autoscaler) based on:\n - [CPU utilization](/compute/docs/autoscaler/scaling-cpu)\n - [Load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing)\n - [Monitoring metrics](/compute/docs/autoscaler/scaling-stackdriver-monitoring-metrics)\n - [Schedules](/compute/docs/autoscaler/scaling-schedules)\n- Learn how to [choose a load balancer](/load-balancing/docs/choosing-load-balancer) and\n - How to [set up an external Application Load Balancer](/load-balancing/docs/https/setting-up-https)\n - How to [set up an external passthrough Network Load Balancer](/load-balancing/docs/network/setting-up-network)"]]