Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Google Cloud ermöglicht Load Balancing und Autoscaling für Instanzgruppen.
Load Balancing
Google Cloud bietet ein serverseitiges Load Balancing, sodass Sie eingehenden Traffic auf mehrere VM-Instanzen verteilen können. Das Load-Balancing hat folgende Vorteile:
Skalierung der Anwendung
Unterstützung bei starkem Traffic
Erkennen und automatisches Entfernen fehlerhafter VM-Instanzen durch Systemdiagnosen (wieder fehlerfreie Instanzen werden automatisch wieder hinzugefügt)
Leiten des Traffics auf die nächstgelegene Virtuelle Maschine
Google Cloud Load Balancing nutzt die Ressourcen der Weiterleitungsregeln, um bestimmte Arten von Traffic zu verarbeiten und an einen Load Balancer weiterzuleiten.
Mit einer Weiterleitungsregel kann beispielsweise TCP-Traffic mit dem Zielport 80 und der IP-Adresse 192.0.2.1 verarbeitet und an einen Load-Balancer weitergeleitet werden. Von dort wird der Traffic dann an fehlerfreie VM-Instanzen weitergeleitet.
Google Cloud Load Balancing ist ein verwalteter Dienst. Das bedeutet, dass seine Komponenten redundant und hoch verfügbar sind. Wenn eine Lastenausgleichskomponente ausfällt, wird sie neu gestartet oder automatisch und sofort ersetzt.
Google Cloud bietet verschiedene Arten des Load Balancing, die sich in den Funktionen, Nutzungsszenarien und der Konfigurationsmethode unterscheiden. Beschreibungen finden Sie in der Google Cloud Dokumentation zum Load Balancing.
Autoscaling
In Compute Engine können mit Autoscaling bei zu- oder abnehmender Arbeitslast automatisch VM-Instanzen in eine verwaltete Instanzgruppe (Managed Instance Group, MIG) eingefügt oder daraus entfernt werden. Mit Autoscaling können Ihre Anwendungen Traffic-Anstiege ordnungsgemäß bewältigen. Außerdem senkt es die Kosten in Zeiten eines geringeren Ressourcenbedarfs. Sie können eine MIG anhand ihrer CPU-Auslastung, der Cloud Monitoring-Messwerte, der Zeitpläne oder der Bereitstellungskapazität des Load-Balancings automatisch skalieren.
Wenn Sie ein Autoscaling einrichten, das auf der Load-Balancing-Bereitstellungskapazität basiert, wird die Bereitstellungskapazität einer Instanzgruppe überwacht und entsprechend skaliert, wenn die VM-Instanzen die Kapazität über- oder unterschreiten. Die Bereitstellungskapazität einer Instanz kann beim Backend-Dienst des Load-Balancers festgelegt werden und entweder auf der Nutzung oder den Anfragen pro Sekunde basieren. Weitere Informationen dazu finden Sie unter Anhand von Load-Balancing-Bereitstellungskapazität skalieren.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-08-19 (UTC)."],[[["\u003cp\u003eGoogle Cloud offers server-side load balancing to distribute incoming traffic across multiple virtual machine instances, ensuring high availability and scalability.\u003c/p\u003e\n"],["\u003cp\u003eThe load balancing service uses forwarding rules to direct specific types of traffic to a load balancer, which then routes it to healthy VM instances.\u003c/p\u003e\n"],["\u003cp\u003eAutoscaling in Compute Engine automatically adjusts the number of VM instances in a managed instance group based on various factors such as CPU utilization, Cloud Monitoring metrics, schedules, or load balancing serving capacity.\u003c/p\u003e\n"],["\u003cp\u003eGoogle Cloud's autoscaling feature can scale based on the serving capacity of the instance group, defined in the load balancer's backend service, which can use either utilization or requests per second as metrics.\u003c/p\u003e\n"]]],[],null,["# Load balancing and scaling\n\n*** ** * ** ***\n\nGoogle Cloud offers load balancing and autoscaling for\n[groups of instances](/compute/docs/instance-groups).\n\nLoad balancing\n--------------\n\nGoogle Cloud offers server-side load balancing so you can distribute\nincoming traffic across multiple virtual machine (VM) instances. Load\nbalancing provides the following benefits:\n\n- Scale your app\n- Support heavy traffic\n- Detect and automatically remove unhealthy VM instances using [health checks](/load-balancing/docs/health-check-concepts). Instances that become healthy again are automatically re-added.\n- Route traffic to the closest virtual machine\n\nGoogle Cloud load balancing uses forwarding rule\nresources to match certain types of traffic and forward it to a load balancer.\nFor example, a forwarding rule can match TCP traffic destined to port 80 on IP\naddress `192.0.2.1`, then forward it to a load balancer, which then directs\nit to healthy VM instances.\n\nGoogle Cloud load balancing is a managed service, which means its\ncomponents are redundant and highly available. If a load balancing component\nfails, it is restarted or replaced automatically and immediately.\n\nGoogle Cloud offers several different types of load balancing that\ndiffer in\ncapabilities, usage scenarios, and how you configure them. See\n[Google Cloud load balancing documentation](/load-balancing/docs)\nfor descriptions.\n\nAutoscaling\n-----------\n\nCompute Engine offers autoscaling to automatically add or remove VM\ninstances from a\n[managed instance group (MIG)](/compute/docs/instance-groups#managed_instance_groups)\nbased on increases or decreases in load. Autoscaling lets your apps gracefully\nhandle increases in traffic, and it reduces cost when the need for resources is\nlower. You can autoscale a MIG based on its CPU utilization, Cloud Monitoring\nmetrics, schedules, or load balancing serving capacity.\n\nWhen you set up an autoscaler to scale based on load balancing serving capacity,\nthe autoscaler watches the serving capacity of an instance group and scales\nwhen the VM instances are over or under capacity. The serving capacity of an\ninstance can be defined in the load balancer's\n[backend service](/load-balancing/docs/backend-service) and can be\nbased on either utilization or requests per second. For more information, see\n[Scaling based on load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing).\n\nTo learn more about autoscaling, see [Autoscaling groups of instances](/compute/docs/autoscaler).\n\nWhat's next\n-----------\n\n- Learn more about [instance groups](/compute/docs/instance-groups).\n- Learn how to [autoscale managed instance groups](/compute/docs/autoscaler) based on:\n - [CPU utilization](/compute/docs/autoscaler/scaling-cpu)\n - [Load balancing serving capacity](/compute/docs/autoscaler/scaling-load-balancing)\n - [Monitoring metrics](/compute/docs/autoscaler/scaling-stackdriver-monitoring-metrics)\n - [Schedules](/compute/docs/autoscaler/scaling-schedules)\n- Learn how to [choose a load balancer](/load-balancing/docs/choosing-load-balancer) and\n - How to [set up an external Application Load Balancer](/load-balancing/docs/https/setting-up-https)\n - How to [set up an external passthrough Network Load Balancer](/load-balancing/docs/network/setting-up-network)"]]