Cargas de trabalho do Kubernetes para alta disponibilidade
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Esta página recomenda estratégias de carga de trabalho de contêiner do Kubernetes que tornam seu
aplicativo mais tolerante a falhas em um universo multizona isolado do Google Distributed Cloud (GDC). O GDC é compatível com aplicativos de contêiner
nativos do Kubernetes, que são amplamente consumidos e compatíveis com o
Google Kubernetes Engine (GKE).
Esta página é destinada a desenvolvedores do grupo de operadores de aplicativos, que são
responsáveis por criar cargas de trabalho de aplicativos para a organização. Para mais informações, consulte Públicos-alvo para documentação isolada do GDC.
Considerações sobre o Kubernetes para apps de alta disponibilidade
Para alcançar a alta disponibilidade (HA) no Kubernetes, é preciso ir além do plano de controle. Você também precisa projetar e implantar cargas de trabalho de contêineres no universo isolado da Google Distributed Cloud (GDC) de maneira resiliente. O Kubernetes oferece vários mecanismos
poderosos para minimizar o tempo de inatividade e fornecer serviços altamente disponíveis
mesmo ao enfrentar problemas de infraestrutura ou durante a manutenção de rotina. Os seguintes tópicos são estratégias importantes para considerar em relação à HA:
Manter a disponibilidade com réplicas e escalonamento automático: você precisa ter instâncias em execução suficientes do aplicativo para oferecer alta disponibilidade.
ReplicaSet: um recurso ReplicaSet mantém um conjunto estável de
réplicas de pods idênticas em execução a qualquer momento. Se um pod falhar ou for
encerrado, o controlador ReplicaSet vai criar automaticamente um novo pod para
substituí-lo. Consulte a documentação do Kubernetes sobre ReplicaSet para mais informações.
Escalonador automático horizontal de pods (HPA): enquanto um ReplicaSet mantém um número fixo de réplicas, o HPA ajusta automaticamente esse número com base em métricas observadas, como utilização da CPU ou uso da memória. Isso permite que o aplicativo processe picos de carga. Consulte a documentação do Kubernetes sobre escalonamento automático horizontal de pods para mais informações.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-04 UTC."],[],[],null,["# Kubernetes workloads for high availability\n\nThis page recommends Kubernetes container workload strategies that make your\napplication more fault tolerant in a Google Distributed Cloud (GDC) air-gapped multi-zone\nuniverse. GDC supports Kubernetes-native container\napplications that are widely consumed and supported on\nGoogle Kubernetes Engine (GKE).\n\nThis page is for developers within the application operator group, who are\nresponsible for creating application workloads for their organization. For more\ninformation, see\n[Audiences for GDC air-gapped documentation](/distributed-cloud/hosted/docs/latest/gdch/resources/audiences).\n\nKubernetes considerations for HA apps\n-------------------------------------\n\nAchieving high availability (HA) in Kubernetes goes beyond just the control\nplane. You must also design and deploy container workloads in your\nGoogle Distributed Cloud (GDC) air-gapped universe resiliently. Kubernetes offers several\npowerful mechanisms to minimize downtime and provide highly available services\neven when facing infrastructure issues or during routine maintenance. The\nfollowing topics are key strategies to consider for HA:\n| **Important:** To access the URLs listed on this page, you must connect to the internet. The URLs are provided to access outside of your air-gapped environment.\n\n- **Maintain availability with replicas and autoscale**: You must have enough\n running instances of your application to provide HA.\n\n - `ReplicaSet`: A `ReplicaSet` resource maintains a stable set of\n identical pod replicas are running at any given time. If a pod fails or is\n terminated, the `ReplicaSet` controller automatically creates a new pod to\n replace it. See\n [ReplicaSet](https://kubernetes.io/docs/concepts/workloads/controllers/replicaset/)\n Kubernetes documentation for more information.\n\n - Horizontal Pod Autoscaler (HPA): While a `ReplicaSet` maintains a fixed\n number of replicas, the HPA automatically adjusts this number based on\n observed metrics like CPU utilization or memory usage. This allows your\n application to handle load spikes. See\n [Horizontal Pod Autoscaling](https://kubernetes.io/docs/tasks/run-application/horizontal-pod-autoscale/)\n Kubernetes documentation for more information.\n\n- **Minimize downtime with `PodDisruptionBudget` (PDB)** : See\n [Specifying a Disruption Budget for your Application](https://kubernetes.io/docs/tasks/run-application/configure-pdb/)\n Kubernetes documentation for more information.\n\n- **Spread your risk with anti-affinity rules** : See\n [Affinity and anti-affinity](https://kubernetes.io/docs/concepts/scheduling-eviction/assign-pod-node/#affinity-and-anti-affinity)\n Kubernetes documentation for more information.\n\n- **Health checks with liveness, readiness, and startup probes** : See\n [Configure Liveness, Readiness and Startup Probes](https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/)\n Kubernetes documentation for more information.\n\n- **Stable endpoints and load balancing with services** : See\n [Services](https://kubernetes.io/docs/concepts/services-networking/service/)\n Kubernetes documentation for more information.\n\n- **Graceful updates and rollbacks with deployments** : See\n [Rolling Back a Deployment](https://kubernetes.io/docs/concepts/workloads/controllers/deployment/#rolling-back-a-deployment)\n Kubernetes documentation for more information.\n\n- **Set requests and limits for resources** : See\n [Resource Management for Pods and Containers](https://kubernetes.io/docs/concepts/configuration/manage-resources-containers/)\n Kubernetes documentation for more information.\n\nWhat's next\n-----------\n\n- [Start learning about Kubernetes](/kubernetes-engine/docs/learn/get-started-with-kubernetes)\n- [Container workloads in GDC](/distributed-cloud/hosted/docs/latest/gdch/application/ao-user/containers/containers-intro)\n- [Create a cluster to run container workloads](/distributed-cloud/hosted/docs/latest/gdch/platform/pa-user/create-user-cluster)"]]