Observabilidade para o GKE

Autopilot Standard

Nesta página, descrevemos como entender a integridade dos aplicativos e manter a disponibilidade e a confiabilidade deles.

Recursos de observabilidade padrão

Por padrão, os clusters do GKE são configurados para fazer o seguinte:

Enviar registros do sistema, de auditoria e de aplicativos ao Cloud Logging.
Enviar métricas do sistema ao Cloud Monitoring.
Usar o Google Cloud Managed Service para Prometheus a fim de coletar métricas configuradas de terceiros e definidas pelo usuário e enviá-las ao Cloud Monitoring. O Google Cloud Managed Service para Prometheus permite monitorar e criar alertas com relação às suas cargas de trabalho usando o Prometheus, sem precisar gerenciá-lo e operá-lo manualmente em grande escala.

Personalizar e aprimorar a coleta de dados

Por padrão, o GKE cria um repositório do Logging para armazenar registros para cada cluster. É possível controlar quais registros e quais métricas, se houver, serão enviados do cluster do GKE para o Cloud Logging e o Cloud Monitoring.

Também é possível controlar se o Google Cloud Managed Service para Prometheus será ativado.

Para clusters Autopilot do GKE, não é possível desativar a integração do Cloud Monitoring e do Cloud Logging.

Outras métricas de observabilidade

É possível coletar mais métricas de observabilidade ativando um ou mais pacotes de métricas de observabilidade.

Métricas do plano de controle: monitore a integridade dos componentes do Kubernetes coletando métricas do servidor da API do Kubernetes, do programador e do gerenciador de controladores. Essas métricas são sinais úteis da integridade do serviço para definir objetivos de nível de serviço (SLOs).
Kube State Metrics: monitore a integridade dos objetos do Kubernetes, como implantações, nós e pods.
Métricas do cAdvisor/Kubelet: monitorar a integridade dos contêineres e do kubelet.

Se você tiver ativado o GKE Enterprise no seu projeto, essas métricas serão ativadas por padrão quando você se registrar em uma frota durante a criação do cluster.

Métricas de terceiros e definidas pelo usuário

A fim de monitorar aplicativos de terceiros em execução nos clusters, como o Postgres, o MongoDB e o Redis, use os exportadores do Prometheus com o Google Cloud Managed Service para Prometheus.

Também é possível programar exportadores personalizados para monitorar outros sinais de integridade e desempenho.

Usar os dados coletados

Use os dados coletados para analisar a integridade do aplicativo, realizar depurações, solucionar problemas e fazer testes durante o desenvolvimento, a implantação e a manutenção dos aplicativos.

O GKE fornece recursos de observabilidade integrados para que você comece a trabalhar rapidamente:

Confira os dados coletados dos clusters e das cargas de trabalho nos painéis de observabilidade do GKE. Você pode personalizar os painéis fornecidos para as seguintes finalidades:
- Confira as principais métricas do cluster, como a utilização da CPU e da memória, além do número de incidentes em aberto.
- Confira os clusters por infraestrutura, cargas de trabalho ou serviços.
- Inspecione namespaces, nós, cargas de trabalho, serviços, pods e contêineres.
- Para pods e contêineres, confira as métricas como uma função de tempo e as entradas de registro.
Também é possível criar seus próprios painéis ou importar painéis do Grafana para atender às suas necessidades.

Observação: os painéis do GKE fornecidos exibem apenas informações de clusters do GKE em execução no Google Cloud. Eles não exibem informações de clusters do GKE em execução em qualquer outro lugar, por exemplo, em servidores locais ou bare metal.
Na guia Observabilidade, é possível criar políticas de alertas recomendadas para receber notificações sobre problemas. Para saber mais sobre alertas, consulte a Visão geral de alertas.
Crie SLOs para monitorar as metas de desempenho do serviço usando as métricas coletadas do GKE.
Use os playbooks do GKE para resolver problemas comuns, como pods não programáveis e contêineres que falham repetidamente após a reinicialização.
Explore e analise dados com ferramentas como a Análise de registros, o Metrics Explorer e o Error Reporting.
Analise os registros de auditoria do GKE que registram atividades administrativas e acessos como parte dos Registros de auditoria do Cloud. A política de registros de auditoria determina quais eventos são gravados e se uma entrada de registro pertence a um registro de atividades do administrador ou a um registro de acesso a dados.

Outros recursos

O GKE se integra a outros serviços do Google Cloud para ajudar você a monitorar e gerenciar clusters e cargas de trabalho.

Use o painel de postura de segurança para identificar preocupações de segurança com base nos nossos padrões e nas práticas recomendadas do setor.
Confira insights e recomendações para otimizar clusters.
Use a geração de registros de políticas de rede para ter ajuda ao solucionar problemas com as políticas de rede do Kubernetes. Se você usar o GKE Dataplane V2, a geração de registros da política de rede será integrada.

Preços

Os preços da integração com o Cloud Logging (incluindo os Registros de auditoria do Cloud), o Cloud Monitoring e o Google Cloud Managed Service para Prometheus são baseados na quantidade de registros e métricas coletados. Veja detalhes na página Preços.

Os recursos fornecidos por outros serviços do Google Cloud listados em Outros recursos têm preços separados. Para mais informações, consulte a seção "Preços" dessas páginas de documentação.

A seguir

Observe os clusters. Saiba como ver painéis, organizar informações de cluster e visualizar detalhes de alertas.
Ative a geração de registros de auditoria detalhados no nível do SO em nós de cluster do GKE e saiba como exportar registros para o Cloud Logging.