Este documento mostra uma visão geral dos serviços que o Cloud Monitoring oferece. Esses serviços podem ajudar você a entender o comportamento, a saúde e dos aplicativos e de outros serviços do Google Cloud. O Cloud Monitoring coleta e armazena automaticamente informações de desempenho na maioria dos serviços do Google Cloud. Você podem coletar o Prometheus métricas usando o Google Cloud Managed Service para Prometheus. Se você instalar o Agente de operações no seu Compute Engine máquinas virtuais (VMs), então é possível coletar métricas e registros de seus e de terceiros.
Os serviços de alerta, teste e visualização fornecidos pelo Cloud Monitoring ajudam a responder a perguntas importantes, como:
- Qual é a carga do meu serviço?
- Meu site está respondendo corretamente?
- Meu serviço tem um bom desempenho?
O Cloud Monitoring tem o console do Google Cloud e suporte a APIs para a maioria
de seus serviços. Alguns serviços também têm suporte para a Google Cloud CLI ou
o Terraform. As páginas de referência da API Cloud Monitoring, como a página
alertPolicies.list
,
permitem que você teste as chamadas de API diretamente da página de referência.
Serviços do Cloud Monitoring
O Cloud Monitoring oferece diferentes serviços que podem ser usados para entender a integridade e o desempenho dos seus aplicativos e dos outros serviços do Google Cloud que você usa.
Alertas e notificações
Para receber notificações quando o valor de uma métrica de desempenho atender aos critérios que você definir, crie uma política de alertas. Política de alertas inclui a lista de pessoas ou grupos que devem receber notificações. O Monitoring é compatível com canais de notificação comuns, incluindo e-mail, Cloud Mobile App e serviços como o PagerDuty ou o Slack. Por exemplo, é possível criar uma política de alertas para receber notificações quando o uso de CPU de uma VM excede 80%.
Cada notificação inclui informações relevantes sobre uma falha e um link para um incidente. Um incidente é um registro permanente que armazena informações que podem ser usadas para resolver a falha. Normalmente, um registro lista o status do incidente, links para registros, um gráfico dos dados de métrica registrados, rótulos e duração.
O serviço de alertas é integrado a vários serviços do Google Cloud. Quando esses existirem integrações, poderá ver um painel que lista alertas recomendados ou aparece um botão em um gráfico que permite criar uma política de alertas. Em ambos os casos, as políticas de alertas são pré-configuradas, especifique somente a lista de pessoas ou grupos que vão receber a notificação.
É possível criar e gerenciar políticas de alertas usando o console do Google Cloud. a API Cloud Monitoring, a Google Cloud CLI ou o Terraform.
Monitoramento e validação proativos
Para testar a disponibilidade, a consistência e o desempenho de serviços, aplicativos, páginas da Web e APIs, crie monitores sintéticos. Por exemplo: é possível verificar a capacidade de resposta dos endpoints HTTP, HTTPS e TCP com verificações de tempo de atividade e receber uma notificação quando não responde. Também é possível criar verificador de link corrompido para rastrear uma página da Web e, em seguida, notificar você quando links corrompidos forem detectados.
É possível criar e gerenciar monitores sintéticos usando o console do Google Cloud. a API Cloud Monitoring, a Google Cloud CLI ou o Terraform.
Visualização de dados
Para visualizar seus dados e ver tendências, identificar outliers e outros detalhes sobre seus dados, você pode usar o serviços de painel e gráficos:
O serviço de painel cria automaticamente um painel gerenciado pelo Google Cloud quando você adiciona um recurso ao seu projeto do Google Cloud. Por exemplo, um painel quando você cria uma instância do Compute Engine, um alerta política ou um monitor sintético. Você pode usar essas painéis para ver informações de desempenho e configuração, como uso do disco ou o endereço IP e para visualizar eventos.
Para controlar quais dados são mostrados e o formato de exibição deles, criar um painel personalizado. Por exemplo: importe um painel do Grafana ou instalar um painel usando um modelo. Os painéis personalizados podem exibir gráficos, tabelas, registros e grupos de erros, políticas de alertas, incidentes e textos. Você também pode compartilhar painéis personalizados com pessoas ou grupos na sua organização e configurar esses painéis para eventos de exibição.
É possível criar e gerenciar painéis usando o Console do Google Cloud ou a API.
O serviço de gráficos, Metrics Explorer, permite visualizar e analisar rapidamente dados de séries temporais. Configurações do gráfico permitem comparar os dados atuais com os anteriores, mostrar outliers e percentis e exibir várias métricas. Você também pode salvar gráficos em um painel personalizado.
Coleta e armazenamento de dados
O Cloud Monitoring coleta e armazena os seguintes tipos de dados de métricas:
- Métricas do sistema geradas pelos serviços do Google Cloud. Essas métricas fornecem informações sobre como um serviço está funcionando.
- Métricas de sistema e aplicativo que o O Agente de operações coleta informações sobre recursos do sistema e aplicativos em execução nas instâncias do Compute Engine. É possível configurar o Agente de operações para coletar métricas de plug-ins de terceiros, como servidores da Web Apache ou Nginx ou bancos de dados MongoDB ou PostgreSQL.
Métricas definidas pelo usuário criadas pelo usando a API Cloud Monitoring ou como o OpenTelemetry.
Métricas externas definidas por algumas políticas de código aberto bibliotecas ou provedores de terceiros.
métricas do Prometheus que são coletadas por Google Cloud Managed Service para Prometheus, ou usando o Agente de operações Receptor do Prometheus ou o Receptor OTLP.
- As métricas com base em registros registram informações numéricas sobre os registros gravados no Cloud Logging. As métricas com base em registros definidas pelo Google incluem contagens dos erros que seu serviço detecta e o número número de entradas de registro recebidas pelo projeto do Google Cloud. Também é possível definir métricas com base em registros.
Linguagens de consulta
Ao criar uma política de alertas ou um gráfico, forneça uma consulta que descreva os dados que você quer monitorar ou criar um gráfico:
Console do Google Cloud: você pode criar sua consulta fazendo seleções a partir de menus, ou escrever uma consulta. Os editores de consultas estão disponíveis para a linguagem de consulta do Prometheus (PromQL) e Linguagem de consulta do Monitoring (MQL, na sigla em inglês). Editores de consultas fornecer verificações e sugestões de sintaxe. Também é possível escrever uma expressão de filtro de monitoramento.
API Cloud Monitoring: a API oferece suporte linguagem de consulta do Prometheus (PromQL), consultas MQL, e as expressões de filtro do Monitoring.
Monitorar sistemas grandes
Nesta seção, descrevemos como gerenciar recursos como e como monitorar as métricas armazenadas no vários projetos do Google Cloud.
Gerenciar recursos como uma coleção
Para gerenciar seus recursos como uma coleção em vez de individualmente, crie um grupo de recursos. Um grupo de recursos é um conjunto dinâmico de recursos que atende a alguns critérios que você fornece. Conforme você adiciona e remove recursos, por exemplo, adicionando instâncias de VM do Compute Engine no projeto do Google Cloud, a associação ao grupo será alterada automaticamente. Veja a seguir exemplos de grupos de recursos:
- Instâncias do Compute Engine com nomes que começam com a string
prod-
. - Recursos com a tag
test-cluster
. - Instâncias do Amazon EC2 na região A ou região B.
Depois de definir um grupo de recursos, é possível monitorar o grupo como se fosse um único recurso. Por exemplo, É possível configurar uma verificação de tempo de atividade para monitorar um grupo de recursos. Para gráficos e políticas de alertas, também é possível filtrar com base no nome do grupo.
Para mais informações, consulte Configurar grupos de recursos.
Monitorar métricas de vários projetos do Google Cloud
Para visualizar e monitorar os dados de série temporal para vários projetos do Google Cloud e contas da AWS por meio de uma única interface, configure um escopo de métricas de vários projetos.
Por padrão, as páginas do Cloud Monitoring no console do Google Cloud oferecem acesso somente às série temporal armazenadas no projeto de escopo. O projeto de escopo é o projeto que você selecionou com o Seletor de projetos do console do Google Cloud. O projeto de escopo armazena os alertas, os monitores sintéticos, os painéis e os grupos de monitoramento configurados.
O projeto de escopo também hospeda um escopo de métricas. O escopo de métricas define os projetos e as contas com métricas visíveis para o projeto de escopo. É possível configurar o escopo das métricas para incluir dados de série temporal de outros projetos do Google Cloud e de contas da AWS. Para informações sobre como modificar um escopo de métricas, consulte Configurar um escopo de métricas para vários projetos.
Modelo de dados do Cloud Monitoring
Nesta seção, apresentamos o modelo de dados do Cloud Monitoring:
Um tipo de métrica descreve algo que é medido. Exemplos de tipos de métricas incluem o uso da CPU de uma VM e as a porcentagem de uso de um disco.
Uma série temporal é uma estrutura de dados que contém medições com carimbo de data/hora de uma métrica e informações sobre a origem e o significado dessas medidas.
Veja alguns detalhes sobre o que uma série temporal contém:
A matriz
points
contém as medidas com carimbo de data/hora.Veja a seguir um exemplo de uma matriz
points
com dois valores:"points": [ { "interval": { "startTime": "2020-07-27T20:20:21.597143Z", "endTime": "2020-07-27T20:20:21.597143Z" }, "value": { "doubleValue": 0.473005 } }, { "interval": { "startTime": "2020-07-27T20:19:21.597239Z", "endTime": "2020-07-27T20:19:21.597239Z" }, "value": { "doubleValue": 0.473025 } }, ],
Para entender o significado de um valor, consulte os outros dados incluídos na série temporal e as definições desses dados.
O campo
resource
descreve o componente de hardware ou software que está sendo monitorado. No Cloud Monitoring, o componente de hardware ou software é chamado de recurso monitorado. Exemplos de recursos monitorados incluem instâncias do Compute Engine e aplicativos do App Engine. Para uma lista de recursos monitorados, consulte a Lista de recursos monitorados.Este é um exemplo de um campo
resource
:"resource": { "type": "gce_instance", "labels": { "instance_id": "2708613220420473591", "zone": "us-east1-b", "project_id": "sampleproject" } }
O campo
type
lista o recurso monitorado como umgce_instance
, que indica que essas medidas são tomadas em uma instância de VM do Compute Engine.O campo
labels
contém pares de chave-valor que fornecem informações adicionais sobre o recurso monitorado. Para um tipogce_instance
, os rótulos identificam a instância de VM que está sendo monitorada.
O campo
metric
descreve o que está sendo medido.Confira abaixo um exemplo de campo
metric
:"metric": { "labels": { "instance_name": "test" }, "type": "compute.googleapis.com/instance/cpu/utilization" },
- Para serviços do Google Cloud, o campo
type
especifica o serviço e quais está sendo monitorada. Neste exemplo, o serviço do Compute Engine medir o uso da CPU. Quando o campotype
começa comcustom
ouexternal
, a métrica é personalizada ou definida por terceiros.
- O campo
labels
contém pares de chave-valor que fornecem informações adicionais sobre a medição. Esses rótulos são definidos como parte doMetricDescriptor
, que é uma estrutura de dados que define os atributos dos dados medidos. OMetricDescriptor
da métricacompute.googleapis.com/instance/cpu/utilization
inclui o rótuloinstance_name
.
- Para serviços do Google Cloud, o campo
O campo
metricKind
descreve a relação entre medições adjacentes em uma série temporal:As métricas
GAUGE
armazenam o valor da coisa que está sendo medida em um determinado momento, por exemplo, um registro de temperatura por hora.As métricas
CUMULATIVE
armazenam o valor acumulado daquilo que está sendo medido em um determinado momento. Por exemplo, um odômetro em um veículo.As métricas
DELTA
armazenam a alteração no valor do que está sendo medido durante um período especificado. Por exemplo, um resumo de ações que mostra os ganhos ou as perdas delas.
O campo
valueType
descreve o tipo de dados da medição:INT64
,DOUBLE
,BOOL
,STRING
ouDISTRIBUTION
.
- É possível mostrar a utilização da CPU de todas as instâncias de VM.
- Para mostrar o uso da CPU de uma instância de VM específica,
filtrando a série temporal por um único valor do rótulo
instance_id
. É possível agrupar pelas instâncias de VM pelo rótulo
machine_type
, e exibir a utilização média da CPU. A captura de tela a seguir ilustra um gráfico com esta configuração:
Preços
Em geral, as métricas do sistema do Cloud Monitoring são gratuitas, e as métricas de sistemas, agentes ou aplicativos externos não são. As métricas faturáveis são faturado pelo número de bytes ou de amostras ingeridas.
Para mais informações sobre os preços do Cloud Monitoring, consulte os seguintes documentos:
A seguir
- Para explorar o Cloud Monitoring, consulte o Guia de início rápido para monitorar uma instância do Compute Engine.
- Para informações sobre como configurar nosso projeto do Google Cloud para visualizar métricas de vários projetos do Google Cloud e contas da AWS, consulte Visão geral dos escopos de métricas.
Para mais informações sobre o modelo de dados do Cloud Monitoring, consulte Métricas, série temporal e recursos.
Para mais informações sobre a API Cloud Monitoring, consulte APIs e referência.
Para listas de métricas e recursos monitorados, consulte a Lista de métricas e Lista de recursos monitorados.