Visão geral de alerta

Neste documento, descrevemos como receber notificações quando seu aplicativo falha ou quando o desempenho dele não atende aos critérios definidos.

Como os alertas funcionam

O processo de alerta do Cloud Monitoring tem três partes:

  • Uma política de alertas, que descreve as circunstâncias em que você quer receber alertas e notificações sobre um incidente. A política de alertas pode monitorar dados de séries temporais armazenados pelo Monitoring ou registros armazenados pelo Cloud Logging. Quando esses dados atendem à condição da política de alertas, o Monitoring cria um incidente e envia as notificações.

  • Cada incidente é um registro do tipo de dados que foi monitorado e de quando as condições foram atendidas. Essas informações podem ajudar você a resolver os problemas que causaram o incidente.

  • Um canal de notificação define como você recebe notificações quando o Monitoring cria um incidente. Por exemplo, é possível configurar uma política de alertas para enviar my-support-team@example.com por e-mail e postar uma mensagem do Slack no canal #my-support-team. Uma política de alertas pode conter um ou mais canais de notificação.

As políticas de alertas podem avaliar três tipos de dados:

  • Dados de série temporal, também chamados de dados de métricas, armazenados pelo Monitoring. Esses tipos de políticas são chamados de políticas de alertas com base em métricas.

    Para saber como configurar uma política de alertas com base em métricas, consulte o Guia de início rápido do Compute Engine.

  • Dados de entradas de registro armazenados pelo Cloud Logging. As políticas de alertas que avaliam entradas de registro individuais são chamadas de políticas de alertas com base em registros. As políticas de alertas baseadas em registros notificam quando uma mensagem específica aparece nos registros. Para mais informações, consulte Monitorar seus registros.

  • Os resultados de uma consulta SQL executada na Análise de dados de registros em relação aos dados de entrada de registro armazenados no Logging. As políticas de alertas que monitoram os resultados de uma consulta SQL são chamadas de políticas de alertas baseadas em SQL. Para mais informações, consulte Monitorar os resultados da consulta SQL com uma política de alertas.

    As políticas de alertas baseadas em SQL estão em pré-lançamento público.

O processo de alerta ajuda você a responder a problemas quando o desempenho de um aplicativo não atinge valores aceitáveis. Por exemplo, você implanta um aplicativo da Web em uma instância de máquina virtual (VM) do Compute Engine. Embora você espere que a latência da resposta HTTP varie, quer que sua equipe de suporte responda quando o aplicativo tiver alta latência por um período significativo. Você pode criar uma política de alertas com base em métricas que monitore a métrica de latência de resposta HTTP do aplicativo. Se a latência de resposta for maior que dois segundos por pelo menos cinco minutos, o Monitoring vai criar um incidente e enviar notificações por e-mail para sua equipe de suporte.

criar uma política de alertas.

Há várias maneiras de criar uma política de alertas. Por exemplo, é possível usar políticas de alertas pré-configuradas ativando os alertas recomendados de integrações ou determinadas páginas no console do Google Cloud . Também é possível configurar uma política de alertas usando o console doGoogle Cloud , a API Cloud Monitoring, a Google Cloud CLI e o Terraform.

Usar integrações e políticas de alertas recomendadas

O Monitoring oferece pacotes pré-criados para que você crie políticas de alertas para seusGoogle Cloud serviços e integrações de terceiros. Os pacotes incluem políticas de alertas recomendadas, painéis de amostra e métricas principais para o serviço. Esses pacotes estão disponíveis para serviçosGoogle Cloud , como Google Kubernetes Engine, Compute Engine e Cloud SQL, e integrações comuns de terceiros, como MongoDB, Kafka e Elasticsearch.

Ao instalar um pacote, é possível ativar as políticas de alerta recomendadas dele. Ao ativar uma política de alertas recomendada, você configura o canal de notificação dela e, se quiser, modifica outros valores. Depois da configuração, a política de alertas começa a monitorar o destino imediatamente, sem necessidade de mais entradas do usuário.

As políticas de alertas recomendadas são úteis quando você implanta um novo serviço e quer receber alertas sobre métricas importantes. Por exemplo, o pacote de integração do Cloud SQL vem com políticas de alertas recomendadas para instâncias com falha e transações lentas:

Duas das políticas de alertas recomendadas para o pacote de integração do Cloud SQL.

Para mais informações sobre integrações de alertas, consulte Como monitorar aplicativos de terceiros.

Criar políticas de alertas

É possível criar políticas de alertas para monitorar diferentes tipos de dados, dependendo das suas necessidades. As seções a seguir listam os diferentes tipos de dados que podem ser monitorados com políticas de alertas.

Monitorar dados de série temporal

Tipo de condição Descrição Exemplo
Condição de limite de métrica

As condições de limite de métrica são atendidas quando os valores de uma métrica são maiores ou menores que um limite para uma janela de reteste específica.

Para mais informações, consulte Criar políticas de alertas de limite de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alertas que envie uma notificação quando a latência de resposta for de 500 ms ou mais por cinco verificações de tempo de atividade consecutivas em 10 minutos.
Condição de ausência de métrica

As condições de ausência de métrica são atendidas quando uma série temporal monitorada não tem dados para uma janela de reteste específica. O período máximo de reteste é de 23,5 horas.

Para mais informações, consulte Criar políticas de alertas de ausência de métrica e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso não responder a nenhuma solicitação HTTP em um período de cinco minutos.
Condição de valor de métrica estimado

As condições de valor de métrica estimada são atendidas quando a política de alertas prevê que o limite será violado na próxima janela de previsão. A janela de previsão pode variar de 1 hora a 7 dias.

Para mais informações, consulte Criar políticas de alertas de valor de métrica previsto e Criar políticas de alertas usando a API.

Você quer uma política de alertas que abra um incidente com sua equipe de suporte quando um recurso estiver prestes a atingir 80% de uso do espaço em disco nas próximas 24 horas.

Monitorar dados de entrada de registro

Para monitorar entradas de registro individuais, use uma política de alertas com base em registros. Uma condição em uma política de alertas com base em registros é atendida quando a política detecta que uma frase de uma entrada de registro corresponde aos critérios da política de alertas. Por exemplo, você quer uma política de alertas que abra um incidente com sua equipe de suporte quando o message de uma entrada de registro contiver product_ids=['tier_1_support', 'tier_2_support'].

Para mais informações, consulte Configurar políticas de alertas com base em registros na documentação do Logging.

Monitorar resultados de consulta SQL

Para monitorar os resultados consulta SQL, use uma política de alertas baseada em SQL. A condição de uma política de alertas baseada em SQL analisa periodicamente os dados de entrada de registro e cria incidentes quando a tabela de resultados da consulta atende a determinados critérios. Esse tipo de política de alertas é útil quando você precisa de uma política que monitore agregações de dados ou padrões complexos em várias entradas de registro. Por exemplo, você quer receber uma notificação quando mais de 50 entradas de registro nos últimos 60 minutos tiverem uma gravidade de WARNING.

Para mais informações, consulte Monitorar os resultados da consulta SQL com uma política de alertas na documentação do Logging.

Componentes da política de alerta

Cada política de alertas tem os seguintes componentes:

  • Uma condição que descreve quando um recurso ou grupo de recursos está em um estado que exige uma resposta. A condição inclui a fonte de dados, um limite estático ou dinâmico e métodos de agregação de dados, como filtros e groupby. Elas podem monitorar uma única métrica, várias métricas ou uma proporção de métricas. Também é possível usar a linguagem de consulta do Prometheus (PromQL) para incluir expressões complexas, como limites dinâmicos e lógica condicional.

    Se você usar uma integração para ativar uma política de alertas recomendada, a condição da política será preenchida automaticamente.

  • Uma lista de canais de notificação que descrevem quem será notificado quando a ação for necessária. Para saber mais, consulte Criar e gerenciar canais de notificação.

  • Documentação que aparece em notificações e páginas de incidentes. Você pode configurar a linha de assunto de uma notificação e adicionar informações úteis ao corpo dela. Por exemplo, você pode configurar a notificação para mostrar links para manuais internos ou para páginas do Google Cloud , como painéis personalizados. Para mais informações sobre documentação, incluindo exemplos, consulte Anotar incidentes com documentação definida pelo usuário.

Linguagens de consulta

Use linguagens de consulta e filtros nas políticas de alertas para ter mais controle sobre a avaliação de métricas. O Monitoring é compatível com os seguintes tipos de consulta:

  • A linguagem de consulta do Prometheus (PromQL) é uma linguagem de consulta funcional usada para avaliar dados de série temporal em tempo real. É possível configurar políticas de alertas para incluir uma consulta PromQL na condição. As consultas do PromQL podem usar qualquer expressão válida, como combinações de métricas, proporções e limites de escalonamento. Ao configurar políticas de alertas baseadas em PromQL no Google Cloud, é possível reduzir as dependências de uma infraestrutura de alertas externa. Para mais informações, consulte PromQL no Cloud Monitoring e Visão geral dos alertas do PromQL.

  • Com os filtros do Monitoring, é possível configurar políticas de alertas para usar proporções de métricas baseadas em filtros. Não é possível visualizar nem modificar políticas de alertas baseadas em filtros no console Google Cloud . Para ver um exemplo de política que usa filtros do Monitoring, consulte Proporção da métrica.

  • A linguagem de consulta de monitoramento (MQL) é uma interface expressiva baseada em texto que permite recuperar, filtrar e manipular dados de séries temporais. É possível criar políticas de alertas com condições que incluem uma operação de alerta da linguagem de consulta do Monitoring. Para mais informações, consulte Visão geral da linguagem de consulta do Monitoring e Políticas de alertas com a MQL.

Gerenciar políticas de alertas e incidentes

Depois que uma política de alertas é ativada, o Monitoring monitora continuamente as condições dessa política. Não é possível configurar a política de alertas para monitorar condições somente por determinados períodos. Se você quiser desativar a política de alertas por um determinado período, crie um adiamento.

Se um incidente estiver aberto e o Monitoring determinar que as condições da política baseada em métricas não são mais atendidas, ele fechará o incidente automaticamente e enviará uma notificação sobre o encerramento.

Preços

Em geral, as métricas do sistema do Cloud Monitoring são gratuitas, e as métricas de sistemas, agentes ou aplicativos externos não são. As métricas faturáveis são cobradas pelo número de bytes ou de amostras ingeridas.

Para mais informações, consulte as seções do Cloud Monitoring na página de preços do Google Cloud Observability.

Para informações sobre como monitorar o número de intervalos de rastreamento ou registros ingeridos ou como receber uma notificação quando um conteúdo específico é incluído em uma entrada de registro, consulte os seguintes documentos:

A seguir