Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Como criar uma política de alertas para um SLO
Nesta página, descrevemos como criar uma política de alertas no Cloud Monitoring para
um objetivo de nível de serviço (SLO) criado no Cloud Service Mesh.
O Cloud Monitoring pode acionar um alerta quando um serviço está prestes a violar
um SLO. Crie uma política de alertas com base na taxa de consumo do
erro de orçamento.
Todos os alertas sobre erros de orçamento têm a mesma condição básica: uma porcentagem
específica do erro de orçamento para o
período de conformidade
é consumida em um período de lookback, que é um intervalo de tempo, como os 60 minutos
anteriores. Quando você cria a política de alertas, o Cloud Service Mesh
define automaticamente a maioria das condições do alerta com base nas configurações do
SLO. Você especifica o período de lookback e a porcentagem de consumo.
Para determinar os valores do período de lookback e a porcentagem de consumo,
podem ser necessárias algumas tentativas e erros. Use o período de lookback padrão
de 60 minutos como ponto de partida. Para determinar a porcentagem de consumo,
monitore o comportamento do serviço para ver qual porcentagem do erro de
orçamento total (durante o período de conformidade) foi consumida nos 60 minutos
anteriores. Defina a porcentagem de consumo de modo a não ultrapassar o valor
do erro de orçamento que você está disposto a pagar para o período de lookback, mas não quer
gerar um alerta desnecessário.
Por exemplo, suponha que você tenha criado um SLO com o seguinte nome:
95% < 300ms Latency in Calendar Week
Com esse SLO, apenas 5% do número total de solicitações em uma semana pode ter uma
latência maior que 300 ms. O erro de orçamento total é consumido ao alcançar ou exceder 5%. Se
você definir o período de lookback como uma hora, cada período de lookback será 1/168 do
período de conformidade (há 168 horas em uma semana). Para calcular a porcentagem de consumo por hora
que não excede o orçamento total de erros da semana:
5% ÷ 168 ≈ 0.03%
Como a latência do serviço pode variar dependendo da carga ou de outras
condições, definir 0,03% como a porcentagem de consumo pode acionar
alertas desnecessários. Comece com o dobro desse valor, ou 0,06%, monitore
o serviço e ajuste o valor conforme necessário.
Selecione o projeto Google Cloud na lista suspensa na barra de menus.
Clique no serviço para criar uma política de alertas.
Na barra de navegação à esquerda, clique em Integridade.
Clique no SLO para criar uma política de alertas.
Na seção Status atual do SLO à direita, clique no
link Criar política de alertas.
A caixa de diálogo Adicionar condição é exibida. O Cloud Service Mesh
preenche automaticamente a condição Taxa de uso do SLO com base nas
configurações do SLO. Configure a condição Taxa de uso do SLO para receber um alerta quando
o erro de orçamento do SLO estiver diminuindo muito rapidamente. Você
quer ter certeza de que vai receber um alerta antes que o SLO esteja fora do erro de
orçamento.
Configure a condição:
Para nomear a condição, clique no link Título sugerido para usar o
nome com base no SLO ou insira um nome para a condição.
Na seção Meta, digite o período de lookback no campo
Duração de lookback ou use o valor padrão.
Na seção Configuração, insira a porcentagem de consumo no
campo Limite.
Clique em Salvar.
A janela Criar nova política de alertas é exibida.
Configure a política de alertas:
Digite um nome de política.
A condição é preenchida automaticamente, mas é possível adicionar
outra condição.
Se a política de alertas tiver apenas uma condição, deixe o campo Gatilhos de
política no valor padrão de Qualquer condição é atendida.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-19 UTC."],[],[],null,["# Creating an alerting policy for an SLO\n======================================\n\n| **Note:** This guide only supports Cloud Service Mesh with Istio APIs and does not support Google Cloud APIs. For more information see, [Cloud Service Mesh overview](/service-mesh/v1.25/docs/overview).\n\nThis page describes how to create an alerting policy in Cloud Monitoring for\na service level objective (SLO) that you create in Cloud Service Mesh.\n\nFor an introduction to SLOs, see the\n[Service level objectives overview](/service-mesh/v1.25/docs/observability/slo-overview).\n\nCloud Monitoring can trigger an alert when a Service is on track to violate\nan SLO. You can create an alerting policy based on the rate of consumption of your\n[error budget](/service-mesh/v1.25/docs/observability/design-slo#error_budgets).\nAll alerts on error budgets have the same basic condition: a specified\npercentage of the error budget for the\n[compliance period](/service-mesh/v1.25/docs/observability/design-slo#compliance_periods)\nis consumed in a lookback period, which is a time period, such as the previous\n60 minutes. When you create the alerting policy, Cloud Service Mesh\nautomatically sets most of the conditions for the alert based on the settings in\nthe SLO. You specify the lookback period and the consumption percentage.\n\nDetermining what values you should set for the lookback period and consumption\npercentage might take some trial and error. You could use the default lookback\nperiod of 60 minutes as a starting point. To determine the consumption\npercentage, monitor the service behavior to see what percentage of the total\nerror budget (over the compliance period) was consumed in the previous 60\nminutes. You want to set the consumption percentage so that you don't burn more\nerror budget in the lookback period than you can afford, but you don't want to\nset off an alert unnecessarily.\n\nFor example, suppose you created an SLO with the following name:\n`95% \u003c 300ms Latency in Calendar Week`\n\nWith this SLO, only 5% of the total number of requests in a week can have a\nlatency \\\u003e 300ms. Hitting or exceeding 5% consumes your total error budget. If\nyou set the lookback period to one hour, each lookback period is `1/168` of your\ncompliance period (there are 168 hours in a week). To calculate the hourly\nconsumption percentage that doesn't exceed the total error budget for the week:\n`5%` ÷ `168` ≈ `0.03%`\n\nBecause latency for your Service can fluctuate depending on load or other\nconditions, setting 0.03% as the consumption percentage might trigger\nunnecessary alerts. You could start with a value twice that, or 0.06%, then\nmonitor your Service and adjust the value as needed.\n\nBefore you begin\n----------------\n\n[Create an SLO](/service-mesh/v1.25/docs/observability/create-slo) for one of\nyour Services.\n\nCreating an alerting policy on an SLO\n-------------------------------------\n\n1. Go to the **Health** tab for a service:\n\n 1. In the Google Cloud console, go to **Cloud Service Mesh**.\n\n [Go to Cloud Service Mesh](https://console.cloud.google.com/kubernetes/services)\n 2. Select the Google Cloud project from the drop-down list on the menu bar.\n\n 3. Click the service that you want to create an alerting policy for.\n\n 4. In the left navigation bar, click **Health**.\n\n2. Click the SLO that you want to create an alerting policy for.\n\n3. In the **Current Status of SLO** section on the right, click the\n **Create Alerting Policy** link.\n\n The **Add condition** dialog displays. Cloud Service Mesh\n automatically populates the **SLO Burn Rate** condition based on the\n settings in the SLO. You configure the **SLO Burn Rate** condition so that\n you get an alert when the SLO's error budget is declining too rapidly. You\n want to make sure that you get an alert before the SLO is out of error\n budget.\n\n4. Configure the condition:\n\n 1. To name the condition, click the **Suggested title** link to use the name based on your SLO, or enter a name for the condition.\n 2. In the **Target** section, enter the lookback period in the **Lookback Duration** field, or use the default value.\n 3. In the **Configuration** section, enter the consumption percentage in the **Threshold** field.\n 4. Click **Save** . The **Create new alerting policy** window displays.\n5. Configure the alerting policy:\n\n 1. Enter a policy name.\n 2. The condition is automatically populated, but you can optionally add another condition.\n 3. If the alerting policy has only one condition, then leave the **Policy\n triggers** field at the default value of **Any condition is met**.\n 4. Optionally, configure the **Notifications** and **Documentation** sections. See [Managing alerting policies](/monitoring/alerts/using-alerting-ui) for more information.\n 5. Click **Save** . The **Policy details** page is displayed.\n 6. To go back to the **Cloud Service Mesh** dashboard, click the **Navigation menu** *dehaze* and go to **Anthos** \\\u003e **Services**.\n\nWhat's next\n-----------\n\n- Learn more about alerting from Site Reliability Engineering at Google:\n\n - [Site Reliability Engineering](https://sre.google/sre-book/practical-alerting/)\n - [The Site Reliability Workbook](https://sre.google/workbook/alerting-on-slos/)"]]