Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Visão geral dos objetivos de nível de serviço
Os objetivos de nível de serviço (SLOs, na sigla em inglês) são uma ferramenta essencial no toolkit de monitoramento
de serviços do Google. Os SLOs podem fornecer um sinal conciso e de baixo ruído sobre a integridade
geral dos serviços. O Cloud Service Mesh permite definir SLOs para seus
serviços e monitorar e alertar os serviços de acordo com esses SLOs.
Para monitorar a integridade de um serviço, você precisa entender quais comportamentos
são importantes para esse serviço e como medi-los e avaliá-los. Um
indicador de nível de serviço (SLI, na sigla em inglês) é uma medida quantitativa de algum aspecto do
serviço. Os SLIs típicos são:
Latência: quanto tempo leva para retornar uma resposta a uma solicitação, geralmente medida
em milissegundos (ms). A latência normalmente é apresentada como uma agregação. Ou seja,
os dados brutos são coletados durante um período e calculados como percentis.
O Cloud Service Mesh exibe um gráfico de latência na página Métricas
para cada um dos serviços. O gráfico mostra a latência ao longo do tempo,
o que pode ajudar a determinar um limiar de latência ou um limiar superior para um serviço.
Disponibilidade: a fração do tempo que um serviço responde com sucesso.
Isso normalmente é apresentado como uma proporção do número de respostas bem-sucedidas
em relação ao número total de respostas. O gráfico de taxa de erros na página Métricas
ajuda a determinar a disponibilidade de cada serviço.
Um SLO é um valor de destino referente a um nível de serviço medido por um SLI. Um SLO
pode ser representado como: SLI ≤ upper_bound ou SLI ≥ lower_bound. Os SLOs são
metas mensuráveis de desempenho ao longo de um período. Por exemplo, podem ser definidos
requisitos como estes para alguns dos serviços:
A latência pode exceder 300 ms em apenas 5% das solicitações durante um período contínuo de 30 dias.
O sistema precisa ter 99% de disponibilidade medida ao longo de uma semana.
É possível definir e visualizar SLOs dos serviços com base nos dados de telemetria na página
Integridade. Em seguida, crie alertas no
Cloud Monitoring para avisar se um serviço não estiver
tendo o desempenho esperado.
A seguir
Saiba mais sobre SLOs da engenharia de confiabilidade do site no Google:
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-19 UTC."],[],[],null,["# Service level objectives overview\n=================================\n\n| **Note:** This guide only supports Cloud Service Mesh with Istio APIs and does not support Google Cloud APIs. For more information see, [Cloud Service Mesh overview](/service-mesh/v1.25/docs/overview).\n\nService Level Objectives (SLOs) are a core tool in the Google service monitoring\ntoolkit. SLOs can give you a concise and low-noise signal as to the overall\nhealth of your services. Cloud Service Mesh lets you set SLOs for your\nservices, and monitor and alert on your services in terms of those SLOs.\n\nTo monitor the health of a service, you need to understand which behaviors\nmatter for that service and how to measure and evaluate those behaviors. A\nservice level indicator (SLI) is a quantitative measure of some aspect of the\nservice. Typical SLIs are:\n\n- Latency: How long it takes to return a response to a request, usually measured in milliseconds (ms). Latency is typically presented as an aggregate. That is, the raw data is collected over a period of time and calculated as percentiles. Cloud Service Mesh displays a Latency graph on the **Metrics** page for each of your services. The Latency graph shows you the latency over time, which can help you determine a latency threshold or upper bound for a service.\n- Availability: The fraction of the time that a service responds successfully. This is typically presented as a ratio of the number of successful responses over the total number of responses. The Error rate graph on the **Metrics** page can help you determine the availability of each service.\n\nAn SLO is a target value for a service level that is measured by an SLI. An SLO\ncan be represented as: `SLI ≤ upper_bound` or `SLI ≥ lower_bound`. SLOs are\nmeasurable goals for performance over a period of time. For example, you might\nhave requirements like the following for some of your services:\n\n- Latency can exceed 300ms in only 5 percent of the requests over a rolling 30-day period.\n- The system must have 99% availability measured over a calendar week.\n\nYou can set and view SLOs for your services based on their telemetry data on the\n**Health** page. You can then create alerts in\n[Cloud Monitoring](/monitoring/alerts) to warn you if a service isn't\nperforming as expected.\n\nWhat's next\n-----------\n\n- Learn more about SLOs from Site Reliability Engineering at Google:\n\n - [Site Reliability Engineering](https://sre.google/sre-book/service-level-objectives/)\n - [The Site Reliability Workbook](https://sre.google/workbook/implementing-slos/)\n- [Designing SLOs](/service-mesh/v1.25/docs/observability/design-slo)\n\n- [Creating SLOs](/service-mesh/v1.25/docs/observability/create-slo)\n\n- [Monitoring SLOs](/service-mesh/v1.25/docs/observability/monitor-slo)"]]