Información general sobre los objetivos de nivel de servicio

Los objetivos de nivel de servicio (SLOs) son una herramienta fundamental del kit de herramientas de monitorización de servicios de Google. Los SLOs pueden proporcionarte una señal concisa y con poco ruido sobre el estado general de tus servicios. Cloud Service Mesh te permite definir SLOs para tus servicios, así como monitorizar y recibir alertas sobre tus servicios en función de esos SLOs.

Para monitorizar el estado de un servicio, debes saber qué comportamientos son importantes para ese servicio y cómo medirlos y evaluarlos. Un indicador de nivel de servicio (SLI) es una medida cuantitativa de algún aspecto del servicio. Los SLIs típicos son los siguientes:

  • Latencia: tiempo que se tarda en devolver una respuesta a una solicitud, normalmente medido en milisegundos (ms). La latencia suele presentarse como un agregado. Es decir, los datos brutos se recogen durante un periodo y se calculan como percentiles. Cloud Service Mesh muestra un gráfico de latencia en la página Métricas de cada uno de tus servicios. El gráfico Latencia muestra la latencia a lo largo del tiempo, lo que puede ayudarte a determinar un umbral de latencia o un límite superior para un servicio.
  • Disponibilidad: la fracción del tiempo en la que un servicio responde correctamente. Normalmente, se representa como una proporción del número de respuestas correctas con respecto al número total de respuestas. El gráfico Tasa de errores de la página Métricas puede ayudarte a determinar la disponibilidad de cada servicio.

Un SLO es un valor objetivo de un nivel de servicio que se mide mediante un SLI. Un SLO se puede representar como SLI ≤ upper_bound o SLI ≥ lower_bound. Los SLOs son objetivos medibles de rendimiento durante un periodo de tiempo. Por ejemplo, puede que tengas requisitos como los siguientes para algunos de tus servicios:

  • La latencia solo puede superar los 300 ms en el 5 % de las solicitudes durante un periodo continuado de 30 días.
  • El sistema debe tener una disponibilidad del 99% medida a lo largo de una semana natural.

Puedes definir y consultar los SLOs de tus servicios en función de sus datos de telemetría en la página Estado. Después, puedes crear alertas en Cloud Monitoring para recibir avisos si un servicio no funciona como se espera.

Siguientes pasos