Monitorizar instancias con Cloud Monitoring

En este documento se describe cómo usar la consola de Cloud Monitoring para monitorizar tus instancias de Spanner.

La consola de Cloud Monitoring proporciona varias herramientas de monitorización para Spanner:

Si prefieres monitorizar Spanner de forma programática, usa las bibliotecas de cliente de Cloud para Cloud Monitoring para obtener métricas.

Usar el panel de control seleccionado de Cloud Monitoring

Cloud Monitoring te proporciona un panel de control seleccionado que resume información clave sobre tus instancias de Spanner, como la siguiente:

  • Incidentes: alertas de monitorización creadas por el usuario que están abiertas, activas o resueltas.
  • Eventos: lista de registros de auditoría de Spanner (si están habilitados y disponibles)
  • Instancias: un resumen de alto nivel de tus instancias de Spanner, que incluye la capacidad de computación, el número de bases de datos y el estado de la instancia.
  • Gráficos agregados del uso del almacenamiento y del rendimiento

Para ver el panel de control de Spanner, sigue estos pasos:

  1. En la Google Cloud consola, selecciona Monitoring. También puedes hacer clic en el siguiente botón:

    Ir a Monitoring

  2. Si Recursos se muestra en el panel de navegación, selecciona Recursos y, a continuación, Cloud Spanner. De lo contrario, selecciona Paneles de control y, a continuación, el panel de control llamado Cloud Spanner.

Ver los detalles de la instancia y la base de datos

Cuando abres el panel de control seleccionado de Spanner, se muestran datos agregados de todas tus instancias. Para ver más detalles sobre una instancia concreta, haga clic en su nombre en Instancias.

El panel de control muestra información como los metadatos de la instancia, las bases de datos de la instancia y gráficos de varias métricas desglosadas por región.

En la página del panel de control de la instancia, también puede ver gráficos de una base de datos específica de la instancia:

  1. En la parte derecha, encima de los gráficos de métricas de la instancia, haz clic en Métricas de la base de datos.

  2. En la lista desplegable Seleccionar un desglose, elige la base de datos que quieras examinar.

    La consola de Cloud Monitoring muestra gráficos de la base de datos.

Crear gráficos personalizados para métricas de Spanner

Puedes usar Cloud Monitoring para crear gráficos personalizados de métricas de Spanner. Puede usar el explorador de métricas para crear gráficos temporales o ad hoc, o bien crear gráficos que aparezcan en paneles de control personalizados.

En concreto, Cloud Monitoring te permite crear un gráfico personalizado que muestra si dos o más métricas están correlacionadas entre sí. Por ejemplo, puedes comprobar si hay una correlación entre la utilización de la CPU y la latencia en una instancia de Spanner, lo que podría indicar que tu instancia necesita más capacidad de computación o que algunas de tus consultas están provocando una utilización de la CPU elevada.

Para empezar a usar este ejemplo, sigue estos pasos:

  1. En la Google Cloud consola, selecciona Monitoring. También puedes hacer clic en el siguiente botón:

    Ir a Monitoring

  2. Si Explorador de métricas se muestra en el panel de navegación, selecciónalo. De lo contrario, seleccione Recursos y, a continuación, Explorador de métricas.

  3. Haz clic en la pestaña Opciones de vista y, a continuación, marca la casilla Escala logarítmica en el eje Y. Esta opción le ayuda a comparar varias métricas cuando una de ellas tiene valores mucho mayores que las demás.

  4. En la lista desplegable situada encima del panel de la derecha, selecciona Línea.

  5. Haz clic en la pestaña Métricas. Ahora puede añadir métricas al gráfico.

Para añadir métricas de latencia al gráfico, sigue estos pasos:

  1. En el cuadro Buscar tipo de recurso y métrica, introduce el valor spanner.googleapis.com/api/request_latencies y, a continuación, haz clic en la fila que aparece debajo del cuadro.
  2. En el cuadro Filtro, introduce el valor instance_id, el ID de la instancia que quieras examinar y haz clic en Aplicar.
  3. En la lista desplegable Aggregator, haz clic en max.
  4. Opcional: Cambia el percentil de latencia:

    1. Haz clic en Mostrar opciones avanzadas.
    2. Haga clic en la lista desplegable Alineador y, a continuación, en el percentil de latencia que quiera ver.

      En la mayoría de los casos, debe consultar la latencia del percentil 50 para conocer la latencia habitual o la latencia del percentil 99 para saber cuál es la latencia del 1% de las solicitudes más lentas.

Para añadir métricas de utilización de CPU al gráfico, sigue estos pasos:

  1. Haz clic en Añadir métrica.
  2. En el cuadro Buscar tipo de recurso y métrica, introduce el valor spanner.googleapis.com/instance/cpu/utilization y, a continuación, haz clic en la fila que aparece debajo del cuadro.
  3. En el cuadro Filtro, introduce el valor instance_id, el ID de la instancia que quieras examinar y haz clic en Aplicar.
  4. En la lista desplegable Aggregator, haz clic en max.

Ahora tiene un gráfico que muestra las métricas de uso de CPU y latencia de una instancia de Spanner. Si ambas métricas son más altas de lo esperado al mismo tiempo, puede tomar medidas adicionales para corregir el problema.

Para obtener más información sobre cómo crear gráficos personalizados, consulta la documentación de Cloud Monitoring.

Crear alertas para métricas de Spanner

Cuando creas una instancia de Spanner, debes elegir la capacidad de computación de la instancia. Como la carga de trabajo de la instancia cambia, Spanner no ajusta automáticamente la capacidad de computación de la instancia. Por lo tanto, debes configurar varias alertas para asegurarte de que la instancia se mantenga dentro de los máximos recomendados de utilización de CPU y del límite recomendado de almacenamiento.

En los siguientes ejemplos se muestra cómo configurar políticas de alertas para algunas métricas de Spanner. Para ver una lista completa de las métricas disponibles, consulta la lista de métricas de Spanner.

CPU de prioridad alta

Para crear una política de alertas que se active cuando la utilización de CPU de alta prioridad de Spanner supere un umbral recomendado, usa los siguientes ajustes.

Campo Nueva condición

Valor
Recurso y métrica En el menú Recursos, selecciona Instancia de Spanner.
En el menú Categorías de métricas, selecciona Instancia.
En el menú Métricas, selecciona Uso de CPU por prioridad.

(El valor de metric.type es spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filtro instance_id = YOUR_INSTANCE_ID
priority = high
En series temporales
Agrupación por serie temporal
location para instancias multirregionales;
déjelo en blanco para instancias regionales.
Entre series temporales
Agregación de series temporales
sum
Ventana de tiempo 10 m
Función de ventana móvil mean
Configurar el activador de alertas
Campo

Valor
Tipo de condición Threshold
Activador de alerta Any time series violates
Posición del umbral Above threshold
Valor de umbral 45% para instancias multirregionales;
65% para instancias regionales.
Ventana de repetición de la prueba 10 minutes

Promedio de 24 horas de la CPU

Para crear una política de alertas que se active cuando la media continua de 24 horas de la utilización de la CPU de Spanner supere el umbral recomendado, utiliza los siguientes ajustes.

Campo Nueva condición

Valor
Recurso y métrica En el menú Recursos, selecciona Instancia de Spanner.
En el menú Categorías de métricas, selecciona Instancia.
En el menú Métricas, selecciona Utilización de CPU suavizada.

(El valor de metric.type es spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Entre series temporales
Agregación de series temporales
sum
Ventana de tiempo 10 m
Función de ventana móvil mean
Configurar el activador de alertas
Campo

Valor
Tipo de condición Threshold
Activador de alerta Any time series violates
Posición del umbral Above threshold
Umbral 90%
Ventana de repetición de la prueba 10 minutes

Almacenamiento

Para crear una política de alertas que se active cuando el almacenamiento de tu instancia de Spanner supere un umbral recomendado, usa los siguientes ajustes.

Campo Nueva condición

Valor
Recurso y métrica En el menú Recursos, selecciona Instancia de Spanner.
En el menú Categorías de métricas, selecciona Instancia.
En el menú Métricas, selecciona Almacenamiento usado.

(El valor de metric.type es spanner.googleapis.com/instance/storage/utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Entre series temporales
Agregación de series temporales
sum
Ventana de tiempo 10 m
Función de ventana móvil max
Configurar el activador de alertas
Campo

Valor
Tipo de condición Threshold
La condición se activa si Any time series violates
Posición del umbral Above threshold
Valor de umbral No es necesario que defina un umbral específico para el almacenamiento máximo por nodo. Sin embargo, te recomendamos que configures una alerta para cuando te acerques al límite máximo de almacenamiento. Para obtener más información, consulta Métricas de uso de almacenamiento.
Ventana de repetición de la prueba 10 minutes

Siguientes pasos