Administra los incidentes de las políticas de alertas basadas en SQL

Por lo general, cuando se cumple una condición, Cloud Monitoring abre un incidente y envía una notificación cuando se recibe un registro que coincide con la condición de tu política de alertas. Sin embargo, los incidentes no se crean en las siguientes circunstancias:

  • La política está pospuesta o inhabilitada.
  • La frecuencia máxima de notificaciones superaría el límite de 1 notificación cada 5 minutos para cada política de alertas basada en registros.
  • El total diario de notificaciones superaría el límite de 20 notificaciones por día para cada política de alertas basada en registros.

Para cada incidente, Monitoring crea una página Detalles del incidente que te permite administrarlo y que informa información del incidente que puede ayudarte a solucionar el problema. Por ejemplo, la página Detalles del incidente muestra listas de resúmenes de resultados de consulta en SQL y los incidentes relacionados.

En este documento, se describe cómo puedes encontrar tus incidentes. También se describe cómo puedes usar la página Detalles del incidente para administrar incidentes de políticas de alertas basadas en SQL, que evalúan los resultados de una consulta en SQL ejecutada en función de datos de grupos de entradas de registro.

Antes de comenzar

Asegúrate de tener los permisos que necesitas:

Para obtener los permisos que necesitas para ver y administrar incidentes con la consola de Google Cloud, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Para obtener más información sobre los roles de Cloud Monitoring, consulta Controla el acceso con Identity and Access Management.

Cómo encontrar incidentes

Para ver una lista de incidentes en tu proyecto de Google Cloud, haz lo siguiente:

  1. En la consola de Google Cloud, ve a la página  Alertas.

    Ir a las Alertas

    Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuyo subtítulo es Monitoring.

    • En el panel Resumen, se muestra la cantidad de incidentes abiertos.
    • En el panel Incidentes, se muestran los incidentes abiertos más recientes. Para enumerar los incidentes más recientes en la tabla, incluidos aquellos que están cerrados, haz clic en Mostrar incidentes cerrados.
  2. Para ver los detalles de un incidente específico, selecciónalo en la lista.

    Se abrirá la página Detalles del incidente. Para obtener más información sobre la página Detalles del incidente, consulta la sección Investiga un incidente de esta página.

Cómo encontrar incidentes más antiguos

En el panel Incidentes en Alertas, se muestran los incidentes abiertos más recientes. Para ubicar los incidentes más antiguos, realiza una de las siguientes acciones:

  • Para desplazarte por las entradas de la tabla Incidentes, haz clic en  Más reciente o  Más antiguo.

  • Para navegar a la página Incidentes, haz clic en Ver todos los incidentes. En la página Incidentes, puedes hacer lo siguiente:

    • Mostrar incidentes cerrados: Para enumerar todos los incidentes en la tabla, haz clic en Mostrar incidentes cerrados.
    • Filtrar incidentes: Si deseas obtener información para agregar filtros, consulta Filtrar incidentes.
    • Confirmar o cerrar un incidente, o posponer su política de alertas Para acceder a estas opciones, haz clic en  Más opciones en la fila del incidente y selecciona el menú. Para obtener más información, consulta Administra incidentes.

Filtrar incidentes

Cuando ingresas un valor en la barra de filtros, solo los incidentes que coinciden con el filtro se enumeran en la tabla Incidentes. Si agregas varios filtros, solo se mostrará un incidente si cumple con todos los filtros.

Para agregar un filtro a la tabla de incidentes, haz lo siguiente:

  1. En la página Incidentes, haz clic en  Filtrar tabla y, luego, selecciona una propiedad de filtro. Las propiedades del filtro incluyen todas las siguientes opciones:

    • Estado del incidente
    • Nombre de la política de alertas
    • Cuando se abrió o cerró el incidente
  2. Selecciona un valor del menú secundario o ingresa un valor en la barra de filtros.

Cómo investigar un incidente

La página Detalles del incidente contiene información que puede ayudarte a identificar la causa de un incidente.

Explora los resultados de la consulta

En el panel Total de tiempo de ranura consumido por día, se muestra la cantidad de tiempo que tus ranuras reservadas de BigQuery dedicaron a ejecutar las consultas de SQL para la política de alertas en las últimas 24 horas.

En el panel Resultados de la consulta en SQL, se muestra una lista de resúmenes de los resultados de las consultas de cada vez que Análisis de registros ejecutó la consulta en SQL de la condición de la política de alertas. De forma predeterminada, la lista se filtra para mostrar solo las consultas que coinciden con la condición de la política de alertas.

  • Para ver la consulta y la tabla de resultados de la consulta de un momento específico en el que Log Analytics ejecutó la consulta, haz clic en un valor de la columna Tiempo de ejecución de la consulta.
  • Para alternar entre mostrar solo los resultados de las consultas que coinciden con la condición de la política de alertas y todas las consultas que Log Analytics ejecutó desde la política de alertas, haz clic en Mostrar solo las consultas que coinciden con las condiciones de alerta.

Cómo ver información complementaria

En la sección Documentación, se muestra la plantilla de documentación para las notificaciones que proporcionaste cuando creaste la política de alertas. Esta información puede incluir una descripción de lo que supervisa la política de alertas y, además, incluye sugerencias para la mitigación. Para obtener más información, consulta Cómo anotar notificaciones con documentación definida por el usuario.

Si no configuraste la documentación para tu política de alertas, en el panel Documentación, se mostrará el mensaje “No se configuró ninguna documentación”.

Para ayudarte a descubrir los problemas subyacentes en tu aplicación, puedes explorar los incidentes relacionados con otras condiciones de la política de alertas.

En la sección Incidentes relacionados, se muestra una lista de otros incidentes que se crearon cuando se cumplió la condición de la política de alertas.

Administración de incidentes

Los incidentes están en uno de los siguientes estados:

  •  Abierto: Se cumplió la condición de la política de alertas basada en SQL y el incidente aún está abierto. Si se vuelve a cumplir la misma condición y ya hay un incidente abierto, no se abre un incidente nuevo.

  • Confirmado: El incidente está abierto y se marcó de forma manual como confirmado. Por lo general, este estado indica que se investiga el incidente.

  •  Cerrado: Cierra el incidente de forma manual o se cerró automáticamente después de que venció el período de cierre automático.

Confirma incidentes

Te recomendamos que marques un incidente como confirmado cuando comiences a investigar la causa del incidente.

Para marcar un incidente como confirmado, haz lo siguiente:

  1. En el panel Incidentes de la página Alertas, haz clic en Ver todos los incidentes.
  2. En la página Incidentes, busca el incidente que deseas confirmar y, luego, realiza una de las siguientes acciones:

    • Haz clic en  Más opciones y, luego, selecciona Confirmar.
    • Abre la página de detalles del incidente y, luego, haz clic en Confirmar incidente.

Pospone una política de alertas

Para evitar que Monitoring cree incidentes y envíe notificaciones durante un período específico, pospone la política de alertas relacionada. Cuando aplazas una política de alertas, los incidentes relacionados con ella permanecen abiertos, pero no generan más notificaciones. Los incidentes se cierran según la duración del cierre automático de la política de alertas.

Para posponer un incidente que estás viendo, haz lo siguiente:

  1. En la página Detalles del incidente, haz clic en Política de posponer.

  2. Selecciona la duración del posponer. Después de seleccionar la duración de la función, esta se iniciará de inmediato.

También puedes posponer una política de alertas desde la página Incidentes. Para ello, busca el incidente que deseas posponer, haz clic en  Más opciones y, luego, selecciona Posponer. Puedes posponer las políticas de alertas durante las interrupciones para evitar recibir más notificaciones durante el proceso de solución de problemas.

Cierra incidentes

Puedes permitir que Monitoring cierre un incidente por ti o cerrarlo tú mismo.

Monitoring cierra automáticamente un incidente cuando vence la duración del cierre automático de la política de alertas. De forma predeterminada, la duración del cierre automático es de 7 días. La duración mínima del cierre automático es de 30 minutos.

Para cerrar un incidente, haz lo siguiente:

  1. En el panel Incidentes de la página Alertas, haz clic en Ver todos los incidentes.
  2. En la página Incidentes, busca el incidente que deseas cerrar y, luego, realiza una de las siguientes acciones:

    • Haz clic en  Ver más y, luego, selecciona Cerrar incidente.
    • Abre la página Detalles del incidente de ese incidente y, luego, haz clic en Cerrar incidente.
Si ves el mensaje Unable to close incident, vuelve a intentarlo en unos minutos. No puedes cerrar un incidente nuevo de inmediato porque el sistema de alertas aún considera activas las condiciones que lo causaron.

Límites y retención de datos

Para obtener información sobre los límites y el período de retención de los incidentes, consulta Límites de las alertas.

¿Qué sigue?