Un incidente es un registro de cuándo se cumple la condición de una política de alertas. Normalmente, Cloud Monitoring abre un incidente y envía una notificación cuando se recibe un registro que coincide con la condición de tu política de alertas. Sin embargo, no se crean incidentes en las siguientes circunstancias:
- La política se ha pospuesto o inhabilitado.
- El número de políticas o incidentes de alerta supera los límites de alerta.
- Otra entrada de registro provoca que se cumpla la misma condición para un incidente abierto. En este caso, Monitoring solo envía otra notificación para el mismo incidente.
Por cada incidente, Monitoring crea una página Detalles del incidente que le permite gestionar el incidente y que informa sobre la información del incidente que puede ayudarle a solucionar el problema. Por ejemplo, la página Detalles del incidente muestra una lista de entradas de registro que coinciden con la consulta de la política de alertas basada en registros. También puedes encontrar enlaces a incidentes relacionados.
En este documento se describe cómo puede encontrar sus incidencias. También se describe cómo puedes usar la página Detalles del incidente para gestionar incidentes de políticas de alertas basadas en registros, que evalúan los datos de las entradas de registro almacenados en registros individuales de Cloud Logging.
Esta función solo se admite en proyectos de Google Cloud . En el caso de las configuraciones de App Hub, seleccione el proyecto host de App Hub o el proyecto de gestión de la carpeta habilitada para aplicaciones.
Antes de empezar
Para obtener los permisos que necesitas para ver y gestionar incidencias mediante la Google Cloud consola, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos en tu proyecto:
-
Para ver los incidentes, usa la Google Cloud consola:
-
Monitorizar el visor de incidencias de la consola de Cloud (
roles/monitoring.cloudConsoleIncidentViewer
) -
Lector de cuentas de Stackdriver (
roles/stackdriver.accounts.viewer
)
-
Monitorizar el visor de incidencias de la consola de Cloud (
-
Gestiona los incidentes mediante la consola: Google Cloud
-
Monitorización del editor de incidencias de la consola de Cloud (
roles/monitoring.cloudConsoleIncidentEditor
) -
Lector de cuentas de Stackdriver (
roles/stackdriver.accounts.viewer
)
-
Monitorización del editor de incidencias de la consola de Cloud (
Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.
También puedes conseguir los permisos necesarios a través de roles personalizados u otros roles predefinidos.
Para obtener más información sobre los roles de Cloud Monitoring, consulta Controlar el acceso con Gestión de Identidades y Accesos.
Buscar incidentes
Para ver una lista de los incidentes de tu Google Cloud proyecto, haz lo siguiente:
-
En la Google Cloud consola, ve a la página notifications Alertas:
Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuya sección sea Monitorización.
En la barra de herramientas de la Google Cloud consola, selecciona tu Google Cloud proyecto. En el caso de las configuraciones de App Hub, seleccione el proyecto host de App Hub o el proyecto de gestión de la carpeta habilitada para aplicaciones.
En la página Alertas se muestra información sobre tus políticas de alertas, las alertas pospuestas y los incidentes:
- En el panel Resumen se indica el número de incidencias abiertas.
- En el panel Incidentes se muestran los incidentes abiertos más recientes. Para ver los incidentes más recientes en la tabla, incluidos los que están cerrados, haz clic en Mostrar incidentes cerrados.
Para ver los detalles de un incidente concreto, selecciónalo en la lista.
Se abrirá la página Detalles del incidente. Para obtener más información sobre la página Detalles del incidente, consulta la sección Investigar un incidente de esta página.
Buscar incidentes antiguos
El panel Incidentes de la página Alertas muestra los incidentes abiertos más recientes. Para localizar incidentes antiguos, haz una de las siguientes acciones:
Para desplazarte por las entradas de la tabla Incidentes, haz clic en arrow_back_ios Más recientes o arrow_forward_ios Más antiguos.
Para ir a la página Incidentes, haga clic en Ver todos los incidentes. En la página Incidentes, puedes hacer lo siguiente:
- Mostrar incidentes cerrados: para ver todos los incidentes en la tabla, haz clic en Mostrar incidentes cerrados.
- Filtrar incidencias: para obtener información sobre cómo añadir filtros, consulte Filtrar incidencias.
- Confirmar o cerrar un incidente, o posponer su política de alertas. Para acceder a estas opciones, haz clic en more_vert Más opciones en la fila del incidente y selecciona una opción del menú. Para obtener más información, consulta Gestionar incidencias.
Filtra incidentes
Cuando introduce un valor en la barra de filtros, en la tabla Incidencias solo se muestran las incidencias que coinciden con el filtro. Si añade varios filtros, solo se mostrará un incidente si cumple todos los filtros.
Para añadir un filtro a la tabla de incidencias, sigue estos pasos:
En la página Incidentes, haga clic en filter_list Filtrar tabla y, a continuación, seleccione una propiedad de filtro. Las propiedades de filtro incluyen lo siguiente:
- Estado del incidente
- Nombre de la política de alertas
- Cuándo se abrió o cerró el incidente
Selecciona un valor en el menú secundario o introduce un valor en la barra de filtros.
Investigar un incidente
La página Detalles del incidente contiene información que puede ayudarte a identificar la causa de un incidente.
Consultar entradas de registro
Explora las entradas de registro para encontrar patrones y problemas recurrentes relacionados con tu investigación. El panel Registros muestra las entradas de registro que coinciden con la consulta de tu política de alertas basada en registros.
- Para ver las entradas de registro en el Explorador de registros, haz clic en Ver en el Explorador de registros y, a continuación, selecciona un proyecto de ámbito.
- Para ver el panel de registros en el explorador de métricas, haz clic en query_stats Explorar datos.
Ver información complementaria
En la sección Etiquetas se muestran las etiquetas y los valores del recurso monitorizado incluido en la entrada de registro que ha provocado el incidente. Esta información puede ayudarte a identificar el recurso concreto monitorizado que ha provocado el incidente. Para obtener más información, consulta Añadir etiquetas a incidentes.
En la sección Documentación se muestra la plantilla de documentación de las notificaciones que has proporcionado al crear la política de alertas. Esta información puede incluir una descripción de lo que monitoriza la política de alertas y consejos para mitigar el problema. Para obtener más información, consulta Anotar notificaciones con documentación definida por el usuario.
Si no has configurado la documentación de tu política de alertas, en el panel Documentación se mostrará el mensaje "No se ha configurado ninguna documentación".
Consultar incidentes relacionados
Para ayudarte a descubrir los problemas subyacentes de tu aplicación, puedes consultar los incidentes relacionados con otras condiciones de la política de alertas.
En la sección Incidentes relacionados se muestra una lista de incidentes que cumplen una de las siguientes condiciones:- El incidente se creó cuando se cumplió una condición de la misma política de alertas.
- El incidente comparte una etiqueta con el incidente que se muestra en la página Detalles del incidente.
Gestionar incidentes
Los incidentes pueden tener uno de los siguientes estados:
error Abierto: Se ha cumplido la condición de la política de alertas basada en registros y el incidente sigue abierto. Si se vuelve a cumplir la misma condición y ya hay un incidente abierto, no se abrirá otro.
warning Registrado: el incidente está abierto y se ha marcado manualmente como registrado. Normalmente, este estado indica que se está investigando el incidente.
check_circle Cerrado: Has cerrado el incidente manualmente o se ha cerrado automáticamente después de que haya finalizado el periodo de cierre automático.
Registrar incidentes
Te recomendamos que marques un incidente como confirmado cuando empieces a investigar la causa del incidente.
Para marcar un incidente como confirmado, siga estos pasos:
- En el panel Incidentes de la página Alertas, haga clic en Ver todos los incidentes.
En la página Incidentes, busca el incidente que quieras confirmar y, a continuación, haz una de las siguientes acciones:
- Haz clic en more_vert Más opciones y, a continuación, selecciona Confirmar.
- Abre la página de detalles del incidente y haz clic en Confirmar incidente.
Posponer una política de alertas
Para evitar que Monitoring cree incidentes y envíe notificaciones durante un periodo específico, pospón la política de alertas relacionada. Cuando aplazas una política de alertas, los incidentes relacionados con ella permanecen abiertos, pero no provocan más notificaciones. Los incidentes se cierran en función de la duración de cierre automático de la política de alertas.
Para posponer una alerta de un incidente que estés viendo, haz lo siguiente:
En la página Detalles del incidente, haz clic en Aplazar política.
Selecciona la duración de la repetición. Después de seleccionar la duración de la repetición, esta empezará inmediatamente.
También puedes posponer una política de alertas desde la página Incidentes. Para ello, busca el incidente que quieras posponer, haz clic en more_vert Más opciones y, a continuación, selecciona Posponer. Puedes posponer las políticas de alertas durante las interrupciones para evitar que se envíen más notificaciones durante el proceso de solución de problemas.
Cerrar incidentes
Puedes dejar que la monitorización cierre un incidente o cerrarlo tú mismo.
La monitorización cierra automáticamente un incidente cuando caduca la duración de cierre automático de la política de alertas. De forma predeterminada, la duración del cierre automático es de 7 días. La duración mínima de cierre automático es de 30 minutos.
La duración del cierre automático especifica el tiempo que debe transcurrir, sin que se repita la causa del incidente, antes de que se cierre. Por este motivo, cuando un incidente está abierto y se vuelve a producir la causa, el incidente puede permanecer abierto más tiempo que la duración del cierre automático.
Para cerrar un incidente, sigue estos pasos:
- En el panel Incidentes de la página Alertas, haga clic en Ver todos los incidentes.
En la página Incidentes, busque el incidente que quiera cerrar y, a continuación, haga una de las siguientes acciones:
- Haz clic en more_vert Ver más y, a continuación, selecciona Cerrar incidencia.
- Abre la página Detalles del incidente de ese incidente y haz clic en Cerrar incidente.
Si ves el mensaje Unable to close incident
, vuelve a intentarlo en unos minutos. No puedes cerrar un incidente nuevo inmediatamente porque el sistema de alertas sigue considerando que las condiciones que lo han provocado están activas.
Conservación y límites de los datos
Para obtener información sobre los límites y el periodo de conservación de los incidentes, consulta Límites de las alertas.
Siguientes pasos
- Para crear y gestionar políticas de alertas con la API Cloud Logging o desde la línea de comandos, consulta Gestionar políticas de alertas mediante la API.