Aunque las interrupciones del servicio son inevitables, es fundamental que la comunicación sea transparente y se produzca con antelación para evaluar lo que está ocurriendo, mantener informados a los participantes y tomar medidas para minimizar el impacto en tu empresa.
El funcionamiento de una aplicación en la nube fiable es una responsabilidad compartida entreGoogle Cloud y los desarrolladores de aplicaciones. Cuando se produce una interrupción del servicio,Google Cloud tiene como objetivo comunicar el incidente rápidamente y proporcionar una evaluación del impacto. Debes evaluar cómo recibir notificaciones, actuar ante los incidentes que surjan y gestionar el impacto en tu aplicación.
Personalized Service Health puede ayudarte con este proceso. Puedes integrarlo de varias formas para conocer los incidentes emergentes, evaluar el impacto en tus aplicaciones y recibir actualizaciones de Google Cloud. En este documento se ofrece una descripción general de cómo recibir señales de interrupciones del servicio deGoogle Cloud, así como recomendaciones sobre cómo integrarlas.
Decide dónde quieres integrar
Personalized Service Health ofrece una vista personalizada de los Google Cloud productos que usan tus proyectos o tu organización. Te recomendamos que te integres con Personalized Service Health para disfrutar de la mayor cobertura y variedad de opciones de integración.
Punto de integración | Caso práctico | Ventajas | Dependencias |
Panel de control de la consola (Personalized Service Health) | Ver interrupciones activas | Personalizadas para tus proyectos y disponibles de forma predeterminada | Gestión de Identidades y Accesos (IAM) Google Cloud console |
Alertas (Personalized Service Health) | Notificaciones proactivas | Personalizado para tus proyectos, cómodo y proactivo | IAM Cloud Logging Cloud Monitoring |
API (Personalized Service Health) | Integración con otro sistema o herramienta | Personalizada para tus proyectos u organización | Gestión de identidades y accesos |
Elegir el método de interacción con Personalized Service Health
Debes tener en cuenta Personalized Service Health en el contexto de tus operaciones, monitorización y modelo de respuesta a incidentes. Al evaluar cómo usan tus equipos las señales durante los incidentes y antes de que se produzcan, puedes decidir cómo quieres usar Personalized Service Health.
En la siguiente tabla se muestra cómo puedes interactuar con el estado de los servicios personalizado, en función de cómo esté configurado.
Caso de ejemplo en tu organización | Integración con Personalized Service Health | Ejemplos de herramientas con las que puedes integrar la API |
Desarrolladores que están de guardia para unas cuantas aplicaciones | Alertas de proyectos individuales
Panel de control de la consola |
Observabilidad de Google Cloud, PagerDuty |
Respuesta a incidentes centralizada en toda la organización | Integración de la API con el sistema actual mediante la API OrganizationEvents (v1 y v1beta) | PagerDuty, paneles de control personalizados |
Plataforma interna para gestionar recursos y operaciones en la nube | API Service Health Alertas de proyectos individuales Integración de la API Service Health con una plataforma de desarrolladores interna |
Backstage, Terraform |
Muchos proyectos configurados y gestionados mediante programación (por ejemplo,más de 1000) | API Service Health Notificaciones automatizadas basadas en APIs |
Backstage, Terraform y PagerDuty |
Usar Personalized Service Health durante un incidente
Una vez que hayas integrado Personalized Service Health y empieces a recibir notificaciones de alertas, esta función te proporcionará información sobre las interrupciones que pueden ayudarte a gestionar su impacto. Google Cloud
Detectar y evaluar el alcance del incidente
Algunas preguntas que puedes hacer en esta fase son:
- ¿Es un problema real?
- ¿Puedes validar el impacto?
- ¿Cuáles son los síntomas?
- ¿Qué usuarios, productos o partes de la empresa se ven afectados? ¿Qué zonas geográficas?
Personalized Service Health te ayuda a saber si el problema se origina en tu proyecto o en Google, para que puedas implementar la respuesta ante incidentes adecuada. Te permite buscar y ver información sobre eventos para que puedas monitorizar el evento, los productos afectados y las ubicaciones que influyen en tu proyecto.
Estos son algunos pasos que puedes seguir:
- Revisa la alerta, si la has configurado.
- ¿Qué ha provocado que se active esta alerta?
- ¿Cómo encajan estas alertas con el resto de las alertas específicas de productos?
- Accede al panel de control Service Health de tu proyecto u organización. Puede ver los eventos, los productos afectados y las ubicaciones de un vistazo, así como responder a las siguientes preguntas:
- ¿A qué proyectos afecta este cambio?
- ¿Qué productos de los que depende tu proyecto se ven afectados?
- ¿El evento afecta a recursos específicos de esas ubicaciones?
- Revisa los eventos y comprende su alcance, su impacto y su relevancia para tu proyecto.
- Identifique un evento que parezca estar relacionado con el problema que está experimentando.
- Consulta los pasos de verificación, las medidas de mitigación (si están disponibles) y el tiempo de resolución previsto del evento.
Personalized Service Health te ayuda a revisar el estado actual y el impacto de los incidentes que afectan a tu proyecto u organización para que puedas gestionarlos y responder a ellos de forma eficiente. Por ejemplo, puedes priorizar de forma eficaz identificando con precisión el incidente de mayor prioridad.
Mitigar, resolver o derivar el incidente
Algunas preguntas que puedes hacer en esta fase son:
- ¿Cómo puedes solucionar el incidente?
- ¿Puedes solucionarlo directamente?
- ¿Deberías iniciar una conmutación por error ahora o esperar más tiempo?
- ¿A quién debes avisar para que lo solucione?
Personalized Service Health te ayuda a comprender el impacto de un incidente en tus proyectos y recursos, a estar al tanto de las soluciones alternativas disponibles y a recibir actualizaciones sobre el tiempo estimado de resolución.
Monitorizar el progreso hacia la resolución de incidentes
La vista general de eventos del panel de estado del servicio identifica información clave, como síntomas y soluciones alternativas, que son necesarios para la mitigación, y muestra cuándo cambia el estado. Estos detalles te permiten:
- Monitoriza un resumen actualizado del posible impacto a medida que evoluciona la situación.
- Mantente al tanto de las novedades y de la hora prevista de la próxima comunicación o actualización.
- Ver cuándo se publica un síntoma.
- Consulta cuándo se identifica una solución alternativa.
- Consulta cuándo cambia el estado a Resuelto.
Mientras monitorizas el progreso, puedes hacer lo siguiente:
- Revisa las soluciones alternativas, si están disponibles.
- Implementa la respuesta ante incidentes adecuada para tu proyecto u organización.
- Sigue monitorizando el evento hasta que se mitigue o se resuelva.
Cuándo ponerse en contacto con el equipo de Asistencia
Google está al tanto de los eventos que aparecen en el panel de control Service Health. Para saber qué está haciendo Google con respecto a un evento, selecciónalo para ver los detalles.
Si un problema no aparece en ninguno de los eventos del panel de control, póngase en contacto con el equipo de Asistencia.
Usar Personalized Service Health con otras fuentes de información sobre incidentes
Independientemente de la configuración de tu empresa, usa Personalized Service Health como señal adicional al evaluar el impacto de los incidentes. Asegúrate de poder consultar varias fuentes de información sobre incidentes para poder decidir los pasos siguientes en función de los datos y las pruebas.
Entre los motivos para usar varias fuentes de información sobre incidentes se incluyen los siguientes:
- Es posible que un producto esté sufriendo un incidente en alguna ubicación, pero que tus proyectos no se vean afectados porque se encuentran en otra ubicación. Google Cloud
- Si tu sistema de publicación tiene dos réplicas completas en zonas independientes y falla un Google Cloud producto crítico Google Cloud en una de las zonas, el estado del servicio personalizado te informará de ese fallo. Sin embargo, es posible que tus usuarios no se vean afectados y que no tengas que tomar medidas inmediatas.
- Si tu proyecto depende de muchos Google Cloud productos de una
ubicación, el estado del servicio personalizado no sabrá:
- Si tu proyecto requiere que todos los productos funcionen.
- Si tu proyecto seguirá funcionando en caso de que falle un producto.
- Si toda tu aplicación se ve afectada si falla uno o varios de los productos.
- El propio Personalized Service Health también puede degradarse o fallar. Para verificarlo, puedes consultar su estado.
Deberá interpretar las señales de Personalized Service Health según corresponda a su configuración.