Protección de datos con almacenamiento multizona

En este documento se proporciona información sobre cómo proteger los datos de tu aplicación en un universo multizona con air gap de Google Distributed Cloud (GDC). Para mantener aplicaciones de alta disponibilidad, puedes implementar una estrategia de protección de datos que sea resiliente a las interrupciones o los fallos locales. GDC proporciona estrategias de replicación de datos para el almacenamiento de objetos y el almacenamiento en bloque, de modo que puedas mantener procedimientos de conmutación por error para las zonas primarias y secundarias de tu universo.

Este documento está dirigido a los administradores de TI del grupo de administradores de la plataforma, que se encargan de desarrollar flujos de trabajo de recuperación tras desastres, y a los desarrolladores de aplicaciones del grupo de operadores de aplicaciones, que se encargan de desarrollar y mantener aplicaciones en un universo de GDC.

Para obtener más información, consulta Audiencias de la documentación aislada de GDC.

Replicación de almacenamiento para la recuperación tras desastres

Puedes configurar una protección de datos sólida para el almacenamiento de tu aplicación en un universo multizona mediante la replicación de datos asíncrona para la recuperación ante desastres. Este enfoque consiste en copiar datos de una zona principal a una secundaria a intervalos periódicos. Este mecanismo mantiene tus datos protegidos y accesibles si la zona principal sufre una interrupción.

La replicación de datos para el almacenamiento de objetos usa segmentos de dos zonas para replicar automáticamente tus datos y no requiere intervención manual. Para obtener más información sobre cómo crear un segmento de doble zona, consulta el artículo Crear segmentos de almacenamiento.

La replicación de datos para el almacenamiento en bloque usa volúmenes persistentes de doble zona para replicar los datos y requiere un procedimiento de conmutación por error de volumen. Para obtener más información, consulta Replicar volúmenes de forma asíncrona.

Después de configurar la replicación de datos, tus datos seguirán un procedimiento de conmutación por error cuando la zona principal esté sin conexión. Los procedimientos de conmutación por error son distintos para la replicación de almacenamiento de bloques y de objetos. Sin embargo, ambas estrategias de replicación de datos siguen estos pasos cruciales:

  1. Verifica la interrupción de la zona principal.
  2. Detener la replicación desde la zona principal.
  3. Promociona la zona secundaria de copia de seguridad para que asuma el rol de la zona principal con intervención manual o con una conmutación por error preconfigurada.
  4. Verifica el estado operativo de la nueva zona principal.

Ponte en contacto con un miembro del grupo de operadores de infraestructura para confirmar que tus dos zonas están configuradas para la replicación de datos asíncrona.

El retraso inherente que conlleva la replicación de datos asíncrona significa que esta configuración es más útil para los sistemas que requieren un objetivo de punto de recuperación (RPO) bajo, pero no nulo. Si tu sistema requiere una pérdida de datos mínima, pero puede tolerar una pequeña cantidad máxima predefinida de pérdida de datos medida en tiempo, normalmente relacionada con los datos generados inmediatamente antes de un desastre que podría ser irrecuperable, la replicación de datos asíncrona es una función valiosa que puedes implementar en tus aplicaciones.

Un ejemplo de un RPO bajo distinto de cero podría ser una plataforma de negociación financiera con un RPO de cinco minutos, en la que la replicación de datos asíncrona se configura para copiar los datos de las operaciones en una zona de recuperación tras fallos secundaria cada dos minutos:

  • Se trata de un escenario de RPO bajo porque los cinco minutos representan el periodo mínimo aceptable de pérdida de datos para el sistema de gran volumen.
  • Se trata de un escenario de RPO distinto de cero, ya que el retraso inherente a la replicación asíncrona de intervalos de dos minutos implica que hay un pequeño periodo en el que los datos aún no se han copiado, lo que puede provocar pérdidas.

Debes colaborar con tu grupo de operadores de infraestructura para definir tu flujo de trabajo de replicación de almacenamiento asíncrono de doble zona y verificar que las funciones de replicación de datos de la infraestructura cumplen tus requisitos de RPO.

Siguientes pasos