La replicación asíncrona proporciona replicación de almacenamiento en bloque con objetivo de punto de recuperación bajo ( RPO ) y objetivo de tiempo de recuperación bajo ( RTO ) para recuperación ante desastres (DR) activo-pasivo entre regiones.
La replicación asincrónica es una opción de almacenamiento que proporciona replicación asincrónica de datos entre dos regiones. En el improbable caso de una interrupción regional, la replicación asíncrona le permite conmutar por error sus datos a una región secundaria y reiniciar su carga de trabajo en esa región.
Puedes usar la replicación asincrónica para administrar la replicación de cargas de trabajo de Compute Engine a nivel de infraestructura, en lugar de a nivel de carga de trabajo.
Descripción general
La replicación asíncrona replica datos de un disco conectado a una carga de trabajo en ejecución, el disco principal , a un disco independiente ubicado en otra región. El disco que recibe datos replicados se denomina disco secundario .
La región en la que se encuentra el disco primario se denomina región primaria y la región en la que se encuentra el disco secundario se denomina región secundaria . Las regiones primaria y secundaria se denominan par de regiones .
Cualquier disco que cumpla con los requisitos de disco se puede utilizar como disco principal. Una vez que tenga un disco primario, puede crear un disco secundario que haga referencia al disco primario e iniciar la replicación desde el disco primario al disco secundario.
Si detiene la replicación desde el disco principal en cualquier momento y desea reiniciar la replicación en un momento posterior, debe crear un nuevo disco secundario para reiniciar la replicación.
Grupos de consistencia
Los grupos de coherencia le permiten realizar pruebas de DR y DR en varios discos. Un grupo de coherencia es una política de recursos que hace lo siguiente:
- Alinea la replicación entre discos primarios y garantiza que todos los discos contengan datos de replicación desde un punto común en el tiempo, que se utiliza para DR.
- Alinea los clones de discos de los discos secundarios y garantiza que todos los clones de discos contengan datos de un punto común en el tiempo, que se utiliza para simulacros de recuperación ante desastres.
Si desea alinear el período de replicación en varios discos, agregue discos primarios a un grupo de coherencia. Si desea clonar varios discos y asegurarse de que esos clones tengan datos de un punto común en el tiempo, agregue discos secundarios a un grupo de coherencia. Se puede utilizar un grupo de coherencia para la replicación o la clonación, pero no para ambas simultáneamente.
Si desea agregar discos primarios a un grupo de coherencia, debe agregar discos al grupo de coherencia antes de iniciar la replicación. Puede agregar discos secundarios a un grupo de coherencia en cualquier momento.
Conmutación por error y conmutación por recuperación
En caso de una interrupción en la región principal, es su responsabilidad identificar la interrupción y reiniciar la carga de trabajo mediante conmutación por error utilizando los discos secundarios, en la región secundaria. La replicación asincrónica no ofrece monitoreo de interrupciones. Puede identificar una interrupción mediante métricas de RPO , comprobaciones de estado , métricas específicas de la aplicación y comunicándose con Atención al cliente en la nube.
El proceso de conmutación por error implica las siguientes tareas:
- Detener la replicación.
- Conecte los discos secundarios a las máquinas virtuales de la región secundaria.
Después de realizar la conmutación por error de los discos, es su responsabilidad validar y reiniciar la carga de trabajo de su aplicación en la región secundaria y reconfigurar las direcciones de red que se utilizan para acceder a su aplicación para que apunten a la región secundaria.
Después de una conmutación por error de la región primaria a la región secundaria, la región secundaria se convierte en la región primaria en funciones. Una vez que se resuelva la interrupción o el desastre, puede iniciar la conmutación por recuperación para iniciar la replicación desde la región secundaria original (la región primaria en funciones) a la región primaria original. Opcionalmente, puede repetir el proceso para devolver la carga de trabajo a la región principal original.
El proceso de recuperación implica las siguientes tareas:
Configure la replicación entre la nueva región primaria y la región primaria original.
- El disco secundario original ahora es el nuevo disco primario y usted lo configura para replicarlo en un nuevo disco secundario en la región primaria original.
- Puede crear una nueva política de recursos de grupo de coherencia en la nueva región primaria para que los nuevos discos primarios (los discos secundarios originales) puedan replicarse de manera consistente en un nuevo conjunto de discos secundarios en la región primaria original.
(Opcional) Después de que se haya producido la replicación inicial, puede repetir el proceso de conmutación por error para devolver la carga de trabajo a la región principal original.
Cifrado de disco
Los discos primarios y secundarios no admiten claves de cifrado proporcionadas por el cliente (CSEK). UsarGoogle-owned and Google-managed encryption keys o claves de cifrado administradas por el cliente (CMEK) . Si usa CMEK en el disco principal, también debe usar CMEK en el disco secundario. Puede utilizar diferentes CMEK en ambos discos.
Personalización del disco secundario
Cuando creas un disco secundario, Compute Engine copia las propiedades del disco principal en el disco secundario. Estas propiedades incluyen la descripción, el tipo de disco y las etiquetas del disco principal.
Si el disco primario es un disco de arranque, el disco secundario también tiene la configuración de arranque del disco primario. La configuración de arranque incluye información sobre la arquitectura del sistema operativo (SO), las licencias del sistema operativo y las características del sistema operativo invitado .
Puede cambiar ciertas propiedades del disco secundario para que difieran del disco principal. Por ejemplo, el disco primario y secundario deben tener el mismo tamaño y clave de cifrado, pero puede asignar etiquetas adicionales al disco secundario.
Para los discos de arranque, puede habilitar opciones de red o seguridad adicionales en el disco secundario especificando características adicionales del sistema operativo invitado. Sin embargo, no puede eliminar ninguna de las funciones del sistema operativo invitado del disco principal. Compute Engine combina las nuevas funciones que especificas con las funciones del sistema operativo invitado existente del disco principal.
Ejemplo
Supongamos que tiene un disco de arranque llamado disk-1
, con las siguientes características del sistema operativo invitado: [GVNIC, UEFI_COMPATIBLE]
.
Si crea un disco secundario a partir disk-1
, solo puede especificar funciones adicionales. No puede eliminar las funciones UEFI_COMPATIBLE
y GVNIC
. Por lo tanto, si especifica MULTI_IP_SUBNET
cuando crea el disco secundario, la nueva función se fusiona con las del disco principal, por lo que las funciones del sistema operativo invitado resultantes para el disco secundario son GVNIC
, UEFI_COMPATIBLE
y MULTI_IP_SUBNET
.
Para aprender a personalizar un disco secundario, consulte Crear un disco secundario personalizado .
Replicación asíncrona y discos regionales
Puede utilizar la replicación asincrónica con discos regionales para lograr alta disponibilidad (HA) y DR.
Los discos persistentes regionales se pueden utilizar como disco primario o secundario en un par de discos de replicación asíncrona. Un par de discos es un disco primario que se replica en un disco secundario.
Cuando se utiliza un disco regional como disco principal, la replicación permanece ininterrumpida incluso si una de sus zonas experimenta una interrupción. El disco primario regional continúa replicando datos de la zona en buen estado al disco secundario. De manera similar, cuando un disco regional sirve como disco secundario, la replicación persiste a pesar de una interrupción en una de sus zonas. El uso de un disco regional como disco secundario prepara su carga de trabajo para una alta disponibilidad entre zonas en caso de una conmutación por error, donde el disco secundario pasa a convertirse en el nuevo disco principal.
Limitaciones
- La replicación asincrónica solo se admite para los siguientes tipos de discos :
- Disco persistente equilibrado
- Disco persistente de rendimiento (SSD)
- Hiperdisco equilibrado
- Alta disponibilidad equilibrada de hiperdisco
- Hiperdisco extremo
- No se admiten discos de solo lectura.
- Los discos de varias escrituras solo se admiten para Hyperdisk Balanced y Hyperdisk Balanced High Availability.
- Las ediciones que realice en el tamaño del hiperdisco se aplican automáticamente al disco secundario. Sin embargo, los cambios en las propiedades del hiperdisco, incluidos los cambios de IOPS, rendimiento y modo de acceso, no se aplican automáticamente al disco secundario. Debe editar manualmente estas propiedades en el disco secundario.
- Cada disco puede tener un tamaño máximo de 64 TiB.
- Debe detener la replicación antes de poder eliminar un disco primario o secundario.
- Si la replicación está en curso para el disco de arranque de una VM, no podrá eliminar la VM hasta que detenga la replicación.
- Si un disco principal está conectado a una máquina virtual como un disco que no es de arranque y el disco está configurado para eliminarse con la máquina virtual, no puede eliminar la máquina virtual o el disco hasta que detenga la replicación o desconecte el disco principal de la máquina virtual. Los intentos de eliminar la máquina virtual fallarán hasta que detenga la replicación.
Cada proyecto puede tener como máximo 1000 pares de discos en cada par de regiones.
Por ejemplo, un proyecto determinado,
project-1
puede tener hasta 1000 pares de discos en el par de regiones Iowa-Oregón.project-1
también puede tener hasta 1000 pares de discos en el par de la región Bélgica-Frankfurt.
Regiones admitidas
La replicación asíncrona está disponible en todas las regiones de los siguientes continentes:
- Asia, excepto Indonesia
- Europa
- América del norte
- Oceanía
Puede replicar un disco primario en una región determinada en un disco secundario en cualquier región disponible dentro del mismo continente. Esto significa que puede crear un par de regiones a partir de dos regiones cualesquiera dentro del mismo continente.
Por ejemplo, supongamos que tiene un disco primario en Frankfurt ( europe-west3
). Puede replicar ese disco en un disco secundario en cualquier lugar de Europa, pero no puede replicarlo en una región de América del Norte.
Para obtener una lista completa de todas las regiones de Compute Engine, consulte Zonas y regiones disponibles .
Actuación
El objetivo del punto de recuperación (RPO), o el retraso de tiempo hasta que los datos estén disponibles en el sitio secundario, depende de las tasas de cambio de disco. La replicación asíncrona normalmente replica datos con un RPO objetivo de un minuto, para hasta 12,5 GB de bloques modificados comprimidos por minuto con bloques de disco replicados con una granularidad de bloque de 4 KB. Si un bloque determinado se cambia varias veces entre eventos de replicación, solo se replica el cambio más reciente en el disco secundario. A velocidades de cambio de disco más altas, el RPO puede ser superior a un minuto y normalmente aumenta a medida que aumentan las velocidades de cambio de disco. RPO no es configurable.
El RPO puede exceder un minuto en los siguientes escenarios:
- Cuando comienza la replicación del disco. Durante la replicación inicial, la replicación asíncrona replica todos los bloques usados en el disco principal en el disco secundario. La replicación inicial se completa cuando la métrica
disk/async_replication/time_since_last_replication
está disponible en Cloud Monitoring. - Si la tasa de cambio de disco es superior a 12,5 GB de bloques cambiados comprimidos por minuto. Después de un aumento en los cambios de disco, el RPO para ciclos de replicación posteriores puede exceder un minuto mientras la replicación se pone al día.
- Si desconecta un disco de una máquina virtual o reinicia una máquina virtual mientras el disco se está replicando. Los discos que están en proceso de replicación y que están desconectados de una máquina virtual pueden ver un aumento de RPO de hasta cinco minutos durante un breve período de tiempo.
Para saber cómo ver el RPO de sus discos, consulte Métricas de rendimiento de la replicación asíncrona .
El objetivo de tiempo de recuperación (RTO) durante la conmutación por error depende del tiempo que lleva completar las diversas tareas involucradas en la conmutación por error de su carga de trabajo a una nueva región. Tareas como detener la replicación y conectar discos a las máquinas virtuales en la región secundaria deberían tardar solo unos minutos en completarse. Puede acelerar el RTO asegurándose de tener máquinas virtuales ejecutándose en la región secundaria para que, si se produce una conmutación por error, no tenga que esperar a que se inicien las máquinas virtuales.
¿Qué sigue?
- Aprenda a configurar la replicación .
- Aprenda a gestionar la replicación .
- Aprenda a gestionar grupos de coherencia .
- Aprenda cómo realizar conmutación por error y conmutación por recuperación .
- Aprenda a administrar discos que utilizan replicación asincrónica .
- Aprenda a monitorear el rendimiento de la replicación asincrónica .