El disco persistente regional y la alta disponibilidad equilibrada de hiperdisco son opciones de almacenamiento que te permiten implementar servicios de alta disponibilidad (HA) en Compute Engine. El disco persistente regional y la alta disponibilidad equilibrada de hiperdisco replican datos de forma sincrónica entre dos zonas en la misma región y garantizan HA para los datos del disco en caso de hasta una falla zonal.
Los volúmenes de alta disponibilidad equilibrada de disco persistente regional y de hiperdisco están diseñados para cargas de trabajo que requieren un objetivo de punto de recuperación (RPO) y un objetivo de tiempo de recuperación (RTO) más bajos. Para obtener más información sobre RPO y RTO, consulte Conceptos básicos de la planificación de recuperación ante desastres .
Disco persistente regional y Los volúmenes de alta disponibilidad equilibrada de Hyperdisk están diseñados para funcionar con grupos de instancias administrados regionales.Este documento proporciona una descripción general de cómo crear servicios HA conDisco persistente regional y Volúmenes de alta disponibilidad equilibrada de Hyperdisk.
Cuando decides usar Disco persistente regional o Alta disponibilidad equilibrada de Hyperdisk, asegúrese de comparar las diferentes opciones para aumentar la disponibilidad del servicio y el costo, el rendimiento y la resiliencia para diferentes arquitecturas de servicio.
Acerca de la replicación de discos síncronos
A Disco persistente regional o El volumen de alta disponibilidad equilibrada de Hyperdisk, también conocido como disco regional o disco replicado sincrónicamente, tiene una zona primaria y una secundaria dentro de su región donde almacena los datos del disco:
- La zona primaria es la misma zona donde se encuentra la instancia informática a la que conecta el disco.
- La zona secundaria es una zona alternativa de su elección dentro de la misma región.
Compute Engine mantiene réplicas de su disco en ambas zonas. Cuando escribes datos en tu disco, Compute Engine replica sincrónicamente esos datos en las réplicas del disco en ambas zonas para garantizar HA. Los datos de cada réplica zonal se distribuyen en varias máquinas físicas dentro de la zona para garantizar la durabilidad. Las réplicas zonales garantizan que los datos del disco permanezcan disponibles y brindan protección contra interrupciones temporales en una de las zonas del disco.
Estado de réplica para réplicas zonales
Estado de réplica de disco para Disco persistente regional o La alta disponibilidad equilibrada de Hyperdisk le muestra el estado de una réplica zonal en comparación con el contenido del disco. Las réplicas zonales de sus discos se encuentran en uno de los siguientes estados de réplica de disco en todo momento:
- Sincronizada : la réplica está disponible, recibe de forma sincrónica todas las escrituras realizadas en el disco y está actualizada con todos los datos del disco.
- Poniéndose al día : la réplica está disponible pero aún se está poniendo al día con los datos del disco de la otra réplica.
- Fuera de sincronización : la réplica no está disponible temporalmente y no está sincronizada con los datos del disco.
Para obtener información sobre cómo comprobar y realizar un seguimiento de los estados de las réplicas zonales, consulte Supervisar los estados de las réplicas del disco .
Estados de replicación para discos regionales
Dependiendo del estado de las réplicas zonales individuales, suDisco persistente regional o El volumen de alta disponibilidad equilibrada de Hyperdisk puede estar en uno de los siguientes estados de replicación:
- Totalmente replicado: las réplicas en ambas zonas están disponibles y están sincronizadas con los datos del disco más recientes.
- Ponerse al día: sus réplicas zonales están disponibles, pero una de las réplicas zonales se está poniendo al día con los datos de disco más recientes.
- Degradado: una de las réplicas zonales tiene un estado
out of sync
debido a una falla o una interrupción.
Si el estado de replicación del disco se está catching up
o degraded
, entonces una de las réplicas zonales no está actualizada con todos los datos. Cualquier interrupción durante este tiempo en la zona de la réplica en buen estado provoca que el disco no esté disponible hasta que se restablezca la zona de réplica en buen estado.
cuando tu Disco persistente regional o El volumen de alta disponibilidad equilibrada de Hyperdisk se está poniendo al día,Google Cloud comienza a curar la réplica zonal que se está poniendo al día. Google recomienda esperar a que la réplica zonal afectada se ponga al día con los datos del disco, momento en el que su estado cambia a Synced
. Después de que la réplica zonal pasa al estado sincronizado, el estado del disco regional vuelve al estado Fully replicated
.
Si el disco regional tiene un estado de catching up
o degraded
durante un período prolongado y no cumple con los requisitos de RPO de su organización, le recomendamos que tome instantáneas de la réplica principal de cualquiera de las siguientes maneras:
- Habilite las instantáneas programadas.
- Cree una instantánea manual de suDisco persistente regional o Disco de alta disponibilidad equilibrado Hyperdisk.
Después de crear una instantánea, puede crear una nuevaDisco persistente regional o Disco de alta disponibilidad equilibrada de Hyperdisk utilizando esa instantánea como origen. Esto restaura la instantánea en el nuevo disco. Su nuevo disco también comienza en un estado completamente replicado con una replicación de datos saludable.
Para aprender cómo verificar el estado de replicación de suDisco persistente regional o Disco Hyperdisk Balanced High Availability, consulte Determinar el estado de replicación de los discos .
Punto de control de recuperación de réplicas
Un punto de control de recuperación de réplica es un atributo de disco que representa el punto en el tiempo consistente con fallas más reciente de un disco completamente replicado. Compute Engine crea y mantiene automáticamente un único punto de control de recuperación de réplica para cada disco regional. Cuando un disco está completamente replicado, Compute Engine continúa actualizando su punto de control aproximadamente cada 10 minutos para garantizar que permanezca actualizado. Cuando el estado de replicación del disco se degraded
, Compute Engine te permite crear una instantánea estándar desde el punto de control de recuperación de réplica de ese disco. La instantánea estándar resultante captura los datos de la versión más reciente del disco completamente replicado.
En casos excepcionales, cuando el disco se degrada, la réplica zonal que está sincronizada con los datos más recientes del disco también puede fallar antes de que la réplica no sincronizada se ponga al día. No podrá forzar la conexión de su disco para calcular instancias en ninguna de las zonas. Su disco replicado deja de estar disponible y debe migrar los datos a un disco nuevo. En tales escenarios, si no tiene ninguna instantánea estándar disponible para su disco, es posible que aún pueda recuperar los datos del disco de la réplica incompleta utilizando una instantánea estándar creada desde el punto de control de recuperación de la réplica.
Compute Engine crea automáticamente puntos de control de recuperación de réplicas para cada montado Disco persistente regional o Disco de alta disponibilidad equilibrado Hyperdisk. No incurre en ningún cargo adicional por la creación de estos puntos de control. Sin embargo, usted incurre en los cargos de almacenamiento aplicables para la creación de instantáneas e instancias informáticas cuando utiliza estos puntos de control para migrar su disco regional a zonas en funcionamiento.
Obtenga más información sobre cómo recuperar los datos de su disco regional utilizando un punto de control de recuperación de réplica .
Conmutación por error de disco regional
En caso de una interrupción en una zona, la zona se vuelve inaccesible y la instancia informática en esa zona no puede realizar operaciones de lectura o escritura en su disco. Para permitir que la instancia siga realizando operaciones de lectura y escritura para el disco regional, Compute Engine permite la migración de datos del disco a la otra zona donde el disco tiene una réplica. Este proceso se llama conmutación por error .
El proceso de conmutación por error implica desconectar la réplica zonal de la instancia en la zona afectada y luego conectar la réplica zonal a una nueva instancia en la zona secundaria. Compute Engine replica sincrónicamente los datos de su disco en la zona secundaria para garantizar una conmutación por error rápida en caso de que se produzca un error en una única réplica.
Conmutación por error por plano de control regional específico de la aplicación
El plano de control regional específico de la aplicación no es un Google Cloud servicio. Cuando diseña arquitecturas de servicios HA, debe crear su propio plano de control regional específico de la aplicación. Este plano de control de aplicaciones decide qué instancia debe tener el disco regional conectado y qué instancia es la instancia principal actual.
Cuando se detecta una falla en la instancia principal o la base de datos del disco regional, el plano de control regional específico de la aplicación de su arquitectura de servicio HA puede iniciar automáticamente la conmutación por error a la instancia en espera en la zona secundaria. Durante la conmutación por error, el plano de control regional específico de la aplicación vuelve a conectar el disco regional a la instancia en espera en la zona secundaria. Luego, Compute Engine dirige todo el tráfico a esa instancia en función de las señales de verificación de estado.
La latencia general de conmutación por error, excluyendo el tiempo de detección de errores, es la suma de las siguientes latencias:
- Menos de 1 minuto para conectar un disco regional a una instancia en espera
- Tiempo necesario para la inicialización de la aplicación y la recuperación tras fallos
Para obtener más información, consulte Comprender el plano de control regional específico de la aplicación .
La página Componentes básicos de recuperación ante desastres cubre los componentes básicos disponibles en Compute Engine.
Conmutación por error mediante conexión forzada
Uno de los beneficios de Disco persistente regional y La alta disponibilidad equilibrada de Hyperdisk significa que, en el improbable caso de una interrupción zonal, puede realizar una conmutación por error manual de su carga de trabajo a otra zona. Cuando la zona original sufre una interrupción, no puede completar la operación de separación del disco hasta que se restaure esa réplica zonal. En este escenario, es posible que necesite adjuntar la réplica zonal secundaria a una nueva instancia informática sin desconectar la réplica zonal principal de su instancia principal. Este proceso se llama conexión forzada .
Cuando su instancia informática en la zona principal deja de estar disponible, puede forzar la conexión de su disco a una instancia en la zona secundaria. Para realizar esta tarea, debe realizar una de las siguientes acciones:
- Inicie otra instancia informática en la misma zona que la réplica de disco regional que está forzando la conexión.
- Mantenga una instancia informática de espera activa en esa zona. Un hot standby es una instancia en ejecución idéntica a la de la zona primaria. Las dos instancias tienen los mismos datos.
Compute Engine ejecuta la operación de conexión forzada en menos de un minuto. El objetivo de tiempo de recuperación total (RTO) depende no solo de la conmutación por error del almacenamiento (la conexión forzada del disco regional), sino también de otros factores, incluidos los siguientes:
- Si primero debe crear una instancia secundaria
- El tiempo que le toma al sistema de archivos subyacente detectar un disco conectado en caliente
- El tiempo de recuperación de las aplicaciones correspondientes.
Para obtener más información sobre cómo realizar una conmutación por error de su instancia informática mediante la conexión forzada, consulte Conmutación por error de su disco regional mediante force-attach
.
Limitaciones
Las siguientes secciones enumeran las limitaciones que se aplicanDisco persistente regional y Alta disponibilidad equilibrada de hiperdisco.
Limitaciones generales para discos regionales
- Puede conectar un disco persistente regional solo a máquinas virtuales que utilicen los tipos de máquinas E2 , N1 , N2 y N2D .
- Puede conectar Hyperdisk Balanced High Availability sólo a tipos de máquinas compatibles .
- No puede crear un disco persistente regional a partir de una imagen del sistema operativo o de un disco creado a partir de una imagen del sistema operativo.
- Cuando usa el modo de solo lectura, puede conectar un disco persistente equilibrado regional a un máximo de 10 instancias de VM.
- El tamaño mínimo de un disco persistente estándar regional es 200 GiB.
- Sólo puedes aumentar el tamaño de un Disco persistente regional oVolumen de alta disponibilidad equilibrado de Hyperdisk; no puedes disminuir su tamaño.
- Disco persistente regional y Los volúmenes de alta disponibilidad equilibrada de Hyperdisk tienen características de rendimiento diferentes a las de sus discos zonales correspondientes. Para obtener más información, consulte Rendimiento del almacenamiento en bloque .
- No puede utilizar un volumen de alta disponibilidad equilibrada de Hyperdisk que esté en modo de escritura múltiple como disco de arranque.
- Si crea un disco replicado mediante la clonación de un disco zonal, las dos réplicas zonales no estarán completamente sincronizadas en el momento de la creación. Después de la creación, puede utilizar la clonación del disco regional en un promedio de 3 minutos. Sin embargo, es posible que deba esperar decenas de minutos antes de que el disco alcance un estado completamente replicado y el objetivo del punto de recuperación (RPO) esté cerca de cero. Aprenda a comprobar si su disco replicado está completamente replicado .
Limitaciones de los puntos de control de recuperación de réplicas
- Un punto de control de recuperación de réplica es parte de los metadatos del dispositivo y no muestra ningún dato del disco por sí solo. Solo puede utilizar el punto de control como mecanismo para crear una instantánea de su disco degradado. Después de crear la instantánea utilizando el punto de control, puede usar la instantánea para restaurar sus datos.
- Puede crear instantáneas desde un punto de control de recuperación de réplica solo cuando su disco esté degradado.
- Compute Engine actualiza el punto de control de recuperación de réplica de su disco solo cuando el disco está completamente replicado.
- Compute Engine mantiene solo un punto de control de recuperación de réplica para un disco y solo mantiene la última versión de ese punto de control.
- No puede ver las marcas de tiempo exactas de creación y actualización de un punto de control de recuperación de réplica.
- Puedes crear una instantánea desde tu punto de control de recuperación de réplica solo usando la API de Compute Engine.
¿Qué sigue?
- Aprenda a crear servicios de alta disponibilidad utilizando discos regionales .
- Revise la guía de planificación de recuperación ante desastres .
- Obtenga más información sobre los precios de los discos .
- Aprenda a crear y administrar discos regionales .
- Aprenda a monitorear los estados de réplica de los discos .
- Aprenda a determinar el estado de replicación de un disco .
- Aprenda a administrar fallas en discos regionales .