Disponibilidad y durabilidad de los datos

En esta página se explican los conceptos relacionados con la disponibilidad y la durabilidad de los datos en Cloud Storage, incluido cómo almacena los datos de forma redundante, el comportamiento de réplica predeterminado de las regiones duales y multirregionales, la función de réplica turbo de las regiones duales y la función de réplica entre segmentos.

Conceptos clave

  • Cloud Storage se ha diseñado para ofrecer una durabilidad anual del 99,999999999% (once nueves).

    • Para ello, Cloud Storage usa la codificación de borrado y almacena fragmentos de datos de forma redundante en varios dispositivos ubicados en distintas zonas de disponibilidad.

    • Cloud Storage almacena de forma redundante los objetos que se escriben en él en al menos dos zonas de disponibilidad diferentes antes de considerar que la escritura se ha realizado correctamente.

    • Las sumas de comprobación se almacenan y se vuelven a validar de manera regular para comprobar de forma proactiva la integridad de todos los datos en reposo, así como para detectar la corrupción de los datos en tránsito. Si es necesario, las correcciones se realizan automáticamente con datos redundantes.

  • La disponibilidad mensual de los datos almacenados en Cloud Storage depende de la clase de almacenamiento de los datos y del tipo de ubicación del segmento. Para obtener más información, consulta las clases de almacenamiento disponibles.

  • Los objetos almacenados en un segmento birregional o multirregional se almacenan de forma redundante en al menos dos ubicaciones geográficas distintas.

    • En el caso de las regiones duales, debes seleccionar las regiones específicas en las que se almacenan tus objetos.

    • En el caso de las multirregiones, Cloud Storage determina los centros de datos específicos que se utilizan para almacenar tus datos según sea necesario, pero se encuentran dentro del límite geográfico de la multirregión y están separados por al menos 160 km. De esta forma, se ofrece redundancia entre regiones a un coste de almacenamiento inferior al de las birregiones.

    • En el improbable caso de que se produzca una interrupción en toda una región, como la causada por un desastre natural, los segmentos birregionales y multirregionales seguirán estando disponibles sin necesidad de cambiar las rutas de almacenamiento.

    Para obtener más información sobre las consideraciones específicas de cada región, consulta el artículo sobre geografía y regiones.

  • Los objetos almacenados en segmentos birregionales y multirregionales se suelen replicar en distintas ubicaciones geográficas mediante la replicación predeterminada.

    • Si uno de los lugares en los que se almacena un objeto deja de estar disponible después de que se haya subido correctamente, pero antes de que se replique en la segunda ubicación, la coherencia fuerte de Cloud Storage asegura que no se sirvan versiones obsoletas del objeto y que las sobreescrituras posteriores no se reviertan cuando la región vuelva a estar disponible.

    • Los objetos almacenados en dos regiones pueden usar opcionalmente la replicación turbo para conseguir una replicación más rápida y predecible entre regiones.

  • Para conseguir redundancia entre un par de regiones que no esté disponible como birregión, te recomendamos que crees un bucket independiente en cada región y que uses las transferencias basadas en eventos o la replicación entre buckets de Storage Transfer Service para mantener los buckets sincronizados.

Redundancia entre regiones

Mientras que los modelos de almacenamiento tradicionales suelen basarse en un enfoque activo-pasivo con ubicaciones geográficas "primarias" y "secundarias", las birregiones y las multirregiones de Cloud Storage proporcionan una arquitectura activa-activa basada en un solo segmento con redundancia en varias regiones. De esta forma, se simplifica el proceso de recuperación ante desastres, ya que los usuarios no tienen que replicar datos de un cubo a otro ni conmutar manualmente a un cubo secundario en caso de que la región principal deje de funcionar.

Cloud Storage siempre conoce el estado actual de un segmento y sirve objetos de forma transparente desde una región disponible según sea necesario. Por lo tanto, los segmentos birregionales y multirregionales se han diseñado para tener un objetivo de tiempo de recuperación (RTO) de cero, y los fallos regionales temporales normalmente no son visibles para los usuarios. En caso de interrupción regional, los segmentos birregionales y multirregionales siguen ofreciendo automáticamente todos los datos que se han replicado en las regiones.

Sin embargo, la redundancia entre regiones se produce de forma asíncrona y los datos que no se hayan replicado en todas las regiones antes de que una de ellas deje de estar disponible no se podrán acceder hasta que la región vuelva a estar online. Es posible que se pierdan datos en el caso muy improbable de que se produzca una destrucción física de la región.

La replicación predeterminada de Cloud Storage está diseñada para proporcionar redundancia entre regiones al 99,9% de los objetos recién escritos en un plazo de una hora y al 100% de los objetos recién escritos en un plazo de 12 horas. Los objetos recién escritos incluyen subidas, reescrituras, copias y composiciones.

Cloud Storage también ofrece la función de réplica entre segmentos, que se puede usar para replicar datos entre segmentos independientes y satisfacer necesidades de réplica de datos adicionales que no se cubren con las ubicaciones birregionales o multirregionales.

Replicación turbo

La replicación turbo proporciona una redundancia más rápida entre regiones para los datos de tus segmentos birregionales, lo que reduce el riesgo de pérdida de datos y ayuda a mantener el servicio ininterrumpido tras una interrupción regional. Cuando está habilitada, la replicación turbo está diseñada para replicar el 100% de los objetos recién escritos en las dos regiones que constituyen una región dual en un objetivo de punto de recuperación de 15 minutos, independientemente del tamaño del objeto.

Ten en cuenta que, incluso en la replicación predeterminada, la mayoría de los objetos terminan de replicarse en cuestión de minutos.

Aunque la redundancia entre regiones y la replicación turbo ayudan a respaldar los esfuerzos de continuidad de la actividad empresarial y recuperación tras desastres (BCDR), los administradores deben planificar e implementar una arquitectura de BCDR completa que se adapte a su carga de trabajo.

Para obtener más información, consulta la guía paso a paso para diseñar la recuperación ante desastres de aplicaciones en Google Cloud.

Limitaciones

  • La replicación turbo solo está disponible para los segmentos de dos regiones.

  • La réplica Turbo no se puede gestionar a través de la API XML, lo que incluye la creación de un nuevo segmento con la réplica Turbo habilitada.

  • Cuando la replicación turbo está habilitada en un bucket, pueden pasar hasta 10 segundos antes de que empiece a aplicarse a los objetos recién escritos.

  • Las escrituras de objetos que se hayan iniciado antes de habilitar la replicación turbo en un segmento se replicarán en las regiones a la velocidad de replicación predeterminada.

    • La composición de objetos que usa objetos de origen escritos con la replicación predeterminada en las últimas 12 horas crea un objeto compuesto que también usa la replicación predeterminada.

Replicación entre contenedores

En algunos casos, puede que quieras mantener una copia de tus datos en un segundo contenedor. La replicación entre segmentos copia de forma asíncrona los objetos nuevos y actualizados de un segmento de origen a un segmento de destino.

La replicación entre segmentos se diferencia de la replicación predeterminada y de la replicación turbo en que tus datos se encuentran en dos segmentos independientes, cada uno con sus propias configuraciones, como la ubicación de almacenamiento, el cifrado, el acceso y la clase de almacenamiento. Es especialmente adecuado para:

  • Soberanía de los datos: mantén los datos en regiones geográficamente distantes.
  • Mantener versiones de desarrollo y producción independientes: crea buckets y espacios de nombres distintos para que el desarrollo no afecte a tu carga de trabajo de producción.
  • Compartir datos: replica datos en un contenedor propiedad de un proveedor o un partner.
  • Agregación de datos: combina datos de diferentes contenedores en un solo contenedor para ejecutar cargas de trabajo de analíticas.
  • Gestionar los costes, la seguridad y el cumplimiento: mantén tus datos en diferentes propiedades, clases de almacenamiento y periodos de conservación.

La replicación entre segmentos usa el Servicio de transferencia de Storage para replicar objetos y Pub/Sub para recibir alertas sobre los cambios en los segmentos de origen y de destino. Puedes habilitar la replicación entre contenedores en los contenedores nuevos que crees y en los que ya tengas.

En los contenedores en los que la tasa de cambio de objetos es inferior a 3000 por segundo y los objetos tienen un tamaño inferior a 1 GiB, la replicación entre contenedores suele tardar entre unos minutos y decenas de minutos, pero no se admite ningún límite superior específico. Además, los contenedores que experimenten tasas de cambio más altas o que tengan objetos más grandes pueden tener retrasos de replicación mayores.

Para obtener instrucciones sobre cómo usar la replicación entre contenedores, consulta el artículo Usar la replicación entre contenedores.

Limitaciones

  • La replicación entre segmentos no se admite en los segmentos de espacios de nombres jerárquicos.

  • Las eliminaciones de objetos en el segmento de origen no se replican en el segmento de destino.

  • Las configuraciones del ciclo de vida de los objetos no se replican.

  • Cuando se replican objetos, no se conservan los metadatos de marca de tiempo (por ejemplo, timeCreated y timeUpdated). Para obtener más información sobre la conservación de metadatos, consulta el artículo sobre transferencias entre segmentos de Cloud Storage.

  • Como la replicación entre segmentos se puede usar para replicar datos entre segmentos ubicados en cualquier Google Cloud ubicación, el rendimiento de la replicación entre segmentos varía en función de las ubicaciones seleccionadas. Por lo tanto, la replicación entre contenedores no ofrece un objetivo de punto de recuperación (RPO).

Monitorización del rendimiento

Cloud Storage monitoriza los objetos más antiguos sin replicar en segmentos de dos regiones y multirregionales mediante la replicación predeterminada o la replicación turbo. Si un objeto no se replica durante más tiempo que su tiempo de objetivo de punto de recuperación (RPO), se considera que está fuera del RPO. Cada minuto en el que uno o varios objetos no cumplen el RPO se contabiliza como un minuto "incorrecto".

Por ejemplo, si un objeto ha generado 20 minutos incorrectos de 9:00 a 9:20 y otro objeto ha generado 10 minutos incorrectos de 9:15 a 9:25, habrá dos objetos que no cumplan el RPO durante el mes. El número total de minutos incorrectos del mes es de 25 minutos, ya que, de 9:00 a 9:25, faltaba el RPO de al menos un objeto.

  • En el caso de los segmentos que usan la replicación turbo, el RPO de los objetos es de 15 minutos.

  • En el caso de los segmentos que usan la replicación predeterminada, el RPO de los objetos es de 12 horas.

    • En los segmentos que usan la replicación predeterminada, los objetos suelen replicarse en una hora o menos.
  • La replicación entre contenedores no proporciona un RPO.

En la consola de Google Cloud , el gráfico Porcentaje de minutos fuera del RPO le permite monitorizar el porcentaje de minutos incorrectos de su segmento durante los últimos 30 días cuando usa la replicación predeterminada o la replicación turbo en segmentos birregionales o multirregionales. Este indicador de nivel de servicio se puede usar para monitorizar el cumplimiento del tiempo de replicación mensual de tu cubo. Del mismo modo, Porcentaje de objetos fuera del objetivo monitoriza las replicaciones de objetos que no se han producido en el RPO. Este indicador de nivel de servicio se puede usar para monitorizar el cumplimiento del volumen de replicación mensual del segmento. Para obtener más información, consulta Monitorización de Cloud Storage y Acuerdo de Nivel de Servicio de Cloud Storage.

Siguientes pasos