Acerca de Persistent Disk


En este documento se describen las características, los tipos, el rendimiento y las ventajas de los volúmenes de disco persistente. Si necesitas almacenamiento en bloques para una instancia de máquina virtual (VM) o un contenedor, como un disco de arranque o un disco de datos, usa volúmenes de Persistent Disk si Google Cloud Hyperdisk no está disponible para tu instancia de computación. Para obtener información sobre otras opciones de almacenamiento en bloque en Compute Engine, consulta Elegir un tipo de disco.

Los volúmenes de Persistent Disk son dispositivos de almacenamiento en red duraderos a los que tus instancias pueden acceder, como discos físicos de un ordenador o un servidor. Los volúmenes de disco persistente no están conectados a la máquina física que aloja la instancia. En su lugar, se adjuntan a la instancia como dispositivos de bloque de red. Cuando lees o escribes en un volumen de disco persistente, los datos se transmiten a través de la red.

Los datos de cada disco persistente se distribuyen en varios discos físicos. Compute Engine gestiona los discos físicos y la distribución de datos para garantizar la redundancia y el rendimiento óptimo.

Puedes desvincular o mover los volúmenes para conservar los datos aunque hayas eliminado las instancias. El rendimiento de los discos persistentes aumenta con el tamaño, por lo que puedes cambiar el tamaño de los volúmenes de disco persistente que ya tienes o añadir más volúmenes de disco persistente a una VM para que se ajusten a tus requisitos de rendimiento y espacio de almacenamiento.

Añade un disco que no sea de arranque a tu instancia cuando necesites un almacenamiento fiable y asequible con características de rendimiento coherentes.

Añadir un disco persistente a una instancia

Tipos de Persistent Disk

Cuando creas un volumen de disco persistente, puedes seleccionar uno de los siguientes tipos de disco:

  • Disco persistente balanceado (pd-balanced)
    • Una alternativa a los discos persistentes SSD (de rendimiento).
    • Equilibrio entre rendimiento y coste. En la mayoría de los tipos de máquina de Compute Engine, estos discos tienen el mismo número máximo de IOPS que los discos persistentes SSD y un número de IOPS por GiB inferior. Este tipo de disco ofrece niveles de rendimiento adecuados para la mayoría de las aplicaciones de uso general a un precio intermedio entre el de los discos persistentes estándar y los SSD.
    • Con unidades de estado sólido (SSD).
  • Disco persistente SSD (rendimiento) (pd-ssd)
    • Adecuado para aplicaciones empresariales y bases de datos de alto rendimiento que requieren una latencia más baja y más IOPS de los que ofrece el disco persistente estándar.
    • Con unidades de estado sólido (SSD).
  • Persistent Disk estándar (pd-standard)
    • Adecuado para cargas de trabajo de procesamiento de datos de gran tamaño que utilizan principalmente E/S secuenciales.
    • Se basa en unidades de disco duro (HDD) estándar.
  • Extreme Persistent Disk (pd-extreme)
    • Ofrece un alto rendimiento en todo momento para las cargas de trabajo de acceso aleatorio y rendimiento en lote.
    • Diseñado para cargas de trabajo de bases de datos de gama alta.
    • Te permite aprovisionar los IOPS objetivo.
    • Con unidades de estado sólido (SSD).
    • Disponible con un número limitado de tipos de máquinas.

Si creas un disco en la consola de Google Cloud , el tipo de disco predeterminado es pd-balanced. Si creas un disco con la CLI de gcloud o la API de Compute Engine, el tipo de disco predeterminado es pd-standard.

Para obtener información sobre la compatibilidad con tipos de máquinas, consulta lo siguiente:

Durabilidad de Persistent Disk

La durabilidad del disco representa la probabilidad de pérdida de datos, por diseño, de un disco típico en un año típico, utilizando un conjunto de supuestos sobre los fallos de hardware, la probabilidad de que se produzcan eventos catastróficos, las prácticas de aislamiento y los procesos de ingeniería de los centros de datos de Google, así como las codificaciones internas que utiliza cada tipo de disco. Los eventos de pérdida de datos de Persistent Disk son extremadamente raros y, históricamente, se han debido a fallos de hardware coordinados, errores de software o una combinación de ambos. Google también toma muchas medidas para mitigar el riesgo de corrupción de datos silenciosa, que es un problema generalizado en el sector. Los errores humanos de un cliente, como cuando elimina un disco por accidente, no están cubiertos por la durabilidad de los discos persistentes. Google Cloud

Existe un riesgo muy pequeño de que se produzca una pérdida de datos con un volumen de disco persistente regional debido a sus codificaciones de datos internas y a su replicación. Persistent Disk regional proporciona alta disponibilidad y se puede usar para la recuperación tras desastres si se pierde un centro de datos completo y no se puede recuperar. El disco persistente regional proporciona el doble de réplicas de disco que el disco persistente zonal, y cada réplica se distribuye entre dos zonas de la misma región. Si una zona principal deja de estar disponible durante una interrupción, se puede acceder inmediatamente a la réplica de la segunda zona.

Para obtener más información sobre las consideraciones específicas de cada región, consulta el artículo sobre geografía y regiones.

En la siguiente tabla se muestra la durabilidad de cada tipo de disco. Una durabilidad del 99,999% significa que, con 1000 discos, probablemente pasarían 100 años sin que perdieras ninguno.

Disco persistente estándar de zona Disco persistente balanceado de zona Disco persistente SSD zonal Disco persistente extremo de zona Disco persistente estándar regional Disco persistente balanceado regional Disco persistente SSD regional
Mejor que el 99,99% Mejor que el 99,999% Mejor que el 99,999% Mejor que el 99,9999% Mejor que el 99,999% Mejor que el 99,9999% Mejor que el 99,9999%

Compatibilidad con series de máquinas

Selecciona una serie de máquinas para ver los tipos de disco persistente (PD) que admite.

Serie de máquinas Disco persistente SSD Disco persistente balanceado Disco persistente Extreme Disco persistente estándar
C4
C4A
C4D
C3
C3D
N4
N2
N2D
N1
T2D
T2A
E2
Z3
H3
C2
C2D
X4
M4
M3
M2
M1
N1+GPU
A4X
A4
A3 (H200)
A3 (H100)
A2
G4
G2

Capacidad máxima

Los volúmenes de Persistent Disk pueden tener un tamaño de hasta 64 TiB. Puedes añadir hasta 127 volúmenes de disco persistente zonal secundarios que no sean de arranque a una instancia de máquina virtual. Sin embargo, la capacidad total combinada de todos los volúmenes de disco persistente conectados a una sola máquina virtual no puede superar los 257 TiB.

Puedes crear volúmenes lógicos únicos de hasta 257 TiB mediante la gestión de volúmenes lógicos en tu VM. Para obtener información sobre cómo asegurar el máximo rendimiento con grandes volúmenes, consulta Tamaño del volumen lógico.

Disco persistente de zona

Un disco persistente de zona es un disco persistente al que solo se puede acceder desde una zona específica, como europe-west-2.

Facilidad de uso

Compute Engine se encarga de la mayoría de las tareas de gestión de discos para que no tengas que gestionar particiones, arrays de discos redundantes ni subvolúmenes. Por lo general, no es necesario crear volúmenes lógicos más grandes. Sin embargo, puedes ampliar la capacidad de tu disco persistente secundario conectado a 257 TiB por máquina virtual y aplicar estas prácticas a tus volúmenes de disco persistente. Puedes ahorrar tiempo y obtener el mejor rendimiento si formateas tus volúmenes de Persistent Disk con un solo sistema de archivos y sin tablas de particiones.

Si necesitas separar tus datos en varios volúmenes únicos, crea discos adicionales en lugar de dividir los discos que ya tienes en varias particiones.

Si necesitas más espacio en tus volúmenes de disco persistente, cambia el tamaño de los discos en lugar de volver a particionarlos y formatearlos.

Rendimiento

El rendimiento de Persistent Disk es predecible y se escala de forma lineal con la capacidad aprovisionada hasta que se alcanzan los límites de las vCPUs aprovisionadas de una VM. Para obtener más información sobre los límites de escalado del rendimiento y la optimización, consulta el artículo Configurar discos para cumplir los requisitos de rendimiento.

Los volúmenes de disco persistente estándar son eficientes y económicos para gestionar operaciones de lectura/escritura secuenciales, pero no están optimizados para gestionar altas tasas de operaciones de entrada/salida aleatorias por segundo (IOPS). Si tus aplicaciones requieren tasas altas de IOPS aleatorias, usa discos persistentes SSD o Extreme. Los discos persistentes SSD se han diseñado para ofrecer latencias de un solo dígito en milisegundos. La latencia observada es específica de la aplicación.

Compute Engine optimiza automáticamente el rendimiento y el escalado de los volúmenes de Persistent Disk. No es necesario combinar varios discos ni precalentarlos para obtener el mejor rendimiento. Si necesitas más espacio en disco o un mejor rendimiento, cambia el tamaño de tus discos y, posiblemente, añade más vCPUs para aumentar el espacio de almacenamiento, el rendimiento y las IOPS. El rendimiento de Persistent Disk se basa en la capacidad total de Persistent Disk conectada a una máquina virtual y en el número de vCPUs que tiene la máquina virtual.

En el caso de los dispositivos de arranque, puedes reducir los costes usando un disco persistente estándar. Los volúmenes de Persistent Disk pequeños (10 GiB) pueden funcionar en casos prácticos de arranque básico y gestión de paquetes. Sin embargo, para asegurar un rendimiento constante en un uso más general del dispositivo de arranque, utiliza un disco persistente balanceado como disco de arranque.

Como las operaciones de escritura en discos persistentes contribuyen al tráfico de salida de red acumulativo de tu máquina virtual, estas operaciones están limitadas por el límite de salida de red de tu máquina virtual.

Fiabilidad

Persistent Disk tiene redundancia integrada para proteger tus datos frente a fallos de los equipos y para asegurar la disponibilidad de los datos durante los eventos de mantenimiento de los centros de datos. Las sumas de comprobación se calculan para todas las operaciones de Persistent Disk, por lo que podemos asegurarnos de que lo que lees es lo que escribiste.

Además, puedes crear capturas de Persistent Disk para protegerte frente a la pérdida de datos debido a errores de los usuarios. Las capturas son incrementales y solo tardan unos minutos en crearse, incluso si haces capturas de discos que están conectados a VMs en ejecución.

Disco persistente regional

Los volúmenes de discos persistentes regionales tienen cualidades de almacenamiento similares a las de los discos persistentes zonales. Sin embargo, los volúmenes de disco persistente regional proporcionan almacenamiento duradero y replicación de datos entre dos zonas de la misma región.

Acerca de la replicación síncrona de discos

Cuando creas un disco persistente, puedes hacerlo en una zona o replicarlo en dos zonas de la misma región.

Por ejemplo, si creas un disco en una zona, como us-west1-a, tendrás una copia del disco. Un disco creado en una sola zona se denomina "disco zonal". Puedes aumentar la disponibilidad del disco almacenando otra copia del disco en una zona diferente de la región, como en us-west1-b.

Los discos persistentes replicados en dos zonas de la misma región se denominan discos persistentes regionales. También puedes usar Hyperdisk Balanced High Availability para la replicación síncrona entre zonas de Google Cloud Hyperdisk.

Es poco probable que una región falle por completo, pero pueden producirse fallos zonales. La replicación en diferentes zonas de la región, como se muestra en la siguiente imagen, ayuda a mejorar la disponibilidad y a reducir la latencia del disco. Si fallan ambas zonas de réplica, se considera un fallo en toda la región.

Ilustración de una VM que tiene un disco regional.
 El disco tiene dos réplicas: una en la misma zona que la VM y otra en una segunda zona.

El disco se replica en dos zonas.

En el caso de la réplica, los datos están disponibles en la zona local (us-west1-a), que es la zona en la que se ejecuta la máquina virtual. A continuación, los datos se replican en otra zona (us-west1-b). Una de las zonas debe ser la misma en la que se ejecuta la VM.

Si se produce una interrupción zonal, normalmente puedes conmutar por error tu carga de trabajo que se ejecuta en un Persistent Disk regional a otra zona. Para obtener más información, consulta Conmutación por error de discos persistentes regionales.

Consideraciones de diseño de los discos persistentes regionales

Si diseñas sistemas robustos o servicios de alta disponibilidad en Compute Engine, usa discos persistentes regionales junto con otras prácticas recomendadas, como crear copias de seguridad de tus datos mediante capturas. Los volúmenes de discos persistentes regionales también están diseñados para funcionar con grupos de instancias gestionadas regionales.

Rendimiento

Los volúmenes de Persistent Disk regionales se han diseñado para cargas de trabajo que requieren un objetivo de punto de recuperación (RPO) y un objetivo de tiempo de recuperación (RTO) más bajos que los que se obtienen con las copias de seguridad de Persistent Disk.

Los discos persistentes regionales son una opción cuando el rendimiento de escritura es menos importante que la redundancia de datos en varias zonas.

Al igual que los discos persistentes zonales, los discos persistentes regionales pueden ofrecer un mejor rendimiento de IOPS y de procesamiento en las máquinas virtuales que tienen un mayor número de vCPUs. Para obtener más información sobre esta y otras limitaciones, consulta Configurar discos para cumplir los requisitos de rendimiento.

Si necesitas más espacio en disco o un mejor rendimiento, puedes cambiar el tamaño de tus discos regionales para añadir más espacio de almacenamiento, rendimiento y IOPS.

Fiabilidad

Compute Engine replica los datos de tu disco persistente regional en las zonas que hayas seleccionado al crear los discos. Los datos de cada réplica se distribuyen en varias máquinas físicas de la zona para asegurar la redundancia.

Al igual que con los discos persistentes de zona, puedes crear capturas de discos persistentes para protegerte frente a la pérdida de datos por errores de usuario. Las capturas son incrementales y solo tardan unos minutos en crearse, incluso si haces capturas de discos que están conectados a VMs en ejecución.

Limitaciones de los discos persistentes regionales

  • Solo puedes asociar discos persistentes regionales a máquinas virtuales que utilicen los tipos de máquinas E2, N1, N2 y N2D.
  • Solo puedes asociar Hyperdisk Balanced High Availability a tipos de máquinas compatibles.
  • No puedes crear un disco persistente regional a partir de una imagen de SO ni a partir de un disco que se haya creado a partir de una imagen de SO.
  • No puedes crear un disco Hyperdisk Balanced High Availability clonando un disco zonal. Para crear un disco Hyperdisk Balanced High Availability a partir de un disco de zona, sigue los pasos que se indican en Cambiar un disco de zona a un disco Hyperdisk Balanced High Availability.
  • Cuando se usa el modo de solo lectura, se puede conectar un disco persistente equilibrado regional a un máximo de 10 instancias de VM.
  • El tamaño mínimo de un disco persistente estándar regional es de 200 GiB.
  • Solo puedes aumentar el tamaño de un disco persistente regionalo de un volumen de hiperdisco Balanced de alta disponibilidad. No puedes reducirlo.
  • Los volúmenes de disco persistente regional y de Hyperdisk Balanced High Availability tienen características de rendimiento diferentes a las de sus discos zonales correspondientes. Para obtener más información, consulta Acerca del rendimiento de Persistent Disk y Límites de rendimiento de Hyperdisk Balanced High Availability.
  • No puedes usar un volumen de Hyperdisk Balanced High Availability que esté en modo de escritura múltiple como disco de arranque.
  • Si creas un disco replicado clonando un disco zonal, las dos réplicas zonales no estarán totalmente sincronizadas en el momento de la creación. Después de crear el clon, puedes usarlo en un plazo de 3 minutos de media. Sin embargo, es posible que tengas que esperar decenas de minutos para que el disco alcance un estado de replicación completo y el objetivo de punto de recuperación (RPO) sea casi cero. Consulta cómo comprobar si tu disco replicado se ha replicado por completo.

Tipos de interfaz de almacenamiento

La interfaz de almacenamiento se elige automáticamente cuando creas una instancia o añades volúmenes de disco persistente a una máquina virtual. Las máquinas virtuales Tau T2A y de tercera generación (como M3) usan la interfaz NVMe para Persistent Disk.

Las instancias de máquina virtual confidencial también usan discos persistentes NVMe. Todas las demás series de máquinas de Compute Engine usan la interfaz de disco SCSI para Persistent Disk.

La mayoría de las imágenes públicas incluyen controladores NVMe y SCSI. La mayoría de las imágenes incluyen un kernel con controladores optimizados que permiten que tu VM consiga el mejor rendimiento con NVMe. Las imágenes de Linux importadas consiguen el mejor rendimiento con NVMe si incluyen la versión 4.14.68 o una posterior del kernel.

Para determinar si una versión del sistema operativo admite NVMe, consulta la página de detalles del sistema operativo.

Modo multiescritura

Puedes conectar un disco persistente SSD en modo multiescritura a un máximo de dos VMs N2 simultáneamente para que ambas VMs puedan leer y escribir en el disco.

Persistent Disk en modo multiescritura ofrece una capacidad de almacenamiento en bloques compartido y proporciona una base de infraestructura para crear sistemas de archivos y bases de datos compartidos de alta disponibilidad. Estos sistemas de archivos y bases de datos especializados deben diseñarse para que funcionen con el almacenamiento de bloques compartido y gestionen la coherencia de la caché entre las VMs mediante herramientas como reservas persistentes SCSI.

Sin embargo, no se debe usar directamente el disco persistente con el modo multiescritura. Muchos sistemas de archivos, como EXT4, XFS y NTFS, no están diseñados para usarse con almacenamiento de bloques compartido. Para obtener más información sobre las prácticas recomendadas al compartir discos persistentes entre máquinas virtuales, consulta Prácticas recomendadas.

Si necesitas un almacenamiento de archivos totalmente gestionado, puedes montar un sistema de archivos compartido de Filestore en tus VMs de Compute Engine.

Para habilitar el modo de multiescritura en los nuevos volúmenes de Persistent Disk, crea un disco persistente y especifica la marca --multi-writer en la CLI de gcloud o la propiedad multiWriter en la API de Compute Engine. Para obtener más información, consulta el artículo sobre cómo compartir volúmenes de discos persistentes entre máquinas virtuales.

Cifrado de Persistent Disk

Compute Engine encripta automáticamente tus datos antes de que salgan de tu máquina virtual y se almacenen en el espacio de almacenamiento de Persistent Disk. Cada disco persistente se encripta con claves definidas por el sistema o con claves proporcionadas por el cliente. Google distribuye los datos de Persistent Disk entre varios discos físicos de una forma que los usuarios no pueden controlar.

Cuando eliminas un volumen de disco persistente, Google descarta las claves de cifrado, por lo que los datos no se pueden recuperar. Este proceso es irreversible,

Si quieres controlar las claves de cifrado que se usan para cifrar tus datos, crea tus discos con tus propias claves de cifrado.

Restricciones

  • No puedes adjuntar un volumen de disco persistente a una máquina virtual de otro proyecto.

  • Puedes conectar un disco persistente equilibrado a un máximo de 10 VMs en modo de solo lectura.

  • En el caso de los tipos de máquinas personalizadas o los tipos de máquinas predefinidas con un mínimo de 1 vCPU, puedes conectar hasta 128 volúmenes de disco persistente.

  • Cada volumen de disco persistente puede ser de hasta 64 TiB, por lo que no es necesario gestionar matrices de discos para crear grandes volúmenes lógicos. Cada VM solo puede asociar una cantidad limitada de espacio total de disco persistente y un número limitado de volúmenes de disco persistente individuales. Los tipos de máquinas predefinidas y los tipos de máquinas personalizadas tienen los mismos límites de discos persistentes.

  • La mayoría de las máquinas virtuales pueden tener hasta 128 volúmenes de Persistent Disk y hasta 257 TiB de espacio total en disco conectado. El espacio total en disco de una máquina virtual incluye el tamaño del disco de arranque.

  • Los tipos de máquinas de núcleo compartido están limitados a 16 volúmenes de Persistent Disk y 3 TiB de espacio total de Persistent Disk.

  • Para crear volúmenes lógicos de más de 64 TiB, puede que tengas que tener en cuenta algunos aspectos especiales. Para obtener más información sobre el rendimiento de volúmenes lógicos más grandes, consulta la sección sobre el tamaño de los volúmenes lógicos.

Persistent Disk y Colossus

Persistent Disk se ha diseñado para funcionar junto con el sistema de archivos de Google, Colossus, que es un sistema de almacenamiento en bloques distribuido. Los controladores de Persistent Disk encriptan automáticamente los datos de la VM antes de que se transmitan de la VM a la red. A continuación, Colossus conserva los datos. Cuando Colossus lee los datos, el controlador descifra los datos entrantes.

imagen

Los volúmenes de Persistent Disk usan Colossus como backend de almacenamiento.

Tener discos como servicio es útil en varios casos. Por ejemplo:

  • Cambiar el tamaño de los discos mientras la instancia está en ejecución es más fácil que detener la instancia primero. Puedes aumentar el tamaño del disco sin detener la instancia.
  • Adjuntar y separar discos es más fácil cuando los discos y las VMs no tienen que compartir el mismo ciclo de vida ni estar ubicados en el mismo lugar. Puedes detener una VM y usar su disco de arranque de disco persistente para arrancar otra VM.
  • Las funciones de alta disponibilidad, como la replicación, son más sencillas porque el controlador de disco puede ocultar los detalles de la replicación y proporcionar una replicación automática en tiempo de escritura.

Siguientes pasos