Acerca de Persistent Disk


En este documento, se describen las funciones, los tipos, el rendimiento y los beneficios de los volúmenes de Persistent Disk. Si necesitas almacenamiento en bloque para una instancia o un contenedor de máquina virtual (VM), como para un disco de arranque o de datos, usa volúmenes de Persistent Disk si Google Cloud Hyperdisk no está disponible para tu instancia de procesamiento. Para obtener información sobre las otras opciones de almacenamiento en bloque en Compute Engine, consulta Elige un tipo de disco.

Los volúmenes de Persistent Disk son dispositivos de almacenamiento de red duraderos a los que tus instancias pueden acceder, como los discos físicos de una computadora de escritorio o un servidor. Los volúmenes de Persistent Disk no están conectados a la máquina física que aloja la instancia. En su lugar, se conectan a la instancia como dispositivos de almacenamiento en bloques de red. Los datos de cada volumen de Persistent Disk se distribuyen en varios discos físicos. Compute Engine administra los discos físicos y la distribución de datos para garantizar la redundancia y optimizar el rendimiento.

Los volúmenes de Persistent Disk no están conectados a la máquina física que aloja la instancia. En su lugar, se conectan a la instancia como dispositivos de almacenamiento en bloques de red. Sin embargo, tu instancia de VM puede acceder a los volúmenes de Persistent Disk como discos físicos en una computadora de escritorio o un servidor. Cuando lees o escribes desde un Persistent Disk, los datos se transmiten a través de la red.

Puedes desconectar o mover los volúmenes para conservar tus datos, incluso después de borrar las instancias. El rendimiento de Persistent Disk aumenta con el tamaño, por lo que puedes cambiar el tamaño de los volúmenes existentes de Persistent Disk o agregar más volúmenes de Persistent Disk a una VM para cumplir con los requisitos de rendimiento y espacio de almacenamiento.

Agrega un disco que no sea de arranque a tu instancia cuando necesites un almacenamiento confiable y asequible con características de rendimiento coherentes.

Agrega un Persistent Disk a tu instancia

Tipos de Persistent Disk

Cuando creas un volumen de Persistent Disk, puedes seleccionar uno de los siguientes tipos de disco:

  • Disco persistente equilibrado (pd-balanced)
    • Una alternativa al Persistent Disk de rendimiento (pd-ssd).
    • Equilibrio entre rendimiento y costo Para la mayoría de las formas de VM, excepto las muy grandes, estos discos tienen las mismas IOPS máximas que los discos persistentes SSD y una cantidad más baja de IOPS por GiB. Este tipo de disco ofrece niveles de rendimiento adecuados para la mayoría de las aplicaciones de uso general a un precio que se encuentra entre los Persistent Disk de rendimiento (pd-ssd) y los estándar.
    • Respaldado por unidades de estado sólido (SSD).
  • Disco persistente de rendimiento (SSD) (pd-ssd)
    • Son adecuados para aplicaciones empresariales y bases de datos de alto rendimiento que requieren menor latencia y más IOPS que las que proporcionan Persistent Disk estándar.
    • Respaldado por unidades de estado sólido (SSD).
  • Disco persistente estándar (pd-standard)
    • Apto para cargas de trabajo de procesamiento de datos grandes que usan fundamentalmente E/S secuenciales.
    • Respaldado por unidades de disco duro estándar (HDD).
  • Disco persistente extremo (pd-extreme)
    • Ofrece un alto rendimiento constante para cargas de trabajo de acceso aleatorio y con capacidad de procesamiento masiva.
    • Diseñado para cargas de trabajo de bases de datos de alta gama.
    • Te permite aprovisionar las IOPS de destino.
    • Respaldado por unidades de estado sólido (SSD).
    • Disponible con una cantidad limitada de tipos de máquinas.

Si creas un disco en la consola de Google Cloud , el tipo de disco predeterminado es pd-balanced. Si creas un disco con gcloud CLI o la API de Compute Engine, el tipo de disco predeterminado es pd-standard.

Para obtener información sobre la compatibilidad con tipos de máquinas, consulta los siguientes vínculos:

Durabilidad de Persistent Disk

La durabilidad del disco representa la probabilidad de pérdida de datos, por diseño, de un disco típico en un año típico, mediante un conjunto de suposiciones sobre fallas de hardware, la probabilidad de eventos catastróficos, prácticas de aislamiento y procesos de ingeniería en los Centros de Datos de Google y las codificaciones internas que usa cada tipo de disco. Los eventos de pérdida de datos del disco persistente son muy poco frecuentes y suelen ser el resultado de fallas de hardware coordinadas, errores de software o una combinación de ambos. Google también toma muchas medidas para mitigar el riesgo de toda la industria por el daño silencioso en los datos. Un error humano de un cliente de Google Cloud , como cuando un cliente borra un disco por accidente, está fuera del alcance de la durabilidad del Persistent Disk.

Existe un riesgo mínimo de que se pierdan datos con un volumen de Persistent Disk regional debido a las codificaciones y la replicación internas de los datos. Persistent Disk regional proporciona alta disponibilidad y se puede usar para la recuperación ante desastres si se pierde un centro de datos completo y no se puede recuperar. El disco persistente regional proporciona el doble de réplicas de disco que el Persistent Disk zonal, con cada réplica distribuida entre dos zonas de la misma región. Si una zona principal deja de estar disponible durante una interrupción, se puede acceder de inmediato a la réplica de la segunda zona.

En la siguiente tabla, se muestra la durabilidad para cada diseño de tipo de disco. La durabilidad del 99.999% significa que, con 1,000 discos, podrías pasar cien años sin perder uno.

Disco persistente estándar zonal Disco persistente balanceado zonal Disco persistente SSD zonal Disco persistente extremo zonal Disco persistente estándar regional Disco persistente regional equilibrado Disco persistente SSD regional
Mejor que el 99.99% Mejor que el 99.999% Mejor que el 99.999% Mejor que el 99.9999% Mejor que el 99.999% Mejor que el 99.9999% Mejor que el 99.9999%

Compatibilidad con series de máquinas

Selecciona una serie de máquinas para ver los tipos de Persistent Disk (PD) compatibles.

Series de máquinas PD SSD PD balanceados PDs extremos PDs estándar
C4A
C4
C3
C3D
N4
N2
N2D
N1
T2D
T2A
E2
Z3
H3
C2
C2D
X4
M3
M2
M1
N1+GPU
A3
A2
G2

Capacidad máxima

Los volúmenes de Persistent Disk pueden tener un tamaño de hasta 64 TiB. Puedes agregar hasta 127 volúmenes de Persistent Disk zonales secundarios que no sean de arranque a una instancia de VM. Sin embargo, la capacidad total combinada de todos los volúmenes de discos persistentes conectados a una sola VM no puede exceder los 257 TiB.

Puedes crear volúmenes lógicos únicos de hasta 257 TiB mediante la administración de volúmenes lógicos dentro de la VM. Para obtener información sobre cómo garantizar el máximo rendimiento con volúmenes grandes, consulta Tamaño de volumen lógico.

Persistent Disk zonal

Un Persistent Disk zonal es un Persistent Disk al que solo se puede acceder dentro de una zona específica, por ejemplo, europe-west-2.

Facilidad de uso

Compute Engine controla la mayoría de las tareas de administración de disco para que no tengas que ocuparte de la partición, los conjuntos de discos redundantes o la administración de subvolúmenes. Por lo general, no es necesario crear volúmenes lógicos más grandes. Sin embargo, puedes ampliar la capacidad del Persistent Disk secundario adjunto a 257 TiB por VM y aplicar estas prácticas a tus volúmenes de Persistent Disk. Puedes ahorrar tiempo y obtener el mejor rendimiento si formateas tus discos persistentes con un solo sistema de archivos y sin tablas particionadas.

Si necesitas separar tus datos en varios volúmenes únicos, crea discos adicionales, en lugar de dividir tus discos existentes en varias particiones.

Cuando necesites espacio adicional en tus volúmenes de Persistent Disk, cambia el tamaño de tus discos en lugar de volver a particionar y formatear.

Rendimiento

El rendimiento del Persistent Disk es predecible y se escala de forma lineal con capacidad aprovisionada hasta que se alcanzan los límites para las CPU virtuales aprovisionadas de una VM. Para obtener más información sobre los límites y la optimización del escalamiento del rendimiento, consulta Configura discos para cumplir con los requisitos de rendimiento.

Los discos persistentes estándar son eficientes y asequibles para controlar operaciones de lectura y escritura secuenciales, pero no están optimizados a fin de controlar tasas altas de operaciones de entrada y salida aleatorias por segundo (IOPS). Si las apps requieren tasas altas de IOPS aleatorias, debes usar SSD o discos persistentes extremos. El disco persistente SSD está diseñado para latencias de milisegundos de un solo dígito. La latencia que se observa es específica de la aplicación.

Compute Engine optimiza el rendimiento y el escalamiento en los volúmenes de Persistent Disk de forma automática. No necesitas seleccionar varios discos ni discos precalentados para obtener el mejor rendimiento. Cuando necesites más espacio en el disco o un mejor rendimiento, cambia el tamaño de tus discos y, en lo posible, agrega más CPU virtuales para agregar más espacio de almacenamiento, IOPS y capacidad de procesamiento. El rendimiento del disco persistente se basa en la capacidad total del disco persistente adjunta a una VM y en la cantidad de CPU virtuales que tiene la VM.

Para los dispositivos de arranque, puedes reducir los costos mediante un disco persistente estándar. Los volúmenes de Persistent Disk pequeños de 10 GiB pueden funcionar en casos de uso básicos de administración de paquetes y arranque. Sin embargo, a fin de garantizar un rendimiento coherente para un uso más general del dispositivo de arranque, debes usar un disco persistente balanceado como disco de arranque.

Debido a que las operaciones de escritura de disco persistente contribuyen al tráfico de salida de red acumulativo para tu VM, las operaciones de escritura de Persistent Disk están limitadas por el límite de salida de red para tu VM.

Confiabilidad

Persistent Disk tienen redundancia incorporada a fin de proteger tus datos contra fallas del equipo y para garantizar la disponibilidad de los datos a través de eventos de mantenimiento del centro de datos. Las sumas de verificación se calculan para todas las operaciones del disco persistente a fin de que podamos asegurarnos de que lo que leas sea lo que escribiste.

Además, puedes crear instantáneas de discos persistentes para obtener protección contra la pérdida de datos debido a un error del usuario. Las instantáneas son incrementales y crearlas solo te llevará unos minutos, incluso si tus discos de instantáneas se encuentran adjuntos a VMs en ejecución.

Disco persistente regional

Los volúmenes de Persistent Disk regionales tienen cualidades de almacenamiento similares a Persistent Disk zonal. Sin embargo, los volúmenes de Persistent Disk regionales proporcionan almacenamiento duradero y replicación de datos entre dos zonas en la misma región.

Acerca de la replicación de disco síncrona

Cuando creas un Persistent Disk nuevo, puedes crearlo en una zona o replicarlo en dos zonas dentro de la misma región.

Por ejemplo, si creas un disco en una zona, como us-west1-a, tienes una copia del disco. Un disco creado en una sola zona se conoce como disco zonal. Para aumentar la disponibilidad del disco, almacena otra copia del disco en una zona diferente dentro de la región, como en us-west1-b.

Persistent Disk replicados en dos zonas de la misma región se denominan discos persistentes regionales. También puedes usar Hyperdisk Balanced High Availability para la replicación síncrona entre zonas de Google Cloud Hyperdisk.

Es poco probable que una región falle por completo, pero pueden ocurrir fallas zonales. Replicar dentro de la región en diferentes zonas, como se muestra en la siguiente imagen, ayuda con la disponibilidad y reduce la latencia del disco. Si fallan ambas zonas de replicación, se considera una falla en toda la región.

Ilustración de una VM que tiene un disco regional.
 El disco tiene dos réplicas, una en la misma zona que la VM y otra en una segunda zona.

El disco se replica en dos zonas.

En la situación replicada, los datos están disponibles en la zona local (us-west1-a), que es la zona en la que se está ejecutando la máquina virtual (VM). Luego, los datos se replican en otra zona (us-west1-b). Una de las zonas debe ser la misma en la que se ejecuta la VM.

Si se produce una interrupción zonal, puedes conmutar por error la carga de trabajo que se ejecuta en discos persistentes regionales a otra zona. Para obtener más información, consulta Conmutación por error del disco persistente regional.

Consideraciones de diseño para Persistent Disk regional

Si diseñas sistemas sólidos o servicios de alta disponibilidad en Compute Engine, usa discos persistentes regionales combinados con otras prácticas recomendadas, como crear una copia de seguridad de los datos mediante instantáneas. Los volúmenes de Persistent Disk regional también están diseñados para funcionar con grupos de instancias administrados regionales.

Rendimiento

Los volúmenes de Persistent Disk regionales están diseñados para cargas de trabajo que requieren un objetivo de punto de recuperación (RPO) y un objetivo de tiempo de recuperación (RTO) menores en comparación con las instantáneas de Persistent Disk.

Los discos persistentes regionales son una opción cuando el rendimiento de escritura es menos crítico que la redundancia de datos en varias zonas.

Al igual que los Persistent Disk zonales, los Persistent Disks regionales pueden lograr un mayor rendimiento de IOPS y de capacidad de procesamiento en las VMs con una mayor cantidad de CPU virtuales. Para obtener más información sobre esta y otras limitaciones, consulta Configura los discos para cumplir con los requisitos de rendimiento.

Cuando necesites más espacio en el disco o mayor rendimiento, puedes cambiar el tamaño de los discos regionales para agregar más espacio de almacenamiento, IOPS y capacidad de procesamiento.

Confiabilidad

Compute Engine replica los datos de tu disco persistente regional en las zonas que seleccionaste cuando creaste tus discos. Los datos de cada réplica se distribuyen en varias máquinas físicas dentro de la zona para garantizar la redundancia.

Al igual que con los discos persistentes zonales, puedes crear instantáneas de discos persistentes a fin de obtener protección contra la pérdida de datos debido a un error del usuario. Las instantáneas son incrementales y crearlas solo te llevará unos minutos, incluso si tus discos de instantáneas se encuentran adjuntos a VMs en ejecución.

Limitaciones de Persistent Disk regional

  • México, Osaka y Montreal tienen tres zonas alojadas en uno o dos centros de datos físicos. Dado que los datos almacenados en estas regiones se pueden perder en el caso poco probable de que se destruya el centro de datos, podrías crear copias de seguridad de los datos esenciales para la empresa en una segunda región con el propósito de aumentar la protección de los datos.
  • Solo puedes conectar el disco persistente regional a las VM que usan E2, N1, N2 y tipos de máquina N2D.
  • Puedes adjuntar alta disponibilidad balanceada de Hyperdisk solo a los tipos de máquinas compatibles.
  • No puedes crear un Persistent Disk regional a partir de una imagen ni de un disco que se creó a partir de una imagen.
  • Cuando usas el modo de solo lectura, puedes conectar un disco persistente regional balanceado a un máximo de 10 instancias de VM.
  • El tamaño mínimo de un Persistent Disk estándar regional es de 200 GiB.
  • Solo puedes aumentar el tamaño de un disco persistente regional o un volumen de alta disponibilidad balanceada de Hyperdisk. No puedes disminuir su tamaño.
  • Los volúmenes de Persistent Disk regionales y alta disponibilidad balanceada de Hyperdisk tienen características de rendimiento diferentes a las de sus discos zonales correspondientes. Para obtener más información, consulta Rendimiento del almacenamiento en bloque.
  • No puedes usar un volumen de alta disponibilidad balanceada de Hyperdisk que esté en modo de varios escritores como disco de arranque.
  • Si creas un disco replicado mediante la clonación de un disco zonal, las dos réplicas zonales no están completamente sincronizadas en el momento de la creación. Después de la creación, puedes usar la clonación de disco regional en promedio en 3 minutos. Sin embargo, es posible que debas esperar decenas de minutos antes de que el disco alcance un estado completamente replicado y el objetivo de punto de recuperación (RPO) esté cerca de cero. Obtén información para verificar si tu disco replicado está replicado por completo.

Tipos de interfaz de almacenamiento

La interfaz de almacenamiento se elige de forma automática cuando creas tu instancia o agregas volúmenes de Persistent Disk a una VM. Las VMs Tau T2A y de tercera generación (como M3) usan la interfaz NVMe para Persistent Disk.

Las instancias de Confidential VMs también usan Persistent Disk NVMe. Todas las demás series de máquinas de Compute Engine usan la interfaz de disco SCSI para Persistent Disk.

La mayoría de las imágenes públicas incluyen controladores NVMe y SCSI. La mayoría de las imágenes incluyen un kernel con controladores optimizados que permiten que tu VM logre el mejor rendimiento mediante NVMe. Las imágenes de Linux importadas pueden lograr el mejor rendimiento con NVMe si incluyen la versión de kernel 4.14.68 o una posterior.

Para determinar si una versión del sistema operativo es compatible con NVMe, consulta la página Detalles del sistema operativo.

Modo de multiescritura

Puedes conectar un disco persistente SSD en modo de multiescritura a un máximo de dos VM N2 de forma simultánea para que ambas puedan leer y escribir en el disco.

Persistent Disk en modo de varios escritores proporciona una capacidad de almacenamiento en bloque compartido y presenta una base de infraestructura para compilar bases de datos y sistemas de archivos compartidos con alta disponibilidad. Estos sistemas de archivos y bases de datos especializados deben diseñarse para funcionar con el almacenamiento en bloque compartido y controlar la coherencia de la caché entre las VMs a través de herramientas como Reservas persistentes SCSI.

Sin embargo, Persistent Disk con el modo de varios escritores no debe usarse directamente. Muchos sistemas de archivos, como EXT4, XFS y NTFS, no están diseñados para usarse con almacenamiento en bloque compartido. Para obtener más información sobre las prácticas recomendadas cuando se comparten Persistent Disk entre las VM, consulta las prácticas recomendadas.

Si necesitas almacenamiento de archivos completamente administrado, puedes activar un archivo compartido de Filestore en tus VM de Compute Engine.

A fin de habilitar el modo multiescritura para los discos persistentes nuevos, crea un nuevo disco y especifica la marca --multi-writer en la CLI de gcloud o la propiedad multiWriter en la API de Compute Engine. Para obtener más información, consulta Comparte volúmenes de Persistent Disk entre VMs.

Encriptación del disco persistente

Compute Engine encripta de forma automática tus datos antes de que se trasladen fuera de tu VM al espacio de almacenamiento de Persistent Disk. Todos los discos persistentes permanecen encriptados con claves definidas por el sistema o suministradas por el cliente. Google distribuye datos de Persistent Disk en varios discos físicos de una manera que los usuarios no pueden controlar.

Cuando borras un disco persistente, Google descarta las claves de encriptación, lo que hace que los datos sean irrecuperables. Este proceso es irreversible.

Si deseas controlar las claves de encriptación que se usan para encriptar tus datos, crea tus discos con tus propias claves de encriptación.

Restricciones

  • No puedes conectar un volumen de Persistent Disk a una VM en otro proyecto.

  • Puedes conectar un Persistent Disk balanceado a un máximo de 10 VMs en modo de solo lectura.

  • Para los tipos personalizados de máquinas o los tipos de máquinas predefinidos que tienen un mínimo de 1 CPU virtual, puedes conectar hasta 128 discos persistentes.

  • Cada volumen de Persistent Disk puede tener un tamaño de hasta 64 TiB, por lo que no es necesario administrar varios conjuntos de discos para crear grandes volúmenes lógicos. Cada VM puede adjuntar solo una cantidad limitada de espacio de disco persistente total y un número limitado de discos persistentes individuales. Los tipos predefinidos de máquinas y tipos personalizados de máquinas tienen los mismos límites de discos persistentes.

  • La mayoría de las VMs pueden tener hasta 128 volúmenes de Persistent Disk y hasta 257 TiB de espacio total en el disco conectado. El espacio total en el disco para una VM incluye el tamaño del disco de arranque.

  • Los tipos de máquinas de núcleo compartido tienen un límite de 16 volúmenes de Persistent Disk y 3 TiB de espacio total del Persistent Disk.

  • Crear volúmenes lógicos de más de 64 TiB puede requerir una consideración especial. Para obtener más información sobre el rendimiento de un volumen lógico más grande, consulta Tamaño del volumen lógico.

Persistent Disk y Colossus

Persistent Disk está diseñado para ejecutarse en conjunto con el sistema de archivos de Google, Colossus, que es un sistema de almacenamiento de bloques distribuido. Los controladores de Persistent Disk encriptan los datos de la VM de forma automática antes de que se transmitan a la red. Luego, Colossus conserva los datos. Cuando Colossus lee los datos, el controlador los desencripta.

imagen

Los volúmenes de Persistent Disk usan Colossus para el backend de almacenamiento.

Tener discos como servicio es útil en varios casos, por ejemplo:

  • Cambiar el tamaño de los discos mientras se ejecuta la instancia se vuelve más fácil que detener la instancia primero. Puedes aumentar el tamaño del disco sin detener la instancia.
  • Conectar y desconectar discos es más fácil cuando los discos y las VMs no tienen que compartir el mismo ciclo de vida ni ubicarse en el mismo lugar. Es posible detener una VM y usar su disco de arranque de Persistent Disk para iniciar otra VM.
  • Las funciones de alta disponibilidad, como la replicación, se vuelven más fáciles porque el controlador del disco puede ocultar los detalles de la replicación y proporcionar replicación automática durante la escritura.

¿Qué sigue?