Elegir entre almacenamiento SSD y HDD
Cuando creas una instancia de Bigtable, eliges si sus clústeres almacenan datos en unidades de estado sólido (SSD) o en unidades de disco duro (HDD):
- El almacenamiento SSD es la opción más eficiente y rentable para la mayoría de los casos prácticos.
- El almacenamiento en HDD es adecuado en ocasiones para grandes conjuntos de datos que no son sensibles a la latencia o a los que no se accede con frecuencia.
Independientemente del tipo de almacenamiento que elijas, tus datos se almacenan en un sistema de archivos distribuido y replicado que abarca muchas unidades físicas.
Las directrices de esta página pueden ayudarte a elegir entre SSD y HDD.
Si tienes dudas, elige el almacenamiento SSD
Hay varios motivos por los que suele ser mejor usar el almacenamiento SSD en tu clúster de Bigtable:
- Las unidades SSD son mucho más rápidas y tienen un rendimiento más predecible que las HDD. En un clúster de Bigtable, el almacenamiento SSD ofrece latencias significativamente más bajas para las lecturas y las escrituras que el almacenamiento HDD.
- El rendimiento de los HDD es mucho más limitado que el de los SSD. En un clúster que usa almacenamiento HDD, es posible alcanzar el rendimiento máximo antes de que el uso de la CPU llegue al 100 %. Puedes monitorizar esta situación con la métrica Carga de disco. Para aumentar el rendimiento, debes añadir más nodos, pero el coste de los nodos adicionales puede superar el ahorro que obtienes al usar el almacenamiento en HDD. El almacenamiento SSD no tiene esta limitación, ya que ofrece un rendimiento mucho mayor por nodo. Por lo general, un clúster que usa almacenamiento SSD alcanza el rendimiento máximo solo cuando utiliza toda la CPU y la memoria disponibles.
- Las lecturas de filas individuales en un disco duro son muy lentas. Debido al tiempo de búsqueda del disco, el almacenamiento en HDD solo admite el 5% de las filas leídas por segundo del almacenamiento en SSD. Sin embargo, las lecturas de varias filas grandes no se ven tan afectadas.
- El ahorro de costes que supone el uso de discos duros es mínimo en comparación con el coste de los nodos de tu clúster de Bigtable, a menos que almacenes grandes cantidades de datos. Por este motivo, como regla general, no deberías usar el almacenamiento en HDD a menos que almacenes al menos 10 TB de datos y tu carga de trabajo no sea sensible a la latencia.
Una posible desventaja del almacenamiento SSD es que requiere más nodos en tus clústeres en función de la cantidad de datos que almacenes. Sin embargo, en la práctica, es posible que necesites esos nodos adicionales para que tus clústeres puedan gestionar el tráfico entrante, no solo para admitir la cantidad de datos que almacenas.
Casos prácticos de almacenamiento en HDD
El almacenamiento en HDD es adecuado para los casos prácticos que cumplen todos los criterios siguientes:
- Tienes previsto almacenar al menos 10 TB de datos.
- No utilizarás los datos para respaldar una aplicación orientada al usuario o sensible a la latencia.
- No tienes previsto habilitar el escalado de nodos al doble.
Tu carga de trabajo se incluye en una de las siguientes categorías:
- Cargas de trabajo por lotes con análisis y escrituras, y no más de lecturas aleatorias ocasionales de un número reducido de filas o lecturas puntuales.
- Archivado de datos, en el que se escriben grandes cantidades de datos y se leen con poca frecuencia.
Por ejemplo, si tienes previsto almacenar un gran volumen de datos históricos de un gran número de dispositivos de teledetección y, a continuación, usar los datos para generar informes diarios, el ahorro de costes del almacenamiento en HDD podría justificar la pérdida de rendimiento. Por otro lado, si tienes previsto usar los datos para mostrar un panel de control en tiempo real, no sería recomendable usar el almacenamiento en HDD, ya que las lecturas serían mucho más frecuentes en este caso y las lecturas que no son análisis son mucho más lentas con el almacenamiento en HDD.
Cambiar entre el almacenamiento SSD y HDD
Cuando creas una instancia de Bigtable, la elección del almacenamiento SSD o HDD para la instancia es permanente. No puedes usar la consolaGoogle Cloud para cambiar el tipo de almacenamiento que se usa en la instancia.
Si quieres cambiar el tipo de almacenamiento en el que se guarda una tabla, usa la función de copias de seguridad:
- Crea o planea usar una instancia que utilice el tipo de almacenamiento que quieras.
- Crea una copia de seguridad de la tabla.
- Restaura la copia de seguridad en una tabla nueva de la otra instancia.
Siguientes pasos
Crea una instancia con almacenamiento SSD o HDD.