Componente HBase opcional de Dataproc

La instalación del componente opcional de HBase está limitada a los clústeres de Dataproc creados con la versión de imagen 1.5 o 2.0.

Aunque Google Cloud ofrece muchos servicios que te permiten desplegar Apache HBase autogestionado, Bigtable suele ser la mejor opción, ya que proporciona una API abierta con HBase y portabilidad de cargas de trabajo. Las tablas de la base de datos de HBase se pueden migrar a Bigtable para gestionar los datos subyacentes, mientras que las aplicaciones que antes interactuaban con HBase, como Spark, pueden permanecer en Dataproc y conectarse de forma segura con Bigtable. En esta guía, se describen los pasos generales para empezar a usar Bigtable y se proporcionan referencias para migrar datos a Bigtable desde implementaciones de HBase de Dataproc.

Empezar a usar Bigtable

Cloud Bigtable es una plataforma NoSQL de alto rendimiento y escalabilidad que ofrece compatibilidad con el cliente de la API Apache HBase y portabilidad para las cargas de trabajo de HBase. El cliente es compatible con las versiones 1.x y 2.x de la API de HBase y se puede incluir en la aplicación para leer y escribir en Bigtable. Las aplicaciones de HBase pueden añadir la biblioteca de cliente de HBase de Bigtable para leer y escribir datos almacenados en Bigtable.

Consulta Bigtable y la API de HBase para obtener más información sobre cómo configurar tu aplicación de HBase con Bigtable.

Crear un clúster de Bigtable

Para empezar a usar Bigtable, crea un clúster y tablas para almacenar datos que antes estaban en HBase. Sigue los pasos que se indican en la documentación de Bigtable para crear una instancia, un clúster y tablas con el mismo esquema que las tablas de HBase. Para crear tablas automáticamente a partir de DDLs de tablas de HBase, consulta la herramienta de traducción de esquemas.

Abre la instancia de Bigtable en la Google Cloud consola para ver la tabla y los gráficos de monitorización del lado del servidor, como las filas por segundo, la latencia y el rendimiento, y así gestionar la tabla recién aprovisionada. Para obtener más información, consulta Monitorización.

Migrar datos de Dataproc a Bigtable

Una vez que hayas creado las tablas en Bigtable, puedes importar y validar tus datos siguiendo las instrucciones de Migrar HBase a Google Cloud Bigtable. Una vez que hayas migrado los datos, puedes actualizar las aplicaciones para que envíen lecturas y escrituras a Bigtable.

Siguientes pasos