Bigtable con Dataproc

Bigtable es el servicio de base de datos NoSQL de Google para trabajar con macrodatos. Es la misma base de datos que utilizan muchos de los servicios centrales de Google, como la Búsqueda, Analytics, Maps y Gmail. Bigtable se diseñó para controlar grandes cargas de trabajo con baja latencia y alto rendimiento de forma uniforme, por lo que es una excelente opción para aplicaciones tanto operativas como analíticas, como IoT, estadísticas de usuarios y análisis de datos financieros.

Bigtable es una opción excelente para cualquier uso de Apache Spark o Hadoop que requiera Apache HBase. Bigtable admite las APIs de Apache HBase 1.0+ y 2.0+, y ofrece un cliente de Bigtable HBase en Maven para usar Bigtable con Dataproc.

Usa el conector de Bigtable Spark

El conector de Bigtable para Spark te permite leer y escribir datos desde y hacia Bigtable. Puedes leer datos desde tu aplicación de Spark con Spark SQL y DataFrames. Para los trabajos de solo lectura, puedes usar la computación sin servidores de Data Boost. Data Boost está diseñado para los requisitos de rendimiento de los trabajos y las consultas de alta capacidad de procesamiento, y te permite evitar afectar el tráfico del clúster de servicio de tu aplicación cuando se ejecutan esos trabajos y consultas.

Para obtener más información, consulta Usa el conector de Bigtable Spark.

¿Qué sigue?

  • Para obtener más información sobre cómo usar Bigtable, consulta la documentación de Bigtable.