Bigtable con Dataproc

Bigtable es el servicio de base de datos NoSQL de Big Data de Google. Es la misma base de datos que utilizan muchos de los principales servicios de Google, como la Búsqueda, Analytics, Maps y Gmail. Bigtable se ha diseñado para gestionar cargas de trabajo masivas con una latencia baja y un rendimiento alto constantes, por lo que es una opción excelente para aplicaciones analíticas y operativas, como las de Internet de las cosas, analíticas de usuarios y analíticas de datos financieros.

Bigtable es una opción excelente para cualquier uso de Apache Spark o Hadoop que requiera Apache HBase. Bigtable admite las APIs Apache HBase 1.0 y 2.0, y ofrece un cliente de HBase de Bigtable en Maven para usar Bigtable con Dataproc.

Usar el conector de Bigtable para Spark

El conector de Bigtable para Spark te permite leer y escribir datos de Bigtable. Puedes leer datos desde tu aplicación de Spark con Spark SQL y DataFrames. En el caso de las tareas de solo lectura, puedes usar la computación sin servidor de Data Boost. Data Boost se ha diseñado para cumplir los requisitos de rendimiento de las tareas y las consultas de alto rendimiento, y te permite evitar que el tráfico de tu clúster de servicio de aplicaciones se vea afectado cuando se ejecuten esas tareas y consultas.

Para obtener más información, consulta Usar el conector de Spark de Bigtable.

Siguientes pasos

  • Para obtener más información sobre el uso de Bigtable, consulta la documentación de Bigtable.