Bigtable avec Dataproc

Bigtable est le service de base de données NoSQL big data de Google. Cette base de données est utilisée par de nombreux services principaux de Google, tels que la recherche, Analytics, Maps et Gmail. Bigtable est conçu pour gérer d'importantes charges de travail en offrant constamment une latence faible et un débit élevé. Il s'agit donc d'un outil idéal pour les applications opérationnelles et analytiques, comme l'IoT, les analyses liées aux utilisateurs et les analyses de données financières.

Bigtable est une excellente option pour toutes les opérations basées sur Apache Spark ou Hadoop nécessitant Apache HBase. Bigtable est compatible avec les API Apache HBase 1.0+ et 2.0+, et propose un client HBase Bigtable dans Maven pour utiliser Bigtable avec Dataproc.

Utiliser le connecteur Bigtable Spark

Le connecteur Bigtable Spark vous permet de lire et d'écrire des données depuis et vers Bigtable. Vous pouvez lire des données depuis votre application Spark à l'aide de Spark SQL et des DataFrames. Pour les jobs en lecture seule, vous pouvez utiliser le service de calcul sans serveur Data Boost. Data Boost est conçu pour répondre aux exigences de performances des jobs et des requêtes à haut débit. Il vous permet d'éviter d'impacter le trafic de votre cluster de diffusion d'applications lorsque ces jobs et requêtes sont exécutés.

Pour en savoir plus, consultez Utiliser le connecteur Bigtable Spark.

Étapes suivantes

  • Pour en savoir plus sur l'utilisation de Bigtable, consultez la documentation Bigtable.