Bigtable mit Dataproc

Bigtable ist der NoSQL-Big-Data-Datenbankdienst von Google. Dieselbe Datenbank wird auch für viele der Hauptdienste von Google wie etwa die Google-Suche, Analytics, Maps und Gmail verwendet. Bigtable ist darauf ausgelegt, große Datenmengen bei konstant niedriger Latenz und hohem Durchsatz zu verarbeiten. Daher eignet es sich ideal für operative und analytische Anwendungen wie etwa IoT-Anwendungen, Nutzeranalysen und die Analyse von Finanzdaten.

Bigtable ist eine hervorragende Option für Apache Spark oder Hadoop, die Apache HBase erfordern. Bigtable unterstützt die Apache HBase APIs ab Version 1.0 und 2.0 und bietet einen Bigtable-HBase-Client in Maven, sodass die Verwendung von Bigtable mit Dataproc einfach ist.

Bigtable Spark-Connector verwenden

Mit dem Bigtable Spark-Connector können Sie Daten aus Bigtable lesen und in Bigtable schreiben. Sie können Daten aus Ihrer Spark-Anwendung mit Spark SQL und DataFrames lesen. Für schreibgeschützte Jobs können Sie serverloses Computing von Data Boost verwenden. Data Boost ist für die Leistungsanforderungen von Jobs und Abfragen mit hohem Durchsatz konzipiert. So können Sie vermeiden, dass der Traffic Ihres Anwendungsbereitstellungsclusters beeinträchtigt wird, wenn diese Jobs und Abfragen ausgeführt werden.

Weitere Informationen finden Sie unter Bigtable Spark-Connector verwenden.

Nächste Schritte