Die Installation der optionalen HBase-Komponente ist auf Dataproc-Cluster beschränkt, die mit der Image-Version 1.5 oder 2.0 erstellt wurden.
Google Cloud bietet viele Dienste, mit denen Sie selbstverwaltetes Apache HBase bereitstellen können. Bigtable ist jedoch oft die beste Option, da es eine offene API mit HBase und Workload-Portabilität bietet. HBase-Datenbanktabellen können zur Verwaltung der zugrunde liegenden Daten zu Bigtable migriert werden. Anwendungen, die zuvor mit HBase interagieren, z. B. Spark, können in Dataproc verbleiben und eine sichere Verbindung zu Bigtable herstellen. In diesem Leitfaden finden Sie eine allgemeine Anleitung für den Einstieg in Bigtable und Informationen zum Migrieren von Daten aus Dataproc-HBase-Bereitstellungen zu Bigtable.
Erste Schritte mit Bigtable
Cloud Bigtable ist eine hoch skalierbare und leistungsstarke NoSQL-Plattform, die Apache HBase API-Clientkompatibilität und Portabilität für HBase-Arbeitslasten bietet. Der Client ist mit den HBase API-Versionen 1.x und 2.x kompatibel und kann in der vorhandenen Anwendung enthalten sein, um Daten in Bigtable zu lesen und zu schreiben. Bestehende HBase-Anwendungen können die Bigtable HBase-Clientbibliothek hinzufügen, um in Bigtable gespeicherte Daten zu lesen und zu schreiben.
Weitere Informationen zum Konfigurieren Ihrer HBase-Anwendung mit Bigtable finden Sie unter Bigtable und die HBase API.
Bigtable-Cluster erstellen
Sie können mit Bigtable beginnen, indem Sie einen Cluster und Tabellen zum Speichern von Daten erstellen, die zuvor in HBase gespeichert waren. Folgen Sie der Anleitung in der Bigtable-Dokumentation zum Erstellen einer Instanz, eines Clusters und Tabellen mit demselben Schema wie die HBase-Tabellen. Informationen zum automatischen Erstellen von Tabellen aus HBase-Tabellen-DDLs finden Sie im Schemaübersetzungstool.
Öffnen Sie die Bigtable-Instanz in der Google Cloud Console, um die Tabelle und serverseitige Überwachungsdiagramme wie Zeilen pro Sekunde, Latenz und Durchsatz aufzurufen und die neu bereitgestellte Tabelle zu verwalten. Weitere Informationen finden Sie unter Monitoring.
Daten von Dataproc zu Bigtable migrieren
Nachdem Sie die Tabellen in Bigtable erstellt haben, können Sie Ihre Daten importieren und validieren. Folgen Sie dazu der Anleitung unter HBase in Google Cloud zu Bigtable migrieren. Nachdem Sie die Daten migriert haben, können Sie Anwendungen so aktualisieren, dass Lese- und Schreibvorgänge an Bigtable gesendet werden.
Nächste Schritte
- Unter Wordcount Spark-Beispiele finden Sie Informationen zum Ausführen von Spark mit Bigtable.
- Informationen zu den Optionen für die Onlinemigration mit Live-Replikation von HBase zu Bigtable
- Weitere Vorteile erfahren Sie im Video So modernisierte Box seine NoSQL-Datenbanken.