Dataproc 選用 HBase 元件

選用 HBase 元件的安裝作業僅限於使用 1.52.0 映像檔版本建立的 Dataproc 叢集。

雖然 Google Cloud 提供許多服務,可讓您部署自行管理的 Apache HBase,但Bigtable 通常是最佳選擇,因為它提供 HBase 開放式 API 和工作負載可攜性。您可以將 HBase 資料庫資料表遷移至 Bigtable,以便管理底層資料。而先前與 HBase 互通的應用程式 (例如 Spark) 則可保留在 Dataproc 上,並安全地連線至 Bigtable。本指南將概略說明如何開始使用 Bigtable,並提供參考資料,說明如何將資料從 Dataproc HBase 部署遷移至 Bigtable。

開始使用 Bigtable

Cloud Bigtable 是可擴充且效能極佳的 NoSQL 平台,可為 HBase 工作負載提供 Apache HBase API 用戶端相容性和可攜性。用戶端與 HBase API 1.x 和 2.x 版本相容,且可與現有應用程式搭配使用,讀取及寫入 Bigtable。現有的 HBase 應用程式可以新增 Bigtable HBase 用戶端程式庫,讀取及寫入儲存在 Bigtable 中的資料。

如要進一步瞭解如何使用 Bigtable 設定 HBase 應用程式,請參閱「Bigtable 和 HBase API」。

建立 Bigtable 叢集

您可以建立叢集和資料表,用於儲存先前儲存在 HBase 中的資料,以便開始使用 Bigtable。請按照 Bigtable 說明文件中的步驟,建立執行個體、叢集和資料表,並使用與 HBase 資料表相同的結構定義。如要自動建立 HBase 資料表 DDL 的資料表,請參閱結構定義轉譯工具

在 Google Cloud 主控台中開啟 Bigtable 執行個體,即可查看資料表和伺服器端監控圖表 (包括每秒資料列、延遲時間和傳輸量),以便管理新佈建的資料表。詳情請參閱「監控」。

將資料從 Dataproc 遷移至 Bigtable

在 Bigtable 中建立資料表後,您可以按照「將 HBase 遷移至 Bigtable」中的指示,匯入及驗證資料。 Google Cloud 遷移資料後,您可以更新應用程式,將讀取和寫入作業傳送至 Bigtable。

後續步驟