關於 Dataproc Metastore 端點通訊協定

建立 Dataproc Metastore 服務時,您必須選擇使用下列任一端點通訊協定:

  • Apache Thrift 通訊協定
  • gRPC 通訊協定

這個通訊協定定義了 Hive Metastore 用戶端存取 Dataproc Metastore 服務中儲存的中繼資料的方式。這項選擇也會影響您可與服務整合及使用的功能。

本頁面說明各端點通訊協定之間的概念差異。

Apache Thrift

Apache Thrift 通訊協定是舊版預設選項,在建立 Dataproc Metastore 服務時會預先選取。

如果您在實作中需要 Kerberos,請使用這個選項。如果您不需要 Kerberos,建議使用 gRPC 通訊協定,因為這可讓您存取其他功能。

如果您使用 Thrift 端點,可以選擇 Thrift 介面連線的通訊埠號碼。根據預設,系統會使用通訊埠號碼 9083

選擇 Thrift 通訊協定後

使用 Thrift 建立 Dataproc Metastore 後,您可以從 Dataproc 叢集或自行管理的叢集連線至該資料庫。叢集就會使用 Dataproc Metastore 做為 Hive 中繼存放區。

gRPC

gRPC 通訊協定是新式、可移植且效能極佳的選項,您必須在建立 Dataproc Metastore 服務時明確選取。

如果您選擇 gRPC 通訊協定,就無法在日後將其更新為 Thrift。如要從 gRPC 改用 Thrift,您必須建立新的 Dataproc Metastore。

如果您使用 gRPC 端點,就無法選擇 gRPC 介面使用的通訊埠號碼。而是將通訊埠號碼 443 自動指派給介面。

選擇 gRPC 通訊協定後

使用 gRPC 端點通訊協定建立 Dataproc Metastore 後,您必須授予其他 IAM 角色。之後,您可以透過 Dataproc 叢集連線至該資料表。叢集就會使用 Dataproc Metastore 做為 Hive 中繼存放區。

後續步驟