Dataproc Metastore エンドポイント プロトコルについて

Dataproc Metastore サービスを作成するときに、次のいずれかのエンドポイント プロトコルを使用するように選択する必要があります。

  • Apache Thrift プロトコル
  • gRPC プロトコル

このプロトコルは、Hive Metastore クライアントが Dataproc Metastore サービスに保存されているメタデータにアクセスする方法を定義します。この選択は、サービスに統合して使用できる機能にも影響します。

このページでは、各エンドポイント プロトコルの概念的な違いについて説明します。

Apache Thrift

Apache Thrift プロトコルは、Dataproc Metastore サービスを作成するときに事前選択される以前のデフォルト オプションです。

実装で Kerberos が必要な場合は、このオプションを使用する必要があります。Kerberos が不要な場合は、追加機能にアクセスできる gRPC プロトコルの使用を検討してください。

Thrift エンドポイントを使用する場合は、Thrift インターフェースが接続するポート番号を選択できます。デフォルトでは、ポート番号 9083 が使用されます。

Thrift プロトコルを選択した後

Thrift を使用して Dataproc Metastore を作成したら、Dataproc クラスタまたはセルフマネージド クラスタから接続できます。クラスタは、Dataproc Metastore を Hive メタストアとして使用します。

gRPC

gRPC プロトコルは、モダンでポータブルな高パフォーマンス オプションです。Dataproc Metastore サービスを作成するときに明示的に選択する必要があります。

gRPC プロトコルを選択した場合、後で Thrift に更新することはできません。gRPC から Thrift に移行する場合は、新しい Dataproc Metastore を作成する必要があります。

gRPC エンドポイントを使用する場合、gRPC インターフェースが使用するポート番号を選択することはできません。代わりに、ポート番号 443 がインターフェースに自動的に割り当てられます。

gRPC プロトコルを選択した後

gRPC エンドポイント プロトコルを使用して Dataproc Metastore を作成したら、追加の IAM ロールを付与する必要があります。これで、Dataproc クラスタから接続できるようになります。クラスタは、Dataproc Metastore を Hive メタストアとして使用します。

次のステップ