Dataproc Metastore サービスを作成するときに、次のいずれかのエンドポイント プロトコルを使用するように選択する必要があります。
- Apache Thrift プロトコル
- gRPC プロトコル
このプロトコルは、Hive Metastore クライアントが Dataproc Metastore サービスに保存されているメタデータにアクセスする方法を定義します。この選択は、サービスに統合して使用できる機能にも影響します。
このページでは、各エンドポイント プロトコルの概念的な違いについて説明します。
Apache Thrift
Apache Thrift プロトコルは、Dataproc Metastore サービスを作成するときに事前選択される以前のデフォルト オプションです。
実装で Kerberos が必要な場合は、このオプションを使用する必要があります。Kerberos が不要な場合は、追加機能にアクセスできる gRPC プロトコルの使用を検討してください。
Thrift エンドポイントを使用する場合は、Thrift インターフェースが接続するポート番号を選択できます。デフォルトでは、ポート番号 9083
が使用されます。
Thrift プロトコルを選択した後
Thrift を使用して Dataproc Metastore を作成したら、Dataproc クラスタまたはセルフマネージド クラスタから接続できます。クラスタは、Dataproc Metastore を Hive メタストアとして使用します。
gRPC
gRPC プロトコルは、モダンでポータブルな高パフォーマンス オプションです。Dataproc Metastore サービスを作成するときに明示的に選択する必要があります。
gRPC プロトコルを選択した場合、後で Thrift に更新することはできません。gRPC から Thrift に移行する場合は、新しい Dataproc Metastore を作成する必要があります。
gRPC エンドポイントを使用する場合、gRPC インターフェースが使用するポート番号を選択することはできません。代わりに、ポート番号 443
がインターフェースに自動的に割り当てられます。
gRPC プロトコルを選択した後
gRPC エンドポイント プロトコルを使用して Dataproc Metastore を作成したら、追加の IAM ロールを付与する必要があります。これで、Dataproc クラスタから接続できるようになります。クラスタは、Dataproc Metastore を Hive メタストアとして使用します。