À propos des protocoles de point de terminaison Dataproc Metastore

Lorsque vous créez un service Dataproc Metastore, vous devez choisir d'utiliser l'un des protocoles de point de terminaison suivants :

  • Protocole Apache Thrift
  • Protocole gRPC

Ce protocole définit la manière dont vos clients Hive Metastore accèdent aux métadonnées stockées dans votre service Dataproc Metastore. Ce choix peut également affecter les fonctionnalités que vous pouvez intégrer et utiliser avec votre service.

Cette page explique les différences conceptuelles entre chacun des protocoles de point de terminaison.

Apache Thrift

Le protocole Apache Thrift est l'ancienne option par défaut qui est présélectionnée lorsque vous créez un service Dataproc Metastore.

Si vous avez besoin de Kerberos dans votre implémentation, vous devez utiliser cette option. Si vous n'avez pas besoin de Kerberos, envisagez d'utiliser le protocole gRPC, qui permet d'accéder à des fonctionnalités supplémentaires.

Si vous utilisez un point de terminaison Thrift, vous pouvez choisir le numéro de port auquel l'interface Thrift se connecte. Par défaut, le numéro de port 9083 est utilisé.

Après avoir choisi le protocole Thrift

Après avoir créé un Dataproc Metastore à l'aide de Thrift, vous pouvez vous y connecter depuis un cluster Dataproc ou un cluster autogéré. Votre cluster utilise ensuite Dataproc Metastore comme métastore Hive.

gRPC

Le protocole gRPC est une option moderne, portable et performante que vous devez sélectionner explicitement lorsque vous créez un service Dataproc Metastore.

Si vous choisissez le protocole gRPC, vous ne pourrez pas le remplacer par Thrift ultérieurement. Si vous souhaitez passer de gRPC à Thrift, vous devez créer un autre Dataproc Metastore.

Si vous utilisez un point de terminaison gRPC, vous ne pouvez pas choisir le numéro de port utilisé par l'interface gRPC. Au lieu de cela, le numéro de port 443 est automatiquement attribué à votre interface.

Après avoir choisi le protocole gRPC

Après avoir créé un métastore Dataproc à l'aide du protocole de point de terminaison gRPC, vous devez accorder des rôles IAM supplémentaires. Vous pourrez ensuite vous y connecter depuis un cluster Dataproc. Votre cluster utilise ensuite Dataproc Metastore comme métastore Hive.

Étapes suivantes