À propos des protocoles de point de terminaison Dataproc Metastore

Lorsque vous créez un service Dataproc Metastore, vous devez choisir l'un des protocoles de point de terminaison suivants:

  • Protocole Apache Thrift
  • Protocole gRPC

Ce protocole définit la manière dont vos clients Hive Metastore accèdent aux métadonnées stockées dans votre service Dataproc Metastore. Ce choix peut également avoir une incidence sur les fonctionnalités que vous pouvez intégrer et utiliser avec votre service.

Cette page explique les différences conceptuelles entre chacun des protocoles de point de terminaison.

Apache Thrift

Le protocole Apache Thrift est l'ancienne option par défaut présélectionnée lorsque vous créez un service Dataproc Metastore.

Si vous avez besoin de Kerberos dans votre implémentation, utilisez cette option. Si vous n'avez pas besoin de Kerberos, envisagez d'utiliser le protocole gRPC, qui permet d'accéder à des fonctionnalités supplémentaires.

Si vous utilisez un point de terminaison Thrift, vous pouvez choisir le numéro de port auquel l'interface Thrift se connecte. Par défaut, le numéro de port 9083 est utilisé.

Après avoir choisi le protocole Thrift

Après avoir créé un métastore Dataproc à l'aide de Thrift, vous pouvez vous y connecter à partir d'un cluster Dataproc ou d'un cluster autogéré. Votre cluster utilise ensuite Dataproc Metastore comme métastore Hive.

gRPC

Le protocole gRPC est l'option moderne, portable et hautes performances que vous devez sélectionner explicitement lorsque vous créez un service Dataproc Metastore.

Si vous choisissez le protocole gRPC, vous ne pourrez pas le mettre à jour vers Thrift ultérieurement. Si vous souhaitez passer de gRPC à Thrift, vous devez créer un autre Dataproc Metastore.

Si vous utilisez un point de terminaison gRPC, vous ne pouvez pas choisir le numéro de port utilisé par l'interface gRPC. À la place, le numéro de port 443 est automatiquement attribué à votre interface.

Après avoir choisi le protocole gRPC

Après avoir créé un métastore Dataproc à l'aide du protocole de point de terminaison gRPC, vous devez accorder des rôles IAM supplémentaires. Vous pouvez ensuite vous y connecter à partir d'un cluster Dataproc. Votre cluster utilise ensuite Dataproc Metastore comme métastore Hive.

Étape suivante