Acerca de los protocolos de endpoint de Dataproc Metastore

Cuando creas un servicio de Dataproc Metastore, debes elegir uno de los siguientes protocolos de endpoint:

  • Protocolo Apache Thrift
  • El protocolo gRPC

Este protocolo define cómo acceden tus clientes de Hive Metastore a los metadatos almacenados en tu servicio Dataproc Metastore. Esta elección también puede afectar a las funciones que puedes integrar y usar con tu servicio.

En esta página se explican las diferencias conceptuales entre cada uno de los protocolos de endpoint.

Apache Thrift

El protocolo Apache Thrift es la opción predeterminada antigua que se selecciona automáticamente al crear un servicio de Dataproc Metastore.

Si necesitas Kerberos en tu implementación, debes usar esta opción. Si no necesitas Kerberos, te recomendamos que uses el protocolo gRPC, que proporciona acceso a funciones adicionales.

Si usas un endpoint de Thrift, puedes elegir el número de puerto al que se conecta la interfaz de Thrift. De forma predeterminada, se usa el número de puerto 9083.

Después de elegir el protocolo Thrift

Una vez que hayas creado un metastore de Dataproc con Thrift, podrás conectarte a él desde un clúster de Dataproc o un clúster autogestionado. El clúster usará Dataproc Metastore como almacén de metadatos de Hive.

gRPC

El protocolo gRPC es la opción moderna, portátil y de alto rendimiento que debes seleccionar explícitamente al crear un servicio de Dataproc Metastore.

Si eliges el protocolo gRPC, no podrás cambiarlo a Thrift más adelante. Si quieres pasar de gRPC a Thrift, debes crear un nuevo Dataproc Metastore.

Si utilizas un endpoint de gRPC, no puedes elegir el número de puerto que usa la interfaz de gRPC. En su lugar, el número de puerto 443 se asigna automáticamente a tu interfaz.

.

Después de elegir el protocolo gRPC

Después de crear un metastore de Dataproc con el protocolo de endpoint gRPC, debes conceder roles de gestión de identidades y accesos adicionales. Después, puedes conectarte a él desde un clúster de Dataproc. El clúster usará Dataproc Metastore como almacén de metadatos de Hive.

Siguientes pasos