Acerca de los protocolos de extremo de Dataproc Metastore

Cuando creas un servicio de Dataproc Metastore, debes elegir usar uno de los siguientes protocolos de extremo:

  • El protocolo Apache Thrift
  • El protocolo gRPC

Este protocolo define cómo tus clientes de Hive Metastore acceden a los metadatos almacenados en tu servicio de Dataproc Metastore. Esta elección también puede afectar las funciones que puedes integrar y usar con tu servicio.

En esta página, se explican las diferencias conceptuales entre cada uno de los protocolos de extremos.

Apache Thrift

El protocolo Apache Thrift es la opción predeterminada heredada que se selecciona de forma previa cuando creas un servicio de Dataproc Metastore.

Si necesitas Kerberos en tu implementación, debes usar esta opción. Si no necesitas Kerberos, considera usar el protocolo gRPC, que proporciona acceso a funciones adicionales.

Si usas un extremo Thrift, puedes elegir el número de puerto al que se conecta la interfaz de Thrift. De forma predeterminada, se usa el número de puerto 9083.

Después de elegir el protocolo Thrift

Después de crear un Dataproc Metastore con Thrift, puedes conectarte a él desde un clúster de Dataproc o un clúster autoadministrado. Luego, tu clúster usará Dataproc Metastore como su almacén de metadatos de Hive.

gRPC

El protocolo gRPC es la opción moderna, portátil y de alto rendimiento que debes seleccionar de forma explícita cuando creas un servicio de Dataproc Metastore.

Si eliges el protocolo gRPC, no podrás actualizarlo a Thrift más adelante. Si deseas pasar de gRPC a Thrift, debes crear un nuevo Dataproc Metastore.

Si usas un extremo gRPC, no puedes elegir el número de puerto que usa la interfaz de gRPC. En su lugar, el número de puerto 443 se asigna automáticamente a tu interfaz.

Después de elegir el protocolo gRPC

Después de crear un Dataproc Metastore con el protocolo de extremo de gRPC, debes otorgar roles de IAM adicionales. Luego, puedes conectarte a él desde un clúster de Dataproc. Luego, tu clúster usa Dataproc Metastore como su almacén de metadatos de Hive.

¿Qué sigue?