Quando crei un servizio Dataproc Metastore, devi scegliere di utilizzare uno dei seguenti protocolli di endpoint:
- Il protocollo Apache Thrift
- Il protocollo gRPC
Questo protocollo definisce in che modo i client Hive Metastore accedono ai metadati archiviati nel servizio Dataproc Metastore. Questa scelta può anche influire sulle funzionalità che puoi integrare e utilizzare con il tuo servizio.
Questa pagina illustra le differenze concettuali tra ciascun protocollo di endpoint.
Apache Thrift
Il protocollo Apache Thrift è l'opzione predefinita precedente preselezionata quando crei un servizio Dataproc Metastore.
Se nella tua implementazione è necessario Kerberos, devi utilizzare questa opzione. Se non hai bisogno di Kerberos, ti consigliamo di utilizzare il protocollo gRPC, che fornisce accesso a funzionalità aggiuntive.
Se utilizzi un endpoint Thrift, puoi scegliere il numero di porta a cui si connette l'interfaccia Thrift. Per impostazione predefinita, viene utilizzato il numero di porta 9083
.
Dopo aver scelto il protocollo Thrift
Dopo aver creato un Dataproc Metastore utilizzando Thrift, puoi connetterti da un cluster Dataproc o autonomo. Il cluster utilizzerà quindi Dataproc Metastore come metastore Hive.
gRPC
Il protocollo gRPC è l'opzione moderna, portatile e ad alte prestazioni che devi selezionare esplicitamente quando crei un servizio Dataproc Metastore.
Se scegli il protocollo gRPC, non potrai aggiornarlo a Thrift in un secondo momento. Se vuoi passare da gRPC a Thrift, devi creare un nuovo Dataproc Metastore.
Se utilizzi un endpoint gRPC, non puoi scegliere il numero di porta utilizzato dall'interfaccia gRPC. Al contrario, il numero di porta 443
viene assegnato automaticamente all'interfaccia.
Dopo aver scelto il protocollo gRPC
Dopo aver creato un metastore Dataproc utilizzando il protocollo dell'endpoint gRPC, devi concedere ruoli IAM aggiuntivi. Dopodiché puoi connetterti da un cluster Dataproc. Il cluster utilizzerà quindi Dataproc Metastore come metastore Hive.