Wenn Sie einen Dataproc Metastore-Dienst erstellen, müssen Sie eines der folgenden Endpunktprotokolle auswählen:
- Das Apache Thrift-Protokoll
- Das gRPC-Protokoll
Dieses Protokoll definiert, wie Ihre Hive-Metastore-Clients auf Metadaten zugreifen, die in Ihrem Dataproc Metastore-Dienst gespeichert sind. Diese Entscheidung kann sich auch auf die Funktionen auswirken, die Sie in Ihren Dienst einbinden und mit ihm verwenden können.
Auf dieser Seite werden die konzeptionellen Unterschiede zwischen den einzelnen Endpunktprotokollen erläutert.
Apache Thrift
Das Apache Thrift-Protokoll ist die alte Standardoption, die beim Erstellen eines Dataproc Metastore-Dienstes vorausgewählt ist.
Wenn Sie Kerberos in Ihrer Implementierung benötigen, sollten Sie diese Option verwenden. Wenn Sie Kerberos nicht benötigen, sollten Sie das gRPC-Protokoll verwenden, das Zugriff auf zusätzliche Funktionen bietet.
Wenn Sie einen Thrift-Endpunkt verwenden, können Sie die Portnummer auswählen, mit der die Thrift-Schnittstelle verbunden wird. Standardmäßig wird die Portnummer 9083
verwendet.
Nachdem Sie das Thrift-Protokoll ausgewählt haben
Nachdem Sie einen Dataproc Metastore mit Thrift erstellt haben, können Sie eine Verbindung zu ihm über einen Dataproc-Cluster oder einen selbstverwalteten Cluster herstellen. Ihr Cluster verwendet dann Dataproc Metastore als Hive-Metastore.
gRPC
Das gRPC-Protokoll ist die moderne, portable und leistungsstarke Option, die Sie beim Erstellen eines Dataproc Metastore-Dienstes explizit auswählen müssen.
Wenn Sie das gRPC-Protokoll auswählen, können Sie es später nicht mehr auf Thrift umstellen. Wenn Sie von gRPC zu Thrift wechseln möchten, müssen Sie einen neuen Dataproc Metastore erstellen.
Wenn Sie einen gRPC-Endpunkt verwenden, können Sie die Portnummer, die von der gRPC-Schnittstelle verwendet wird, nicht auswählen. Stattdessen wird Ihrem Interface automatisch die Portnummer 443
zugewiesen.
Nachdem Sie das gRPC-Protokoll ausgewählt haben
Nachdem Sie einen Dataproc Metastore mit dem gRPC-Endpunktprotokoll erstellt haben, müssen Sie zusätzliche IAM-Rollen zuweisen. Anschließend können Sie eine Verbindung zu dem Dienst über einen Dataproc-Cluster herstellen. Ihr Cluster verwendet dann Dataproc Metastore als Hive-Metastore.