Saat membuat layanan Dataproc Metastore, Anda harus memilih untuk menggunakan salah satu protokol endpoint berikut:
- Protokol Apache Thrift
- Protokol gRPC
Protokol ini menentukan cara klien Hive Metastore Anda mengakses metadata yang disimpan di layanan Dataproc Metastore Anda. Pilihan ini juga dapat memengaruhi fitur yang dapat Anda integrasikan dan gunakan dengan layanan Anda.
Halaman ini menjelaskan perbedaan konseptual antara setiap protokol endpoint.
Apache Thrift
Protokol Apache Thrift adalah opsi default lama yang telah dipilih sebelumnya saat Anda membuat layanan Dataproc Metastore.
Jika memerlukan Kerberos dalam penerapan, Anda harus menggunakan opsi ini. Jika Anda tidak memerlukan Kerberos, pertimbangkan untuk menggunakan protokol gRPC, yang memberikan akses ke fitur tambahan.
Jika menggunakan endpoint Thrift, Anda dapat memilih nomor port yang terhubung ke antarmuka Thrift. Secara default, nomor port 9083
digunakan.
Setelah memilih protokol Thrift
Setelah membuat Dataproc Metastore menggunakan Thrift, Anda dapat terhubung ke layanan tersebut dari cluster Dataproc atau cluster yang dikelola sendiri. Cluster Anda kemudian menggunakan Dataproc Metastore sebagai metastore Hive-nya.
gRPC
Protokol gRPC adalah opsi modern, portabel, dan berperforma tinggi yang harus Anda pilih secara eksplisit saat membuat layanan Dataproc Metastore.
Jika memilih protokol gRPC, Anda tidak dapat mengupdatenya ke Thrift di lain waktu. Jika ingin beralih dari gRPC ke Thrift, Anda harus membuat Dataproc Metastore baru.
Jika menggunakan endpoint gRPC, Anda tidak dapat memilih nomor port yang digunakan antarmuka gRPC. Sebagai gantinya, nomor port 443
akan otomatis ditetapkan ke antarmuka Anda.
Setelah memilih protokol gRPC
Setelah membuat Dataproc Metastore menggunakan protokol endpoint gRPC, Anda harus memberikan peran IAM tambahan. Setelah itu, Anda dapat terhubung ke cluster tersebut dari cluster Dataproc. Cluster Anda kemudian menggunakan Dataproc Metastore sebagai metastore Hive-nya.