Anda dapat menginstal komponen tambahan seperti Apache Pig saat membuat cluster Dataproc menggunakan fitur Komponen opsional. Halaman ini menjelaskan komponen Pig, platform open source untuk menganalisis set data besar.
Menginstal komponen
Instal komponen saat Anda membuat cluster Dataproc.
Apache Pig adalah komponen opsional di versi image Dataproc 2.3
dan yang lebih baru.
Lihat Versi Dataproc yang didukung untuk versi komponen yang disertakan dalam rilis image Dataproc terbaru.
gcloud
Untuk membuat cluster Dataproc yang menyertakan komponen Pig, gunakan perintah
gcloud dataproc clusters create CLUSTER_NAME
dengan flag --optional-components
(menggunakan versi image 2.3 atau yang lebih baru).
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ --optional-components=PIG \ --image-version=2.3 \ ... other flags
REST API
Komponen Pig dapat ditentukan melalui Dataproc API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.
Konsol
Aktifkan komponen:
- Di konsol Google Cloud , buka halaman Dataproc Create a cluster. Panel Set up cluster dipilih.
- Di bagian Components, di bagian Optional components, pilih Pig dan komponen opsional lainnya untuk diinstal di cluster Anda.