Komponen Pig opsional Dataproc

Anda dapat menginstal komponen tambahan seperti Apache Pig saat membuat cluster Dataproc menggunakan fitur Komponen opsional. Halaman ini menjelaskan komponen Pig, platform open source untuk menganalisis set data besar.

Menginstal komponen

Instal komponen saat Anda membuat cluster Dataproc.

Apache Pig adalah komponen opsional di versi image Dataproc 2.3 dan yang lebih baru.

Lihat Versi Dataproc yang didukung untuk versi komponen yang disertakan dalam rilis image Dataproc terbaru.

gcloud

Untuk membuat cluster Dataproc yang menyertakan komponen Pig, gunakan perintah gcloud dataproc clusters create CLUSTER_NAME dengan flag --optional-components (menggunakan versi image 2.3 atau yang lebih baru).

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --optional-components=PIG \
    --image-version=2.3 \
    ... other flags

REST API

Komponen Pig dapat ditentukan melalui Dataproc API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.

Konsol

Aktifkan komponen:

  1. Di konsol Google Cloud , buka halaman Dataproc Create a cluster. Panel Set up cluster dipilih.
  2. Di bagian Components, di bagian Optional components, pilih Pig dan komponen opsional lainnya untuk diinstal di cluster Anda.