Componente Pig facoltativo di Dataproc

Puoi installare componenti aggiuntivi come Apache Pig quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Pig, una piattaforma open source per l'analisi di grandi set di dati.

Installa il componente

Installa il componente quando crei un cluster Dataproc.

Apache Pig è un componente facoltativo nelle versioni immagine di Dataproc 2.3 e successive.

Consulta Versioni di Dataproc supportate per le versioni dei componenti incluse nelle ultime release delle immagini Dataproc.

gcloud

Per creare un cluster Dataproc che includa il componente Pig, utilizza il comando gcloud dataproc clusters create CLUSTER_NAME con il flag --optional-components (utilizzando la versione dell'immagine 2.3 o successive).

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --optional-components=PIG \
    --image-version=2.3 \
    ... other flags

API REST

Il componente Pig può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component nell'ambito di una richiesta clusters.create.

Console

Attiva il componente:

  1. Nella console Google Cloud , apri la pagina Crea un cluster di Dataproc. Il riquadro Configura cluster è selezionato.
  2. Nella sezione Componenti, in Componenti facoltativi, seleziona Pig e altri componenti facoltativi da installare sul cluster.