Puoi installare componenti aggiuntivi come Apache Pig quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Pig, una piattaforma open source per l'analisi di grandi set di dati.
Installa il componente
Installa il componente quando crei un cluster Dataproc.
Apache Pig è un componente facoltativo nelle versioni immagine di Dataproc 2.3
e successive.
Consulta Versioni di Dataproc supportate per le versioni dei componenti incluse nelle ultime release delle immagini Dataproc.
gcloud
Per creare un cluster Dataproc che includa il componente Pig, utilizza il comando
gcloud dataproc clusters create CLUSTER_NAME
con il flag --optional-components
(utilizzando la versione dell'immagine
2.3 o successive).
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ --optional-components=PIG \ --image-version=2.3 \ ... other flags
API REST
Il componente Pig può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component nell'ambito di una richiesta clusters.create.
Console
Attiva il componente:
- Nella console Google Cloud , apri la pagina Crea un cluster di Dataproc. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti, in Componenti facoltativi, seleziona Pig e altri componenti facoltativi da installare sul cluster.