Modifiche importanti nella versione 2.3:
La versione
2.3
è un'immagine leggera che contiene solo i componenti principali, riducendo l'esposizione alle vulnerabilità ed esposizioni comuni (CVE). Per requisiti di conformità alla sicurezza più elevati, utilizza la versione dell'immagine2.3
o successive quando crei un cluster Dataproc.Se scegli di installare componenti facoltativi quando crei un cluster Dataproc con l'immagine
2.3
, questi verranno scaricati e installati durante la creazione del cluster. Ciò potrebbe aumentare il tempo di avvio del cluster. Per evitare questo ritardo, puoi creare un'immagine personalizzata con i componenti facoltativi preinstallati. A questo scopo, eseguigenerate_custom_image.py
con il flag--optional-components
.
Note:
Di seguito sono riportati i componenti facoltativi nelle immagini 2.3:
- Apache Flink
- Apache Hive WebHCat
- Apache Hudi
- Apache Iceberg
- Apache Pig
- Delta Lake
- Docker
- Blocco note JupyterLab
- Ranger
- Solr
- Zeppelin Notebook
- Zookeeper
yarn.nodemanager.recovery.enabled
e l'audit logging HDFS sono abilitati per impostazione predefinita nelle immagini 2.3.micromamba, anziché conda nelle versioni precedenti dell'immagine, viene installato come parte dell'installazione di Python.
Problemi di installazione di Docker e Zeppelin:
- L'installazione non va a buon fine se il cluster non ha accesso a internet pubblico. Come
soluzione alternativa, crea un cluster che utilizzi un'immagine personalizzata con i componenti
opzionali preinstallati. Per farlo, esegui
generate_custom_image.py
con il flag--optional-components
. - L'installazione può non riuscire se il cluster è bloccato su una versione secondaria precedente dell'immagine: i pacchetti vengono installati su richiesta dai repository OSS pubblici e un pacchetto potrebbe non essere disponibile upstream per supportare l'installazione.
Come soluzione alternativa, crea un cluster che utilizzi un'immagine personalizzata con componenti
facoltativi preinstallati nell'immagine personalizzata. Per farlo, esegui
generate_custom_image.py
con il flag--optional-components
.
- L'installazione non va a buon fine se il cluster non ha accesso a internet pubblico. Come
soluzione alternativa, crea un cluster che utilizzi un'immagine personalizzata con i componenti
opzionali preinstallati. Per farlo, esegui