Wichtige Änderungen in Version 2.3:
Version
2.3
ist ein schlankes Image, das nur Kernkomponenten enthält. Dadurch wird das Risiko von Common Vulnerabilities and Exposures (CVEs) verringert. Wenn Sie höhere Sicherheitsanforderungen erfüllen müssen, verwenden Sie beim Erstellen eines Dataproc-Clusters die Image-Version2.3
oder höher.Wenn Sie beim Erstellen eines Dataproc-Clusters mit dem
2.3
-Image optionale Komponenten installieren, werden diese während der Clustererstellung heruntergeladen und installiert. Dadurch kann sich die Startzeit des Clusters verlängern. Um diese Verzögerung zu vermeiden, können Sie ein benutzerdefiniertes Image mit den vorinstallierten optionalen Komponenten erstellen. Dazu führen Siegenerate_custom_image.py
mit dem Flag--optional-components
aus.
Hinweise:
Die folgenden Komponenten sind in 2.3-Images optional:
- Apache Flink
- Apache Hive WebHCat
- Apache Hudi
- Apache Iceberg
- Apache Pig
- Delta Lake
- Docker
- JupyterLab-Notebook
- Ranger
- Solr
- Zeppelin-Notebook
- Zookeeper
yarn.nodemanager.recovery.enabled
und HDFS-Audit-Logging sind in Version 2.3-Images standardmäßig aktiviert.micromamba wird anstelle von conda in früheren Image-Versionen als Teil der Python-Installation installiert.
Probleme bei der Docker- und Zeppelin-Installation:
- Die Installation schlägt fehl, wenn der Cluster keinen öffentlichen Internetzugang hat. Als Workaround können Sie einen Cluster erstellen, der ein benutzerdefiniertes Image mit vorinstallierten optionalen Komponenten verwendet. Führen Sie dazu
generate_custom_image.py
mit dem Flag--optional-components
aus. - Die Installation kann fehlschlagen, wenn der Cluster an eine ältere untergeordnete Image-Version angepinnt ist: Pakete werden bei Bedarf aus öffentlichen OSS-Repositories installiert und ein Paket ist möglicherweise nicht upstream verfügbar, um die Installation zu unterstützen.
Als Workaround können Sie einen Cluster erstellen, der ein benutzerdefiniertes Image mit vorinstallierten optionalen Komponenten verwendet. Führen Sie dazu
generate_custom_image.py
mit dem--optional-components
-Flag aus.
- Die Installation schlägt fehl, wenn der Cluster keinen öffentlichen Internetzugang hat. Als Workaround können Sie einen Cluster erstellen, der ein benutzerdefiniertes Image mit vorinstallierten optionalen Komponenten verwendet. Führen Sie dazu