Modifications importantes dans la version 2.3 :
La version
2.3
est une image légère qui ne contient que les composants de base, ce qui réduit l'exposition aux failles et expositions courantes (CVE). Pour répondre à des exigences de conformité de sécurité plus élevées, utilisez la version d'image2.3
ou ultérieure lorsque vous créez un cluster Dataproc.Si vous choisissez d'installer des composants facultatifs lorsque vous créez un cluster Dataproc avec l'image
2.3
, ils seront téléchargés et installés lors de la création du cluster. Cela peut augmenter le temps de démarrage du cluster. Pour éviter ce délai, vous pouvez créer une image personnalisée avec les composants facultatifs préinstallés. Pour ce faire, exécutezgenerate_custom_image.py
avec l'option--optional-components
.
Remarques :
Voici les composants facultatifs des images 2.3 :
- Apache Flink
- Apache Hive WebHCat
- Apache Hudi
- Apache Iceberg
- Apache Pig
- Delta Lake
- Docker
- Notebook JupyterLab
- Ranger
- Solr
- Bloc-notes Zeppelin
- ZooKeeper
yarn.nodemanager.recovery.enabled
et les journaux d'audit HDFS sont activés par défaut dans les images 2.3.micromamba, au lieu de conda dans les versions d'image précédentes, est installé dans le cadre de l'installation de Python.
Problèmes d'installation de Docker et Zeppelin :
- L'installation échoue si le cluster n'a pas d'accès Internet public. Pour contourner ce problème, créez un cluster qui utilise une image personnalisée avec des composants optionnels préinstallés. Pour ce faire, exécutez
generate_custom_image.py
avec l'indicateur--optional-components
. - L'installation peut échouer si le cluster est associé à une ancienne version d'image sous-mineure : les packages sont installés à la demande à partir de dépôts OSS publics, et il est possible qu'un package ne soit pas disponible en amont pour prendre en charge l'installation.
Pour contourner ce problème, créez un cluster qui utilise une image personnalisée avec des composants facultatifs préinstallés dans l'image personnalisée. Pour ce faire, exécutez
generate_custom_image.py
avec l'option--optional-components
.
- L'installation échoue si le cluster n'a pas d'accès Internet public. Pour contourner ce problème, créez un cluster qui utilise une image personnalisée avec des composants optionnels préinstallés. Pour ce faire, exécutez