Mudanças importantes na versão 2.3:
A versão
2.3
é uma imagem leve que contém apenas componentes principais, reduzindo a exposição a vulnerabilidades e exposições comuns (CVEs). Para requisitos de conformidade de segurança mais altos, use a versão da imagem2.3
ou mais recente ao criar um cluster do Dataproc.Se você optar por instalar componentes opcionais ao criar um cluster do Dataproc com a imagem
2.3
, eles serão baixados e instalados durante a criação do cluster. Isso pode aumentar o tempo de inicialização do cluster. Para evitar esse atraso, crie uma imagem personalizada com os componentes opcionais pré-instalados. Para isso, executegenerate_custom_image.py
com a flag--optional-components
.
Observações:
Estes são os componentes opcionais nas imagens 2.3:
- Apache Flink
- Apache Hive WebHCat
- Apache Hudi
- Apache Iceberg
- Apache Pig
- Delta Lake
- Docker
- Notebook do JupyterLab
- Ranger
- Solr
- Zeppelin Notebook
- Zookeeper
O
yarn.nodemanager.recovery.enabled
e o HDFS Audit Logging são ativados por padrão nas imagens 2.3.O micromamba, em vez do conda nas versões de imagem anteriores, é instalado como parte da instalação do Python.
Problemas de instalação do Docker e do Zeppelin:
- A instalação falha se o cluster não tiver acesso público à Internet. Como solução alternativa, crie um cluster que use uma imagem personalizada com componentes opcionais pré-instalados. Para isso, execute
generate_custom_image.py
com a flag--optional-components
. - A instalação pode falhar se o cluster estiver fixado em uma versão mais antiga de imagem subalterna. Os pacotes são instalados sob demanda de repositórios OSS públicos, e um pacote pode não estar disponível upstream para oferecer suporte à instalação.
Como alternativa, crie um cluster que use uma imagem personalizada com componentes opcionais pré-instalados. Para fazer isso, execute
generate_custom_image.py
com a flag--optional-components
.
- A instalação falha se o cluster não tiver acesso público à Internet. Como solução alternativa, crie um cluster que use uma imagem personalizada com componentes opcionais pré-instalados. Para isso, execute