Puedes instalar componentes adicionales, como Zeppelin, al crear un clúster de Dataproc mediante la función Componentes opcionales. En esta página se describe el componente Zeppelin.
El componente Zeppelin Notebook es un cuaderno web para realizar análisis de datos interactivos. La interfaz de usuario web de Zeppelin está disponible en el puerto 8080
del primer nodo maestro del clúster.
De forma predeterminada, los cuadernos se guardan en Cloud Storage en el segmento de desarrollo por fases de Dataproc, que especifica el usuario o se crea automáticamente cuando se crea el clúster. La ubicación se puede cambiar en el momento de la creación del clúster mediante la propiedad zeppelin:zeppelin.notebook.gcs.dir
.
Instalar el componente
Instala el componente al crear un clúster de Dataproc. Los componentes se pueden añadir a los clústeres creados con la versión 1.3 de Dataproc o versiones posteriores.
Consulta las versiones de Dataproc compatibles para ver la versión del componente incluida en cada lanzamiento de imagen de Dataproc.
Comando gcloud
Para crear un clúster de Dataproc que incluya el componente Zeppelin, usa el comando gcloud dataproc clusters create cluster-name
con la marca --optional-components
.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API REST
El componente Zeppelin se puede especificar a través de la API Dataproc mediante SoftwareConfig.Component como parte de una solicitud clusters.create.Consola
- Habilita el componente y la pasarela de componentes.
- En la consola de Google Cloud , abre la página de Dataproc Crear un clúster. Se selecciona el panel Configurar clúster.
- En la sección Components (Componentes):
- En Componentes opcionales, selecciona Zeppelin y otros componentes opcionales que quieras instalar en tu clúster.
- En Pasarela de componentes, selecciona Habilitar pasarela de componentes (consulta Ver y acceder a URLs de pasarela de componentes).
Abre el cuaderno de Zeppelin.
Consulta Ver y acceder a URLs de Component Gateway para hacer clic en los enlaces de Component Gateway de la consola Google Cloud para abrir la interfaz de usuario del cuaderno de Zeppelin que se ejecuta en el nodo maestro del clúster en tu navegador local.