Componente Solr opcional de Dataproc

Puedes instalar componentes adicionales, como Solr, al crear un clúster de Dataproc mediante la función Componentes opcionales. En esta página se describe el componente Solr.

El componente Apache Solr es una plataforma de búsqueda empresarial de código abierto. El servidor Solr y la interfaz de usuario web están disponibles en el puerto 8983 de los nodos maestros del clúster.

Persistencia de archivos de Solr: de forma predeterminada, Solr escribe y lee los archivos de índice y de registro de transacciones en HDFS. Para conservar los archivos de Solr, usa una ruta de Cloud Storage como directorio principal de Solr. Para ello, define la dataproc:solr.gcs.path propiedad del clúster cuando instales el componente.

Instalar el componente

Instala el componente al crear un clúster de Dataproc. Los componentes se pueden añadir a los clústeres creados con la versión 1.3 de Dataproc o versiones posteriores.

Consulta las versiones de Dataproc compatibles para ver la versión del componente incluida en cada lanzamiento de imagen de Dataproc.

Comando gcloud

Para crear un clúster de Dataproc que incluya el componente Solr, usa el comando gcloud dataproc clusters create cluster-name con la marca --optional-components. El comando de ejemplo que aparece a continuación usa la marca opcional properties para definir una ruta de Cloud Storage como directorio principal de Solr.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
Añade la --properties="dataproc:solr.gcs.path=gs://bucket-name/" propiedad del clúster al comando gcloud dataproc clusters create para definir un segmento de Cloud Storage en el que se almacenarán los documentos de Solr (directorio principal de Solr).

API REST

El componente Solr se puede especificar a través de la API Dataproc mediante SoftwareConfig.Component como parte de una solicitud clusters.create.

Consola

  1. Habilita el componente y la pasarela de componentes.
    • En la consola de Google Cloud , abre la página de Dataproc Crear un clúster. Se selecciona el panel Configurar clúster.
    • En la sección Components (Componentes):
      • En Componentes opcionales, selecciona Solr y otros componentes opcionales que quieras instalar en el clúster.
      • En Pasarela de componentes, selecciona Habilitar pasarela de componentes (consulta Ver y acceder a URLs de pasarela de componentes).