Componente Solr facoltativo di Dataproc

Puoi installare componenti aggiuntivi come Solr quando crei un cluster Dataproc utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Solr.

Il componente Apache Solr è una piattaforma di ricerca aziendale open source. Il server Solr e la UI web sono disponibili sulla porta 8983 nei nodi master del cluster.

Persistenza dei file Solr: per impostazione predefinita, Solr scrive e legge i file di indice e di log delle transazioni in HDFS. Per rendere persistenti i file Solr, utilizza un percorso Cloud Storage come directory home di Solr impostando la dataproc:solr.gcs.path proprietà del cluster quando installi il componente.

Installa il componente

Installa il componente quando crei un cluster Dataproc. I componenti possono essere aggiunti ai cluster creati con Dataproc versione 1.3 e successive.

Consulta Versioni di Dataproc supportate per la versione del componente inclusa in ogni release dell'immagine Dataproc.

Comando g-cloud

Per creare un cluster Dataproc che includa il componente Solr, utilizza il comando gcloud dataproc clusters create cluster-name con il flag --optional-components. Il comando di esempio riportato di seguito utilizza il flag facoltativo properties per impostare un percorso Cloud Storage come directory home di Solr.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
Aggiungi la proprietà del cluster --properties="dataproc:solr.gcs.path=gs://bucket-name/" al comando gcloud dataproc clusters create per impostare un bucket Cloud Storage in cui verranno archiviati i documenti Solr (directory principale di Solr).

API REST

Il componente Solr può essere specificato tramite l'API Dataproc utilizzando SoftwareConfig.Component nell'ambito di una richiesta clusters.create.

Console

  1. Attiva il componente e il gateway dei componenti.
    • Nella console Google Cloud , apri la pagina Crea un cluster di Dataproc. Il riquadro Configura cluster è selezionato.
    • Nella sezione Componenti: