Dataproc-Komponenten

Beim Erstellen eines Clusters werden automatisch Komponenten des Apache Hadoop-Systems auf dem Cluster installiert. Weitere Informationen finden Sie unter Liste der Dataproc-Versionen. Sie können beim Erstellen des Clusters auch zusätzliche Komponenten, sogenannte „optionale Komponenten“, im Cluster installieren. Das Hinzufügen von optionalen Komponenten zu einem Cluster ist vergleichbar mit dem Hinzufügen von Komponenten mithilfe von Initialisierungsaktionen. Es gibt jedoch die folgenden Vorteile:

  • Kürzere Cluster-Startzeiten.
  • Getestete Kompatibilität mit bestimmten Dataproc-Versionen.
  • Verwendung eines Clusterparameters statt eines Skripts mit Initialisierungsaktionen.

Verfügbare optionale Komponenten

Optionale Komponente COMPONENT_NAME
in gcloud-Befehlen und API-Anfragen
Image-Version Releasestufe
Docker DOCKER 1.5 oder höher GA
Flink FLINK 1.5 oder höher AV
HBase HBASE 1.5 oder höher
(nicht in 2.1 und höher verfügbar)
Beta
Hive WebHCat HIVE_WEBHCAT 1.3 oder höher GA
Hudi Hudi 1.5 oder höher GA
Jupyter-Notebook JUPYTER 1.3 oder höher AV
Presto PRESTO 1.3 oder höher
(nicht in 2.1 und höher verfügbar)
GA
Ranger RANGER 1.3 oder höher AV
Solr SOLR 1.3 oder höher GA
Trino TRINO 2.1 oder höher GA
Zeppelin-Notebook ZEPPELIN 1.3 oder höher AV
Zookeeper ZOOKEEPER 1.0 oder höher AV

Optionale Komponenten hinzufügen

gcloud-Befehl

Verwenden Sie zum Erstellen eines Dataproc-Clusters und zur Installation einer oder mehrerer optionaler Komponenten im Cluster den Befehl gcloud beta dataproc clusters create cluster-name mit dem Flag --optional-components.

gcloud dataproc clusters create cluster-name \
  --optional-components=COMPONENT-NAME(s) \
  ... other flags

REST API

Optionale Komponenten können über die Dataproc API mit SoftwareConfig.Component als Teil einer clusters.create-Anfrage angegeben werden.

Console

Öffnen Sie in der Google Cloud Console die Dataproc-Seite Cluster erstellen. Der Bereich „Cluster einrichten“ ist ausgewählt. Wählen Sie im Abschnitt „Komponenten“ unter „Optionale Komponenten“ eine oder mehrere Komponenten aus, die auf Ihrem Cluster installiert werden sollen.