Lokale Dataproc-SSDs

Als Ergänzung zum Bootlaufwerk können Sie lokale SSDs (Solid State Drive) an Master-, primäre Worker- und sekundäre Worker-Knoten in Ihrem Cluster anhängen. Wenn für den Cluster lokale SSDs bereitgestellt werden, werden sowohl HDFS- als auch Scratch-Daten wie Shuffle-Ausgaben, verwenden Sie die lokalen SSDs anstelle des Bootvorgangs, nichtflüchtiger Speicher.

  • Lokale SSDs bieten schnellere Lese- und Schreibzeiten als nichtflüchtige Speicher. (siehe Leistung lokaler SSDs).
  • Die Größe von 375 GB der einzelnen lokalen SSDs ist fest vorgegeben. Sie können jedoch mehrere lokale SSDs anhängen, um den SSD-Speicher zu erhöhen (siehe Lokale SSDs).
  • Jede lokale SSD wird auf Dataproc-Clusterknoten unter /mnt/<id> bereitgestellt.
  • Für lokale SSDs wird ext4 als Standarddateisystem verwendet.

Lokale SSDs verwenden

gcloud-Befehl

Verwenden Sie den Befehl gcloud dataproc clusters create mit den Flags --num-master-local-ssds, --num-workers-local-ssds und --num-secondary-worker-local-ssds, um lokale SSDs jeweils zu den Masterknoten sowie zu primären und sekundären Worker-Knoten des Clusters hinzuzufügen.

Lokale SSDs können über ein SCSI an Dataproc-VMs angehängt werden (Small Computer System Interface) oder NVME-Schnittstelle (Non-Volatile Memory Express) (siehe Leistung lokaler SSDs. Die Standard-SSD-Schnittstelle der Dataproc-Cluster-VM ist die SCSI-Schnittstelle. Verwenden Sie die Methode gcloud Dataproc-Cluster erstellen mit dem --master-local-ssd-interface-Befehl, --worker-local-ssd-interface und --secondary-worker-local-ssd-interface-Flags zum Angeben der lokalen SSD-Schnittstelle für Master, primäre und sekundäre Instanz Worker-Knoten.

Beispiel:

gcloud dataproc clusters create cluster-name \
    --region=region \
    --num-master-local-ssds=1 \
    --num-worker-local-ssds=1 \
    --num-secondary-worker-local-ssds=1 \
    --master-local-ssd-interface=NVME \
    --worker-local-ssd-interface=NVME \
    --secondary-worker-local-ssd-interface=NVME \
    ... other args ...

REST API

Legen Sie das Feld numLocalSsds in den InstanceGroupConfig-Objekten masterConfig, workerConfig und secondaryWorkerConfig der API-Anfrage cluster.create fest, um lokale SSDs jeweils an den Masterknoten sowie an primäre und sekundäre Worker-Knoten des Clusters anzuhängen.

Lokale SSDs können über eine SCSI- (Small Computer System Interface) oder NVMe- (Non-Volatile Memory Express) Schnittstelle an Dataproc-VMs angehängt werden (siehe Leistung lokaler SSDs). Die standardmäßige lokale SSD-Schnittstelle der Dataproc-Cluster-VM ist die SCSI-Schnittstelle. Legen Sie das Feld localSsdInterface in den InstanceGroupConfig-Objekten masterConfig, workerConfig und secondaryWorkerConfig der API-Anfrage cluster.create fest, um die SCSI- oder NVME-Schnittstelle anzugeben, über die lokale SSDs an die Master-, primären und sekundären Worker-Knoten des Clusters angeschlossen werden sollen.

Console

Erstellen Sie einen Cluster und hängen Sie lokale SSDs zum Master an. primären und sekundären Worker-Knoten aus dem Bereich „Knoten konfigurieren“ der Dataproc Seite Cluster erstellen der Google Cloud Console.