Dataproc-Cluster mit Clientbibliotheken erstellen
Der unten aufgeführte Beispielcode zeigt Ihnen, wie Sie mit den Cloud-Clientbibliotheken einen Dataproc-Cluster erstellen, einen Job im Cluster ausführen und anschließend den Cluster löschen.
Sie können die Aufgaben auch hiermit ausführen:
- API REST-Anfragen in Kurzanleitung: API Explorer verwenden
- in der Google Cloud Console unter Dataproc-Cluster mit der Google Cloud Console erstellen
- der Google Cloud CLI unter Dataproc-Cluster mit der Google Cloud CLI erstellen
Hinweise
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataproc API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataproc API.
Code ausführen
Anleitung ausprobieren:Klicken Sie auf In Cloud Shell öffnen, um eine Anleitung für Python-Cloud-Clientbibliotheken auszuführen, mit der ein Cluster erstellt, ein PySpark-Job ausgeführt und der Cluster anschließend gelöscht wird.
Go
- Installieren Sie die Clientbibliothek. Weitere Informationen finden Sie unter Entwicklungsumgebung einrichten.
- Authentifizierung einrichten
- Klonen Sie GitHub-Beispielcode und führen Sie ihn aus.
- Sehen Sie sich die Ausgabe an. Der Code gibt das Jobtreiberlog an den standardmäßigen Dataproc-Staging-Bucket in Cloud Storage aus. Sie können die Jobtreiberausgabe in der Google Cloud Console im Dataproc-Bereich Jobs Ihres Projekts aufrufen. Klicken Sie auf die Job-ID, um die Jobausgabe auf der Seite "Jobdetails" anzuzeigen.
Java
- Installieren Sie die Clientbibliothek. Weitere Informationen finden Sie unter Java-Entwicklungsumgebung einrichten.
- Authentifizierung einrichten
- Klonen Sie GitHub-Beispielcode und führen Sie ihn aus.
- Sehen Sie sich die Ausgabe an. Der Code gibt das Jobtreiberlog an den standardmäßigen Dataproc-Staging-Bucket in Cloud Storage aus. Sie können die Jobtreiberausgabe in der Google Cloud Console im Dataproc-Bereich Jobs Ihres Projekts aufrufen. Klicken Sie auf die Job-ID, um die Jobausgabe auf der Seite "Jobdetails" anzuzeigen.
Node.js
- Installieren Sie die Clientbibliothek. Weitere Informationen finden Sie unter Node.js-Entwicklungsumgebung einrichten.
- Authentifizierung einrichten
- Klonen Sie GitHub-Beispielcode und führen Sie ihn aus.
- Sehen Sie sich die Ausgabe an. Der Code gibt das Jobtreiberlog an den standardmäßigen Dataproc-Staging-Bucket in Cloud Storage aus. Sie können die Jobtreiberausgabe in der Google Cloud Console im Dataproc-Bereich Jobs Ihres Projekts aufrufen. Klicken Sie auf die Job-ID, um die Jobausgabe auf der Seite "Jobdetails" anzuzeigen.
Python
- Installieren Sie die Clientbibliothek. Weitere Informationen finden Sie unter Python-Entwicklungsumgebung einrichten.
- Authentifizierung einrichten
- Klonen Sie GitHub-Beispielcode und führen Sie ihn aus.
- Sehen Sie sich die Ausgabe an. Der Code gibt das Jobtreiberlog an den standardmäßigen Dataproc-Staging-Bucket in Cloud Storage aus. Sie können die Jobtreiberausgabe in der Google Cloud Console im Dataproc-Bereich Jobs Ihres Projekts aufrufen. Klicken Sie auf die Job-ID, um die Jobausgabe auf der Seite "Jobdetails" anzuzeigen.
Nächste Schritte
- Weitere Informationen finden Sie in der Dataproc Cloud-Clientbibliothek unter Zusätzliche Ressourcen.