Diese Seite wurde von der Cloud Translation API übersetzt.

PySpark-Code in BigQuery Studio-Notebooks ausführen

In diesem Dokument wird beschrieben, wie Sie PySpark-Code in einem BigQuery-Python-Notebook ausführen.

Hinweise

Erstellen Sie ein Google Cloud Projekt und einen Cloud Storage-Bucket, falls noch nicht geschehen.

Projekt einrichten
1. Cloud Storage-Bucket erstellen in Ihrem Projekt, falls Sie noch keinen haben.
2. Notebook einrichten
  1. Notebook-Anmeldedaten: Standardmäßig werden in Ihrer Notebook-Sitzung Ihre Nutzeranmeldedaten verwendet. Wenn Sie Anmeldedaten für das Dienstkonto für Ihre Sitzung angeben möchten, muss es die Dataproc-Worker-Rolle (roles/dataproc.worker) haben. Weitere Informationen finden Sie unter Dataproc Serverless-Dienstkonto.
  2. Notebook-Laufzeit: Ihr Notebook verwendet eine Standard-Vertex-Laufzeit, sofern Sie keine andere Laufzeit auswählen. Wenn Sie eine eigene Laufzeit definieren möchten, erstellen Sie sie in der Google Cloud -Konsole auf der Seite Laufzeiten.