Notebooks planen
In diesem Dokument wird beschrieben, wie Sie Colab Enterprise-Notebooks in BigQuery planen und geplante Notebook-Ausführungen prüfen.
Notebooks sind Code-Assets, die auf Dataform basieren. Notebooks sind jedoch nicht in Dataform sichtbar.
Sie können ein Notebook so planen, dass es automatisch zu einer bestimmten Zeit und mit einer bestimmten Häufigkeit ausgeführt wird, z. B. um ein ML-Modell zu trainieren, externe APIs aufzurufen oder BigQuery DataFrames-Code auszuführen.
Änderungen, die Sie an einem Notebook vornehmen, werden automatisch gespeichert, sind aber nur für Sie und für Nutzer verfügbar, die Zugriff auf das Notebook haben. Wenn Sie den Zeitplan mit einer neuen Version des Notebooks aktualisieren möchten, müssen Sie das Notebook bereitstellen. Wenn Sie ein Notebook bereitstellen, wird sein Zeitplan mit der aktuellen Version des Notebooks aktualisiert. Zeitpläne führen die zuletzt bereitgestellte Version des Notebooks aus.
Jeder Notebook-Zeitplan wird mit den Nutzeranmeldedaten Ihres Google-Kontos oder einem Dataform-Dienstkonto ausgeführt, das Sie beim Konfigurieren des Zeitplans auswählen.
Dataform schreibt die Ausgabe geplanter Notebook-Ausführungen in den Cloud Storage-Bucket, der beim Erstellen des Zeitplans ausgewählt wurde.
Für Notebook-Zeitpläne wird eine Standardlaufzeit vom Typ E2 verwendet. Es fallen Gebühren für Colab Enterprise-Laufzeiten an. Die Gebühren für die Laufzeitverarbeitung richten sich nach dem E2-Maschinentyp. Informationen zu den Preisen für Standard-E2-Laufzeiten finden Sie unter Colab Enterprise-Preise.
Hinweise
Erstellen Sie zuerst ein Notebook.
Notebook-Zeitplanung aktivieren
Wenn Sie Notebooks planen möchten, müssen Sie dem Dienstkonto, das Sie für Notebookpläne verwenden möchten, die folgenden Rollen zuweisen:
- Notebook Executor User (
roles/aiplatform.notebookExecutorUser
) - Folgen Sie der Anleitung unter Einzelne Rolle für ein Projekt gewähren, um Ihrem Dienstkonto für das ausgewählte Projekt die Rolle „Notebook-Ausführer“ zuzuweisen.
- Storage-Administrator (
roles/storage.admin
) - Folgen Sie der Anleitung unter Richtlinie auf Bucket-Ebene ein Hauptkonto hinzufügen, um Ihrem Dienstkonto ein Hauptkonto für den Cloud Storage-Bucket hinzuzufügen, den Sie zum Speichern der Ausgabe geplanter Notebook-Ausführungen verwenden möchten, und diesem Hauptkonto die Rolle „Storage-Administrator“ zuzuweisen.
- Service Account User (
roles/iam.serviceAccountUser
) - Folgen Sie der Anleitung unter Einer einzelnen Rolle ein Dienstkonto zuweisen, um Ihrem Dienstkonto ein Hauptkonto hinzuzufügen. Das bedeutet, dass Sie dem Dienstkonto dasselbe Dienstkonto als Hauptkonto hinzufügen. Weisen Sie diesem Hauptkonto dann die Rolle „Dienstkontonutzer“ zu.
Außerdem müssen Sie dem Standard-Dataform-Dienstkonto die folgende Rolle zuweisen:
- Ersteller von Dienstkonto-Token (
roles/iam.serviceAccountTokenCreator
) - Folgen Sie der Anleitung unter Zugriff auf die Tokenerstellung für ein benutzerdefiniertes Dataform-Dienstkonto gewähren, um dem standardmäßigen Dataform-Dienstkonto ein Hauptkonto für Ihr Dienstkonto hinzuzufügen und diesem Hauptkonto die Rolle „Ersteller von Dienstkonto-Tokens“ zuzuweisen.
Weitere Informationen zu Dienstkonten in Dataform finden Sie unter Dienstkonten in Dataform.
Erforderliche Berechtigungen
Zum Erstellen von Notebook-Zeitplänen benötigen Sie die folgenden Rollen:
- Dataform Admin (
roles/dataform.admin
) - BigQuery Read Session-Nutzer (
roles/bigquery.readSessionUser
) oder BigQuery Studio-Nutzer (roles/bigquery.studioUser
) - Notebook Runtime-Nutzer (
roles/aiplatform.notebookRuntimeUser
)
Wenn Sie beim Planen von Notebooks Notebook-Laufzeitvorlagen verwenden möchten, benötigen Sie die Rolle Notebook Runtime User (roles/aiplatform.notebookRuntimeUser
).
Zum Bearbeiten und Löschen von Notebook-Zeitplänen benötigen Sie die Rolle Dataform-Bearbeiter (roles/dataform.editor
).
Sie benötigen die Rolle Dataform-Betrachter (roles/dataform.viewer
), um Notebook-Zeitpläne aufzurufen.
Weitere Informationen zu BigQuery IAM finden Sie unter Zugriffssteuerung mit IAM.
Zeitplan erstellen
So erstellen Sie einen Notebook-Zeitplan:
Bereich Explorer
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Notebooks und gegebenenfalls den Ordner Freigegebene Notebooks. Klicken Sie auf den Namen des Notebooks, das Sie planen möchten.
Klicken Sie in der Symbolleiste Notebook auf Planen.
Alternativ können Sie auch auf
Planen klicken.Geben Sie im Bereich Notebook planen im Feld Name des Zeitplans einen Namen für den Zeitplan ein.
Autorisieren Sie das Notebook im Bereich Authentifizierung mit den Anmeldedaten Ihres Google-Kontos oder eines Dienstkontos.
- Wenn Sie die Nutzeranmeldedaten Ihres Google-Kontos verwenden möchten (Vorschau), wählen Sie Mit meinen Nutzeranmeldedaten ausführen aus.
- Wenn Sie ein Dienstkonto verwenden möchten, wählen Sie Mit ausgewähltem Dienstkonto ausführen aus und wählen Sie dann ein Dienstkonto aus.
Wählen Sie im Abschnitt Notebook-Optionen im Feld Laufzeitvorlage eine Colab-Notebook-Laufzeitvorlage oder die Standardlaufzeitspezifikationen aus. Weitere Informationen zum Erstellen einer Laufzeitvorlage für ein Colab-Notebook finden Sie unter Laufzeitvorlage erstellen.
Klicken Sie im Feld Cloud Storage-Bucket auf Durchsuchen und wählen Sie einen Cloud Storage-Bucket aus oder erstellen Sie einen.
Dem ausgewählten Dienstkonto muss die IAM-Rolle Storage Admin (
roles/storage.admin
) für den ausgewählten Bucket zugewiesen sein. Weitere Informationen finden Sie unter Notebook-Planung aktivieren.Führen Sie im Abschnitt Planungshäufigkeit folgende Schritte aus:
- Wählen Sie im Menü Wiederholungen die Häufigkeit der geplanten Notebook-Ausführungen aus.
- Geben Sie im Feld Um die Uhrzeit für die geplanten Notebook-Ausführungen ein.
- Wählen Sie im Menü Zeitzone die Zeitzone für den Zeitplan aus.
Klicken Sie auf Zeitplan erstellen. Wenn Sie Mit meinen Nutzeranmeldedaten ausführen als Authentifizierungsmethode ausgewählt haben, müssen Sie Ihr Google-Konto autorisieren (Vorschau).
Wenn Sie den Zeitplan erstellen, wird die aktuelle Version des Notebooks automatisch bereitgestellt. Wenn Sie den Zeitplan mit einer neuen Version des Notebooks aktualisieren möchten, müssen Sie das Notebook bereitstellen.
Die zuletzt bereitgestellte Version des Notebooks wird zur ausgewählten Zeit und mit der ausgewählten Häufigkeit ausgeführt.
Seite Planung
Rufen Sie in der Google Cloud Console die Seite Scheduling auf.
Klicken Sie auf Erstellen und wählen Sie im Menü Notizbuch-Zeitplan aus.
Wählen Sie im Bereich Notebook planen im Feld Notebook das Notebook aus, das Sie planen möchten.
Geben Sie im Feld Name des Zeitplans einen Namen für den Zeitplan ein.
Autorisieren Sie das Notebook im Bereich Authentifizierung mit den Anmeldedaten Ihres Google-Kontos oder eines Dienstkontos.
- Wenn Sie die Nutzeranmeldedaten Ihres Google-Kontos verwenden möchten (Vorschau), wählen Sie Mit meinen Nutzeranmeldedaten ausführen aus.
- Wenn Sie ein Dienstkonto verwenden möchten, wählen Sie Mit ausgewähltem Dienstkonto ausführen aus und wählen Sie dann ein Dienstkonto aus.
Wählen Sie im Abschnitt Notebook-Optionen im Feld Laufzeitvorlage eine Colab-Notebook-Laufzeitvorlage oder die Standardlaufzeitspezifikationen aus. Weitere Informationen zum Erstellen einer Laufzeitvorlage für ein Colab-Notebook finden Sie unter Laufzeitvorlage erstellen.
Klicken Sie im Feld Cloud Storage-Bucket auf Durchsuchen und wählen Sie einen Cloud Storage-Bucket aus oder erstellen Sie einen.
Dem ausgewählten Dienstkonto muss die IAM-Rolle Storage Admin (
roles/storage.admin
) für den ausgewählten Bucket zugewiesen sein. Weitere Informationen finden Sie unter Notebook-Planung aktivieren.Führen Sie im Abschnitt Planungshäufigkeit folgende Schritte aus:
- Wählen Sie im Menü Wiederholungen die Häufigkeit der geplanten Notebook-Ausführungen aus.
- Geben Sie im Feld Um die Uhrzeit für die geplanten Notebook-Ausführungen ein.
- Wählen Sie im Menü Zeitzone die Zeitzone für den Zeitplan aus.
Klicken Sie auf Zeitplan erstellen. Wenn Sie Mit meinen Nutzeranmeldedaten ausführen als Authentifizierungsmethode ausgewählt haben, müssen Sie Ihr Google-Konto autorisieren (Vorschau).
Wenn Sie den Zeitplan erstellen, wird die aktuelle Version des Notebooks automatisch bereitgestellt. Wenn Sie den Zeitplan mit einer neuen Version des Notebooks aktualisieren möchten, müssen Sie das Notebook bereitstellen.
Die zuletzt bereitgestellte Version des Notebooks wird zur ausgewählten Zeit und mit der ausgewählten Häufigkeit ausgeführt.
Google-Konto autorisieren
Wenn Sie die Ressource mit den Nutzeranmeldedaten Ihres Google-Kontos authentifizieren möchten, müssen Sie BigQuery-Pipelines manuell die Berechtigung erteilen, das Zugriffstoken für Ihr Google-Konto abzurufen und in Ihrem Namen auf die Quelldaten zuzugreifen. Sie können die manuelle Genehmigung über die OAuth-Dialogoberfläche erteilen.
Sie müssen BigQuery-Pipelines nur einmal eine Berechtigung erteilen.
So heben Sie die erteilte Berechtigung auf:
- Rufen Sie Ihre Google-Kontoseite auf.
- Klicken Sie auf BigQuery-Pipelines.
- Klicken Sie auf Zugriff entfernen.
Wenn Sie den Inhaber des Notebook-Zeitplans durch Aktualisieren der Anmeldedaten ändern, ist auch eine manuelle Genehmigung erforderlich, falls der neue Google-Kontoinhaber noch nie einen Zeitplan erstellt hat.
Notebook bereitstellen
Durch die Bereitstellung eines Notebooks wird sein Zeitplan mit der aktuellen Version des Notebooks aktualisiert. Zeitpläne führen die zuletzt bereitgestellte Version des Notebooks aus.
Wenn Sie einen Zeitplan für dieses Notebook haben, werden Sie in BigQuery aufgefordert, Änderungen bereitzustellen, um den Zeitplan zu aktualisieren, wenn Sie das Notebook bearbeiten.
So stellen Sie ein Notebook bereit:
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Notebooks und gegebenenfalls den Ordner Freigegebene Notebooks. Klicken Sie auf den Namen des ausgewählten Notizbuchs.
Klicken Sie auf Bereitstellen.
Der entsprechende Zeitplan wird mit der aktuellen Version des Notebooks aktualisiert. Die zuletzt bereitgestellte Version des Notebooks wird zum geplanten Zeitpunkt ausgeführt.
Bereitgestelltes Notebook manuell ausführen
Wenn Sie ein Notebook, das mit einem ausgewählten Zeitplan bereitgestellt wurde, manuell ausführen, führt BigQuery das bereitgestellte Notebook einmal aus, unabhängig vom Zeitplan.
So führen Sie ein bereitgestelltes Notebook manuell aus:
Rufen Sie in der Google Cloud Console die Seite Scheduling auf.
Klicken Sie auf den Namen des ausgewählten Notebook-Zeitplans.
Klicken Sie auf der Seite mit den Details zum Zeitplan auf Ausführen.
Alle Zeitpläne ansehen
So rufen Sie alle Notebook-Zeitpläne in Ihrem Projekt auf:
Rufen Sie in der Google Cloud Console die Seite Scheduling auf.
Optional: Wenn Sie zusätzliche Spalten mit Details zum Notebook-Zeitplan anzeigen möchten, klicken Sie auf
Spaltenanzeigeoptionen, wählen Sie die gewünschten Spalten aus und klicken Sie auf OK.
Details zum Zeitplan ansehen
Details zu einem ausgewählten Zeitplan können Sie im Bereich Explorer oder auf der Seite Planung aufrufen.
So rufen Sie Zeitplandetails für ein ausgewähltes Notebook auf:
Bereich Explorer
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Notebooks und gegebenenfalls den Ordner Freigegebene Notebooks. Klicken Sie auf den Namen des ausgewählten Notebooks.
Klicken Sie in der Symbolleiste Notebook auf Planen.
Alternativ können Sie auch auf
Planen klicken.
Seite Planung
Rufen Sie in der Google Cloud Console die Seite Scheduling auf.
Klicken Sie auf den Namen des ausgewählten Notebook-Zeitplans.
Bisherige Ausführungen ansehen
Sie können sich vergangene Ausführungen eines ausgewählten Notebook-Zeitplans im Bereich Explorer oder auf der Seite Zeitplanung ansehen.
So rufen Sie bisherige Ausführungen eines ausgewählten Notebook-Zeitplans auf:
Bereich Explorer
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Notebooks und gegebenenfalls den Ordner Freigegebene Notebooks. Klicken Sie auf den Namen des ausgewählten Notebooks.
Klicken Sie auf Zeitplan und dann auf Vorherige Ausführungen ansehen.
Seite Planung
Rufen Sie in der Google Cloud Console die Seite Scheduling auf.
Klicken Sie auf den Namen des ausgewählten Notebook-Zeitplans.
Prüfen Sie auf der Seite Zeitplandetails im Abschnitt Frühere Ausführungen frühere Ausführungen.
Optional: Klicken Sie auf Aktualisieren, um die Liste der letzten Ausführungen zu aktualisieren.
Zeitplan deaktivieren
Wenn Sie geplante Ausführungen eines ausgewählten Notebooks pausieren möchten, ohne den Zeitplan zu löschen, können Sie ihn deaktivieren.
So deaktivieren Sie einen Zeitplan für ein ausgewähltes Notebook:
Bereich Explorer
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Notebooks und gegebenenfalls den Ordner Freigegebene Notebooks. Klicken Sie auf den Namen des ausgewählten Notizbuchs.
Klicken Sie in der Symbolleiste Notebook auf Planen.
Alternativ können Sie auch auf
Planen klicken.Klicken Sie in der Tabelle „Zeitplandetails“ in der Zeile Zeitplanstatus auf die Ein/Aus-Schaltfläche Zeitplan ist aktiviert.
Seite Planung
Rufen Sie in der Google Cloud Console die Seite Scheduling auf.
Klicken Sie auf den Namen des ausgewählten Notizbuchs.
Klicken Sie auf der Seite Details zum Zeitplan auf Deaktivieren.
Zeitplan aktivieren
So nehmen Sie geplante Ausführungen eines deaktivierten Notebook-Zeitplans wieder auf:
Bereich Explorer
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Notebooks und gegebenenfalls den Ordner Freigegebene Notebooks. Klicken Sie auf den Namen des ausgewählten Notizbuchs.
Klicken Sie in der Symbolleiste Notebook auf Planen.
Alternativ können Sie auch auf
Planen klicken.Klicken Sie in der Tabelle „Zeitplandetails“ in der Zeile Zeitplanstatus auf die Ein/Aus-Schaltfläche Zeitplan deaktiviert.
Seite Planung
Rufen Sie in der Google Cloud Console die Seite Scheduling auf.
Klicken Sie auf den Namen des ausgewählten Notizbuchs.
Klicken Sie auf der Seite Details zum Zeitplan auf Aktivieren.
Zeitplan bearbeiten
Sie können einen Zeitplan im Bereich Explorer oder auf der Seite Zeitplanung bearbeiten.
So bearbeiten Sie einen Zeitplan:
Bereich Explorer
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Notebooks und gegebenenfalls den Ordner Freigegebene Notebooks. Klicken Sie auf den Namen des ausgewählten Notebooks.
Klicken Sie auf Zeitplan und dann auf Bearbeiten.
Bearbeiten Sie im Dialogfeld Zeitplandetails den Zeitplan und klicken Sie dann auf Zeitplan aktualisieren.
Seite Planung
Rufen Sie in der Google Cloud Console die Seite Scheduling auf.
Klicken Sie auf den Namen des ausgewählten Notebook-Zeitplans.
Klicken Sie auf der Seite Details zum Zeitplan auf Bearbeiten.
Klicken Sie auf Zeitplan ansehen und dann auf Bearbeiten.
Bearbeiten Sie im Dialogfeld Notebook planen den Zeitplan und klicken Sie dann auf Zeitplan aktualisieren.
Zeitplan löschen
So löschen Sie einen Zeitplan für ein ausgewähltes Notebook endgültig:
Rufen Sie in der Google Cloud Console die Seite Scheduling auf.
Führen Sie eine der folgenden Aktionen aus:
Klicken Sie auf den Namen des ausgewählten Zeitplans und dann auf der Seite Zeitplandetails auf Löschen.
Klicken Sie in der Zeile mit dem ausgewählten Zeitplan in der Spalte Aktionen auf
Aktionen ansehen und dann auf Löschen.
Klicken Sie im angezeigten Dialogfeld auf Löschen.
Nächste Schritte
- Weitere Informationen zu Colab Enterprise-Notebooks in BigQuery
- Notebooks erstellen