Airflow-DAGs planen

In diesem Dokument wird beschrieben, wie Sie gerichtete azyklische Graphen (Directed Acyclic Graphs, DAGs) in Airflow über die Seite Planung in BigQuery aus Cloud Composer 3 planen. Außerdem wird beschrieben, wie Sie DAGs manuell auslösen und den Verlauf und die Logs vergangener DAG-Ausführungen ansehen.

Airflow-DAGs in BigQuery verwalten

Auf der Seite Planung in BigQuery finden Sie Tools zum Planen von Airflow-DAGs, die in Ihren Cloud Composer 3-Umgebungen ausgeführt werden.

Airflow-DAGs, die Sie in BigQuery planen, werden in einer oder mehreren Cloud Composer-Umgebungen in Ihrem Projekt ausgeführt. Auf der Seite Planung in BigQuery werden Informationen für alle Airflow-DAGs in Ihrem Projekt zusammengefasst.

Während einer DAG-Ausführung plant und führt Airflow einzelne Aufgaben aus, aus denen ein DAG besteht, in einer vom DAG definierten Reihenfolge. Auf der Seite Planung in BigQuery können Sie den Status vergangener DAG-Ausführungen ansehen, detaillierte Logs aller DAG-Ausführungen und aller Aufgaben aus diesen DAG-Ausführungen aufrufen und Details zu DAGs ansehen.

Weitere Informationen zu den Airflow-Kernkonzepten wie Airflow-DAGs, DAG-Ausführungen, Aufgaben oder Operatoren finden Sie in der Airflow-Dokumentation auf der Seite Core Concepts (Kernkonzepte).

Weitere Informationen zu Cloud Composer-Umgebungen finden Sie in der Cloud Composer-Dokumentation auf der Seite Cloud Composer 3 – Übersicht.

Hinweise

  1. Enable the Cloud Composer API.

    Enable the API

  2. Achten Sie darauf, dass Ihr Google Cloud -Projekt mindestens eine Cloud Composer 3-Umgebung mit mindestens einer bereits hochgeladenen DAG-Datei enthält:

Erforderliche Berechtigungen

Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Planen von Airflow-DAGs benötigen:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Planen von Airflow-DAGs erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:

Erforderliche Berechtigungen

Die folgenden Berechtigungen sind erforderlich, um Airflow-DAGs zu planen:

  • So rufen Sie Airflow-DAGs und ihre Details auf: composers.dags.list, composer.environments.list
  • So lösen Sie Airflow-DAGs aus und pausieren sie: composers.dags.list, composer.environments.list, composer.dags.execute

Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Weitere Informationen zu Cloud Composer 3-IAM finden Sie in der Cloud Composer-Dokumentation unter Zugriffssteuerung mit IAM.

Airflow-DAG manuell auslösen

Wenn Sie einen Airflow-DAG manuell auslösen, führt Airflow den DAG einmal aus, unabhängig vom Zeitplan, der für den DAG angegeben wurde.

So lösen Sie einen ausgewählten Airflow-DAG manuell aus:

  1. Rufen Sie in der Google Cloud Console die Seite Scheduling auf.

    Zur Seite Terminplanung

  2. Führen Sie eine der folgenden Aktionen aus:

    • Klicken Sie auf den Namen des ausgewählten DAG und dann auf der Seite DAG-Details auf DAG auslösen.

    • Klicken Sie in der Zeile mit dem ausgewählten DAG in der Spalte Aktionen auf Aktionen ansehen und dann auf DAG auslösen.

Airflow-DAG-Ausführungsprotokolle und -Details ansehen

So rufen Sie Details zu einem ausgewählten Airflow-DAG auf:

  1. Rufen Sie in der Google Cloud Console die Seite Scheduling auf.

    Zur Seite Terminplanung

  2. Klicken Sie auf den Namen des ausgewählten DAG.

  3. Wählen Sie auf der Seite DAG-Details den Tab Details aus.

  4. Wenn Sie frühere DAG-Ausführungen aufrufen möchten, wählen Sie den Tab Ausführungen aus.

    1. Optional: Auf dem Tab Ausführungen werden standardmäßig DAG-Ausführungen der letzten 10 Tage angezeigt. Wenn Sie DAG-Ausführungen nach einem anderen Zeitraum filtern möchten, wählen Sie im Drop-down-Menü 10 Tage einen Zeitraum aus und klicken Sie dann auf OK.

    2. Optional: Wenn Sie zusätzliche Spalten mit Details zum DAG-Lauf in der Liste aller DAG-Läufe anzeigen möchten, klicken Sie auf  Spaltenanzeigeoptionen, wählen Sie die gewünschten Spalten aus und klicken Sie auf OK.

    3. Wenn Sie Details und Logs für eine ausgewählte DAG-Ausführung aufrufen möchten, wählen Sie eine DAG-Ausführung aus.

  5. Wenn Sie eine Visualisierung des DAG mit Aufgabenabhängigkeiten aufrufen möchten, wählen Sie den Tab Diagramm aus.

    1. Wenn Sie die Details einer Aufgabe aufrufen möchten, wählen Sie im Diagramm eine Aufgabe aus.
  6. Wenn Sie den Quellcode des DAG ansehen möchten, wählen Sie den Tab Code aus.

  7. Optional: Klicken Sie auf Aktualisieren, um die angezeigten Daten zu aktualisieren.

Alle Airflow-DAGs ansehen

So rufen Sie Airflow-DAGs aus allen Cloud Composer 3-Umgebungen in IhremGoogle Cloud -Projekt auf:

  1. Rufen Sie in der Google Cloud Console die Seite Scheduling auf.

    Zur Seite Terminplanung

  2. Optional: Wenn Sie zusätzliche Spalten mit DAG-Details anzeigen möchten, klicken Sie auf  Spaltenanzeigeoptionen, wählen Sie die gewünschten Spalten aus und klicken Sie auf OK.

Airflow-DAG pausieren

So pausieren Sie einen ausgewählten Airflow-DAG:

  1. Rufen Sie in der Google Cloud Console die Seite Scheduling auf.

    Zur Seite Terminplanung

  2. Führen Sie eine der folgenden Aktionen aus:

    • Klicken Sie auf den Namen des ausgewählten DAG und dann auf der Seite DAG-Details auf DAG pausieren.

    • Klicken Sie in der Zeile mit dem ausgewählten DAG in der Spalte Aktionen auf  Aktionen ansehen und dann auf DAG pausieren.

Fehlerbehebung

Eine Anleitung zur Fehlerbehebung bei Airflow-DAGs finden Sie in der Cloud Composer-Dokumentation unter Fehlerbehebung bei Airflow-DAGs.

Nächste Schritte