Failover-Tests für hochgradig resiliente Umgebungen durchführen

Cloud Composer 3 | Cloud Composer 2 | Cloud Composer 1

Auf dieser Seite wird beschrieben, wie Sie einen Datenbank-Failover-Test für hochverfügbare Umgebungen durchführen.

Bei Failover-Tests für Ihre Umgebung wird ein vollständiger Ausfall einer Zone in einem Rechenzentrum simuliert. In einem solchen Szenario kann es zu einem zonalen Ausfall einer Datenbank kommen. Wenn Sie einen Failover-Test durchführen, können Sie beobachten, wie Ihr hochverfügbares System ein Failover ausführt, und prüfen, wie sich dies auf Ihre DAGs und Aufgaben auswirkt.

Hinweise

  • Für Failover-Tests muss Ihr Google-Konto die folgenden Rollen und Berechtigungen haben:

    • Berechtigung composer.environments.update. Eine Liste der Rollen mit dieser Berechtigung finden Sie unter Zugriffssteuerung mit IAM.

  • In Cloud Composer 3 befindet sich der Cluster der Umgebung im Mandantenprojekt Ihrer Umgebung. Es ist nicht möglich, einen zonalen Ausfall für ihn zu simulieren.

Prüfen, ob Ihre Umgebung fehlerfrei ist

Führen Sie Failover-Tests nur in fehlerfreien Umgebungen durch. So prüfen Sie, ob Ihre Umgebung fehlerfrei ist:

  1. Rufen Sie in der Google Cloud -Console die Seite Umgebungen auf.

    Zur Seite Umgebungen

  2. Klicken Sie in der Liste der Umgebungen auf den Namen Ihrer Umgebung. Die Seite Umgebungsdetails wird geöffnet.

  3. Rufen Sie den Tab Monitoring auf.

  4. Achten Sie darauf, dass alle Systemdiagnosemesswerte grün sind.

Datenbank-Failover-Test durchführen

Sie können einen Datenbank-Failover-Test durchführen, der einen zonalen Ausfall simuliert, indem Sie ihn mit einem Google Cloud CLI-Befehl auslösen. Das kann beispielsweise sinnvoll sein, um zu messen, wie lange es dauert, bis die Datenbank Ihrer Umgebung in eine andere Zone wechselt.

So führen Sie einen Datenbank-Failover-Test für Ihre Umgebung durch:

  1. Prüfen Sie, ob Ihre Umgebung fehlerfrei ist.

  2. Primäre Zone der Datenbank Ihrer Umgebung abrufen:

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    Ersetzen Sie Folgendes:

    • ENVIRONMENT_NAME: Der Name Ihrer Cloud Composer-Umgebung.
    • LOCATION: die Region, in der sich die Umgebung befindet.

    Beispiel:

    gcloud composer environments fetch-database-properties \
        example-environment \
        --location us-central1
    
  3. Starten Sie den Datenbank-Failover-Test:

    gcloud composer environments database-failover \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    Ersetzen Sie Folgendes:

    • ENVIRONMENT_NAME: Der Name Ihrer Cloud Composer-Umgebung.
    • LOCATION: die Region, in der sich die Umgebung befindet.

    Beispiel:

    gcloud composer environments database-failover \
        example-environment \
        --location us-central1
    
  4. Warten Sie, bis der Datenbank-Failover-Test abgeschlossen ist. Der Vorgang kann bis zu 3 Minuten dauern.

  5. Prüfen Sie, ob die primäre Zone der Datenbank Ihrer Umgebung geändert wurde:

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    
  6. Prüfen Sie die Gesundheitsmesswerte Ihrer Umgebung, um sicherzustellen, dass Ihre Umgebung in gutem Zustand ist.

  7. Die Datenbank Ihrer Umgebung ist bereit für ein weiteres Failover, wenn der Umgebungs-Messwert Database available for failover (composer.googleapis.com/environment/database/available_for_failover) den Wert True hat. Weitere Informationen zum Ansehen der Messwerte Ihrer Umgebung in Cloud Monitoring finden Sie unter Umgebungen überwachen.

Nächste Schritte