kubectl
-Befehlszeilentools erforderlich.
Übersicht
Sie können die Hochverfügbarkeit in Ihrem Datenbankcluster aktivieren, indem Sie den AlloyDB Omni Kubernetes-Operator anweisen, Stand-by-Replikate Ihrer primären Datenbankinstanz zu erstellen. Der AlloyDB Omni-Operator konfiguriert Ihren Datenbankcluster so, dass die Daten auf diesem Replikat kontinuierlich aktualisiert werden und alle Datenänderungen in Ihrer primären Instanz übernommen werden.
Hochverfügbarkeit aktivieren
Bevor Sie die Hochverfügbarkeit für Ihren Datenbankcluster aktivieren, muss Ihr Kubernetes-Cluster Folgendes haben:
- Speicherplatz für zwei vollständige Kopien Ihrer Daten
- Rechenressourcen für zwei parallel ausgeführte Datenbankinstanzen
So aktivieren Sie HA:
Ändern Sie das Manifest des Datenbankclusters so, dass es unter dem Abschnitt
spec
einen Abschnittavailability
enthält. In diesem Abschnitt wird die Anzahl der Stand-by-Instanzen definiert, die Sie hinzufügen möchten, indem Sie den ParameternumberOfStandbys
festlegen.spec: availability: numberOfStandbys: NUMBER_OF_STANDBYS
Ersetzen Sie
NUMBER_OF_STANDBYS
durch die Anzahl der Stand-by-Instanzen, die Sie hinzufügen möchten. Der Höchstwert ist5
. Wenn Sie HA einrichten und sich nicht sicher sind, wie viele Stand-bys Sie benötigen, beginnen Sie mit dem Wert1
oder2
.Wenden Sie das Manifest noch einmal an.
Hochverfügbarkeit deaktivieren
So deaktivieren Sie HA:
Setzen Sie
numberOfStandbys
im Manifest des Clusters auf0
:spec: availability: numberOfStandbys: 0
Wenden Sie das Manifest noch einmal an.
HA in einem Datenbankcluster prüfen
Wenn Sie den aktuellen HA-Status eines Datenbankclusters aufrufen möchten, prüfen Sie die HAReady
-Bedingung des Status dieses Clusters. Wenn dieser Wert für status
auf True
festgelegt ist, ist HA für den Datenbankcluster eingerichtet und funktioniert.
Führen Sie den folgenden Befehl aus, um diesen Wert in der Befehlszeile zu prüfen:
kubectl get dbcluster.alloydbomni.dbadmin.goog DB_CLUSTER_NAME -o jsonpath={.status.conditions[?(@.type == \'HAReady\')]} -n NAMESPACE
Ersetzen Sie Folgendes:
DB_CLUSTER_NAME
: Der Name des Datenbankclusters.NAMESPACE
: Der Namespace des Datenbankclusters.
Failover auf eine Stand-by-Instanz ausführen
Wenn Ihre primäre Instanz für einen konfigurierbaren Zeitraum nicht verfügbar ist, führt der AlloyDB Omni-Operator automatisch ein Failover von der primären Datenbankinstanz zur Stand-by-Instanz durch. Die Standardzeit zum Auslösen eines automatischen Failovers beträgt 90 Sekunden.
Failover sind eine gute Option, wenn Sie nach einem unerwarteten Fehler eine schnelle Wiederherstellung sowie eine geringe Ausfallzeit wünschen, auch wenn dies bedeutet, dass möglicherweise eine geringe Menge an Daten verloren geht, wenn die primäre Datenbank nicht mehr verfügbar ist, bevor die Sicherung vollständig aktualisiert wurde.
Der AlloyDB Omni-Operator unterstützt sowohl automatische als auch manuelle Failover. Das automatische Failover ist standardmäßig aktiviert.
Ein Failover führt zu der folgenden Ereignisabfolge:
Der AlloyDB Omni-Operator nimmt die primäre Datenbankinstanz offline.
Der AlloyDB Omni-Operator stuft das Stand-by-Replikat zur neuen primären Datenbankinstanz hoch.
Der AlloyDB Omni-Operator löscht die vorherige primäre Datenbankinstanz.
Der AlloyDB Omni-Operator erstellt ein neues Stand-by-Replikat.
Automatischen Failover deaktivieren
Automatische Failover sind in Datenbankclustern standardmäßig aktiviert.
So deaktivieren Sie ein Failover:
Setzen Sie
enableAutoFailover
im Manifest des Clusters auffalse
:spec: availability: enableAutoFailover: false
Einstellungen für den automatischen Failover-Trigger anpassen
Mit den Einstellungen können Sie automatische Failover für jeden Datenbankcluster anpassen.
Der AlloyDB Omni-Operator führt alle 30 Sekunden regelmäßige Systemdiagnosen durch. Wenn eine Instanz den Grenzwert für den automatischen Failover erreicht hat, löst der AlloyDB Omni-Operator einen automatischen Failover aus.
Der Standardwert für den Schwellenwert für die automatische Failover-Auslösung ist 3
. Der Grenzwert ist die Anzahl der aufeinanderfolgenden Fehler bei der Systemdiagnose, bevor ein Failover ausgelöst wird. Wenn Sie den Grenzwert ändern möchten, legen Sie autoFailoverTriggerThreshold
im Manifest des Clusters auf einen Ganzzahlwert fest:
```yaml
spec:
availability:
autoFailoverTriggerThreshold: TRIGGER_THRESHOLD
```
Ersetzen Sie Folgendes:
TRIGGER_THRESHOLD
: Ein Ganzzahlwert für die Anzahl der aufeinanderfolgenden Fehler bei der Systemdiagnose, bevor ein Failover ausgelöst wird. Der Standardwert ist3
.
Manuelles Failover auslösen
Um ein manuelles Failover auszulösen, erstellen und wenden Sie ein Manifest für eine neue Failover-Ressource an:
apiVersion: alloydbomni.dbadmin.goog/v1
kind: Failover
metadata:
name: FAILOVER_NAME
namespace: NAMESPACE
spec:
dbclusterRef: DB_CLUSTER_NAME
Ersetzen Sie Folgendes:
FAILOVER_NAME
: Ein Name für diese Ressource, z. B.failover-1
.NAMESPACE
: Der Namespace für diese Failover-Ressource. Er muss mit dem Namespace des Datenbankclusters übereinstimmen, auf den sie angewendet wird.DB_CLUSTER_NAME
: Der Name des Datenbankclusters, für den ein Failover durchgeführt werden soll.
Führen Sie zur Überwachung des Failovers den folgenden Befehl aus:
kubectl get failover FAILOVER_NAME -o jsonpath={.status.state} -n NAMESPACE
Ersetzen Sie Folgendes:
FAILOVER_NAME
: Der Name, den Sie der Failover-Ressource beim Erstellen zugewiesen haben.NAMESPACE
: Der Namespace des Datenbankclusters.
Der Befehl gibt Success
zurück, nachdem die neue primäre Datenbankinstanz einsatzbereit ist. Informationen zum Überwachen des Status der neuen Stand-by-Instanz finden Sie im nächsten Abschnitt.
Switchover zur Stand-by-Instanz durchführen
Ein Switchover wird durchgeführt, wenn Sie Ihre Einrichtung für die Notfallwiederherstellung oder andere geplante Aktivitäten testen möchten, bei denen die Rollen der primären Datenbank und des Stand-by-Replikats getauscht werden müssen.
Nach Abschluss des Switchovers werden die Rollen der primären Datenbankinstanz und des Stand-by-Replikats zusammen mit der Richtung der Replikation umgekehrt. Sie müssen sich für Switchovers entscheiden, wenn Sie mehr Kontrolle über das Testen Ihrer Notfallwiederherstellungseinrichtung ohne Datenverlust haben möchten.
Der AlloyDB Omni-Operator unterstützt manuelles Switchover.
Ein Switchover führt zu der folgenden Ereignisabfolge:
Der AlloyDB Omni-Operator nimmt die primäre Datenbankinstanz offline.
Der AlloyDB Omni-Operator stuft das Stand-by-Replikat zur neuen primären Datenbankinstanz hoch.
Der AlloyDB Omni-Operator ändert die vorherige primäre Datenbankinstanz in ein Stand-by-Replikat.
Switchover durchführen
Prüfen Sie vor dem Switchover Folgendes:
- Prüfen Sie, ob sowohl die primäre Datenbankinstanz als auch das Stand-by-Replikat fehlerfrei sind. Weitere Informationen finden Sie unter AlloyDB Omni verwalten und überwachen.
- Prüfen Sie, ob der aktuelle HA-Status
HAReady
lautet. Weitere Informationen finden Sie unter HA in einem Datenbankcluster prüfen.
Um ein Switchover durchzuführen, erstellen und wenden Sie ein Manifest für eine neue Switchover-Ressource an:
apiVersion: alloydbomni.dbadmin.goog/v1
kind: Switchover
metadata:
name: SWITCHOVER_NAME
spec:
dbclusterRef: DB_CLUSTER_NAME
newPrimary: STANDBY_REPLICA_NAME
Ersetzen Sie Folgendes:
SWITCHOVER_NAME
: Ein Name für diese Switchover-Ressource, z. B.switchover-1
.DB_CLUSTER_NAME
: Der Name der primären Datenbankinstanz, auf die sich der Switchover-Vorgang bezieht.STANDBY_REPLICA_NAME
: Der Name der Datenbankinstanz, die Sie zur neuen primären Instanz hochstufen möchten.Führen Sie den folgenden Befehl aus, um den Namen des Stand-by-Replikats zu ermitteln:
posix-terminal kubectl get instances.alloydbomni.internal.dbadmin.goog
Stand-by-Replikat als schreibgeschützte Instanz verwenden
So verwenden Sie ein Stand-by-Replikat als schreibgeschützte Instanz:
Ändern Sie das Manifest des Datenbankclusters, um den Parameter
enableStandbyAsReadReplica
auftrue
zu setzen.spec: availability: enableStandbyAsReadReplica: true
Wenden Sie das Manifest noch einmal an.
Prüfen Sie, ob der schreibgeschützte Endpunkt im Feld
status
desDBCluster
-Objekts angegeben ist:kubectl describe dbcluster -n NAMESPACE DB_CLUSTER_NAME
Die folgende Beispielantwort enthält den Endpunkt der schreibgeschützten Instanz:
Status: [...] Primary: [...] Endpoints: Name: Read-Write Value: 10.128.0.81:5432 Name: Read-Only Value: 10.128.0.82:5432