Daten zwischen AlloyDB Omni und anderen Datenbanken replizieren

Wählen Sie eine Dokumentationsversion aus:

Auf dieser Seite wird beschrieben, wie Sie Daten zwischen AlloyDB Omni und anderen Datenbanken mit der pglogical-Erweiterung replizieren.

Weitere Informationen finden Sie unter pglogical-Erweiterung und pglogical-Terminologie und grundlegende Komponenten.

Unterstützte Authentifizierungsmethoden

Die beiden wichtigsten Authentifizierungsmethoden, die mit der pglogical-Erweiterung verwendet werden, sind Passwort- und Vertrauensauthentifizierungsmethoden.

Die empfohlene Authentifizierungsmethode ist die Vertrauensauthentifizierung. Weitere Informationen finden Sie unter Unterstützte Authentifizierungsmethoden.

Hinweise

Sie können pglogical als Erweiterung in einer bestimmten Datenbank installieren.

Bevor Sie die pglogical-Erweiterung in AlloyDB Omni implementieren, müssen die folgenden Systemanforderungen erfüllt sein:

  • Zugriff auf Ihren Nicht-AlloyDB PostgreSQL-Cluster als superuser.
  • Die Erweiterung pglogical ist in Ihrem PostgreSQL-Cluster installiert, der nicht AlloyDB ist. Eine versions- und distributionsspezifische Installationsanleitung finden Sie unter pglogical.
  • Ein AlloyDB Omni-Server ist installiert und konfiguriert. Eine Anleitung zur Installation von AlloyDB Omni finden Sie unter AlloyDB Omni installieren.
  • Die IP-Adressen für den PostgreSQL-Cluster, der nicht AlloyDB ist, und den AlloyDB Omni-Hostserver.
  • Es muss eine sichere Netzwerkverbindung zwischen dem Nicht-AlloyDB PostgreSQL-Cluster und dem AlloyDB Omni-Hostserver bestehen. TCP-Verbindungen über den PostgreSQL-Standardport 5432 sind erforderlich.

Parameter für den Nicht-AlloyDB-Anbieter anpassen

  1. Legen Sie den Parameter wal_level auf logical fest und hängen Sie pglogical an den Parameter shared_preload_libraries in der Datei postgresql.conf an. Für die pglogical-Erweiterung sind nur minimale Anpassungen der Parameter im Nicht-AlloyDB-Providercluster erforderlich.

    cp postgresql.conf postgresql.bak
    sed -r -i "s|(\#)?wal_level\s*=.*|wal_level=logical|" postgresql.conf
    sed -r -i "s|(\#)?(shared_preload_libraries\s*=\s*)'(.*)'.*$|\2'\3,pglogical'|" postgresql.conf
    sed -r -i "s|',|'|" postgresql.conf
  2. Prüfen Sie, ob die Parameter richtig festgelegt sind:

    grep -iE 'wal_level|shared_preload_libraries' postgresql.conf
  3. Starten Sie Ihren Nicht-AlloyDB-Cluster neu, damit die Parameteränderungen wirksam werden.

    Andere Parameter sind möglicherweise bereits auf ausreichende Werte festgelegt oder müssen je nach Ihrer Nicht-AlloyDB-Distribution und -Version angepasst werden.

    Prüfen Sie die folgenden Parameter:

    • max_worker_processes: eine pro Anbieterdatenbank und mindestens eine pro Abonnentenknoten. Der Standardwert für diesen Parameter ist mindestens 10.
    • max_replication_slots: Eine pro Knoten auf Anbietern.
    • max_wal_senders: Eine pro Knoten auf Anbietern.
    • track_commit_timestamp: Auf on setzen, wenn eine Konfliktlösung erforderlich ist, bei der die letzte oder erste Aktualisierung gewinnt.
    • listen_addresses: muss die AlloyDB Omni-IP-Adresse enthalten oder über einen umfassenden CIDR-Block angegeben werden.
  4. (Optional) Wenn Ihr Nicht-AlloyDB-Anbieter Amazon RDS oder Aurora ist, muss die pglogical-Erweiterung aktiviert und die erforderlichen Parameter über cluster parameter group-Anpassungen angepasst werden.

    1. Legen Sie in einer vorhandenen oder neuen Clusterparametergruppe die folgenden Parameter fest:

      • rds.logical_replication bis 1
      • max_replication_slots nach 50
      • max_wal_senders nach 50
      • max_worker_processes nach 64
      • shared_preload_libraries bis pg_stat_statements, pglogical
    2. Starten Sie Ihren Amazon RDS- oder Aurora-Cluster neu, damit die Anpassungen der Clusterparametergruppe wirksam werden.

  5. Prüfen Sie, ob alle Parameterwerte relevant sind:

    SELECT name, setting
    FROM pg_catalog.pg_settings
     WHERE name IN ('listen_addresses',
                    'wal_level',
                    'shared_preload_libraries',
                    'max_worker_processes',
                    'max_replication_slots',
                    'max_wal_senders',
                    'track_commit_timestamp')
     ORDER BY name;
    

Anpassungen der hostbasierten Authentifizierung am Nicht-AlloyDB Omni-Anbietercluster

Mit pglogical werden lokale TCP-Verbindungen zur Anbieterdatenbank hergestellt. Daher müssen Sie die IP-Adresse des Hostservers der AlloyDB Omni-Datei DATA_DIR/pg_hba.conf hinzufügen, wobei DATA_DIR der Dateisystempfad zu Ihrem Datenverzeichnis ist, z. B. /home/$USER/alloydb-data.

  1. Fügen Sie der Datei DATA_DIR/pg_hba.conf einen Eintrag für die Vertrauensauthentifizierung für den lokalen Server hinzu, der für einen neuen pglogical_replication-Nutzer spezifisch ist.

    Außerdem müssen sich Abonnentenknoten bei den Providerknoten authentifizieren können. Fügen Sie der Datei DATA_DIR/pg_hba.conf entweder die IP-Adresse jedes Abonnentenknotens oder den entsprechenden IP-Bereich des CIDR-Blocks hinzu:

    echo -e "# pglogical entries:
    host all pglogical_replication samehost trust
    host all pglogical_replication SERVER_IP_ADDRESS/32 trust
    " | column -t | sudo tee -a DATA_DIR/pg_hba.conf

    Ersetzen Sie SERVER_IP_ADDRESS durch die IP-Adresse der primären AlloyDB Omni-Instanz, von der repliziert werden soll.

  2. Prüfen Sie, ob die Einträge korrekt sind:

    tail -3 DATA_DIR/pg_hba.conf
  3. Starten Sie Ihren Nicht-AlloyDB-Cluster neu, damit die Parameteränderungen wirksam werden.

Parameter für den AlloyDB Omni-Abonnentencluster anpassen

Für die pglogical sind auch im AlloyDB Omni-Abonnentencluster nur minimale Parameteranpassungen erforderlich. Sie müssen pglogical an den Parameter shared_preload_libraries in der Datei DATA_DIR/postgresql.conf anhängen. Wenn eine Datenbank im Cluster als Anbieterdatenbank fungiert, nehmen Sie die für Anbieterdatenbanken erforderlichen Parameteränderungen vor.

  1. Passen Sie die Parameter an:

    sudo sed -r -i "s|(shared_preload_libraries\s*=\s*)'(.*)'.*$|\1'\2,pglogical'|" DATA_DIR/postgresql.conf
  2. Prüfen Sie, ob der Parameter richtig festgelegt ist:

    grep -iE 'shared_preload_libraries' DATA_DIR/postgresql.conf
  3. Starten Sie AlloyDB Omni neu, damit die Parameteränderung wirksam wird:

    Docker

     docker container restart CONTAINER_NAME

    Ersetzen Sie CONTAINER_NAME durch den Namen, den Sie dem AlloyDB Omni-Container beim Start zugewiesen haben.

    Podman

     podman container restart CONTAINER_NAME

    Ersetzen Sie CONTAINER_NAME durch den Namen, den Sie dem AlloyDB Omni-Container beim Start zugewiesen haben.

  4. Legen Sie die AlloyDB Omni-Standardwerte für andere Datenbankparameter des Anbieters fest:

    • max_worker_processes: Eine pro Anbieterdatenbank und eine pro Abonnentenknoten.
    • track_commit_timestamp: Setzen Sie diese Option auf on, wenn eine Konfliktlösung für die letzte/erste Aktualisierung erforderlich ist.
  5. Prüfen Sie, ob alle Parameterwerte relevant sind:

    Docker

    docker exec CONTAINER_NAME psql -h localhost -U postgres -c "
    SELECT name, setting
      FROM pg_catalog.pg_settings
     WHERE name IN ('listen_addresses',
                    'wal_level',
                    'shared_preload_libraries',
                    'max_worker_processes',
                    'max_replication_slots',
                    'max_wal_senders',
                    'track_commit_timestamp')
         ORDER BY name;
    "

    Podman

    podman exec CONTAINER_NAME psql -h localhost -U postgres -c "
    SELECT name, setting
      FROM pg_catalog.pg_settings
     WHERE name IN ('listen_addresses',
                    'wal_level',
                    'shared_preload_libraries',
                    'max_worker_processes',
                    'max_replication_slots',
                    'max_wal_senders',
                    'track_commit_timestamp')
         ORDER BY name;
    "

Anpassungen der hostbasierten Authentifizierung für den AlloyDB Omni-Abonnentencluster

Mit pglogical werden lokale TCP-Verbindungen zur AlloyDB Omni-Abonnentendatenbank hergestellt. Daher müssen Sie die IP-Adresse des Hostservers des Abonnenten der DATA_DIR/pg_hba.conf-Datei von AlloyDB Omni hinzufügen.

  1. Fügen Sie der Datei DATA_DIR/pg_hba.conf einen Eintrag für die Vertrauensauthentifizierung für den lokalen Server hinzu, der für einen neuen pglogical_replication-Nutzer spezifisch ist:

    echo -e "# pglogical entries:
    host all pglogical_replication samehost trust
    " | column -t | sudo tee -a DATA_DIR/pg_hba.conf
  2. Prüfen Sie, ob der Eintrag korrekt ist:

    tail -2 DATA_DIR/pg_hba.conf
  3. Starten Sie AlloyDB Omni neu, damit die Authentifizierungsänderung wirksam wird:

    docker container restart CONTAINER_NAME

pglogical-Nutzer in Provider- und Abonnentenclustern erstellen

Sie müssen sowohl im Anbieter- als auch im Abonnentencluster einen neuen Nutzer erstellen. Für pglogical muss der Nutzer sowohl das Attribut superuser als auch das Attribut replication haben.

  1. Erstellen Sie im AlloyDB for PostgreSQL-Providercluster die Nutzerrolle:

    CREATE USER pglogical_replication LOGIN PASSWORD 'secret';
    ALTER USER pglogical_replication WITH replication;
    ALTER USER pglogical_replication WITH superuser;
    
  2. Optional: Wenn Ihr Nicht-AlloyDB-Anbieter Amazon RDS oder Aurora ist, müssen Sie die folgende Rolle zuweisen:

    GRANT rds_superuser TO replication_user;
    

pglogical und Knoten zur Nicht-AlloyDB-Anbieterdatenbank hinzufügen

  1. Erforderliche Berechtigungen erteilen

    Sie müssen die Erweiterung pglogical in jeder Datenbank installieren und dem pglogical-Datenbanknutzer die Berechtigung usage gewähren.

    Wenn Ihre Datenbank beispielsweise my_test_db heißt, führen Sie den folgenden Befehl aus:

    CREATE EXTENSION IF NOT EXISTS pglogical;
    GRANT usage ON SCHEMA pglogical TO pglogical_replication;
    
  2. Erstellen Sie einen pglogical-Knoten für die Anbieterdatenbanken. node_name ist beliebig und der String dsn muss eine gültige TCP-Verbindung zurück zur selben Datenbank sein.

    Führen Sie für die Datenbank my_test_db beispielsweise den folgenden Befehl aus:

    SELECT pglogical.create_node(node_name := 'provider', dsn := 'host=SERVER_IP_ADDRESS port=5432 dbname=my_test_db user=pglogical_replication password=secret');
    

Tabelle erstellen und dem Standard-Replikations-Dataset hinzufügen

Erstellen Sie eine Tabelle und fügen Sie sie dem Standard-Replikations-Dataset in der Nicht-AlloyDB-Anbieterdatenbank hinzu.

  1. Erstellen Sie in der Anbieterdatenbank eine Testtabelle mit dem Namen test_table_1:

    CREATE TABLE test_table_1 (col1 INT PRIMARY KEY);
    INSERT INTO test_table_1 VALUES (1),(2),(3);
    
  2. Fügen Sie die Testtabelle manuell dem Standardreplikationssatz hinzu. Sie können entweder benutzerdefinierte pglogical-Replikationssätze erstellen oder die Standardreplikationssätze verwenden. Beim Erstellen der Erweiterung wurden mehrere Standardreplikationssätze wie default, default_insert_only und ddl_sql erstellt. Sie können den Replikationssets Tabellen und Sequenzen einzeln oder alle gleichzeitig für ein bestimmtes Schema hinzufügen.

    -- Add the specified table to the default replication set:
    SELECT pglogical.replication_set_add_table(set_name := 'default', relation := 'test_table_1', synchronize_data := TRUE);
    
    -- Check which tables have been added to all replication sets:
    SELECT * FROM pglogical.replication_set_table;
    
  3. Optional: Fügen Sie alle Tabellen in einem angegebenen Schema hinzu, z. B. public:

    -- Add all "public" schema tables to the default replication set:
    SELECT pglogical.replication_set_add_all_tables('default', ARRAY['public']);
    
    -- Check which tables have been added to all replication sets:
    SELECT * FROM pglogical.replication_set_table;
    
    -- Add all "public" schema sequences to the default replication:
    SELECT pglogical.replication_set_add_all_sequences('default', ARRAY['public']);
    
    -- Check which sequences have been added to all replication sets:
    SELECT * FROM pglogical.replication_set_seq;
    
  4. Entfernen Sie die Tabelle aus dem Replikationssatz default. Wenn das Schema Tabellen ohne Primärschlüssel oder Replikatidentität enthält, können nur INSERT-Anweisungen repliziert werden. Wenn Sie diese Tabellen dem Replikationssatz default automatisch über die Funktion replication_set_add_all_tables hinzugefügt haben, müssen Sie sie manuell aus diesem Replikationssatz entfernen und dem Satz default_insert_only hinzufügen.

    -- Remove the table from the **default** replication set:
    SELECT pglogical.replication_set_remove_table(set_name := 'default', relation := 'test_table_2');
    
    -- Manually add to the **default_insert_only** replication set:
    SELECT pglogical.replication_set_add_table(set_name := 'default_insert_only', relation := 'test_table_2');
    

    Wenn Sie die neu erstellten Tabellen optional automatisch dem Replikationssatz hinzufügen möchten, fügen Sie den pglogical_assign_repset-Trigger wie in der pglogical-Quelle vorgeschlagen hinzu.

Kopieren Sie die Datenbank in den AlloyDB Omni-Abonnentencluster.

  1. Erstellen Sie mit dem Dienstprogramm pg_dump eine Sicherung der Quelldatenbank, die nur das Schema enthält.

  2. Führen Sie den Befehl pg_dump auf dem AlloyDB Omni-Abonnentenserver mit der IP-Adresse oder dem Endpunkt des Nicht-AlloyDB-Servers aus.

    pg_dump -h SERVER_IP_ADDRESS -U postgres --create --schema-only my_test_db > my_test_db.schema-only.sql
  3. Importieren Sie die Sicherung in die Abonnentendatenbank auf dem AlloyDB Omni-Server des Abonnenten:

    Docker

    docker exec -i CONTAINER_NAME psql -h localhost -U postgres < my_test_db.schema-only.sql

    Podman

    podman exec -i CONTAINER_NAME psql -h localhost -U postgres < my_test_db.schema-only.sql

Dadurch werden die Datenbank und das Schema ohne Zeilendaten erstellt. Zeilendaten werden von der Erweiterung pglogical repliziert. Kopieren oder erstellen Sie alle anderen erforderlichen Nutzer oder Rollen manuell.

Knoten und Abo in der AlloyDB Omni-Abonnentendatenbank erstellen

  1. Erstellen Sie einen Knoten in der AlloyDB Omni-Abonnentendatenbank. Fügen Sie das Passwort Ihrem dsn hinzu, wenn Sie die Passwortauthentifizierung verwenden möchten.

    Docker

    docker exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT pglogical.create_node(node_name := 'subscriber', dsn := 'host=localhost port=5432 dbname=my_test_db user=pglogical_replication');
    "

    Podman

    podman exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT pglogical.create_node(node_name := 'subscriber', dsn := 'host=localhost port=5432 dbname=my_test_db user=pglogical_replication');
    "
  2. Erstellen Sie in der Abonnentendatenbank ein Abo, das auf die Anbieterdatenbank auf dem AlloyDB Omni-Anbieterserver verweist.

    Docker

    docker exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT pglogical.create_subscription(subscription_name := 'test_sub_1', provider_dsn := 'host=SERVER_IP_ADDRESS port=5432 dbname=my_test_db user=pglogical_replication password=secret');
    "

    Podman

    podman exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT pglogical.create_subscription(subscription_name := 'test_sub_1', provider_dsn := 'host=SERVER_IP_ADDRESS port=5432 dbname=my_test_db user=pglogical_replication password=secret');
    "
  3. Innerhalb weniger Sekunden oder Minuten sollten die ursprünglichen Daten vom Anbieter zum Abonnenten repliziert werden:

    Docker

    docker exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT * FROM test_table_1 ORDER BY 1;
    "

    Podman

    podman exec CONTAINER_NAME psql -h localhost -U postgres -d my_test_db -c "
    SELECT * FROM test_table_1 ORDER BY 1;
    "

    Zusätzliche Zeilen, die der Anbieterdatenbank hinzugefügt werden, werden ebenfalls innerhalb von Sekunden in Echtzeit repliziert.

Zusätzliche pglogical-Bereitstellungsüberlegungen

Die Erweiterung pglogical bietet viele erweiterte Funktionen, die in diesem Dokument nicht behandelt werden. Viele dieser Funktionen sind für Ihre Implementierung relevant. Sie können die folgenden erweiterten Funktionen in Betracht ziehen:

  • Konfliktlösung
  • Multimaster- und bidirektionale Replikation
  • Einbeziehung von Sequenzen
  • Switchover- und Failover-Verfahren

Nächste Schritte