Questa pagina descrive come utilizzare il ripristino di emergenza (RE) avanzato. Il DR avanzato offre due funzionalità principali:
- Il failover della replica consente di eseguire il failover dell'istanza principale sulla replica di RE immediatamente in caso di guasto regionale. Per Cloud SQL per SQL Server, la replica di RE è una replica a cascata.
- Il cambio ti consente di invertire i ruoli dell'istanza principale e di una replica di RE senza perdita di dati. Puoi utilizzare lo switchover per ripristinare lo stato di deployment originale di un deployment dopo il failover della replica oppure per testare il RE.
Il DR avanzato è supportato solo nelle istanze della versione Cloud SQL Enterprise Plus.
Prima di iniziare
Se prevedi di utilizzare Google Cloud SDK, devi utilizzare la versione 502.0.0 o successiva. Per controllare la versione dell'Google Cloud SDK, esegui gcloud --version
. Per aggiornare
l'Google Cloud SDK, esegui gcloud components update
.
Per installare Google Cloud SDK, consulta Installa Google Cloud CLI.
Crea una replica RE
Prima di utilizzare RE avanzato, crea una replica con struttura a cascata dell'istanza principale in una regione diversa da quella dell'istanza principale.
Eseguire uno switchover
Dopo aver creato una replica di RE, puoi eseguire l'operazione di switchover. Tuttavia, come best practice, evita di eseguire l'operazione di passaggio nelle seguenti circostanze:
- L'istanza principale è in uso attivo.
- Sono in corso operazioni di amministrazione, come il backup automatico o l'attivazione o la disattivazione dell'alta disponibilità (HA).
Per evitare un timeout, valuta la possibilità di eseguire il passaggio quando il volume delle transazioni è ridotto.
Al termine dello switchover, l'operazione esegue il backup della nuova istanza principale (l'ex replica RE) non appena la nuova istanza principale viene promossa. Il completamento del backup può richiedere da 5 a 15 minuti, a seconda delle dimensioni del disco. Al termine del backup, se vuoi utilizzare il PITR sull'istanza promossa, devi abilitare il PITR manualmente. Per ulteriori informazioni sulle considerazioni relative all'utilizzo del PITR con RE avanzato, consulta Utilizzare il PITR con il DR avanzato.
Al termine dell'operazione di switchover, noterai che la direzione della replica è invertita.
Dopo che la vecchia istanza principale è stata riconfigurata come replica di lettura, l'endpoint di scrittura DNS, che in precedenza risolveva nella vecchia istanza principale, risolve nella nuova istanza principale.
Prima di iniziare
Prima di eseguire l'operazione di passaggio, segui questi passaggi:
- Se non l'hai ancora fatto, crea una RE DR.
- Verifica che l'istanza principale e la replica di RE siano online.
- Se utilizzi un endpoint di scrittura DNS, verifica che la configurazione SSL per l'istanza principale e la replica di RE sia la stessa. Ad esempio, se la replica di RE è configurata per applicare la crittografia SSL, ma l'istanza principale consente connessioni non criptate, i client non potranno connettersi alla nuova istanza principale al termine dell'operazione di switchover.
- Esegui un backup on demand dell'istanza principale. Questo backup è una misura di sicurezza nel caso in cui tu debba recuperare da eventuali errori imprevisti.
Esegui l'operazione di switchover
gcloud
Per eseguire l'operazione di passaggio, esegui il seguente comando:
gcloud sql instances switchover REPLICA_NAME
Sostituisci le seguenti variabili:
- REPLICA_NAME: il nome della replica di RE con cui vuoi che l'istanza principale cambi ruolo.
REST v1
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: l'ID o il numero di progetto del Google Cloud progetto dell'istanza principale e della replica di RE.
- REPLICA_NAME: il nome della replica RE.
Metodo HTTP e URL:
POST https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/REPLICA_NAME/switchover
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
REST v1beta4
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: l'ID o il numero di progetto del Google Cloud progetto dell'istanza principale e della replica di RE.
- REPLICA_NAME: il nome della replica RE.
Metodo HTTP e URL:
POST https://sqladmin.googleapis.com/sql/v1beta4/projects/PROJECT_ID/instances/REPLICA_NAME/switchover
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Esegui il DR richiamando un failover della replica
In caso di guasto regionale o di emergenza, puoi eseguire RE invocando un'operazione di failover della replica alla replica di RE designata. Per eseguire un failover della replica, promuovi la replica RE. A differenza del passaggio, la promozione della replica di RE è immediata.
Poiché la replica di RE assume immediatamente il ruolo dell'istanza principale, è possibile che la replica non contenga tutti i dati dell'istanza principale precedente a causa del ritardo della replica. Per questo motivo, un failover della replica può comportare la perdita di dati.
Nell'ambito del processo di promozione, il failover della replica esegue il backup della nuova istanza principale (l'ex replica RE) subito dopo che la replica RE diventa la nuova istanza principale. Al termine del backup, il recupero point-in-time (PITR) è completamente abilitato nella nuova istanza principale. Il completamento di questo backup può richiedere da 5 a 15 minuti, a seconda delle dimensioni del disco della nuova (e della vecchia) istanza principale. Durante questo periodo di backup, la funzionalità PITR non è disponibile.
Quando la vecchia istanza principale viene di nuovo online, il processo di failover della replica esegue un backup. Dopo aver eseguito il backup, la vecchia istanza principale viene rielaborata come replica di lettura della nuova istanza principale.
Per ulteriori informazioni sulle considerazioni relative all'utilizzo del PITR con RE avanzato, consulta Utilizzare il PITR con il DR avanzato.
Dopo aver invocato l'operazione di failover della replica, l'endpoint di scrittura DNS, che in precedenza risolveva nella vecchia istanza principale, si risolve nella nuova istanza principale.
Prima di iniziare
Prima di poter eseguire un failover della replica, segui questi passaggi:
- Se non l'hai ancora fatto, crea una RE DR.
- Assicurati che la replica di RE sia online e funzionante.
Esegui l'operazione di failover della replica
gcloud
Per invocare un failover della replica alla replica di RE, utilizza il seguente comando:
gcloud sql instances promote-replica \ REPLICA_NAME --failover
Sostituisci la seguente variabile:
- REPLICA_NAME: il nome della replica RE
REST v1
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: l'ID o il numero del progetto Google Cloud dell'istanza principale e della replica di RE.
- REPLICA_NAME: il nome della replica RE.
- ENABLE_REPLICA_FAILOVER: impostato su
true
per utilizzare il failover della replica. Se imposti il valorefalse
, l'API utilizza il metodopromoteReplica
normale senza il failover della replica.
Metodo HTTP e URL:
POST https://sqladmin.googleapis.com/v1/projects/PROJECT_ID/instances/REPLICA_NAME/promoteReplica?failover=ENABLE_REPLICA_FAILOVER
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
REST v1beta4
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: l'ID o il numero del progetto Google Cloud dell'istanza principale e della replica di RE.
- REPLICA_NAME: il nome della replica RE.
- ENABLE_REPLICA_FAILOVER: impostato su
true
per utilizzare il failover della replica. Se imposti il valorefalse
, l'API utilizza il metodopromoteReplica
normale senza il failover della replica.
Metodo HTTP e URL:
POST https://sqladmin.googleapis.com/sql/v1beta4/projects/PROJECT_ID/instances/REPLICA_NAME/promoteReplica?failover=ENABLE_REPLICA_FAILOVER
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Controllare lo stato del failover di una replica
Il failover della replica avviene in due fasi. La prima fase è la promozione della replica RE. La seconda fase consiste nella ricreazione della vecchia istanza principale come replica di lettura.
Per controllare lo stato del failover della replica, controlla lo stato di ogni fase.
Controlla lo stato della prima fase.
Console
Per verificare se la replica di RE è stata promossa a un'istanza autonoma:
-
Nella Google Cloud console, vai alla pagina Istanze Cloud SQL.
- Trova il nome della replica RE che hai promosso.
- Verifica che SQL Server VERSION sia visualizzato nella colonna Tipo per la nuova istanza principale.
gcloud
Per controllare lo stato, esegui il seguente comando:gcloud sql instances describe DR_REPLICA_NAME
Sostituisci la seguente variabile:
- DR_REPLICA_NAME: il nome della replica RE promossa
Nell'output, verifica che venga visualizzato il seguente campo e che la replica sia diventata un'istanza principale Cloud SQL autonoma:
instanceType: CLOUD_SQL_INSTANCE
-
Per verificare il completamento della seconda fase, controlla il log delle operazioni nell'istanza per il messaggio
RECONFIGURE_OLD_PRIMARY
.La visualizzazione di questo messaggio dipende da quando la vecchia istanza principale torna online, il che può richiedere minuti o giorni in caso di incidente.
Per ulteriori informazioni su come controllare i log delle operazioni in un'istanza, vedi Visualizzare i log dell'istanza.
Utilizzare il PITR con RE avanzato
Indipendentemente dal fatto che si tratti di uno switchover o di un failover della replica, se la replica di RE viene promossa a un'istanza principale e vuoi utilizzare la PITR nell'istanza promossa, devi attivarla manualmente.
Dopo aver attivato PITR, vengono applicati i criteri di configurazione del backup e di conservazione dei log delle transazioni. Se non specifichi valori per queste impostazioni, viene applicato il valore predefinito di 14 giorni.
Per ulteriori informazioni, consulta Utilizzare PITR.
Dopo aver attivato il PITR sulla nuova istanza principale, puoi ripristinarla in qualsiasi momento in cui è un'istanza principale attiva.
Stato di split-brain durante il failover della replica
È possibile che si verifichi la situazione di split-brain quando l'istanza principale continua ad accettare le scritture mentre una replica viene promossa utilizzando il failover della replica. Dopo la promozione della replica, quando la vecchia istanza principale è di nuovo disponibile, viene ricostruita come replica dell'istanza promossa e viene eseguito un backup finale. Questo backup può essere utilizzato per recuperare eventuali dati con problemi di coerenza che non sono stati scritti nella replica promossa.
Eliminazione di backup e log delle transazioni sulle repliche
Se un'istanza principale abilitata con PITR e i backup diventa una replica di lettura, l'ultimo backup e il criterio di conservazione PITR dal momento in cui era un'istanza principale vengono conservati e applicati durante il periodo in cui è una replica. Anche se la nuova istanza principale non esegue i backup, i vecchi backup e i log delle transazioni utilizzati per il PITR vengono eliminati nella replica di lettura in base all'ultimo criterio configurato.
Ad esempio, se l'istanza è configurata per avere backup automatici giornalieri e mantenere 7 backup con 7 giorni di log PITR, quando questa istanza diventa una replica di lettura, tutto ciò che risale a più di 7 giorni fa viene eliminato una volta al giorno.
Se devi eliminare i backup prima, puoi rimuoverli manualmente. Per maggiori informazioni, consulta Eliminare un backup.
Limitazioni
- Il DR avanzato non è supportato per le istanze Cloud SQL che utilizzano Private Service Connect. Il DR avanzato supporta l'accesso ai servizi privati.
Non puoi designare un'istanza di replica di lettura della versione Cloud SQL Enterprise Plus come replica di RE se l'istanza principale memorizza i log delle transazioni per il recupero point-in-time (PITR) su disco. Per controllare dove un'istanza archivia i log per il PITR, consulta Controllare la posizione di archiviazione dei log delle transazioni utilizzati per il PITR.
Non puoi designare una replica esterna come replica RE.
Terraform non è supportato per le operazioni di failover delle repliche.
- Non puoi utilizzare la Google Cloud console per eseguire operazioni di failover o switchover della replica.
Risoluzione dei problemi
Problema | Risoluzione dei problemi |
---|---|
L'operazione di switchover non è riuscita. |
|
L'operazione di switchover non è riuscita e l'istanza principale è bloccata in modalità di sola lettura. | Esegui un riavvio del database per ripristinare la modalità di scrittura dell'istanza principale. |
L'operazione di switchover è stata completata, ma la Google Cloud console non mostra i nuovi ruoli invertiti per le istanze. | Aggiorna il browser per visualizzare la topologia aggiornata. |
L'operazione di failover della replica non è riuscita. |
|
Passaggi successivi
- Visualizza tutti i Google Cloud servizi disponibili in località di tutto il mondo.
- Scopri di più sull'osservabilità del database
- Monitora le istanze Cloud SQL