A replicação assíncrona fornece replicação de armazenamento em bloco com baixo objetivo de ponto de recuperação ( RPO ) e baixo objetivo de tempo de recuperação ( RTO ) para recuperação de desastres (DR) ativa-passiva entre regiões.
A replicação assíncrona é uma opção de armazenamento que fornece replicação assíncrona de dados entre duas regiões. No caso improvável de uma interrupção regional, a Replicação Assíncrona permite fazer failover dos seus dados para uma região secundária e reiniciar a carga de trabalho nessa região.
Você pode usar a replicação assíncrona para gerenciar a replicação de cargas de trabalho do Compute Engine no nível da infraestrutura, em vez de no nível da carga de trabalho.
Visão geral
A replicação assíncrona replica dados de um disco anexado a uma carga de trabalho em execução, o disco primário , para um disco separado localizado em outra região. O disco que recebe os dados replicados é chamado de disco secundário .
A região onde o disco primário está localizado é chamada de região primária e a região onde o disco secundário está localizado é chamada de região secundária . As regiões primária e secundária são referidas como um par de regiões .
Qualquer disco que atenda aos requisitos de disco pode ser usado como disco primário. Depois de ter um disco primário, você poderá criar um disco secundário que faça referência ao disco primário e iniciar a replicação do disco primário para o disco secundário.
Se você interromper a replicação do disco primário a qualquer momento e desejar reiniciar a replicação posteriormente, deverá criar um novo disco secundário para reiniciar a replicação.
Grupos de consistência
Os grupos de consistência permitem executar testes de DR e DR em vários discos. Um grupo de consistências é uma política de recursos que faz o seguinte:
- Alinha a replicação entre discos primários e garante que todos os discos contenham dados de replicação de um ponto comum no tempo, que é usado para DR.
- Alinha clones de disco de discos secundários e garante que todos os clones de disco contenham dados de um ponto comum no tempo, que é usado para simulações de DR.
Se desejar alinhar o período de replicação em vários discos, inclua discos primários em um grupo de consistências. Se desejar clonar vários discos e garantir que esses clones tenham dados de um momento comum, inclua discos secundários em um grupo de consistências. Um grupo de consistências pode ser usado para replicação ou clonagem, mas não ambos simultaneamente.
Se desejar incluir discos primários em um grupo de consistências, deverá incluir discos no grupo de consistências antes de iniciar a replicação. É possível incluir discos secundários em um grupo de consistências a qualquer momento.
Failover e failback
No caso de uma interrupção na região primária, é sua responsabilidade identificar a interrupção e reiniciar o failover da sua carga de trabalho usando os discos secundários, na região secundária. A Replicação Assíncrona não oferece monitoramento de interrupções. Você pode identificar uma interrupção usando métricas de RPO , verificações de integridade , métricas específicas de aplicativos e entrando em contato com o Cloud Customer Care.
O processo de failover envolve as seguintes tarefas:
- Pare a replicação.
- Anexe os discos secundários às VMs na região secundária.
Depois de fazer failover dos discos, é sua responsabilidade validar e reiniciar a carga de trabalho do seu aplicativo na região secundária e reconfigurar os endereços de rede usados para acessar seu aplicativo para apontar para a região secundária.
Após um failover da região primária para a região secundária, a região secundária torna-se a região primária atuante. Após a resolução da interrupção ou desastre, você poderá iniciar o failback para iniciar a replicação da região secundária original (a região primária atuante) para a região primária original. Opcionalmente, você pode repetir o processo para mover a carga de trabalho de volta para a região primária original.
O processo de failback envolve as seguintes tarefas:
Configure a replicação entre a nova região primária e a região primária original.
- O disco secundário original agora é o novo disco primário e você o configura para replicar para um novo disco secundário na região primária original.
- É possível criar uma nova política de recursos do grupo de consistências na nova região primária para que os novos discos primários (os discos secundários originais) possam replicar consistentemente para um novo conjunto de discos secundários na região primária original.
(Opcional) Após a replicação inicial, você poderá repetir o processo de failover para retornar a carga de trabalho à região primária original.
Criptografia de disco
Os discos primários e secundários não suportam chaves de criptografia fornecidas pelo cliente (CSEK). UsarGoogle-owned and Google-managed encryption keys ou chaves de criptografia gerenciadas pelo cliente (CMEK) . Se você usar CMEK no disco primário, também deverá usar CMEK no disco secundário. Você pode usar CMEKs diferentes em ambos os discos.
Personalização do disco secundário
Quando você cria um disco secundário, o Compute Engine copia as propriedades do disco primário para o disco secundário. Essas propriedades incluem a descrição, o tipo de disco e os rótulos do disco primário.
Se o disco primário for um disco de inicialização, o disco secundário também terá a configuração de inicialização do disco primário. A configuração de inicialização inclui informações sobre a arquitetura do sistema operacional (SO), licenças do SO e seus recursos do SO convidado .
Você pode alterar determinadas propriedades do disco secundário para que sejam diferentes do disco primário. Por exemplo, o disco primário e secundário devem ter o mesmo tamanho e chave de criptografia, mas você pode atribuir rótulos adicionais ao disco secundário.
Para discos de inicialização, você pode ativar opções adicionais de segurança ou rede no disco secundário especificando recursos adicionais do sistema operacional convidado. No entanto, você não pode remover nenhum recurso do sistema operacional convidado do disco principal. O Compute Engine mescla os novos recursos especificados com os recursos existentes do sistema operacional convidado do disco principal.
Exemplo
Suponha que você tenha um disco de inicialização chamado disk-1
, com os seguintes recursos de sistema operacional convidado: [GVNIC, UEFI_COMPATIBLE]
.
Se você criar um disco secundário a partir de disk-1
, poderá especificar apenas recursos adicionais. Você não pode remover os recursos UEFI_COMPATIBLE
e GVNIC
. Portanto, se você especificar MULTI_IP_SUBNET
ao criar o disco secundário, o novo recurso será mesclado com os do disco primário, portanto, os recursos do sistema operacional convidado resultantes para o disco secundário serão GVNIC
, UEFI_COMPATIBLE
e MULTI_IP_SUBNET
.
Para saber como personalizar um disco secundário, consulte Criar um disco secundário personalizado .
Replicação assíncrona e discos regionais
Você pode usar a replicação assíncrona com discos regionais para obter alta disponibilidade (HA) e DR.
Os discos permanentes regionais podem ser usados como disco primário ou secundário em um par de discos de replicação assíncrona. Um par de discos é um disco primário que é replicado para um disco secundário.
Ao usar um disco regional como disco primário, a replicação permanece ininterrupta mesmo se uma de suas zonas sofrer uma interrupção. O disco primário regional continua replicando dados da zona íntegra para o disco secundário. Da mesma forma, quando um disco regional serve como disco secundário, a replicação persiste apesar de uma interrupção em uma de suas zonas. Usar um disco regional como disco secundário prepara sua carga de trabalho para alta disponibilidade entre zonas no caso de um failover, onde o disco secundário faz a transição para se tornar o novo disco primário.
Limitações
- A replicação assíncrona é suportada apenas pelos seguintes tipos de disco :
- Disco permanente balanceado
- Disco permanente de desempenho (SSD)
- Hiperdisco balanceado
- Alta disponibilidade balanceada de hiperdisco
- Hiperdisco Extremo
- Discos somente leitura não são suportados.
- Os discos multigravadores são suportados apenas para Hyperdisk Balanced e Hyperdisk Balanced High Availability.
- As edições feitas no tamanho do hiperdisco são aplicadas automaticamente ao disco secundário. No entanto, as alterações nas propriedades do hiperdisco, incluindo IOPS, taxa de transferência e alterações no modo de acesso, não são aplicadas automaticamente ao disco secundário. Você deve editar manualmente essas propriedades no disco secundário.
- Cada disco pode ter um tamanho máximo de 64 TiB.
- Você deve interromper a replicação antes de excluir um disco primário ou secundário.
- Se a replicação estiver em andamento para um disco de inicialização da VM, você não poderá excluir a VM até interromper a replicação.
- Se um disco primário estiver anexado a uma VM como um disco que não é de inicialização e o disco estiver configurado para ser excluído com a VM, você não poderá excluir a VM ou o disco até interromper a replicação ou desanexar o disco primário da VM. As tentativas de excluir a VM falharão até você interromper a replicação.
Cada projeto pode ter no máximo 1.000 pares de discos em cada par de regiões.
Por exemplo, um determinado projeto,
project-1
pode ter até 1.000 pares de discos no par de regiões Iowa-Oregon.project-1
também pode ter até 1.000 pares de discos no par da região Bélgica-Frankfurt.
Regiões suportadas
A replicação assíncrona está disponível em todas as regiões dos seguintes continentes:
- Ásia, exceto Indonésia
- Europa
- América do Norte
- Oceânia
Você pode replicar um disco primário em uma determinada região para um disco secundário em qualquer região disponível no mesmo continente. Isso significa que você pode criar um par de regiões a partir de duas regiões quaisquer no mesmo continente.
Por exemplo, suponha que você tenha um disco primário em Frankfurt ( europe-west3
). Você pode replicar esse disco para um disco secundário em qualquer lugar da Europa, mas não pode replicá-lo para uma região da América do Norte.
Para ver uma lista completa de todas as regiões no Compute Engine, consulte Zonas e regiões disponíveis .
Desempenho
O objetivo do ponto de recuperação (RPO), ou o atraso de tempo para quando os dados estão disponíveis no site secundário, depende das taxas de alteração do disco. A replicação assíncrona normalmente replica dados com um RPO de destino de um minuto, para até 12,5 GB de blocos alterados compactados por minuto, com blocos de disco replicados com granularidade de bloco de 4 KB. Se um determinado bloco for alterado diversas vezes entre eventos de replicação, apenas a alteração mais recente será replicada no disco secundário. Em taxas de alteração de disco mais altas, o RPO pode ser superior a um minuto e normalmente aumenta à medida que as taxas de alteração de disco aumentam. O RPO não é configurável.
O RPO pode exceder um minuto nos seguintes cenários:
- Quando a replicação do disco é iniciada. Durante a replicação inicial, a Replicação Assíncrona replica todos os blocos usados no disco primário para o disco secundário. A replicação inicial será concluída quando a métrica
disk/async_replication/time_since_last_replication
estiver disponível no Cloud Monitoring. - Se a taxa de alteração do disco for superior a 12,5 GB de blocos alterados compactados por minuto. Após um pico nas alterações do disco, o RPO para ciclos de replicação posteriores poderá exceder um minuto enquanto a replicação é atualizada.
- Se você desanexar um disco de uma VM ou reiniciar uma VM enquanto o disco estiver replicando. Os discos que estão sendo replicados e desconectados de uma VM podem ver o RPO aumentar em até cinco minutos por um curto período de tempo.
Para saber como visualizar o RPO dos seus discos, consulte Métricas de desempenho de replicação assíncrona .
O objetivo de tempo de recuperação (RTO) durante o failover depende do tempo necessário para concluir as diversas tarefas envolvidas no failover da sua carga de trabalho para uma nova região. Tarefas como parar a replicação e anexar discos a VMs na região secundária devem levar apenas alguns minutos para serem concluídas. Você pode acelerar o RTO garantindo que as VMs sejam executadas na região secundária para que, se ocorrer um failover, você não precise esperar a inicialização das VMs.
O que vem a seguir
- Aprenda como configurar a replicação .
- Aprenda como gerenciar a replicação .
- Aprenda como gerenciar grupos de consistências .
- Aprenda como fazer failover e failback .
- Saiba como gerenciar discos que usam replicação assíncrona .
- Saiba como monitorar o desempenho da replicação assíncrona .