Esta página foi traduzida pela API Cloud Translation.

Replicação

Nesta página, descrevemos como os dados são replicados no Spanner, os diferentes tipos de réplicas do Spanner e as funções deles em leituras e gravações, além dos benefícios da replicação.

Visão geral

O Spanner faz a replicação automática no nível de bytes. Conforme descrito em Duração de leituras e gravações do Spanner, ele aproveita esse recurso no sistema de arquivos subjacente em que foi baseado. O Spanner grava mutações do banco de dados em arquivos nesse sistema de arquivos, e ele cuida da replicação e recuperação dos arquivos diante de uma falha da máquina ou do disco.

Ainda que o sistema de arquivos distribuído em que o Spanner é criado já ofereça a replicação no nível de byte, o Spanner também replica dados para proporcionar os benefícios adicionais de disponibilidade de dados e localidade geográfica. De modo geral, todos os dados no Spanner são organizados em linhas. O Spanner cria várias cópias, ou réplicas, dessas linhas e as armazena em diferentes áreas geográficas. O Spanner usa um esquema de replicação síncrona baseada em Paxos, em que as réplicas de votação recebem um voto a cada solicitação de gravação antes que ela seja confirmada. Essa propriedade da replicação globalmente síncrona permite ler os dados mais atualizados de qualquer réplica de leitura/gravação ou somente leitura do Spanner.

O Spanner cria réplicas de cada divisão do banco de dados. Uma divisão contém um intervalo de linhas contíguas, em que as linhas são ordenadas pela chave primária. Todos os dados em uma divisão são armazenados fisicamente juntos na réplica, e o Spanner publica cada réplica de uma zona de falha independente. Para mais informações, consulte a visão geral dos esquemas.

Um conjunto de divisões é armazenado e replicado usando o Paxos. Dentro de cada conjunto de réplicas Paxos, uma réplica é eleita para atuar como líder. As réplicas líderes processam gravações, enquanto as réplicas de leitura/gravação ou somente leitura podem atender a uma solicitação de leitura sem se comunicar com o líder. Se uma leitura forte for solicitada, o líder normalmente será consultado para garantir que a réplica somente leitura tenha recebido todas as mutações recentes. Para monitorar a taxa de mudança e a quantidade de dados replicados da réplica líder para as réplicas entre regiões na configuração da instância, consulte Monitorar a replicação de dados.

Benefícios da replicação do Spanner

Os benefícios da replicação do Spanner incluem:

Disponibilidade dos dados: ter mais cópias de seus dados os torna mais disponíveis para clientes que farão a leitura deles. Além disso, o Spanner ainda pode atender as gravações, mesmo que algumas réplicas não estejam disponíveis, porque apenas a maioria das réplicas de votação é necessária para confirmar uma gravação.
Localidade geográfica: com a capacidade de colocar dados em diferentes regiões e continentes com o Spanner, esses dados podem ficar geograficamente mais próximos dos usuários e serviços que necessitam deles. Portanto, o acesso fica mais rápido.
Experiência de banco de dados único: o Spanner pode oferecer uma experiência de banco de dados único devido à replicação síncrona e à consistência forte global.
Desenvolvimento mais fácil de aplicativos: como o Spanner é compatível com ACID e oferece consistência forte global, os desenvolvedores que trabalham com ele não precisam adicionar mais lógica aos aplicativos para lidar com a consistência posterior. Isso facilita e acelera o desenvolvimento e, posteriormente, a manutenção dos aplicativos.

Tipos de réplica

O Spanner tem três tipos de réplicas: de leitura/gravação, somente leitura e testemunha. As regiões e as topologias de replicação que formam as configurações de instância de base são fixas:

As configurações básicas de instâncias de região única (regionais) usam apenas réplicas de leitura/gravação.
As configurações básicas de instâncias birregionais usam réplicas de leitura/gravação e testemunhas.
As configurações básicas de instâncias multirregionais usam uma combinação dos três tipos de réplica.

É possível criar configurações de instância personalizadas e adicionar mais réplicas somente leitura para configurações de instância regionais e multirregionais.

A tabela a seguir resume os tipos de réplicas do Spanner e as respectivas propriedades:

Tipo de réplica	Pode votar	Pode se tornar líder	Pode atender leituras	Pode configurar a réplica manualmente
Leitura/gravação	sim	sim	sim	não
Somente leitura	não	não	sim	sim^*
Testemunha	sim	não	não	não

^* Para mais informações, consulte como criar uma instância com uma configuração personalizada.

Réplicas de leitura/gravação

As réplicas de leitura/gravação permitem leituras e gravações. Elas:

mantêm uma cópia completa dos dados;
Atendem a leituras.
Podem votar sobre a necessidade de fazer o commit de uma gravação.
Participam de uma eleição de liderança.
Estão qualificadas para se tornarem líderes.
São o único tipo de réplica usado em instâncias regionais.

Réplicas somente leitura

As réplicas somente leitura permitem apenas leituras, e não permitem gravações. Essas réplicas não votam para líderes nem fazem a confirmação de gravações. Elas permitem que você dimensione a capacidade de leitura sem aumentar o tamanho do quórum necessário para gravações. Réplicas somente leitura:

mantêm uma cópia completa dos dados, que são replicados da réplica de leitura/gravação principal;
Não participam da votação sobre a necessidade de commits de gravações. Portanto, o local das réplicas somente leitura nunca contribui para a latência da gravação;
não estão qualificadas para se tornarem líderes.
Atendem a leituras.
Pode ser escalonado de forma assimétrica. Para mais informações, consulte Escalonamento automático de somente leitura assimétrica.
Se for a réplica mais próxima do seu aplicativo, a réplica somente leitura poderá atender a leituras inativas sem precisar de uma ida e volta à região líder, supondo que a inatividade seja de, no mínimo, 15 segundos. Você também pode usar leituras direcionadas para encaminhar transações somente leitura e leituras únicas para um tipo de réplica específico ou uma região em uma configuração de instância multirregional. Para mais informações, consulte Leituras direcionadas.

As leituras consistentes podem exigir uma viagem de ida e volta à réplica líder. A ida e volta é apenas para negociar o carimbo de data/hora, e não enviar os dados reais do líder. A negociação do carimbo de data/hora é uma operação eficiente da CPU no líder e, geralmente, os dados já estão sendo roteados. Essa comunicação é processada automaticamente pelo sistema.

Para mais informações sobre leituras obsoletas e consistentes, consulte a seção "Em leituras".

Réplicas somente leitura opcionais

É possível criar uma configuração de instância regional ou multirregional personalizada e adicionar réplicas somente leitura opcionais para escalonar leituras e oferecer suporte a leituras obsoletas de baixa latência. A réplica somente leitura adicionada precisa estar em uma região que não faça parte da configuração predefinida da instância de base. Para uma lista das regiões opcionais somente leitura que podem ser adicionadas, consulte a coluna "Região opcional" em Configurações regionais disponíveis e Configurações multirregionais disponíveis. Se você não encontrar o local escolhido para a réplica somente leitura, solicite uma nova região opcional de réplica somente leitura.

Todas as réplicas somente leitura opcionais estão sujeitas a custos de capacidade de computação, armazenamento e replicação.

Além disso, adicionar réplicas somente leitura a uma configuração de instância personalizada não muda os SLAs do Spanner (em inglês) da configuração de instância.

Se você adicionar uma réplica somente leitura a um continente diferente da região líder, recomendamos adicionar pelo menos duas réplicas somente leitura. Isso ajuda a manter a latência de leitura baixa caso uma das réplicas somente leitura fique indisponível.

Como prática recomendada, teste as cargas de trabalho de desempenho em instâncias de não produção na configuração de instância personalizada primeiro. Consulte o painel de comparativo de mercado de latência e capacidade entre regiões para ver os dados de latência mediana entre regiões. Por exemplo, se você criar uma configuração de instância personalizada com a configuração básica multirregional eur6 e uma réplica somente leitura opcional em us-east1, a latência de leitura consistente esperada para um cliente em us-east1 será de cerca de 100 milissegundos devido ao tempo de ida e volta para a região líder em europe-west4. Leituras desatualizadas com desatualização suficiente não incorrem na viagem de ida e volta e, portanto, são muito mais rápidas. Você também pode usar os insights de bloqueio e de transação para identificar transações que causam alta latência.

Para instruções sobre como adicionar réplicas opcionais somente leitura, consulte Criar uma configuração de instância personalizada.

Réplicas testemunhas

As réplicas testemunhas não são compatíveis com leituras, mas participam da votação sobre a necessidade de fazer a confirmação das gravações. Essas réplicas facilitam o recebimento de quóruns para gravações sem os recursos de armazenamento e computação exigidos pelas réplicas de leitura/gravação para armazenar uma cópia completa dos dados e atender leituras. Réplicas testemunha:

são usadas em instâncias birregionais e multirregionais;
Não mantêm uma cópia completa dos dados.
Não atendem a leituras.
Votam se é necessário fazer o commit de gravações.
participam na eleição da líder, mas não estão qualificadas para se tornarem líderes réplica.

O papel das réplicas em gravações e leituras

Nesta seção, descrevemos o papel das réplicas nas gravações e leituras do Spanner, o que é útil para entender por que o Spanner usa réplicas de testemunha em configurações de região dupla e multirregionais.

Em gravações

As solicitações de gravação de clientes sempre são processadas primeiro na réplica líder, mesmo que haja uma réplica não líder mais próxima do cliente ou se a réplica líder estiver geograficamente distante do cliente. Se você usar uma configuração de instância birregional ou multirregional e o aplicativo cliente estiver localizado em uma região não líder, o Spanner usará o roteamento com reconhecimento de líder para rotear transações de leitura e gravação de forma dinâmica e reduzir a latência no banco de dados. Para mais informações, consulte Roteamento com reconhecimento do líder.

A réplica líder registra a gravação recebida e a encaminha, em paralelo, para as outras réplicas que estão qualificadas para votar naquela gravação. Cada réplica qualificada completa a respectiva gravação e, em seguida, responde de volta à líder com uma votação sobre a necessidade de fazer o commit da gravação. O commit da gravação é feito quando a maioria das réplicas da votação (ou quórum de gravação) concorda sobre isso. Em segundo plano, todas as réplicas restantes (não testemunhas) registram a gravação. Se uma réplica de leitura/gravação ou somente leitura se atrasar no registro das gravações, ela poderá solicitar os dados ausentes de outra réplica que tenha uma cópia completa e atualizada dos dados.

Em leituras

As solicitações de leitura pelo cliente podem ser executadas na réplica líder ou exigir a comunicação com ela, dependendo do modo de simultaneidade da solicitação.

As leituras que fazem parte de uma transação de leitura e gravação são atendidas pela réplica líder, já que ela mantém os bloqueios exigidos para impor a capacidade de serialização.
Os métodos de leitura única (uma leitura fora do contexto de uma transação) e as leituras em transações somente leitura podem exigir a comunicação com a líder, dependendo do modo de simultaneidade da leitura. Para mais informações sobre modos de simultaneidade, consulte Tipos de leitura.
- As solicitações de leitura forte podem acessar qualquer réplica de leitura e gravação ou somente leitura. Se a solicitação acessar uma réplica não líder, ela precisará se comunicar com a líder para executar a leitura.
- As solicitações de leitura desatualizadas acessam a réplica de leitura/gravação ou somente leitura mais próxima disponível com o mesmo carimbo de data/hora da solicitação. Isso pode acontecer com a réplica líder se ela for a mais próxima do cliente que emitiu a solicitação de leitura.

À parte: por que réplicas somente leitura e testemunhas?

As configurações multirregionais básicas usam uma combinação de réplicas de leitura/gravação, somente leitura e testemunha, enquanto as configurações birregionais básicas usam réplicas de leitura/gravação e testemunha, e as configurações regionais básicas usam apenas réplicas de leitura/gravação. Os motivos para essa diferença têm a ver com os vários papéis das réplicas nas leituras e gravações. Para gravações, o Spanner precisa que a maioria das réplicas votantes concorde sobre o commit de uma mutação. Em outras palavras, toda gravação em um banco de dados do Spanner exige a comunicação entre as réplicas votantes. Para minimizar a latência dessa comunicação, é desejável usar o menor número de réplicas votantes e colocar essas réplicas o mais próximo possível umas das outras. É por isso que as configurações regionais básicas contêm exatamente três réplicas de leitura/gravação, cada uma em sua própria zona de disponibilidade, com uma cópia completa dos seus dados e capacidade de voto. Se uma réplica falhar, as outras duas ainda poderão formar um quórum de gravação e, como as réplicas nesta configuração estão na mesma região geográfica, as latências de rede são mínimas.

As configurações birregionais e multirregionais básicas contêm mais réplicas por design, e essas réplicas estão em diferentes data centers para que os clientes possam ler os dados deles rapidamente de mais locais. Que características essas réplicas adicionais têm? Todas podem ser réplicas de leitura/gravação, mas isso não é recomendável porque adicionar mais réplicas de leitura/gravação a uma configuração aumenta o tamanho do quórum de gravação (o que significa latências de rede potencialmente mais altas devido a mais réplicas se comunicando entre si, especialmente se as réplicas estiverem em locais geograficamente distribuídos) e também aumenta a quantidade de armazenamento necessária (porque as réplicas de leitura/gravação contêm uma cópia completa dos dados). Em vez de usar mais réplicas de leitura/gravação, a configuração básica de duas regiões contém uma réplica de testemunha adicional, e as configurações básicas multirregionais contêm réplicas somente leitura e réplicas de testemunha, que têm menos responsabilidades do que as réplicas de leitura/gravação.

As réplicas somente leitura não votam para líderes nem fazem o commit de gravações. Elas permitem que você dimensione a capacidade de leitura sem aumentar o tamanho do quórum necessário para gravações.
As réplicas testemunhas votam para líderes e para fazer o commit das gravações, mas não armazenam uma cópia completa dos dados, não podem se tornar líderes e não podem atender leituras. Com elas, é mais fácil atingir o quórum para gravações sem os recursos de armazenamento e computação exigidos pelas réplicas de leitura/gravação para armazenar uma cópia completa dos dados e exibir leituras.

Monitorar a replicação de dados

É possível monitorar a taxa de mudança e a quantidade de dados replicados da réplica líder para as réplicas entre regiões na configuração da instância. A taxa de mudança está em bytes por segundo, e a quantidade de dados está em bytes. Para isso, use a métrica de monitoramento Bytes replicados entre regiões (instance/cross_region_replicated_bytes_count).

Para conferir essa métrica no console do Google Cloud , siga estas etapas:

No console Google Cloud , acesse Monitoring:

Acessar Monitoring
No menu de navegação, selecione Metrics Explorer.
No campo Métrica, clique no menu suspenso Selecionar uma métrica.
No campo Filtrar por nome do recurso ou da métrica, selecione Instância do Cloud Spanner > Instância > Bytes replicados entre regiões e clique em Aplicar.

Essa métrica só fica disponível em Métricas ativas se houver atividade de replicação entre regiões na sua instância. Caso contrário, ela vai aparecer em Métricas inativas. Por padrão, a UI filtra e mostra apenas métricas ativas. Desmarque a caixa de seleção Ativa para ver métricas ativas e inativas.

O gráfico mostra a taxa de mudança (em bytes por segundo) dos dados replicados em todas as instâncias do Spanner no período especificado.
Opcional: para mostrar a quantidade de dados (em bytes) replicados em vez da taxa de mudança:
1. No campo Agregação, clique no menu suspenso Soma e selecione Configurar alinhador.
2. No campo Função de alinhamento, clique no menu suspenso Taxa e selecione Delta.
3. Selecione Tabela ou Ambos como o tipo de tabela em vez de "Gráfico".
  
  A tabela mostra a quantidade de dados (em bytes) que foi replicada no período especificado.
Opcional: para conferir o uso de uma instância ou atributo específico:
1. Use o campo Filtro para adicionar filtros, como um ID de instância, ID de banco de dados, região de origem, região de destino ou uma tag.
2. Clique em Adicionar filtro para adicionar vários filtros.

Para conferir uma lista completa de métricas do Google Cloud , consulte métricas doGoogle Cloud .

A seguir

Saiba mais sobre configurações de instâncias.
Saiba como criar e gerenciar instâncias.
Saiba como criar e gerenciar configurações de instância.
Saiba mais sobre Google Cloud áreas geográficas e regiões.