Monitore estados de réplica e status de replicação para discos regionais


O Compute Engine mantém cópias de cada disco regional em dois Google Cloud zonas. Cada cópia é chamada de réplica zonal. Quando você grava dados no disco, o Compute Engine replica esses dados de forma síncrona para ambas as réplicas para garantir alta disponibilidade (HA). A qualquer momento, o status de replicação do disco regional informa sobre a capacidade de um disco gravar de forma síncrona em ambas as réplicas. O status de replicação do disco é determinado pelos estados das réplicas zonais do disco. O estado da réplica de uma zona informa o estado de uma réplica zonal individual em comparação com os dados mais recentes no disco. Se uma réplica zonal contiver os dados de disco mais recentes, essa réplica será considerada sincronizada com os dados de disco mais recentes. Se ambas as réplicas zonais estiverem sincronizadas, seuDisco permanente regional ouO disco Hyperdisk Balanced High Availability é considerado totalmente replicado .

Este documento explica como você pode monitorar os estados de réplica dos seus discos regionais e o status de replicação do disco durante um período de tempo. Você pode usar este documento para fazer o seguinte:

  1. Verifique os estados de réplica atuais e históricos dos seus discos regionais.
  2. Use as informações do estado da réplica de um momento específico para determinar se o disco foi totalmente replicado.

Para saber mais sobre o estado da réplica e o status da replicação do disco, consulte Sobre a replicação síncrona do disco .

Funções obrigatórias

Para receber as permissões necessárias para visualizar os estados de replicação usando o Cloud Monitoring, peça ao administrador para conceder a você os seguintes papéis do IAM:

Para obter mais informações sobre a concessão de funções, consulte Gerenciar acesso a projetos, pastas e organizações .

Você também poderá obter as permissões necessárias por meio de funções personalizadas ou outras funções predefinidas .

Monitore usando o console do Google Cloud

Esta seção explica como você pode monitorar os estados de réplica e o status de replicação de disco de um Hyperdisk Balanced High Availability ou disco permanente regionalvolume usando o console do Google Cloud.

Verifique se as réplicas zonais estão sincronizadas para um único disco

Você pode usar o console do Google Cloud para verificar se as réplicas zonais de um disco regional estão sincronizadas com os dados mais recentes do disco.

Para ver informações detalhadas sobre os estados exatos da réplica zonal de todos os discos regionais em um projeto, verifique os estados da réplica zonal usando o painel do Cloud Monitoring .

Console

Para monitorar os estados de réplica zonal dos seus discos regionais, faça o seguinte:

  1. No console do Google Cloud, acesse a página Discos .

    Vá para discos

  2. Na página Discos , na coluna Nome , selecione o disco cujos estados de réplica você deseja verificar.

    A página Gerenciar disco é aberta para o disco selecionado e exibe a guia Detalhes desse disco.

  3. Clique na guia Observabilidade .

    A página Gerenciar disco exibe as informações de monitoramento do disco.

  4. Para ver as informações históricas do estado da réplica do seu disco, na guia Observabilidade , navegue até o gráfico Estado de replicação do disco permanente regional .

    O gráfico exibe os valores de estado das réplicas zonais durante a hora anterior na forma de duas linhas de gráfico separadas.

    O valor do estado da réplica pode ser um dos seguintes:

    • 0 : A réplica não está sincronizada com os dados mais recentes do disco.
    • 1 . A réplica é sincronizada com os dados mais recentes do disco.
  5. Para verificar o valor do estado da réplica das réplicas zonais em um momento específico, faça o seguinte:

    • Mantenha o ponteiro no gráfico para o valor de tempo no qual deseja verificar o estado da réplica.
    • Para ver os valores de estado das réplicas zonais, navegue até a parte inferior do gráfico.
    • Opcional: Para ver o nome e o valor do estado da réplica indicados por uma linha do gráfico, mantenha o ponteiro sobre a linha do gráfico para qualquer valor de tempo específico. O gráfico destaca o nome e o estado específico do tempo dessa réplica dentro de uma dica de ferramenta.
  6. Opcional: Para modificar o período durante o qual você deseja ver os dados de estado da réplica, selecione um período na parte superior da guia Observabilidade . As seguintes opções estão disponíveis:

    • 1 hora : a hora anterior. Este é o valor padrão.
    • 6 horas : as 6 horas anteriores.
    • 1 dia : o dia anterior.
    • 1 semana : a semana anterior.
    • 1 mês : o mês anterior.
    • 6 semanas : as 6 semanas anteriores.
    • Personalizado : um período de tempo específico de sua escolha. Para especificar um período de monitoramento personalizado, clique em Personalizado e faça o seguinte:

      • No campo Data e hora de início , especifique o início do período de monitoramento. Você deve especificar um horário no passado.
      • No campo Data e hora de término , especifique o término do período de monitoramento. Você deve especificar um horário no passado.
      • Para salvar seu período de monitoramento personalizado, clique em Aplicar .

Determine se o disco está totalmente replicado

Depois de determinar se suas réplicas zonais estão ou não sincronizadas com os dados de disco mais recentes, você poderá usar essas informações para determinar se seu disco está totalmente replicado ou não.

A qualquer momento, o disco foi totalmente replicado se o valor do estado da réplica para ambas as réplicas zonais fosse 1 . Se esse não for o caso, verifique os estados exatos da réplica naquele momento para saber se o seu disco estava degradado ou em recuperação . Para obter mais informações, consulte Monitorar usando métricas do Cloud Monitoring .

Monitore usando métricas do Cloud Monitoring

Você pode verificar informações detalhadas sobre os estados exatos da réplica zonal de todos os seus discos regionais usando a métrica Regional disk replica state no Cloud Monitoring.

Sobre a métrica Regional disk replica state

Você pode ver os estados atuais e históricos das réplicas de disco das suas réplicas zonais no painel do Cloud Monitoring. O Compute Engine captura os estados de réplica dos seus discos a cada minuto e os informa usando a métrica Regional disk replica state . No entanto, se houver uma interrupção zonal que afete a instância de computação à qual uma réplica zonal está anexada, você não verá nenhum dado de métrica Regional disk replica state para nenhuma das réplicas zonais.

A seguir estão os valores possíveis da métrica Regional disk replica state . Suas réplicas zonais estão sempre em um desses estados de réplica de disco.

  • Synced : a réplica está disponível, recebe de forma síncrona todas as gravações realizadas no disco e está atualizada com todos os dados do disco.
  • CatchingUp : a réplica está disponível, mas ainda está atualizando os dados no disco da outra réplica.
  • OutOfSync : a réplica está temporariamente indisponível e fora de sincronia com os dados no disco.

Para informações sobre a definição de métrica, consulte a seção Métricas do Compute Engine Monitoring .

Você pode usar os dados de métrica Regional disk replica state para fazer o seguinte:

  • Determine o status de replicação do seu disco regional .
  • Revise o histórico do estado da réplica do seu disco regional para entender se a sua arquitetura de failover funciona conforme o esperado e tome as medidas necessárias caso o estado do seu disco regional mude.
  • Crie alertas com base nos dados de métrica Regional disk replica state , detecte quaisquer alterações nos estados da sua réplica e tome as ações necessárias. Para obter mais informações sobre como criar alertas baseados em métricas, consulte Como adicionar uma política de alertas .

Verifique os dados da métrica Regional disk replica state

Para ver o status das réplicas zonais de um disco regional anexado, crie uma consulta e crie um gráfico temporário para a métrica Regional disk replica state . Você pode fazer isso no Metrics Explorer usando a interface orientada por menu, Monitoring Query Language (MQL) ou PromQL .

  1. No console do Google Cloud, acesse a página do explorador de métricas :

    Vá para o explorador de métricas

    Se você usar a barra de pesquisa para encontrar esta página, selecione o resultado cujo subtítulo é Monitoramento .

    A página do Metrics Explorer é aberta e exibe a guia Consultas .

  2. Para ver os dados de estado de réplica de cada réplica zonal em um projeto, selecione os dados de série temporal para a métrica Regional disk replica state e remova o filtro de agregação fazendo o seguinte na barra de ferramentas do painel de consulta:

    1. No menu Métrica , clique em Selecionar uma métrica e selecione Disco > Disco > Estado da réplica do disco regional .

    2. Clique em Aplicar .

    3. No menu Agregação , selecione Não agregado por Nenhum .

    Um gráfico aparece e exibe os dados de métrica da hora anterior para cada réplica como uma série temporal. Você vê os dados métricos somente para réplicas zonais de discos anexados.

    Para obter mais informações sobre como selecionar séries temporais para uma métrica, consulte Selecionar métricas ao usar o Metrics Explorer .

  3. Para visualizar gráficos e tabelas simultaneamente, na parte superior do gráfico, clique em Ambos .

  4. Para visualizar dados de todas as propriedades de disco regional disponíveis, na parte superior da visualização da tabela, clique em Column display options... , selecione todas as colunas e clique em Ok .

    O painel exibe os seguintes campos para cada linha da tabela, junto com seus valores atuais:

    • disk_id : ID do disco
    • zone : a região onde o disco regional foi criado.
    • replica_zone : zona de réplica
    • state : estado da réplica
    • storage_type : tipo de armazenamento do disco
    • value : valor para o estado da réplica

    Para visualizar esses dados na série temporal correspondente na visualização do gráfico, mantenha o ponteiro no gráfico no horário atual. O gráfico exibe esses valores dentro de uma dica de ferramenta.

  5. Para verificar os estados históricos da réplica em um momento específico, faça o seguinte:

    1. Mantenha o ponteiro sobre o gráfico em um valor de tempo específico de sua escolha. O painel exibe os dados de métrica de todos os estados de réplica de todas as réplicas zonais do seu projeto naquele momento específico.

      Na visualização do gráfico, essas informações aparecem dentro de uma dica de ferramenta.

      Na visualização de tabela, essas informações aparecem como linhas individuais.

    2. Observe os estados da réplica e seus valores correspondentes. A qualquer momento, se um estado específico tiver o valor 1 , a réplica estava nesse estado.

      Na visualização do gráfico, verifique os estados e valores da réplica dentro da dica de ferramenta para os IDs de disco e zonas de réplica que você deseja.

      Na visualização de tabela, verifique as colunas de estado e valor dos IDs de disco e zonas de réplica específicos que você deseja.

    Para saber mais sobre o que significam os estados da réplica e seus valores, consulte Compreender os dados de métrica Regional disk replica state .

  6. Opcional: Para visualizar as informações do estado da réplica de um rótulo específico, no menu Filtro , selecione o rótulo cujos dados deseja visualizar e, em seguida, conclua a caixa de diálogo. Você pode adicionar vários filtros.

    O painel exibe os dados de métrica somente para os rótulos filtrados. Para obter mais informações sobre filtros, consulte Filtrar dados em gráfico .

    Por exemplo, para visualizar os dados do estado da réplica de um disco específico, faça o seguinte:

    1. No menu Filtro , selecione o rótulo do nome .
    2. No menu Comparador , selecione = (igual) .
    3. No menu Valor , selecione o nome do disco desejado.
  7. Opcional: Para determinar a porcentagem de tempo em que as réplicas de um disco específico foram sincronizadas, filtre os dados do disco e do estado específicos e, em seguida, use o menu de agregação:

    1. No menu Filtro , selecione o rótulo do nome .
    2. No menu Comparador , selecione = (igual) .
    3. No menu Valor , selecione o nome do disco.
    4. No menu Filtro , selecione o rótulo do estado .
    5. No menu Comparador , selecione = (igual) .
    6. No menu Valor , selecione Sincronizado .
    7. No menu Agregação , selecione Média por replica_zone .
    8. Selecione o período de tempo para o qual deseja ver os dados.

    O painel exibe os dados sobre o status synced médio das réplicas do seu disco durante o período especificado. Multiplique esses dados por 100 para determinar a porcentagem de tempo durante o qual as réplicas foram sincronizadas. Se o valor médio for 1 para esse período, a réplica estará sempre atualizada com os dados mais recentes. Um valor médio menor que 1 indica que a réplica não foi sincronizada em algum momento durante o período especificado.

    Para obter mais informações sobre agrupamento e alinhamento, consulte Escolher como exibir dados em gráfico .

  8. Opcional: Para modificar o período durante o qual você deseja monitorar os dados de métrica, na parte superior do painel, clique em Última 1 hora e selecione o período desejado.

    Você pode selecionar um período de tempo relativo ao horário atual ou especificar horários de início e término de sua preferência. Por padrão, você vê os dados de métrica da hora anterior.

MQL

  1. No console do Google Cloud, acesse a página do explorador de métricas :

    Vá para o explorador de métricas

    Se você usar a barra de pesquisa para encontrar esta página, selecione o resultado cujo subtítulo é Monitoramento .

    A página do Metrics Explorer é aberta e exibe a guia Consultas .

  2. Na barra de ferramentas do seu painel de consulta, clique no botão cujo nome começa com < > .

  3. No campo Idioma , selecione MQL como seu idioma de consulta. Este campo está na mesma barra de ferramentas que permite formatar sua consulta.

  4. Opcional: desative a alternância de execução automática .

  5. Insira sua consulta e clique em Executar consulta .

    Quando a alternância de execução automática está habilitada, o botão Executar consulta não é exibido.

    Por exemplo, para visualizar os dados de estado da réplica de um disco chamado disk-1 , execute a seguinte consulta:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-=1')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    

    Como outro exemplo, para determinar qual porcentagem de tempo as réplicas foram sincronizadas para um disco chamado disk-1 , execute a seguinte consulta:

    fetch gce_disk
    | metric 'compute.googleapis.com/disk/regional/replica_state'
    | filter (metadata.system_labels.name == 'disk-1') && (metric.state == 'Synced')
    | group_by 1m, [value_replica_state_mean: mean(value.replica_state)]
    | every 1m
    | group_by [metric.replica_zone],
        [value_replica_state_mean_mean: mean(value_replica_state_mean)]
    
  6. Para modificar o período durante o qual você deseja monitorar os dados de métrica, na parte superior do painel, clique em Última 1 hora e selecione o período e o fuso horário desejados.

    Você pode selecionar um período de tempo relativo ao horário atual ou especificar horários de início e término de sua preferência. Por padrão, você vê os dados de métrica da hora anterior.

PromQL

  1. No console do Google Cloud, acesse a página do explorador de métricas :

    Vá para o explorador de métricas

    Se você usar a barra de pesquisa para encontrar esta página, selecione o resultado cujo subtítulo é Monitoramento .

    A página do Metrics Explorer é aberta e exibe a guia Consultas .

  2. Na barra de ferramentas do seu painel de consulta, clique no botão cujo nome começa com < > .

  3. No campo Idioma , selecione PromQL como idioma de consulta. Este campo está na mesma barra de ferramentas que permite formatar sua consulta.

  4. Opcional: desative a alternância de execução automática .

  5. Insira sua consulta e clique em Executar consulta .

    Quando a alternância de execução automática está habilitada, o botão Executar consulta não é exibido.

    Por exemplo, para visualizar os dados de estado da réplica de um disco chamado disk-1 , execute a seguinte consulta:

    avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",metadata_system_name="disk-1"}[${__interval}])
    

    Como outro exemplo, para determinar qual porcentagem de tempo as réplicas foram sincronizadas para um disco chamado disk-1 , execute a seguinte consulta:

    avg by (replica_zone)(avg_over_time(compute_googleapis_com:disk_regional_replica_state{monitored_resource="gce_disk",state="Synced",metadata_system_name="disk-1"}[${__interval}]))
    
  6. Para modificar o período durante o qual você deseja monitorar os dados de métrica, na parte superior do painel, clique em Última 1 hora e selecione o período e o fuso horário desejados.

    Você pode selecionar um período de tempo relativo ao horário atual ou especificar horários de início e término de sua escolha. Por padrão, você vê os dados de métrica da hora anterior.

Determine os estados exatos da réplica zonal usando dados métricos

Para compreender os dados de métrica Regional disk replica state para um disco regional, você deve verificar as colunas de estado e valor das réplicas zonais no gráfico gerado. Se você não adicionar nenhum filtro à sua consulta, acontecerá o seguinte:

  • A coluna state exibe todos os estados possíveis de réplica de disco para uma réplica zonal, um de Synced , CatchingUp e OutOfSync . O gráfico exibe cada um desses estados na forma de uma série temporal para todas as réplicas zonais de todos os discos regionais do seu projeto.
  • A coluna de valor indica se a réplica zonal está ou não em um estado específico de réplica de disco. Esta coluna mostra um valor binário correspondente ( 0 ou 1 ) para cada valor de estado para todas as réplicas zonais de todos os discos regionais no seu projeto.

Para qualquer réplica zonal, se a coluna de valor mostrar 1 para um estado específico da réplica do disco, essa réplica zonal estará nesse estado específico. Se a coluna de valor mostrar 0 para um estado específico, então essa réplica não está nesse estado específico. A qualquer momento, uma réplica zonal tem exatamente um dos estados de réplica de disco com 1 na coluna de valor . Os outros dois estados de réplica de disco possuem 0 em suas respectivas colunas de valor .

Para cada réplica zonal, o gráfico e a tabela exibem uma entrada separada para cada estado de réplica de disco: Synced , CatchingUp e OutOfSync . A coluna de valor para cada entrada é um valor binário ( 0 ou 1 ) que indica se a réplica está ou não nesse estado. A qualquer momento, uma réplica zonal tem exatamente um estado de réplica com valor 1 .

Determine o status exato da replicação do disco

Você pode usar os estados de réplica de suas réplicas zonais para determinar o estado de replicação de seus discos regionais da seguinte maneira:

  • Se ambas as réplicas zonais tiverem 1 como valor para o estado Synced , o disco será totalmente replicado .
  • Se uma das réplicas zonais tiver 1 como valor para o estado Synced e a outra réplica zonal tiver 1 como valor para o estado CatchingUp , o disco estará atualizando .
  • Se uma das réplicas zonais tiver 1 como valor para o estado Synced e a outra réplica zonal tiver 1 como valor para o estado OutOfSync , o disco estará degradado .

Por exemplo, considere um disco denominado my-disk1 que possui réplicas em us-central1-a e us-central1-b . Os cenários a seguir mostram os valores das colunas state e value das réplicas zonais para cada estado de replicação possível de my-disk1 :

Totalmente replicado

Nesse cenário, a réplica em us-central1-a e a réplica em us-central1-b são atualizadas com os dados mais recentes no disco. O gráfico exibe os seguintes valores para cada estado de réplica de disco para as réplicas zonais de my-disk1 :

zona_réplica estado valor
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 1
us-central1-b CatchingUp 0
us-central1-b OutOfSync 0

Alcançando

Nesse cenário, a réplica em us-central1-a é atualizada com os dados no disco e a réplica em us-central1-b está atualizando os dados no disco. O gráfico exibe os seguintes valores para cada estado de réplica de disco para as réplicas zonais de my-disk1 :

zona_réplica estado valor
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 1
us-central1-b OutOfSync 0

Degradado

Neste cenário, a réplica em us-central1-a é atualizada com os dados no disco e a réplica em us-central1-b está fora de sincronia. O gráfico exibe os seguintes valores para cada estado de réplica de disco para as réplicas zonais de my-disk1 :

zona_réplica estado valor
us-central1-a Synced 1
us-central1-a CatchingUp 0
us-central1-a OutOfSync 0
us-central1-b Synced 0
us-central1-b CatchingUp 0
us-central1-b OutOfSync 1

O que vem a seguir