Esta página foi traduzida pela API Cloud Translation.

Guia de confiabilidade da infraestrutura de Google Cloud

Last reviewed 2024-11-20 UTC

A infraestrutura confiável é um requisito essencial para as cargas de trabalho na nuvem. Como arquiteto de nuvem, para projetar uma infraestrutura confiável para suas cargas de trabalho, você precisa ter uma boa compreensão dos recursos de confiabilidade do provedor de nuvem que você escolher. Neste documento, descrevemos os elementos básicos de confiabilidade no Google Cloud (zonas, regiões e recursos com escopo de localização) e os níveis de disponibilidade que eles oferecem. Neste documento, também fornecemos diretrizes para avaliar os requisitos de confiabilidade das cargas de trabalho e apresentamos recomendações de arquitetura para criação e gerenciamento de infraestruturas confiáveis no Google Cloud.

Este documento é dividido nas seguintes partes:

Se você já leu este guia e quer saber o que mudou, consulte as Notas da versão.

Visão geral da confiabilidade

Um aplicativo ou uma carga de trabalho é confiável quando atinge os objetivos atuais de disponibilidade e resiliência a falhas.

Disponibilidade (ou tempo de atividade) é a porcentagem de tempo em que um aplicativo é utilizável. Por exemplo, para um aplicativo que tem uma meta de disponibilidade de 99,99%, o tempo de inatividade total não pode exceder 8,64 segundos durante um período de 24 horas. Às vezes, a disponibilidade é medida como a proporção de solicitações que o aplicativo atende com êxito durante um determinado período. Por exemplo, para um aplicativo que tem uma meta de disponibilidade de 99,99% para cada 100.000 solicitações recebidas, mais de 10 solicitações podem falhar. A disponibilidade costuma ser expressa como o número de noves na porcentagem. Por exemplo, a disponibilidade de 99,99% é expressa como "4 noves".

Dependendo da finalidade do aplicativo, você pode ter conjuntos diferentes de indicadores da confiabilidade do aplicativo. Veja abaixo exemplos desses indicadores de confiabilidade:

Para aplicativos que exibem conteúdo, disponibilidade, latência e capacidade são indicadores importantes de confiabilidade. Elas indicam se o aplicativo pode responder a solicitações, quanto tempo leva para responder às solicitações e quantas solicitações o aplicativo pode processar em um determinado período.
Para bancos de dados e sistemas de armazenamento, latência, capacidade, disponibilidade e durabilidade (como os dados estão protegidos contra perda ou corrupção) são indicadores de confiabilidade. Elas indicam quanto tempo o sistema leva para ler ou gravar dados e se os dados podem ser acessados sob demanda.
Para cargas de trabalho de Big Data e análise, como pipelines de processamento de dados, o desempenho consistente do pipeline (capacidade e latência) é essencial para garantir a atualização dos produtos de dados, além de ser um indicador importante de confiabilidade. Indica a quantidade de dados que podem ser processados e quanto tempo leva para o pipeline ir da ingestão de dados ao processamento de dados.
A maioria dos aplicativos tem a correção de dados como um indicador essencial de confiabilidade.

Para ver mais diretrizes sobre como definir os objetivos de confiabilidade dos aplicativos, consulte Avaliar os requisitos de confiabilidade das suas cargas de trabalho na nuvem.

Fatores que afetam a confiabilidade do aplicativo

A confiabilidade de um aplicativo implantado em Google Cloud depende dos seguintes fatores:

O design interno do aplicativo.
Os aplicativos secundários ou componentes de que o aplicativo depende.
Google Cloud recursos de infraestrutura, como computação, rede, armazenamento, bancos de dados e segurança, em que o aplicativo é executado e como o aplicativo usa a infraestrutura.
A capacidade da infraestrutura que você provisiona e como a capacidade é escalonada.
As ferramentas e os processos de DevOps que você usa para criar, implantar e manter o aplicativo, as dependências dele e a infraestrutura do Google Cloud.

Esses fatores estão resumidos no diagrama a seguir:

Dependências de confiabilidade do aplicativo.

Conforme mostrado no diagrama anterior, a confiabilidade de um aplicativo implantado no Google Cloud depende de vários fatores. O foco deste guia é a confiabilidade da infraestrutura do Google Cloud .

A seguir

Colaboradores

Autores:

Nir Tarcic | UTL SRE do ciclo de vida do Cloud
Kumar Dhanagopal | Desenvolvedor de soluções para vários produtos

Outros colaboradores:

Alok Kumar | Engenheiro emérito
Andrew Fikes | Pesquisador em engenharia, confiabilidade
Chris Heiser | Líder de equipe de SRE
David Ferguson | Diretor, engenharia de confiabilidade do site
Joe Tan | Consultor sênior de produtos
Krzysztof Duleba | Engenheiro principal
Narayan Desai | SRE principal
Sailesh Krishnamurthy | Vice-presidente de engenharia
Steve McGhee | Defensor de confiabilidade
Sudhanshu Jain | Gerente de produtos
Yaniv Aknin | Engenheiro de software

Avançar

Elementos básicos de confiabilidade