Definir metas realistas de confiabilidade

Esse princípio do pilar de confiabilidade do Google Cloud framework bem-arquitetado (em inglês) ajuda a definir metas de confiabilidade tecnicamente viáveis para suas cargas de trabalho no Google Cloud.

Esse princípio é relevante para a área de foco da confiabilidade do escopo.

Visão geral do princípio

Projete seus sistemas para que sejam confiáveis o suficiente para a satisfação dos usuários. Pode parecer contraditório, mas uma meta de 100% de confiabilidade geralmente não é a estratégia mais eficaz. Uma confiabilidade maior pode resultar em um custo significativamente maior, tanto em termos de investimento financeiro quanto de possíveis limitações em inovação. Se os usuários já estão satisfeitos com o nível atual de serviço, os esforços para aumentar ainda mais a satisfação podem gerar um baixo retorno do investimento. Em vez disso, é possível gastar melhor os recursos em outro lugar.

Você precisa determinar o nível de confiabilidade em que seus usuários estão satisfeitos e determinar o ponto em que o custo de melhorias incrementais começa a superar os benefícios. Ao determinar esse nível de confiabilidade suficiente, é possível alocar recursos estrategicamente e se concentrar em recursos e melhorias que agreguem mais valor aos usuários.

Recomendações

Para definir metas de confiabilidade realistas, considere as recomendações nas subseções a seguir.

Aceitar algumas falhas e priorizar componentes

Procure alta disponibilidade, como 99,99% de tempo de atividade, mas não defina uma meta de 100% de tempo de atividade. Reconheça que algumas falhas são inevitáveis.

A lacuna entre 100% de tempo de atividade e uma meta de 99,99% é a chance de falhas. Essa lacuna costuma ser chamada de margem de erro. A margem de erro pode ajudar você a correr riscos e inovar, o que é fundamental para manter a competitividade de qualquer negócio.

Priorize a confiabilidade dos componentes mais críticos do sistema. Aceitar que componentes menos críticos podem ter uma tolerância maior a falhas.

Equilibrar confiabilidade e custo

Para determinar o nível de confiabilidade ideal para seu sistema, realize análises completas de custo-benefício.

Considere fatores como requisitos do sistema, as consequências de falhas e a tolerância ao risco da sua organização para o aplicativo específico. Lembre-se de considerar as métricas de recuperação de desastres, como o objetivo do tempo de recuperação (RTO) e o objetivo do ponto de recuperação (RPO). Decida qual nível de confiabilidade é aceitável dentro do orçamento e de outras restrições.

Procure maneiras de melhorar a eficiência e reduzir custos sem comprometer recursos essenciais de confiabilidade.