Esse princípio no pilar de confiabilidade do Google Cloud Framework bem arquitetado ajuda você a definir metas de confiabilidade tecnicamente viáveis para suas cargas de trabalho no Google Cloud.
Esse princípio é relevante para a área de foco de escopo da confiabilidade.
Visão geral do princípio
Projete seus sistemas para serem confiáveis o suficiente para a satisfação do usuário. Pode parecer contraditório, mas uma meta de 100% de confiabilidade geralmente não é a estratégia mais eficaz. Uma confiabilidade maior pode resultar em um custo significativamente maior, tanto em termos de investimento financeiro quanto de possíveis limitações na inovação. Se os usuários já estiverem satisfeitos com o nível atual de serviço, os esforços para aumentar ainda mais a satisfação poderão gerar um baixo retorno do investimento. Em vez disso, você pode gastar melhor os recursos em outro lugar.
Você precisa determinar o nível de confiabilidade em que os usuários ficam satisfeitos e o ponto em que o custo das melhorias incrementais começa a superar os benefícios. Quando você determina esse nível de confiabilidade suficiente, é possível alocar recursos de forma estratégica e se concentrar em recursos e melhorias que oferecem mais valor aos usuários.
Recomendações
Para definir metas realistas de confiabilidade, considere as recomendações nas subseções a seguir.
Aceitar algumas falhas e priorizar componentes
Busque alta disponibilidade, como 99,99% de atividade, mas não defina uma meta de 100%. Reconheça que algumas falhas são inevitáveis.
A diferença entre 100% de tempo de atividade e uma meta de 99,99% é a tolerância a falhas. Essa lacuna é chamada de orçamento de erros. A margem de erro ajuda você a correr riscos e inovar, o que é fundamental para qualquer empresa se manter competitiva.
Priorize a confiabilidade dos componentes mais importantes do sistema. Aceite que componentes menos críticos podem ter uma tolerância maior a falhas.
Equilibrar confiabilidade e custo
Para determinar o nível ideal de confiabilidade do seu sistema, faça análises completas de custo-benefício.
Considere fatores como requisitos do sistema, consequências de falhas e a tolerância a riscos da sua organização para o aplicativo específico. Não se esqueça de considerar suas métricas de recuperação de desastres, como o objetivo de tempo de recuperação (RTO) e o objetivo de ponto de recuperação (RPO). Decida qual nível de confiabilidade é aceitável dentro do orçamento e de outras restrições.
Procure maneiras de melhorar a eficiência e reduzir os custos sem comprometer os recursos essenciais de confiabilidade.