Esse princípio do pilar de confiabilidade do Google Cloud framework bem-arquitetado (em inglês) ajuda você a avaliar a experiência dos usuários e, em seguida, associar as descobertas a metas e métricas de confiabilidade.
Esse princípio é relevante para a área de foco da confiabilidade do escopo.
Visão geral do princípio
As ferramentas de observabilidade fornecem grandes quantidades de dados, mas nem todos os dados estão diretamente relacionados aos impactos sobre os usuários. Por exemplo, você pode observar uso elevado da CPU, operações de servidor lentas ou até mesmo tarefas com falha. No entanto, se esses problemas não afetarem a experiência do usuário, eles não serão uma interrupção do serviço.
Para avaliar a experiência do usuário, você precisa distinguir entre o comportamento interno do sistema e os problemas do usuário. Concentre-se em métricas como a taxa de sucesso das solicitações do usuário. Não confie apenas em métricas centradas no servidor, como o uso de CPU, que podem levar a conclusões equivocadas sobre a confiabilidade do seu serviço. Confiabilidade verdadeira significa que os usuários podem usar seu aplicativo ou serviço de maneira consistente e eficaz.
Recomendações
Para ajudar você a avaliar a experiência do usuário de maneira eficaz, considere as recomendações nas seções a seguir.
Avaliar a experiência do usuário
Para realmente entender a confiabilidade do seu serviço, priorize métricas que reflitam a experiência real dos usuários. Por exemplo, meça a taxa de sucesso de consultas, a latência do aplicativo e as taxas de erro dos usuários.
O ideal é coletar esses dados diretamente do dispositivo ou navegador do usuário. Se essa coleta direta de dados não for viável, mude seu ponto de medição progressivamente para mais longe do usuário no sistema. Por exemplo, é possível usar o balanceador de carga ou o serviço de front-end como o ponto de medição. Essa abordagem ajuda a identificar e resolver problemas antes que eles possam afetar significativamente os usuários.
Analisar as jornadas dos usuários
Para entender como os usuários interagem com seu sistema, use ferramentas de rastreamento, como o Cloud Trace. Ao seguir a jornada de um usuário pelo seu aplicativo, você pode encontrar gargalos e problemas de latência que podem prejudicar a experiência do usuário. O Cloud Trace captura dados de desempenho detalhados para cada salto na arquitetura de serviço. Esses dados ajudam a identificar e resolver problemas de performance com mais eficiência, o que pode resultar em uma experiência do usuário mais confiável e satisfatória.