Esse princípio no pilar de confiabilidade do Google Cloud Framework bem arquitetado ajuda você a avaliar a experiência dos usuários e mapear os resultados para metas e métricas de confiabilidade.
Esse princípio é relevante para a área de foco de escopo da confiabilidade.
Visão geral do princípio
As ferramentas de observabilidade fornecem grandes quantidades de dados, mas nem todos estão diretamente relacionados aos impactos nos usuários. Por exemplo, você pode observar uso alto da CPU, operações lentas do servidor ou até mesmo falhas nas tarefas. No entanto, se esses problemas não afetarem a experiência do usuário, eles não vão constituir uma interrupção.
Para medir a experiência do usuário, é preciso distinguir entre o comportamento interno do sistema e os problemas enfrentados pelo usuário. Concentre-se em métricas como a proporção de sucesso das solicitações dos usuários. Não confie apenas em métricas centradas no servidor, como o uso da CPU, que podem levar a conclusões enganosas sobre a confiabilidade do seu serviço. A verdadeira confiabilidade significa que os usuários podem usar seu aplicativo ou serviço de forma consistente e eficaz.
Recomendações
Para medir a experiência do usuário de maneira eficaz, considere as recomendações nas seções a seguir.
Medir a experiência do usuário
Para entender de verdade a confiabilidade do seu serviço, priorize métricas que reflitam a experiência real dos usuários. Por exemplo, meça a proporção de sucesso das consultas dos usuários, a latência do aplicativo e as taxas de erro.
O ideal é coletar esses dados diretamente do dispositivo ou navegador do usuário. Se essa coleta direta de dados não for viável, afaste progressivamente o ponto de medição do usuário no sistema. Por exemplo, é possível usar o balanceador de carga ou o serviço de front-end como ponto de medição. Essa abordagem ajuda a identificar e resolver problemas antes que eles afetem significativamente os usuários.
Analisar as jornadas dos usuários
Para entender como os usuários interagem com seu sistema, use ferramentas de rastreamento, como o Cloud Trace. Ao acompanhar a jornada de um usuário no aplicativo, é possível encontrar gargalos e problemas de latência que podem prejudicar a experiência dele. O Cloud Trace captura dados detalhados de desempenho para cada salto na arquitetura de serviço. Esses dados ajudam a identificar e resolver problemas de performance com mais eficiência, o que pode levar a uma experiência do usuário mais confiável e satisfatória.