Este principio del pilar de fiabilidad del Google Cloud framework Well-Architected te ayuda a definir objetivos de fiabilidad que sean técnicamente viables para tus cargas de trabajo en Google Cloud.
Este principio se aplica al ámbito de la fiabilidad.
Descripción general de los principios
Diseña tus sistemas para que sean lo suficientemente fiables como para que los usuarios estén contentos. Puede parecer contradictorio, pero un objetivo de fiabilidad del 100% no suele ser la estrategia más eficaz. Una mayor fiabilidad puede suponer un coste significativamente más alto, tanto en términos de inversión financiera como de posibles limitaciones en la innovación. Si los usuarios ya están satisfechos con el nivel de servicio actual, los esfuerzos para aumentar aún más su satisfacción pueden dar lugar a un bajo retorno de la inversión. En su lugar, puedes invertir mejor los recursos en otros ámbitos.
Debes determinar el nivel de fiabilidad con el que tus usuarios están satisfechos y el punto en el que el coste de las mejoras incrementales empieza a superar los beneficios. Cuando determines este nivel de fiabilidad suficiente, podrás asignar recursos de forma estratégica y centrarte en las funciones y las mejoras que aporten más valor a tus usuarios.
Recomendaciones
Para definir objetivos de fiabilidad realistas, ten en cuenta las recomendaciones de las siguientes subsecciones.
Acepta algunos errores y prioriza los componentes
Intenta conseguir una alta disponibilidad, como un tiempo de actividad del 99,99 %, pero no fijes un objetivo del 100 %. Reconoce que algunos fracasos son inevitables.
La diferencia entre el 100% de tiempo de actividad y el objetivo del 99,99% es el margen de error. Esta diferencia se suele denominar presupuesto de errores. El presupuesto de errores puede ayudarte a asumir riesgos e innovar, lo cual es fundamental para que cualquier empresa siga siendo competitiva.
Prioriza la fiabilidad de los componentes más importantes del sistema. Acepta que los componentes menos críticos pueden tener una mayor tolerancia a los fallos.
Equilibra la fiabilidad y el coste
Para determinar el nivel de fiabilidad óptimo de tu sistema, realiza análisis exhaustivos de costes y beneficios.
Ten en cuenta factores como los requisitos del sistema, las consecuencias de los fallos y la tolerancia al riesgo de tu organización para la aplicación específica. No olvides tener en cuenta las métricas de recuperación tras desastres, como el objetivo de tiempo de recuperación (RTO) y el objetivo de punto de recuperación (RPO). Decide qué nivel de fiabilidad es aceptable dentro del presupuesto y otras restricciones.
Busca formas de mejorar la eficiencia y reducir los costes sin poner en riesgo las funciones de fiabilidad esenciales.