El pilar de excelencia operativa del Google Cloud framework Well-Architected proporciona recomendaciones para operar cargas de trabajo de forma eficiente en Google Cloud. La excelencia operativa en la nube implica diseñar, implementar y gestionar soluciones en la nube que aporten valor, rendimiento, seguridad y fiabilidad. Las recomendaciones de este pilar te ayudan a mejorar y adaptar continuamente las cargas de trabajo para satisfacer las necesidades dinámicas y en constante evolución de la nube.
El pilar de excelencia operativa es relevante para las siguientes audiencias:
- Directores y líderes: un marco para establecer y mantener la excelencia operativa en la nube, así como para asegurar que las inversiones en la nube aporten valor y respalden los objetivos empresariales.
- Equipos de operaciones en la nube: orientación para gestionar incidentes y problemas, planificar la capacidad, optimizar el rendimiento y gestionar los cambios.
- Ingenieros de fiabilidad del sitio (SRE): prácticas recomendadas que te ayudan a conseguir altos niveles de fiabilidad del servicio, como la monitorización, la respuesta ante incidentes y la automatización.
- Arquitectos e ingenieros de la nube: requisitos operativos y prácticas recomendadas para las fases de diseño e implementación, que ayudan a asegurar que las soluciones se diseñen para ofrecer eficiencia operativa y escalabilidad.
- Equipos de DevOps: orientación sobre automatización, flujos de procesamiento de CI/CD y gestión de cambios para ayudar a ofrecer software de forma más rápida y fiable.
Para lograr la excelencia operativa, debes adoptar la automatización, la orquestación y las estadísticas basadas en datos. La automatización ayuda a eliminar el esfuerzo. También agiliza y crea medidas de protección en torno a las tareas repetitivas. La orquestación ayuda a coordinar procesos complejos. Las estadísticas basadas en datos permiten tomar decisiones fundamentadas. Si sigues estas prácticas, podrás optimizar las operaciones en la nube, reducir costes, mejorar la disponibilidad de los servicios y reforzar la seguridad.
La excelencia operativa en la nube va más allá de la competencia técnica en las operaciones en la nube. Implica un cambio cultural que fomenta el aprendizaje y la experimentación continuos. Los equipos deben tener la capacidad de innovar, iterar y adoptar una mentalidad de crecimiento. Una cultura de excelencia operativa fomenta un entorno de colaboración en el que se anima a las personas a compartir ideas, cuestionar suposiciones e impulsar mejoras.
Para consultar los principios y las recomendaciones de excelencia operativa específicos de las cargas de trabajo de IA y aprendizaje automático, consulta el artículo Perspectiva de IA y aprendizaje automático: excelencia operativa del framework Well-Architected.
Principios básicos
Las recomendaciones del pilar de excelencia operativa del framework Well-Architected se corresponden con los siguientes principios básicos:
- Asegurar la preparación operativa y el rendimiento con CloudOps: asegúrate de que las soluciones en la nube cumplan los requisitos operativos y de rendimiento definiendo objetivos de nivel de servicio (SLOs) y realizando una monitorización exhaustiva, pruebas de rendimiento y planificación de la capacidad.
- Gestionar incidentes y problemas: minimizar el impacto de los incidentes en la nube y evitar que se repitan mediante una observabilidad integral, procedimientos de respuesta a incidentes claros, retrospectivas exhaustivas y medidas preventivas.
- Gestionar y optimizar los recursos en la nube: optimiza y gestiona los recursos en la nube mediante estrategias como el ajuste de tamaño y el escalado automático, y usando herramientas eficaces de monitorización de costes.
- Automatizar y gestionar los cambios: automatiza los procesos, optimiza la gestión de los cambios y reduce la carga de trabajo manual.
- Mejorar e innovar continuamente: céntrate en las mejoras constantes y en la introducción de nuevas soluciones para mantener la competitividad.
Colaboradores
Autores:
- Ryan Cox | Arquitecto principal
- Hadrian Knotz | Arquitecto empresarial
Otros colaboradores:
- Daniel Lees | Arquitecto de seguridad en la nube
- Filipe Gracio, doctor | Ingeniero de clientes y especialista en IA y aprendizaje automático
- Gary Harmson | Arquitecto principal
- Jose Andrade | Ingeniero de clientes, especialista en SRE
- Kumar Dhanagopal | Desarrollador de soluciones entre productos
- Nicolas Pintaux | Ingeniero de clientes, especialista en modernización de aplicaciones
- Radhika Kanakam | Responsable del programa Google Cloud Well-Architected Framework
- Samantha He | Redactora técnica
- Zach Seils | Especialista en redes
- Wade Holmes | Director de Soluciones Globales