O pilar de excelência operacional no Google Cloud Well-Architected Framework fornece recomendações para operar cargas de trabalho de maneira eficiente no Google Cloud. A excelência operacional na nuvem envolve projetar, implementar e gerenciar soluções de nuvem que oferecem valor, desempenho, segurança e confiabilidade. As recomendações neste pilar ajudam você a melhorar e adaptar continuamente as cargas de trabalho para atender às necessidades dinâmicas e em constante evolução na nuvem.
O pilar de excelência operacional é relevante para os seguintes públicos-alvo:
- Gerentes e líderes: um framework para estabelecer e manter a excelência operacional na nuvem e garantir que os investimentos em nuvem gerem valor e apoiem os objetivos de negócios.
- Equipes de operações na nuvem: orientações para gerenciar incidentes e problemas, planejar a capacidade, otimizar o desempenho e gerenciar mudanças.
- Engenheiros de confiabilidade do site (SREs): práticas recomendadas que ajudam a alcançar altos níveis de confiabilidade do serviço, incluindo monitoramento, resposta a incidentes e automação.
- Arquitetos e engenheiros de nuvem: requisitos operacionais e práticas recomendadas para as fases de design e implementação, ajudando a garantir que as soluções sejam projetadas para eficiência operacional e escalonabilidade.
- Equipes de DevOps: orientações sobre automação, pipelines de CI/CD e gerenciamento de mudanças para ajudar a acelerar e tornar mais confiável a entrega de software.
Para alcançar a excelência operacional, é preciso adotar a automação, a orquestração e os insights baseados em dados. Automation ajuda a eliminar o trabalho. Ele também simplifica e cria mecanismos de proteção para tarefas repetitivas. A orquestração ajuda a coordenar processos complexos. Os insights baseados em dados permitem a tomada de decisões com base em evidências. Ao usar essas práticas, você pode otimizar as operações na nuvem, reduzir custos, melhorar a disponibilidade do serviço e aumentar a segurança.
A excelência operacional na nuvem vai além da proficiência técnica em operações na nuvem. Isso inclui uma mudança cultural que incentiva o aprendizado e a experimentação contínuos. As equipes precisam ter autonomia para inovar, iterar e adotar uma mentalidade de crescimento. Uma cultura de excelência operacional promove um ambiente colaborativo em que as pessoas são incentivadas a compartilhar ideias, questionar premissas e impulsionar melhorias.
Para princípios e recomendações de excelência operacional específicos para cargas de trabalho de IA e ML, consulte Perspectiva de IA e ML: excelência operacional no framework bem arquitetado.
Princípios básicos
As recomendações no pilar de excelência operacional do Well-Architected Framework são mapeadas para os seguintes princípios básicos:
- Garantir a prontidão operacional e o desempenho usando o CloudOps: garanta que as soluções de nuvem atendam aos requisitos operacionais e de desempenho definindo objetivos de nível de serviço (SLOs) e realizando monitoramento abrangente, testes de desempenho e planejamento de capacidade.
- Gerenciar incidentes e problemas: minimize o impacto de incidentes na nuvem e evite recorrências com observabilidade abrangente, procedimentos claros de resposta a incidentes, retrospectivas completas e medidas preventivas.
- Gerenciar e otimizar recursos de nuvem: otimize e gerencie recursos de nuvem com estratégias como dimensionamento adequado, escalonamento automático e usando ferramentas eficazes de monitoramento de custos.
- Automatizar e gerenciar mudanças: automatize processos, simplifique o gerenciamento de mudanças e alivie o trabalho manual.
- Melhorar e inovar continuamente: concentre-se em melhorias contínuas e na introdução de novas soluções para manter a competitividade.
Colaboradores
Autores:
- Ryan Cox | Arquiteto principal
- Hadrian Knotz | Arquiteto corporativo
Outros colaboradores:
- Daniel Lees | Arquiteto de segurança do Cloud
- Filipe Gracio, PhD | Engenheiro de clientes
- Gary Harmson | Arquiteto principal
- Jose Andrade | Engenheiro de clientes de infraestrutura empresarial
- Kumar Dhanagopal | Desenvolvedor de soluções para vários produtos
- Nicolas Pintaux | Engenheiro de clientes, especialista em modernização de aplicativos
- Radhika Kanakam | Gerente sênior de programas, GTM da nuvem
- Samantha He | Redatora técnica
- Zach Seils | Especialista em rede
- Wade Holmes | Diretor global de soluções