O pilar de excelência operacional no Google Cloud framework bem arquitetado fornece recomendações para operar cargas de trabalho de maneira eficiente em Google Cloud. A excelência operacional na nuvem envolve projetar, implementar e gerenciar soluções de nuvem que ofereçam valor, desempenho, segurança e confiabilidade. As recomendações neste pilar ajudam a melhorar e adaptar continuamente as cargas de trabalho para atender às necessidades dinâmicas e em constante evolução na nuvem.
O pilar de excelência operacional é relevante para os seguintes públicos-alvo:
- Gerentes e líderes: um framework para estabelecer e manter a excelência operacional na nuvem e garantir que os investimentos em nuvem agreguem valor e apoiem os objetivos de negócios.
- Equipes de operações na nuvem: orientação para gerenciar incidentes e problemas, planejar capacidade, otimizar o desempenho e gerenciar mudanças.
- Engenheiros de confiabilidade do site (SREs, na sigla em inglês): práticas recomendadas que ajudam a alcançar altos níveis de confiabilidade do serviço, incluindo monitoramento, resposta a incidentes e automação.
- Arquitetos e engenheiros de nuvem: requisitos operacionais e práticas recomendadas para as fases de projeto e implementação, para ajudar a garantir que as soluções sejam projetadas para eficiência operacional e escalonabilidade.
- Equipes de DevOps: orientações sobre automação, pipelines de CI/CD e gerenciamento de mudança para permitir uma entrega de software mais rápida e confiável.
Para alcançar a excelência operacional, adote a automação, orquestração e insights baseados em dados. A automação ajuda a eliminar tarefas repetitivas. Ele também simplifica e cria proteções em torno de tarefas repetitivas. A orquestração ajuda a coordenar processos complexos. Insights baseados em dados permitem tomada de decisões com base em evidências. Com essas práticas, é possível otimizar as operações na nuvem, reduzir custos, melhorar a disponibilidade do serviço e reforçar a segurança.
A excelência operacional na nuvem vai além da proficiência técnica em operações na nuvem. Isso inclui uma mudança cultural que incentiva o aprendizado e a experimentação contínuos. As equipes precisam ser capacitadas para inovar, iterar e adotar uma mentalidade de crescimento. Uma cultura de excelência operacional promove um ambiente colaborativo em que as pessoas são incentivadas a compartilhar ideias, desafiar suposições e promover melhorias.
Para ver princípios e recomendações de excelência operacional específicos para cargas de trabalho de IA e ML, consulte Perspectiva de IA e ML: excelência operacional no framework bem arquitetado.
Princípios básicos
As recomendações no pilar de excelência operacional do framework bem-arquitetado são mapeadas de acordo com os seguintes princípios fundamentais:
- Garantir a prontidão operacional e o desempenho usando o CloudOps: garanta que as soluções de nuvem atendam aos requisitos operacionais e de desempenho definindo objetivos de nível de serviço (SLOs) e realizando monitoramento abrangente, teste de desempenho e planejamento de capacidade.
- Gerencie incidentes e problemas: minimize o impacto dos incidentes na nuvem e evite a recorrência com observabilidade abrangente, procedimentos claros de resposta a incidentes, retrospectivas completas e medidas preventivas.
- Gerenciar e otimizar recursos da nuvem: otimize e gerencie recursos de nuvem por meio de estratégias como dimensionamento correto, escalonamento automático e uso de ferramentas eficazes de monitoramento de custos.
- Automatizar e gerenciar mudanças: automatize processos, simplifique a gestão de mudanças e reduza a carga do trabalho manual.
- Melhorar e inovar continuamente: concentre-se em melhorias contínuas e na introdução de novas soluções para manter a competitividade.
Colaboradores
Autores:
- Ryan Cox | Arquiteto principal
- Hadrian Knotz | Arquiteto corporativo
Outros colaboradores:
- Daniel Lees | Arquiteto de segurança do Cloud
- Filipe Gracio, PhD | Engenheiro de clientes
- Gary Harmson | Arquiteto principal
- Jose Andrade | Engenheiro de clientes de infraestrutura corporativa
- Kumar Dhanagopal | Desenvolvedor de soluções para vários produtos
- Nicolas Pintaux | Engenheiro de clientes, especialista em modernização de aplicativos
- Radhika Kanakam | Gerente de programa sênior, GTM do Cloud
- Samantha He | Redatora técnica
- Zach Seils | Especialista em rede
- Wade Holmes | Diretor de soluções globais