Framework com boa arquitetura: pilar de excelência operacional

O pilar de excelência operacional no Google Cloud framework bem arquitetado fornece recomendações para operar cargas de trabalho de maneira eficiente em Google Cloud. A excelência operacional na nuvem envolve projetar, implementar e gerenciar soluções de nuvem que ofereçam valor, desempenho, segurança e confiabilidade. As recomendações neste pilar ajudam a melhorar e adaptar continuamente as cargas de trabalho para atender às necessidades dinâmicas e em constante evolução na nuvem.

O pilar de excelência operacional é relevante para os seguintes públicos-alvo:

  • Gerentes e líderes: um framework para estabelecer e manter a excelência operacional na nuvem e garantir que os investimentos em nuvem agreguem valor e apoiem os objetivos de negócios.
  • Equipes de operações na nuvem: orientação para gerenciar incidentes e problemas, planejar capacidade, otimizar o desempenho e gerenciar mudanças.
  • Engenheiros de confiabilidade do site (SREs, na sigla em inglês): práticas recomendadas que ajudam a alcançar altos níveis de confiabilidade do serviço, incluindo monitoramento, resposta a incidentes e automação.
  • Arquitetos e engenheiros de nuvem: requisitos operacionais e práticas recomendadas para as fases de projeto e implementação, para ajudar a garantir que as soluções sejam projetadas para eficiência operacional e escalonabilidade.
  • Equipes de DevOps: orientações sobre automação, pipelines de CI/CD e gerenciamento de mudança para permitir uma entrega de software mais rápida e confiável.

Para alcançar a excelência operacional, adote a automação, orquestração e insights baseados em dados. A automação ajuda a eliminar tarefas repetitivas. Ele também simplifica e cria proteções em torno de tarefas repetitivas. A orquestração ajuda a coordenar processos complexos. Insights baseados em dados permitem tomada de decisões com base em evidências. Com essas práticas, é possível otimizar as operações na nuvem, reduzir custos, melhorar a disponibilidade do serviço e reforçar a segurança.

A excelência operacional na nuvem vai além da proficiência técnica em operações na nuvem. Isso inclui uma mudança cultural que incentiva o aprendizado e a experimentação contínuos. As equipes precisam ser capacitadas para inovar, iterar e adotar uma mentalidade de crescimento. Uma cultura de excelência operacional promove um ambiente colaborativo em que as pessoas são incentivadas a compartilhar ideias, desafiar suposições e promover melhorias.

Para ver princípios e recomendações de excelência operacional específicos para cargas de trabalho de IA e ML, consulte Perspectiva de IA e ML: excelência operacional no framework bem arquitetado.

Princípios básicos

As recomendações no pilar de excelência operacional do framework bem-arquitetado são mapeadas de acordo com os seguintes princípios fundamentais:

  • Garantir a prontidão operacional e o desempenho usando o CloudOps: garanta que as soluções de nuvem atendam aos requisitos operacionais e de desempenho definindo objetivos de nível de serviço (SLOs) e realizando monitoramento abrangente, teste de desempenho e planejamento de capacidade.
  • Gerencie incidentes e problemas: minimize o impacto dos incidentes na nuvem e evite a recorrência com observabilidade abrangente, procedimentos claros de resposta a incidentes, retrospectivas completas e medidas preventivas.
  • Gerenciar e otimizar recursos da nuvem: otimize e gerencie recursos de nuvem por meio de estratégias como dimensionamento correto, escalonamento automático e uso de ferramentas eficazes de monitoramento de custos.
  • Automatizar e gerenciar mudanças: automatize processos, simplifique a gestão de mudanças e reduza a carga do trabalho manual.
  • Melhorar e inovar continuamente: concentre-se em melhorias contínuas e na introdução de novas soluções para manter a competitividade.

Colaboradores

Autores:

Outros colaboradores: