Resolver problemas de carga de banco de dados alta com a assistência da IA

Este documento descreve como usar a assistência de IA no Cloud SQL para resolver problemas de carga de banco de dados alta no Cloud SQL. Você pode usar os recursos de assistência de IA do Cloud SQL e do Gemini Cloud Assist para investigar, analisar, receber recomendações e, por fim, implementar essas recomendações para otimizar suas consultas no Cloud SQL.

Acesse o painel Insights de consulta no console Google Cloud para analisar seu banco de dados e resolver problemas de eventos quando o sistema apresentar uma carga de banco de dados maior que a média. O Cloud SQL usa as 24 horas de dados que ocorrem antes do período selecionado para calcular a carga esperada do banco de dados. Você pode analisar os motivos dos eventos de carga mais altos e analisar as evidências por trás da redução de desempenho. Por fim, o Cloud SQL oferece recomendações para otimizar seu banco de dados e melhorar o desempenho.

Antes de começar

Para resolver problemas de carga alta do banco de dados com a assistência da IA, faça o seguinte:

  1. Analise as limitações com a solução de problemas assistida por IA.
  2. Ative a solução de problemas assistida por IA.

Papéis e permissões necessárias

Para saber quais são os papéis e as permissões necessários para resolver problemas de carga de banco de dados com assistência de IA, consulte Observar e resolver problemas com IA.

Usar a assistência de IA

Para usar a assistência de IA na solução de problemas de carga alta do banco de dados, acesse a página Visão geral da instância ou o painel Insights de consulta no console Google Cloud .

Página de visão geral da instância

Siga estas etapas para resolver problemas de carga de banco de dados alta com a assistência da IA na página Visão geral da instância:

  1. No Google Cloud console, acesse a página Instâncias do Cloud SQL.

    Acesse "Instâncias do Cloud SQL"

  2. Para abrir a página Visão geral de uma instância, clique no nome da instância.
  3. Na página Visão geral, no menu Gráfico, selecione uma métrica para o banco de dados. Você pode selecionar qualquer métrica.
  4. Opcional: para selecionar um período de análise específico, use o filtro Período para selecionar 1 hora, 6 horas, 1 dia, 7 dias, 30 dias ou um período personalizado .
  5. Gráfico de desempenho do banco de dados na página "Visão geral" que mostra a utilização da CPU
    em um período de 24 horas e uma opção para analisar o desempenho da instância.

    É possível aumentar o zoom em seções específicas do gráfico em que você percebe áreas de carga alta que quer analisar. Por exemplo, uma área de carga alta pode mostrar níveis de utilização da CPU mais próximos de 100%. Para aumentar o zoom, clique e selecione uma parte do gráfico.

    Amplie o gráfico de desempenho do banco de dados.
  6. Clique em Analisar a performance da instância para começar a resolver problemas de carga de banco de dados alta com a assistência da IA. Isso gera a página Analisando a carga do banco de dados.

Painel de insights da consulta

Resolva problemas de carga alta do banco de dados com a assistência da IA no painel Query insights seguindo estas etapas:

  1. No Google Cloud console, acesse a página Instâncias do Cloud SQL.

    Acesse "Instâncias do Cloud SQL"

  2. Para abrir a página Visão geral de uma instância, clique no nome da instância.
  3. Clique em Insights de consulta para abrir o painel Insights de consulta.
  4. Opcional: use o filtro Período para selecionar 1 hora, 6 horas, 1 dia, 7 dias, 30 dias ou um período personalizado.
  5. Gráfico de carga do banco de dados no gráfico "Query insights" que mostra a latência da consulta em um período de 24 horas e uma opção para analisar o desempenho da instância.

    É possível aumentar o zoom em seções específicas do gráfico em que você percebe áreas de carga de banco de dados mais alta pelo tempo de execução da consulta. Para aumentar o zoom, clique e selecione uma parte do gráfico.

  6. No Gráfico de carga do banco de dados, clique em Analisar a performance da instância para começar a resolver problemas de carga alta do banco de dados com a assistência da IA. Isso gera a página Analisando a carga do banco de dados.

Analisar a carga alta do banco de dados

Com a assistência de IA, é possível analisar e resolver problemas nos detalhes da carga do banco de dados.

Na página Analisar a carga do banco de dados, você pode conferir os seguintes detalhes da sua instância do Cloud SQL:

  • Período da análise
  • Uso da CPU (p99)
  • Uso da memória (p99)

O Cloud SQL mostra um gráfico de consultas do MySQL, em que você pode conferir a atividade de consulta durante o período selecionado. Você pode verificar picos repentinos de atividade durante um período específico.

Página de análise de desempenho do banco de dados do Cloud SQL para MySQL

Período da análise

O Cloud SQL analisa seu banco de dados no período selecionado no gráfico de carga do banco de dados no painel Query Insights ou na página Visão geral da instância. Se você selecionar um período de menos de 24 horas, o Cloud SQL vai analisar todo o período. Se você selecionar um período maior que 24 horas, o Cloud SQL vai selecionar apenas as últimas 24 horas do período para análise.

Para calcular a análise de desempenho de referência do seu banco de dados, o Cloud SQL inclui 24 horas de um período de referência no período de análise. Se o período selecionado ocorrer em um dia diferente de segunda-feira, o Cloud SQL vai usar um período de referência das 24 horas anteriores ao período selecionado. Se o período selecionado ocorrer em uma segunda-feira, o Cloud SQL vai usar um período de referência do sétimo dia anterior ao período selecionado.

Situação

Quando o Cloud SQL inicia a análise, ele verifica mudanças significativas nas seguintes métricas principais:

  • Consultas por segundo (QPS)
  • CPU
  • Memória
  • E/S de disco

O Cloud SQL compara os dados agregados de referência do seu banco de dados com os dados de desempenho da janela de tempo de análise. Se o Cloud SQL detectar uma mudança significativa no limite de uma métrica principal, ele indicará uma possível situação com seu banco de dados. A situação identificada pode explicar a causa raiz da alta carga no seu banco de dados no período selecionado.

Por exemplo, você pode identificar várias situações que explicam por que o banco de dados está com carga alta:

  • Alta simultaneidade de linhas de execução
  • Mudanças significativas na utilização da CPU
  • Mudanças significativas nas IOPS de disco
  • Mudanças significativas no QPS

Situação e evidências do Cloud SQL para MySQL

Evidência

Para cada situação, o Cloud SQL fornece uma lista de evidências para apoiar a descoberta. O Cloud SQL baseia as evidências em métricas coletadas da instância.

Cada situação tem evidências de apoio usadas para detectar anomalias no desempenho do sistema. O Cloud SQL detecta uma anomalia quando o desempenho do sistema ultrapassa determinados limites ou atende a critérios específicos de tempo. O Cloud SQL define esses limites ou critérios para cada situação.

Para ajudar nas situações em que são detectadas mudanças significativas nas principais métricas, você pode encontrar as seguintes evidências:

  • QPS total: a média mudou de 18.534,22 para 37.619,86, o p20 mudou de 3,55 para 5,45 e o p80 mudou de 5,62 para 112.050,8.
  • QPS de leitura: a média mudou de 1.802,98 para 3.657,93, o p20 mudou de 1,17 para 2,1, o p80 mudou de 2,12 para 10.908,8.
  • QPS de gravação: a média mudou de 1.751,61 para 3.553,48, o p20 mudou de 0,2 para 0,2, o p80 mudou de 0,2 para 10.600,13.
  • Mudança no uso da CPU: foram detectadas mudanças significativas na utilização da CPU. A média mudou em 183,85%. O p80 mudou em 2.630,49%. O p20 mudou em 6,75%.
  • IOPS de disco: foi detectada uma mudança significativa nas IOPS de disco. A média mudou em 173,39%. O p80 mudou em 20.832,44%. O p20 mudou em 1,88%.
  • Linhas de execução: há um aumento de 3.166,67% no número de linhas de execução.

Para conferir as evidências recuperadas durante a análise, clique em cada situação. O comprovante aparece no painel ao lado da situação correspondente.

Recomendações

Com base em todas as situações analisadas, o Cloud SQL oferece uma ou mais recomendações práticas para ajudar a corrigir os problemas de carga de banco de dados. O Cloud SQL apresenta as recomendações com uma análise de custo-benefício para que você possa tomar uma decisão informada sobre a implementação da recomendação.

Em algumas situações, com base na análise, talvez não haja uma recomendação.

Tabela de recomendações

Por exemplo, você pode receber as seguintes recomendações:

  • Analisar a carga de trabalho simultânea: use os insights de consulta para analisar as cargas de trabalho atuais e anteriores.

    • Quando o uso da CPU aumentar, concentre-se nas principais consultas com uso intenso de recursos para identificar possíveis ineficiências.
    • Quando o uso da CPU diminuir, revise os eventos de espera para identificar possíveis disputas.
  • Analisar as flags de banco de dados relacionadas a E/S: as flutuações de IOPS do disco podem resultar de modificações na flag de banco de dados.

    • Algumas flags importantes que podem afetar as IOPS incluem, entre outras:

      • innodb_buffer_pool_size
      • innodb_redo_log_capacity
      • innodb_io_capacity
      • innodb_flush_neighbors
      • innodb_lru_scan_depth
      • temptable_max_ram

      A revisão dessas configurações pode ajudar a identificar a possível causa das mudanças de E/S.

  • Analisar outras métricas de E/S: para entender melhor as mudanças nas IOPS, analise as seguintes métricas do System Insights:

    • Disk read/write operations
    • Read/write InnoDB pages

    Além disso, revise outras métricas de E/S do InnoDB no Metrics Explorer.

Se você quiser continuar a solução de problemas ou receber mais ajuda com o desempenho do sistema, também é possível abrir o Gemini Cloud Assist. Para mais informações, consulte Observar e resolver problemas com a assistência de IA.

A seguir