Este documento descreve como acessar e visualizar métricas de máquinas virtuais (VM). Também descreve como rever as métricas da VM para saber mais sobre as suas VMs ou resolver problemas específicos com uma VM.
O monitoramento de instâncias de máquinas virtuais (VM) é essencial para manter seus recursos de VM. O Compute Engine oferece uma visualização de alto nível das métricas da sua VM usando a guia Observabilidade no console do Google Cloud. Esta guia fornece um painel predefinido usando dados de telemetria para que você possa monitorar suas VMs e tomar decisões informadas sobre os recursos do Compute Engine. Você também pode personalizar o painel predefinido para visualizar apenas as métricas específicas desejadas.
Todas as VMs têm dados básicos de utilização de processos disponíveis quando são criadas. No entanto, a instalação do Ops Agent fornece insights mais profundos sobre o comportamento da VM.
Para obter mais informações sobre como criar uma política de alertas de monitoramento, usando o Metrics Explorer, ou para obter informações gerais sobre como o monitoramento e as métricas funcionam em Google Cloud, consulte os documentos do Cloud Monitoring .
Antes de começar
Opcional: instale o agente de operações para coletar dados mais detalhados das instâncias do Compute Engine.
Para verificar quais instâncias de VM têm o Ops Agent instalado, faça o seguinte:
No console do Google Cloud, acesse Painéis de monitoramento
Selecione instâncias de VM na lista do painel.
Clique em Lista para visualizar as VMs como uma lista.
Todas as VMs do seu projeto são exibidas. A coluna Agente mostra o status da instalação do Agente de operações. Você pode instalar ou atualizar o agente nesta página.
Opcional: para atualizar o painel predefinido para exibir eventos, como aqueles que indicam uma atualização em um grupo de instâncias gerenciadas, clique em event_available Selecionar eventos e preencha a caixa de diálogo.
Para obter mais informações sobre eventos, consulte Tipos de eventos .
Acesse métricas de observabilidade da VM
Acesse informações de uma ou várias VMs usando a guia Observabilidade no console do Google Cloud. Por padrão, um painel predefinido exibe as métricas da VM. Se quiser visualizar apenas as métricas específicas desejadas, você pode criar um painel personalizado .
Ver métricas de observabilidade para uma única VM
Métricas básicas de VM, como utilização de CPU e tráfego de rede, estão disponíveis quando você cria sua VM. As métricas de utilização de memória e processos só estão disponíveis com a instalação do Ops Agent, que é o agente principal para coletar telemetria das instâncias do Compute Engine.
Para visualizar as métricas de uma única VM, faça o seguinte:
No console do Google Cloud, acesse a página de instâncias de VM .
Selecione uma VM para abrir a página Detalhes .
Clique na guia Observabilidade para exibir informações sobre a VM.
Opcional: Redefina o período padrão de uma hora para o período que você deseja monitorar.
Opcional: para atualizar o painel predefinido para exibir eventos, como aqueles que indicam uma atualização em um grupo de instâncias gerenciadas, clique em event_available Selecionar eventos e preencha a caixa de diálogo.
Para obter mais informações sobre eventos, consulte Tipos de eventos .
As informações na Figura 1 exibem detalhes da VM sem o agente de operações instalado na VM. Observe que os gráficos de utilização de memória e espaço em disco não possuem dados.

Ver métricas de observabilidade para várias VMs
A observabilidade no nível da frota exibe as métricas das cinco principais VMs com maior utilização de processos. As cinco principais VMs listadas variam de acordo com a métrica. Talvez você não veja as mesmas cinco VMs para cada processo. Embora haja mais dados disponíveis no nível da frota sem a instalação do Ops Agent em comparação com a quantidade de dados disponíveis para uma única VM, a instalação do agente fornece mais dados para fins de solução de problemas futuros.
Para visualizar as métricas de várias VMs, faça o seguinte:
No console do Google Cloud, acesse a página de instâncias de VM .
Clique na guia Observabilidade .
Opcional: Redefina o período padrão de uma hora para o período que você deseja monitorar.
Filtre os resultados por uma ou mais das seguintes opções:
- EU IA
- Nome
- Tipo de máquina
- Zona
- Região
- Grupo de instâncias
- Etiquetas
- Estado
As informações na Figura 2 exibem um exemplo da guia Observabilidade quando várias VMs em um projeto têm o Agente de Operações instalado. Observe que há mais métricas disponíveis sobre essas VMs.

Ver métricas detalhadas de uma VM
Cada métrica de processo de VM é representada por uma linha gráfica em um gráfico. No exemplo a seguir, a VM uptime-demo tem o agente de operações instalado. Os dados de utilização de memória estão disponíveis para fins de solução de problemas. Se uma VM não estiver listada no cartão, filtre pelo nome da VM para encontrar uma VM específica.
Para recuperar as informações sobre esta VM ou outra das cinco principais VMs da guia Observabilidade, faça o seguinte:
- Mantenha o ponteiro sobre a linha do gráfico de qualquer VM. Um cartão aparece com uma lista das cinco principais VMs que usam o processo, cada uma exibindo uma métrica.
- Para saber mais sobre o comportamento da VM, clique na linha do gráfico da VM ou em um nome de VM específico na lista.
A VM de demonstração de tempo de atividade exibida no cartão na Figura 3 revela algumas métricas que podem exigir uma revisão.

Clique na VM uptime-demo para abrir a página Detalhes da VM exibida na Figura 4 , que fornece as seguintes informações:
- O status do agente de operações.
- As opções no contexto para criar alertas , verificar eventos ou criar verificações de tempo de atividade .
- A opção de visualizar os detalhes das configurações, métricas e logs da VM.

Crie um painel personalizado para visualizar métricas específicas
Por padrão, a guia Observabilidade no Compute Engine fornece um painel predefinido que exibe métricas básicas de VM. Para visualizar apenas as métricas específicas que deseja ver, você pode modificar o painel predefinido e salvá-lo como um painel personalizado. Você pode personalizar ainda mais o painel conforme achar necessário.
Para criar um painel personalizado, faça o seguinte:
No console do Google Cloud, acesse a página de instâncias de VM .
Vá para a guia Observabilidade da seguinte maneira:
- Para uma única VM: na página Instâncias de VM , clique no nome da VM para abrir a página Detalhes e, em seguida, clique na guia Observabilidade dessa VM.
- Para várias VMs: na página Instâncias de VM , clique na guia Observabilidade .
Se o menu suspenso Painel estiver ativado, painéis personalizados estarão disponíveis. Para modificar uma visualização personalizada, selecione uma visualização personalizada no menu suspenso e, na barra de ferramentas do painel, clique em
.Caso contrário, para personalizar o painel predefinido, na barra de ferramentas do painel, clique em
.O Compute Engine cria uma cópia do painel predefinido e abre a cópia no modo de edição.
No editor, você pode adicionar, modificar, excluir, reposicionar ou redimensionar as visualizações no painel. As visualizações são chamadas coletivamente de widgets . Para obter mais informações sobre os diferentes tipos de widget, consulte Visão geral dos painéis .
Para adicionar um widget, na barra de ferramentas do painel, clique em Adicionar widget e conclua a configuração.
Por exemplo, para visualizar os logs com seus dados métricos, clique em Adicionar widget , selecione Logs e clique em Aplicar .
Para modificar um widget, coloque o ponteiro sobre o widget para ativar a barra de ferramentas, clique em
Editar widget e, em seguida, use a caixa de diálogo Configurar widget . Para aplicar suas alterações ao painel, na barra de ferramentas, clique em Aplicar . Para descartar suas alterações, clique em Cancelar .Para excluir um widget, coloque o ponteiro sobre o widget para ativar a barra de ferramentas, clique em
Mais opções de gráfico e selecione Excluir .Para reposicionar um widget, use o ponteiro para arrastar o widget pelo cabeçalho para um novo local.
Para redimensionar um widget, use o ponteiro para reposicionar o canto direito do widget.
Depois de terminar de modificar o painel, clique em Salvar .
Na caixa de diálogo de confirmação das alterações, clique em Visualizar painel personalizado para acessar a visualização personalizada.
Você pode voltar para a visualização predefinida selecionando Predefinido no menu suspenso Painel .
Revise as métricas de recursos
Para saber mais sobre cada métrica de recurso, clique em cada processo no menu da guia Observabilidade :
- Explore CPU , processos , utilização de memória , tráfego de rede e utilização de disco .
- Visualize os dados de log pesquisando Logs para identificar e visualizar eventos do sistema .
- Adicione integrações de terceiros e verifique as integrações existentes configuradas .
O restante desta seção descreve exemplos de como alguns processos podem afetar suas cargas de trabalho. Estas informações pressupõem que o Ops Agent esteja instalado em suas VMs.
Utilização da CPU
Um exemplo de utilização extrema da CPU pode ser quando um servidor está sob uma carga inesperadamente pesada, como quando um site sofre um aumento repentino no tráfego ou quando uma tarefa de processamento de dados em grande escala está em andamento. Nessas situações, a CPU pode funcionar a 100% da capacidade por um longo período de tempo, o que pode fazer com que o servidor fique lento ou pare de responder.
Neste exemplo, a saturação é a preocupação. Se a utilização da CPU estiver em 100%, isso pode ser adequado para suas cargas de trabalho, mas talvez você queira examinar outras métricas para saber se isso requer intervenção. Nesse caso, talvez você queira criar uma política de alertas para ser notificado quando a utilização da CPU de uma VM aumentar.
Com as permissões adequadas, você pode conectar-se usando SSH às suas VMs para investigar o problema. No entanto, se o Ops Agent estiver instalado, você poderá ver mais dados históricos para ajudar na solução de problemas.
Utilização do processo
Um exemplo de comportamento extremo do processo pode ser quando um processo consome uma quantidade excessiva de recursos, como CPU, memória ou E/S de disco, a ponto de causar degradação do desempenho ou até travar a VM.
Por exemplo, se um processo em execução em uma VM estiver enfrentando um vazamento de memória, ele poderá começar a consumir quantidades cada vez maiores de memória ao longo do tempo, fazendo com que a VM fique sem memória e trave. Da mesma forma, se um processo estiver usando muito o disco, isso poderá fazer com que a E/S do disco da VM fique saturada, levando a tempos de resposta lentos para outros processos.
Utilização de memória
Os bancos de dados requerem uma grande quantidade de memória para realizar operações como indexação, classificação e união de tabelas.
Um exemplo de alto uso de memória em uma VM é quando você executa um servidor de banco de dados, como Cloud SQL para MySQL ou Cloud SQL para PostgreSQL, com um grande conjunto de dados. Se a memória disponível da sua VM for muito pequena, recarregar um conjunto de dados na memória pode fazer com que o banco de dados fique lento ou trave.
Desempenho da rede
Os problemas de desempenho da rede são o resultado de diferentes fatores: congestionamento, limitações de largura de banda, problemas de hardware ou software e latência. Para diagnosticar o problema, monitore as métricas de desempenho da rede, solucione problemas de hardware e software e analise padrões de tráfego de rede para identificar e resolver a causa raiz do problema.
Utilização de disco
A alta utilização do disco em uma VM ocorre quando há uma grande quantidade de dados sendo lidos ou gravados no disco virtual, resultando em um atraso no acesso ao disco e em um possível efeito no desempenho da VM.
O monitoramento de métricas de utilização de disco, como operações de E/S de disco por segundo (IOPS), comprimento da fila de disco e tempo médio de resposta do disco, pode ajudar a identificar e diagnosticar problemas de alta utilização de disco em uma VM.
Verifique logs e eventos do sistema
A página Todos os Logs fornece dados de log sobre seus recursos. Classifique por gravidade para identificar problemas e inspecionar a carga.
Os logs de auditoria registram eventos administrativos que ocorrem em seus recursos. Os logs podem informar o que aconteceu para acionar o evento. Vários logs são registrados e mantidos na mesma linha, portanto, por exemplo, se você tiver 20 logs idênticos, as informações serão armazenadas em uma linha, em vez de 20 linhas separadas.
Você pode pensar em eventos do sistema como um termo abrangente para eventos que ocorrem em um nível superior, mas que podem afetar os recursos do Compute Engine. Um evento do sistema ocorre quando um erro não relacionado a um evento planejado é acionado. Os eventos do sistema são registrados no nível da frota.
Use integrações de terceiros
O monitoramento fornece integrações com aplicativos de terceiros. Essas integrações permitem coletar telemetria de aplicativos como Apache Web Server, Cloud SQL para MySQL, Memorystore para Redis e outros para implantações em execução no Compute Engine e no GKE. Quando você usa o Compute Engine, a telemetria de terceiros é coletada pelo agente de operações.