Este documento explica o comportamento, o faturamento e as limitações da unidade de monitoramento de desempenho (PMU, na sigla em inglês) no Compute Engine. Para saber como ativar a PMU em uma instância de máquina virtual (VM) C4A ou C4, consulte Ativar a PMU em VMs.
A PMU é um componente de hardware no núcleo da CPU que monitora como o processador executa o código. Ao ativar a PMU em uma VM C4A ou C4, você pode acessar os contadores de desempenho na PMU usando um software de monitoramento de desempenho. Essa abordagem permite otimizar cargas de trabalho sensíveis ao desempenho, como computação de alto desempenho (HPC) ou cargas de trabalho de machine learning (ML), ajudando você a identificar e resolver gargalos de desempenho nos seus aplicativos.
Como a PMU funciona
A PMU é composta por um conjunto de contadores de hardware chamados contadores de monitoramento de desempenho (PMCs, na sigla em inglês). Esses contadores são registros específicos do modelo que contam cada vez que um evento de processador de baixo nível, como um erro de previsão de ramificação ou ausência no cache, ocorre na CPU. É possível ler e configurar PMCs no PMU usando um software de monitoramento de desempenho, como o Intel VTune Profiler.
Por padrão, a PMU fica desativada nas VMs. Para ativá-la, especifique os tipos de eventos de CPU de baixo nível a serem rastreados ativando um dos seguintes tipos de PMU:
Arquitetural (
ARCHITECTURAL
): é possível medir os seguintes eventos de performance de arquitetura:Instruções da ramificação desativadas: o número de instruções da ramificação desativadas. Use esse evento para medir a execução do código e identificar possíveis gargalos de desempenho.
A ramificação ausente foi removida: o número de instruções da ramificação que foram previstos incorretamente, fazendo com que o processador trave e descarte as instruções buscadas. Se você vir um número alto para esse evento, poderá otimizar o desempenho da CPU.
Instruções desativadas: o número de instruções que a CPU processa corretamente. Use esse evento para medir a capacidade de processamento de instruções da CPU.
Slots de cima para baixo: o número de slots disponíveis no pipeline do processador que são usados para executar instruções simultaneamente. Use esse evento para entender com que eficiência seu código está usando o recurso do processador.
Ciclos de núcleo não interrompidos: o número de ciclos de núcleo quando a linha de execução não é interrompida, por exemplo, devido ao gerenciamento de energia ou interrupções. Use esse evento para avaliar o uso geral do processador.
Ciclos de referência não interrompidos: o número de ciclos de referência em que o núcleo não é interrompido, por exemplo, ao buscar dados ou instruções. O núcleo é interrompido quando executa as instruções
HLT
ouMWAIT
. Os ciclos de referência operam em uma frequência fixa, fornecendo uma referência de tempo estável mesmo quando a velocidade do processador muda para economizar energia. Use esse evento para medir o tempo gasto em uma tarefa e identificar gargalos de desempenho no código.
Padrão (
STANDARD
): é possível medir todos os eventos do tipo de PMU e quaisquer eventos locais dentro do núcleo da CPU, incluindo eventos de cache de nível 2 (L2).Aprimorado (
ENHANCED
): você pode medir todos os eventos do tipo de PMU padrão eventos locais fora do núcleo da CPU, incluindo eventos de cache do nível 3 (L3).
Depois de ativar a PMU em uma VM, ela será executada em segundo plano, continuamente de monitorando eventos de desempenho usando PMCs. Você pode configurar limites para PMCs específicos usando seu software de monitoramento de desempenho preferido. Se uma PMC exceder o limite designado, ela notificará o software.
Limitações
A PMU tem as seguintes limitações:
Só é possível ativar a PMU nas seguintes plataformas de CPU:
Plataforma de CPU Série de máquinas com suporte Eventos de performance com suporte Processador Google Axion™ C4A Guia da PMU do Arm Neoverse V2 Processador escalonável Intel Xeon (Emerald Rapids) de 5ª geração C4 emeraldrapids_core.json Só é possível ativar o tipo de PMU aprimorada em VMs que usam um tipo de máquina C4 com 96 ou 192 vCPUs.
Preços
Não há custos associados à ativação ou desativação da PMU em uma VM.