Plataformas de CPU


Ao criar uma máquina virtual (VM) ou uma instância bare metal usando o Compute Engine, você especifica uma série de máquinas e um tipo de máquina para a instância. Cada série de máquinas está associada a uma ou mais plataformas de CPU. Se houver diversas plataformas de CPU disponíveis para uma série de máquinas, você poderá selecionar uma plataforma de CPU mínima para a instância de computação.

Uma plataforma de CPU oferece vários processadores físicos, e cada um desses processadores é chamado de núcleo. Para os processadores disponíveis no Compute Engine, um único núcleo de CPU pode ser executado como vários threads de hardware por meio de multithreading simultâneo (SMT) , conhecido nos processadores Intel como tecnologia Intel Hyper-Threading . No Compute Engine, cada thread de hardware é chamado de CPU virtual (vCPU). Algumas séries de máquinas, como C4A, T2D e H3, não usam SMT e cada vCPU representa um núcleo. Quando as vCPUs são informadas à VM como ocupando diferentes núcleos virtuais, o Compute Engine garante que essas vCPUs nunca compartilhem o mesmo núcleo físico.

O tipo de máquina da sua instância de computação especifica o número de vCPUs, e você pode inferir o número de núcleos físicos da CPU usando a proporção padrão de vCPU por núcleo para essa série de máquinas:

  • Para as séries de máquinas C4A, Tau T2D, Tau T2A e H3, as VMs sempre têm uma vCPU por núcleo.
  • Para todas as outras séries de máquinas, as instâncias de computação têm duas vCPUs por núcleo por padrão.

Opcionalmente, você pode definir o número de threads por núcleo para um valor não padrão, o que pode beneficiar algumas cargas de trabalho. É importante ressaltar que quando você faz isso, o tipo de máquina da sua instância de computação não reflete mais o número correto de vCPUs. Em vez disso, o preço e o número de núcleos físicos de CPU permanecem os mesmos que seriam para a proporção padrão de duas vCPUs por núcleo, e o número de vCPUs é metade do valor indicado pelo tipo de máquina.

Processadores de braço

Para processadores Arm, o Compute Engine usa um thread por núcleo. Cada vCPU é mapeada para um núcleo físico sem SMT.

A tabela a seguir descreve os processadores Arm disponíveis para instâncias do Compute Engine.

Processador CPU e SKU Séries e tipos de máquinas suportados
Processadores Google Axion™ C4A
Ampère Altra Q64-30 Tau T2A

processadores x86

Para a maioria dos processadores x86, cada vCPU é implementado como um único thread de hardware. A série de máquinas H3 é a exceção, com uma vCPU representando um núcleo físico.

Processadores Intel

Nos processadores Intel Xeon, a tecnologia Intel Hyper-Threading oferece suporte a vários threads executados simultaneamente em cada núcleo. O tipo de máquina da sua instância de computação determina o número de suas vCPUs e memória.

Processador CPU SKU do processador Séries e tipos de máquinas suportados Frequência básica (GHz) Frequência turbo de todos os núcleos (GHz) Frequência turbo máxima de núcleo único (GHz)
Processador escalável Intel Xeon
(Esmeralda Rapids)
5ª geração
Processador Intel® Xeon® Platinum 8581C
2.1 2.9 4,0
Processador Intel® Xeon® Platinum 8581C
2.3 3.1 4,0
Processador Intel® Xeon® Platinum 8581C
2.1 2.9 3.3
Processador escalável Intel Xeon
(Corridas de Safira)
4ª geração
Processador Intel® Xeon® Platinum 8490H 1,9 2.9 3.5
Processador Intel® Xeon® Platinum 8481C 2.2 3,0 3,0
Processador Intel® Xeon® Platinum 8481C 2,0 3.8 2.9
Processador escalável Intel Xeon (Ice Lake)
3ª Geração
Intel® Xeon® Platina
Processador 8373C
2.6 3.4 3.5
Processador escalável Intel Xeon (Cascade Lake)
2ª Geração
Processador Intel® Xeon® Gold 6268CL 2.8 3.4 3.9
Processador Intel® Xeon® Gold 6253CL 3.1 3.8 3.9
Processador Intel® Xeon® Platinum 8280L 2,5 3.4 4,0
Processador Intel® Xeon® Platinum 8273CL 2.2 2.9 3.7
Processador escalável Intel Xeon (Skylake)
1ª Geração
Processador Intel® Xeon® escalável Platinum 8173M 2,0 2.7 3.5
Intel Xeon E7 (Broadwell E7) Processador Intel® Xeon® E7-8880V4 2.2 2.6 3.3
Intel Xeon E5 v4 (Broadwell E5) Processador Intel® Xeon® E5-2696V4 2.2 2.8 3.7
Intel Xeon E5 v3 (Haswell) Processador Intel® Xeon® E5-2696V3 2.3 2.8 3.8
Intel Xeon E5 v2 (Ivy Bridge) Processador Intel® Xeon® E5-2696V2 2,5 3.1 3.5
Intel Xeon E5 (Sandy Bridge) Processador Intel® Xeon® E5-2689 2.6 3.2 3.6

* Os tipos de máquinas N2 que possuem 96 ou mais vCPUs exigem a CPU Intel Ice Lake.

Processadores AMD

Os processadores AMD oferecem desempenho e escalabilidade otimizados usando SMT. Em quase todos os casos, o Compute Engine usa dois threads por núcleo, e cada vCPU é um thread. Tau T2D é a exceção em que o Compute Engine usa um thread por núcleo e cada vCPU é mapeado para um núcleo físico. O tipo de máquina da sua instância de computação determina o número de suas vCPUs e memória.

Processador CPU SKU do processador Série de máquinas suportadas Frequência básica (GHz) Frequência efetiva (GHz) Frequência máxima de reforço (GHz)
AMD EPYC Gênova
4ª Geração
AMD EPYC™ 9B14 2.6 3.3 3.7
AMD EPYC Milão
3ª Geração
AMD EPYC™7B13 2,45 2.8 3.5
AMD EPYC Roma
2ª Geração
AMD EPYC™7B12 2,25 2.7 3.3

Comportamento de frequência

As tabelas anteriores descrevem as especificações de hardware das CPUs disponíveis com o Compute Engine, mas lembre-se dos seguintes pontos:

  • Frequência : A frequência de um PC, ou velocidade do clock, mede o número de ciclos que a CPU executa por segundo, medido em GHz (gigahertz). Geralmente, frequências mais altas indicam melhor desempenho. No entanto, diferentes designs de CPU lidam com instruções de maneira diferente, portanto, uma CPU mais antiga com uma velocidade de clock mais alta pode ser superada por uma CPU mais nova com uma velocidade de clock mais baixa porque a arquitetura mais recente lida com as instruções de forma mais eficiente.

  • Frequência base : A frequência na qual a CPU funciona quando o sistema está ocioso ou sob carga leve. Ao funcionar na frequência base, a CPU consome menos energia e produz menos calor.

    O ambiente convidado de uma instância de computação reflete a frequência base, independentemente da frequência em que a CPU está realmente sendo executada.

  • Frequência turbo de todos os núcleos : A frequência na qual cada CPU normalmente funciona quando todos os núcleos no soquete não estão ociosos ao mesmo tempo. Cargas de trabalho diferentes impõem demandas diferentes à CPU de um sistema. As tecnologias Boost abordam essa diferença e ajudam os processos a se adaptarem às demandas da carga de trabalho, aumentando a frequência da CPU.

    • A maioria das instâncias de computação obtém a frequência turbo de todos os núcleos, mesmo que apenas a frequência base seja anunciada para o ambiente convidado.
    • Os processadores Ampere Altra Arm podem fornecer um desempenho mais previsível porque a frequência dos processadores Arm é sempre a frequência turbo de todos os núcleos.
    • As VMs C4 podem ser executadas na frequência turbo máxima de todos os núcleos, definindo o campo AdvancedMachineFeature como ALL_CORE_MAX . Se este campo não estiver definido, a VM será executada na configuração padrão, que é frequência irrestrita.
  • Frequência turbo máxima : A frequência que uma CPU atinge quando sobrecarregada por um aplicativo exigente, como um videogame ou aplicativo de modelagem de design. É a frequência máxima de núcleo único que uma CPU atinge sem overclock.

  • Tecnologias de gerenciamento de energia do processador : Os processadores Intel suportam múltiplas tecnologias para otimizar o consumo de energia. Essas tecnologias são divididas em duas categorias, ou estados:

    • Os estados C são estados em que a CPU reduziu ou desligou as funções selecionadas.
    • Os estados P fornecem uma maneira de dimensionar a frequência e a tensão nas quais o processador funciona, de modo a reduzir o consumo de energia da CPU.

    Todos os tipos de máquinas C4 e determinados tipos de máquinas C2 (30, 60 vCPUs), C2D (56, 112 vCPUs) e M2 (208, 416 vCPUs) suportam dicas de estado C fornecidas pela instância por meio da instrução MWAIT .

    As instâncias do Compute Engine não oferecem nenhum recurso para o controle dos estados P pelo cliente.

Recursos da CPU

Os fabricantes de chips adicionam tecnologias avançadas para computação, gráficos, virtualização e gerenciamento de memória às CPUs que produzem. Google Cloudoferece suporte ao uso de alguns desses recursos avançados com o Compute Engine.

Extensões de vetor avançadas

Advanced Vector Extensions (AVX) são extensões de instrução única e múltiplos dados (SIMD) para a arquitetura do conjunto de instruções x86 para microprocessadores da Intel e Advanced Micro Devices (AMD). AVX fornece novas instruções e um novo esquema de codificação.

Para obter mais informações, consulte Extensões de vetor avançadas .

AVX está disponível com todos os processadores x86 usados ​​pelo Compute Engine.

Extensões de vetor avançadas (AVX2)

AVX2 (também conhecido como Haswell New Instructions) apresenta as seguintes adições ao AVX:

  • Expande a maioria das instruções SSE e AVX de inteiros vetoriais para 256 bits
  • Adiciona suporte para Gather, permitindo que elementos vetoriais sejam carregados de locais de memória não contíguos
  • Permutações de qualquer para qualquer com granularidade DWORD e QWORD
  • Mudanças vetoriais

AVX2 está disponível com as seguintes plataformas de CPU:

  • Intel Xeon E5 v3 (Haswell) e processadores mais recentes
  • Todos os processadores AMD

Extensões de vetor avançadas (AVX512)

AVX-512 expande AVX para suporte de 512 bits usando a codificação de prefixo EVEX. AVX-512 fornece aceleração integrada para cargas de trabalho exigentes que envolvem processamento pesado baseado em vetores. O grande registro do acelerador AVX-512 suporta 32 números de ponto flutuante de precisão dupla e 64 números de ponto flutuante de precisão simples, além de oito números inteiros de 64 bits e 16 números inteiros de 32 bits.

Para obter mais informações sobre AVX-512, consulte O que é Intel AVX-512? .

AVX-512 está disponível com as seguintes plataformas de CPU:

  • Processador escalável Intel Xeon (Skylake) de 1ª geração e processadores mais recentes
  • Processadores AMD EPYC Genoa 4ª geração

Extensões de matriz avançadas

Intel Advanced Matrix Extensions (AMX) é uma nova extensão de arquitetura de conjunto de instruções (ISA) projetada para acelerar cargas de trabalho de inteligência artificial (IA) e aprendizado de máquina (ML). AMX apresenta novas instruções que podem ser usadas para realizar operações de multiplicação e convolução de matrizes, que são duas das operações mais comuns em IA e ML.

AMX introduz registros bidimensionais chamados blocos nos quais os aceleradores podem realizar operações. AMX pretende ser uma arquitetura extensível. O primeiro acelerador implementado é denominado unidade de multiplicação de matriz de blocos (TMUL). Cada núcleo de CPU do processador Sapphire Rapids possui uma unidade AMX TMUL independente.

Para obter detalhes técnicos sobre o Intel AMX, consulte Suporte ao Intel AMX em 5.16 . A Intel oferece um tutorial sobre AMX em Code Sample: Intel® Advanced Matrix Extensions (Intel® AMX) - Intrinsics Functions .

AMX está disponível com processadores Intel Xeon de 4ª geração (Sapphire Rapids) e posteriores. AMX não está disponível com processadores AMD ou Arm.

Requisitos para usar AMX

As instruções Intel AMX têm certos requisitos mínimos de software, como:

  • Para imagens personalizadas, o AMX é compatível com o kernel Linux versão 5.16 ou posterior.
  • O Compute Engine oferece suporte para AMX nas seguintes imagens públicas :
    • CentOS Stream 8 ou posterior
    • Container-Optimized OS 109 LTS ou posterior
    • RHEL 8 (compilação mais recente) ou posterior
    • Rocky Linux 8 (versão mais recente) ou posterior
    • Ubuntu 22.04 ou posterior
    • Windows Server 2022 ou posterior
  • Tensorflow 2.9.1 ou superior
  • Extensão Intel para otimização Intel® para PyTorch

Para disponibilidade regional de VMs C4 e C3, consulte Regiões e zonas disponíveis e filtre a tabela para mostrar apenas os tipos de máquinas C4 ou C3.

Recursos de CPU disponíveis para instâncias bare metal

Além de oferecer todos os recursos de computação brutos do servidor, as instâncias bare metal executadas em processadores escaláveis ​​Intel Xeon de 4ª geração podem usar vários aceleradores e descarregamentos integrados com funções específicas:

  • Intel-QAT : Tecnologia Intel QuickAssist (Intel QAT) acelera compactação, criptografia e descriptografia
  • Intel-DLB : Intel Dynamic Load Balancer (Intel DLB) ajuda a acelerar filas de dados
  • Intel IAA : Intel In-Memory Analytics Accelerator (Intel IAA) melhora o desempenho do processamento de consultas.
  • Intel DSA : Intel Data Streaming Accelerator (Intel DSA) ajuda a copiar e mover dados com mais rapidez.

Computação Confidencial

Para proteger seus dados enquanto eles estão em uso, plataformas de CPU que suportam tecnologias de Computação Confidencial podem ser usadas para criar instâncias de VM Confidencial .

Para saber mais sobre os requisitos para criar uma instância de VM confidencial, consulte Configurações compatíveis .

O que vem a seguir

Experimente você mesmo

Se você é novo no Google Cloud, crie uma conta para avaliar o desempenho do Compute Engine em cenários do mundo real. Novos clientes também recebem US$ 300 em créditos gratuitos para executar, testar e implantar cargas de trabalho.

Experimente o Compute Engine gratuitamente