A família de máquinas otimizadas para acelerador foi projetada por Google Cloud para fornecer o desempenho e a eficiência necessários para cargas de trabalho aceleradas por GPU, como inteligência artificial (IA), aprendizado de máquina (ML) e computação de alto desempenho (HPC).
A família de máquinas otimizadas para acelerador está disponível nas seguintes séries de máquinas: A4, A3, A2 e G2. Cada tipo de máquina de uma série possui um modelo específico e um número específico de GPUs NVIDIA conectadas. Você também pode anexar alguns modelos de GPU a tipos de máquinas de uso geral N1.
Recomendação de série de máquinas por tipo de carga de trabalho
A seção a seguir fornece as séries de máquinas recomendadas com base nas cargas de trabalho da GPU.
Tipo de carga de trabalho | Tipo ou série de máquina recomendada |
---|---|
Modelos de pré-treinamento | A4, A3 Ultra, A3 Mega, A3 Alto, A2 Para identificar o melhor ajuste, consulte Recomendações para modelos de pré-treinamento na documentação do AI Hypercomputer. |
Modelos de ajuste fino | A4, A3 Ultra, A3 Mega, A3 Alto, A2 Para identificar o melhor ajuste, consulte Recomendações para modelos de ajuste fino na documentação do AI Hypercomputer. |
Servindo inferência | A4, A3 Ultra, A3 Mega, A3 Alto, A2 Para identificar a melhor opção, consulte Recomendações para servir inferência na documentação do AI Hypercomputer. |
Cargas de trabalho com uso intensivo de gráficos | G2, N1+T4 |
Computação de alto desempenho | Para cargas de trabalho de computação de alto desempenho, qualquer série de máquinas otimizadas para aceleradores funciona bem. O melhor ajuste depende da quantidade de computação que deve ser transferida para a GPU. Para obter mais informações, consulte Recomendações para HPC na documentação do AI Hypercomputer. |
Opções de preços e provisionamento
Os tipos de máquinas otimizadas para acelerador são cobrados pelas GPUs anexadas, vCPU predefinida, memória e SSD local incluído (se aplicável). Os descontos que podem ser aplicados a instâncias otimizadas para aceleradores variam de acordo com a opção de provisionamento usada, conforme resumido na tabela a seguir. Para obter mais informações sobre preços de instâncias otimizadas para acelerador, consulte a seção Família de tipos de máquinas otimizadas para acelerador na página de preços de instâncias de VM.
Sob demanda (padrão) | Reservas | VMs spot | |
---|---|---|---|
Séries de máquinas otimizadas para aceleradores suportadas | Todos exceto A4 e A3 Ultra | Varia de acordo com o tipo de reserva:
| Todos |
Descontos | Você pode receber descontos por uso contínuo (CUDs) para alguns recursos comprando compromissos baseados em recursos. No entanto, GPUs e discos SSD locais que você usa com a opção de provisionamento sob demanda não são elegíveis para CUDs. Se você deseja receber CUDs mesmo para GPUs e discos SSD locais, recomendamos usar a opção de provisionamento de reservas. | Você pode receber CUDs para seus recursos de tipo de máquina otimizados para acelerador comprando compromissos baseados em recursos. Observe que os compromissos para quaisquer GPUs e discos SSD locais exigem reservas anexadas para esses recursos . | As VMs do Spot obtêm descontos automaticamente por meio dos preços das VMs do Spot . |
A série de máquinas A4
A série de máquinas A4 oferece tipos de máquinas com até 224 vCPUs e 3.968 GB de memória. A4 oferece desempenho até três vezes maior que os tipos de instância de GPU anteriores para a maioria das cargas de trabalho aceleradas por GPU. A4 é especialmente recomendado para cargas de trabalho de treinamento de ML em grandes escalas – por exemplo, centenas ou milhares de GPUs.
A série de máquinas A4 também oferece os seguintes recursos:
GPUs conectadas : GPUs NVIDIA B200 conectadas, que oferecem 180 GB de memória de GPU por GPU.
Plataforma de CPU : Processador escalável Intel Xeon de 5ª geração (Emerald Rapids) e oferece frequência turbo máxima sustentada de núcleo único de até 4,0 GHz. Para obter mais informações sobre este processador, consulte Plataforma de CPU .
Escala NVLink líder do setor : as GPUs NVIDIA B200 fornecem largura de banda GPU NVLink de 1.800 GBps, bidirecionalmente por GPU.
Com topologia NVLink completa entre 8 GPUs em um sistema, a largura de banda NVLink agregada é de até 14,4 TBps.
Protocolos de rede : para este tipo de máquina, RDMA sobre Ethernet Convergente (RoCE) aumenta o desempenho da rede combinando placas de interface de rede (NICs) NVIDIA ConnectX-7 com a rede alinhada por trilhos de quatro vias em todo o datacenter do Google. Ao aproveitar o RDMA sobre Ethernet Convergente (RoCE), as máquinas A4 alcançam uma taxa de transferência muito maior entre VMs em um cluster quando comparadas aos tipos de máquinas otimizadas para acelerador A3, exceto A3 Ultra.
Velocidade de computação e rede aprimoradas : Oferece velocidades de rede de até 4x em comparação com a série de máquinas da geração A2.
Para obter mais informações sobre redes, consulte Largura de banda de rede e GPUs .
Otimizações de virtualização : a topologia Peripheral Component Interconnect Express (PCIe) de VMs A4 fornece informações de localidade mais precisas que as cargas de trabalho podem usar para otimizar as transferências de dados.
As GPUs também expõem a redefinição de nível de função (FLR) para recuperação elegante de falhas e suporte a operações atômicas para melhorias de simultaneidade em determinados cenários.
Armazenamento : O SSD local pode ser usado para discos de trabalho rápidos ou para alimentar dados nas GPUs, evitando gargalos de E/S. 12.000 GiB de SSD local são adicionados automaticamente às VMs A4.
Você também pode anexar até 512 TiB de hiperdisco a tipos de máquinas desta série para aplicativos que exigem maior desempenho de armazenamento.
Suporte para alocação densa e agendamento com reconhecimento de topologia : ao provisionar máquinas A4 que usam os recursos e serviços disponíveis no Cluster Director , você pode solicitar blocos de capacidade alocada densamente. Suas máquinas host são alocadas fisicamente próximas umas das outras, provisionadas como blocos de recursos e interconectadas com uma malha de rede de ML dinâmica para minimizar saltos de rede e otimizar para a latência mais baixa. Além disso, você pode obter informações de topologia no nível do nó e do cluster que podem ser usadas para posicionamento de trabalho.
Os seguintes tipos de máquinas estão disponíveis para a série de máquinas A4.
Tipo de máquina A4
Tipo de máquina | Contagem de GPU | Memória GPU * (GB HBM3e) | Contagem de vCPUs † | Memória VM (GB) | SSD local anexado (GiB) | Contagem física de NICs | Largura de banda máxima da rede (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a4-highgpu-8g | 8 | 1.440 | 224 | 3.968 | 12.000 | 10 | 3.600 |
* A memória GPU é a memória de um dispositivo GPU que pode ser usada para armazenamento temporário de dados. Ele é separado da memória da VM e foi projetado especificamente para lidar com as maiores demandas de largura de banda de suas cargas de trabalho com uso intensivo de gráficos.
† Uma vCPU é implementada como um hiperthread de hardware único em uma das plataformas de CPU disponíveis.
‡ A largura de banda máxima de saída não pode exceder o número fornecido. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Consulte Largura de banda da rede .
Limitações A4
- Você só pode solicitar capacidade usando as opções de provisionamento suportadas para um tipo de máquina A4.
- Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A4.
- Você só pode usar um tipo de máquina A4 em determinadas regiões e zonas .
- Não é possível usar disco permanente (regional ou zonal) em uma VM que usa tipo de máquina A4.
- O tipo de máquina A4 está disponível apenas na plataforma Emerald Rapids CPU .
- Não é possível alterar o tipo de máquina de uma VM do tipo A4. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
- Não é possível alterar o tipo de máquina de uma VM para um tipo de máquina A4. Se precisar de uma VM que use um tipo de máquina A4, você deverá criar uma nova VM.
- Os tipos de máquina A4 não suportam locação individual .
- Você não pode executar sistemas operacionais Windows em máquinas do tipo A4.
Tipos de disco suportados para a série A4
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Tipos de máquinas | Todos os discos † | Hiperdisco balanceado | Taxa de transferência do hiperdisco | ML de hiperdisco | Hiperdisco Extremo | SSD local anexado |
a4-highgpu-8g | 128 | 128 | N / D | N / D | 8 | 32 |
* O uso do hiperdisco é cobrado separadamente do preço do tipo de máquina . Para preços de disco, consulte Preços de hiperdiscos .
† Este limite se aplica ao hiperdisco, mas não inclui discos SSD locais.
Limites de disco e capacidade
Se for compatível com o tipo de máquina, você poderá usar uma combinação de volumes de hiperdisco e disco permanente em uma VM, mas as seguintes restrições serão aplicadas:
- O número combinado de volumes de hiperdisco e disco permanente não pode exceder 128 por VM.
A capacidade total máxima do disco (em TiB) em todos os tipos de disco não pode exceder:
Para tipos de máquinas com menos de 32 vCPUs:
- 257 TiB para todos os hiperdiscos ou todos os discos permanentes
- 257 TiB para uma mistura de hiperdisco e disco permanente
Para tipos de máquinas com 32 ou mais vCPUs:
- 512 TiB para todos os hiperdiscos
- 512 TiB para uma mistura de hiperdisco e disco permanente
- 257 TiB para todos os discos permanentes
Para obter detalhes sobre os limites de capacidade, consulte Limites de capacidade do hiperdisco por VM e Capacidade máxima do disco permanente .
A série de máquinas A3
A série de máquinas A3 possui até 224 vCPUs e 2.944 GB de memória. Esta série de máquinas é otimizada para uso intensivo de computação e memória, treinamento de ML vinculado à rede e cargas de trabalho de HPC.
A série de máquinas A3 também oferece os seguintes recursos:
Recurso | A3 ultra | A3 Mega, Alto, Borda |
---|---|---|
GPUs anexadas | GPUs NVIDIA H200 SXM anexadas, que oferecem 141 GB de memória de GPU por GPU e fornecem memória maior e mais rápida para suportar modelos de linguagens grandes e cargas de trabalho de HPC. | GPUs NVIDIA H100 SXM anexadas, que oferecem 80 GB de memória de GPU por GPU e são ideais para grandes modelos de linguagem baseados em transformadores, bancos de dados e HPC. |
Plataforma CPU | Processador escalável Intel Xeon de 5ª geração (Emerald Rapids) e oferece frequência turbo máxima sustentada de núcleo único de até 4,0 GHz. Para obter mais informações sobre este processador, consulte Plataforma de CPU . | Processador escalável Intel Xeon de 4ª geração (Sapphire Rapids) e oferece frequência turbo máxima sustentada de núcleo único de até 3,3 GHz. Para obter mais informações sobre este processador, consulte Plataforma de CPU . |
Escala NVLink líder do setor | As GPUs NVIDIA H200 fornecem largura de banda GPU NVLink de pico de 900 GB/s, unidirecionalmente. Com topologia NVLink completa entre 8 GPUs em um sistema, a largura de banda NVLink agregada é de até 7,2 TB/s. | As GPUs NVIDIA H100 fornecem largura de banda GPU NVLink de pico de 450 GB/s, unidirecionalmente. Com topologia NVLink completa entre 8 GPUs em um sistema, a largura de banda NVLink agregada é de até 7,2 TB/s. |
Protocolos de rede | Para esse tipo de máquina, o RDMA sobre Ethernet Convergente (RoCE) aumenta o desempenho da rede combinando placas de interface de rede (NICs) NVIDIA ConnectX-7 com nossa rede alinhada por trilhos de quatro vias em todo o datacenter. Ao aproveitar o RDMA sobre Ethernet Convergente (RoCE), o tipo de máquina a3-ultragpu-8g alcança uma taxa de transferência muito maior entre VMs em um cluster quando comparado a outros tipos de máquinas otimizadas para acelerador A3. |
|
Maior velocidade de computação e rede | Oferece velocidades de rede de até 4x em comparação com a série de máquinas A2 da geração anterior. Para obter mais informações sobre redes, consulte Largura de banda de rede e GPUs . | Oferece velocidades de rede de até 2,5X em comparação com a série de máquinas A2 da geração anterior. Para obter mais informações sobre redes, consulte Largura de banda de rede e GPUs . |
Otimizações de virtualização | A topologia Peripheral Component Interconnect Express (PCIe) de VMs A3 fornece informações de localidade mais precisas que as cargas de trabalho podem usar para otimizar as transferências de dados. As GPUs também expõem a redefinição de nível de função (FLR) para recuperação elegante de falhas e suporte a operações atômicas para melhorias de simultaneidade em determinados cenários. | |
Armazenar | O SSD local pode ser usado para discos de trabalho rápidos ou para alimentar dados nas GPUs, evitando gargalos de E/S. O SSD local é anexado da seguinte forma:
Você também pode anexar até 512 TiB de disco permanente e hiperdisco a tipos de máquinas dessas séries para aplicativos que exigem maior desempenho de armazenamento. | |
Suporte à política de posicionamento compacto | Fornece mais controle sobre o posicionamento físico de suas VMs nos data centers. Isso permite menor latência e maior largura de banda para posicionamento de VM em uma única zona de disponibilidade. Para obter mais informações, consulte Sobre políticas de posicionamento compacto . |
Os seguintes tipos de máquinas estão disponíveis para a série de máquinas A3.
Tipo de máquina A3 Ultra
Tipo de máquina | Contagem de GPU | Memória GPU * (GB HBM3e) | Contagem de vCPUs † | Memória VM (GB) | SSD local anexado (GiB) | Contagem física de NICs | Largura de banda máxima da rede (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a3-ultragpu-8g | 8 | 1128 | 224 | 2.952 | 12.000 | 10 | 3.600 |
* A memória GPU é a memória de um dispositivo GPU que pode ser usada para armazenamento temporário de dados. Ele é separado da memória da VM e foi projetado especificamente para lidar com as maiores demandas de largura de banda de suas cargas de trabalho com uso intensivo de gráficos.
† Uma vCPU é implementada como um hiperthread de hardware único em uma das plataformas de CPU disponíveis.
‡ A largura de banda máxima de saída não pode exceder o número fornecido. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Consulte Largura de banda da rede .
Limitações do A3 Ultra
- Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A3 Ultra.
- Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A3 Ultra.
- Você só pode usar um tipo de máquina A3 Ultra em determinadas regiões e zonas .
- Não é possível usar disco permanente (regional ou zonal) em uma VM que usa o tipo de máquina A3 Ultra.
- O tipo de máquina A3 Ultra está disponível apenas na plataforma Emerald Rapids CPU .
- Não é possível alterar o tipo de máquina de uma VM do tipo máquina A3 Ultra. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
- Não é possível alterar o tipo de máquina de uma VM para um tipo de máquina A3 Ultra. Se precisar de uma VM que use um tipo de máquina A3 Ultra, você deverá criar uma nova VM.
- Os tipos de máquina A3 Ultra não suportam locação individual .
- Você não pode executar sistemas operacionais Windows em máquinas do tipo A3 Ultra.
Tipo de máquina A3 Mega
Tipo de máquina | Contagem de GPU | Memória GPU * (GB HBM3) | Contagem de vCPUs † | Memória VM (GB) | SSD local anexado (GiB) | Contagem física de NICs | Largura de banda máxima da rede (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a3-megagpu-8g | 8 | 640 | 208 | 1.872 | 6.000 | 9 | 1.800 |
* A memória GPU é a memória de um dispositivo GPU que pode ser usada para armazenamento temporário de dados. Ele é separado da memória da VM e foi projetado especificamente para lidar com as maiores demandas de largura de banda de suas cargas de trabalho com uso intensivo de gráficos.
† Uma vCPU é implementada como um hiperthread de hardware único em uma das plataformas de CPU disponíveis.
‡ A largura de banda máxima de saída não pode exceder o número fornecido. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Consulte Largura de banda da rede .
Limitações do A3 Mega
- Você só pode solicitar capacidade usando as opções de provisionamento suportadas para um tipo de máquina A3 Mega.
- Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A3 Mega.
- Você só pode usar um tipo de máquina A3 Mega em determinadas regiões e zonas .
- Não é possível usar o disco permanente regional em uma VM que usa o tipo de máquina A3 Mega.
- O tipo de máquina A3 Mega está disponível apenas na plataforma Sapphire Rapids CPU .
- Você não pode alterar o tipo de máquina de uma VM do tipo máquina A3 Mega. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
- Você não pode alterar o tipo de máquina de uma VM para um tipo de máquina A3 Mega. Se você precisar de uma VM que use um tipo de máquina A3 Mega, deverá criar uma nova VM.
- Os tipos de máquinas A3 Mega não suportam locação individual .
- Você não pode executar sistemas operacionais Windows em um tipo de máquina A3 Mega.
Tipo de máquina alta A3
Tipo de máquina | Contagem de GPU | Memória GPU * (GB HBM3) | Contagem de vCPUs † | Memória VM (GB) | SSD local anexado (GiB) | Contagem física de NICs | Largura de banda máxima da rede (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a3-highgpu-1g | 1 | 80 | 26 | 234 | 750 | 1 | 25 |
a3-highgpu-2g | 2 | 160 | 52 | 468 | 1.500 | 1 | 50 |
a3-highgpu-4g | 4 | 320 | 104 | 936 | 3.000 | 1 | 100 |
a3-highgpu-8g | 8 | 640 | 208 | 1.872 | 6.000 | 5 | 1.000 |
* A memória GPU é a memória de um dispositivo GPU que pode ser usada para armazenamento temporário de dados. Ele é separado da memória da VM e foi projetado especificamente para lidar com as maiores demandas de largura de banda de suas cargas de trabalho com uso intensivo de gráficos.
† Uma vCPU é implementada como um hiperthread de hardware único em uma das plataformas de CPU disponíveis.
‡ A largura de banda máxima de saída não pode exceder o número fornecido. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Consulte Largura de banda da rede .
A3 Altas limitações
- Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A3 High.
- Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A3 High.
- Você só pode usar um tipo de máquina A3 High em determinadas regiões e zonas .
- Não é possível usar o disco permanente regional em uma VM que usa o tipo de máquina A3 High.
- O tipo de máquina A3 High está disponível apenas na plataforma Sapphire Rapids CPU .
- Não é possível alterar o tipo de máquina de uma VM do tipo A3 High. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
- Não é possível alterar o tipo de máquina de uma VM para um tipo de máquina A3 High. Se precisar de uma VM que use um tipo de máquina A3 High, você deverá criar uma nova VM.
- Os tipos de máquinas A3 High não suportam locação individual .
- Você não pode executar sistemas operacionais Windows em um tipo de máquina A3 High.
- Para os tipos de máquina
a3-highgpu-1g
,a3-highgpu-2g
ea3-highgpu-4g
, aplicam-se as seguintes limitações:- Para esses tipos de máquinas, você deve usar VMs Spot ou um recurso que use o Dynamic Workload Scheduler (DWS), como solicitações de redimensionamento em um MIG. Para obter instruções detalhadas sobre qualquer uma dessas opções, revise o seguinte:
- Para criar VMs Spot, consulte Criar uma VM otimizada para acelerador e lembre-se de definir o modelo de provisionamento como
SPOT
- Para criar uma solicitação de redimensionamento em um MIG, que usa o Dynamic Workload Scheduler, consulte Criar um MIG com VMs de GPU .
- Para criar VMs Spot, consulte Criar uma VM otimizada para acelerador e lembre-se de definir o modelo de provisionamento como
- Você não pode usar o Hyperdisk Balanced com esses tipos de máquinas.
- Você não pode criar reservas.
- Para esses tipos de máquinas, você deve usar VMs Spot ou um recurso que use o Dynamic Workload Scheduler (DWS), como solicitações de redimensionamento em um MIG. Para obter instruções detalhadas sobre qualquer uma dessas opções, revise o seguinte:
Tipo de máquina A3 Edge
Tipo de máquina | Contagem de GPU | Memória GPU * (GB HBM3) | Contagem de vCPUs † | Memória VM (GB) | SSD local anexado (GiB) | Contagem física de NICs | Largura de banda máxima da rede (Gbps) ‡ |
---|---|---|---|---|---|---|---|
a3-edgegpu-8g | 8 | 640 | 208 | 1.872 | 6.000 | 5 |
|
* A memória GPU é a memória de um dispositivo GPU que pode ser usada para armazenamento temporário de dados. Ele é separado da memória da VM e foi projetado especificamente para lidar com as maiores demandas de largura de banda de suas cargas de trabalho com uso intensivo de gráficos.
† Uma vCPU é implementada como um hiperthread de hardware único em uma das plataformas de CPU disponíveis.
‡ A largura de banda máxima de saída não pode exceder o número fornecido. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Consulte Largura de banda da rede .
Limitações do A3 Edge
- Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A3 Edge.
- Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A3 Edge.
- Você só pode usar um tipo de máquina A3 Edge em determinadas regiões e zonas .
- Não é possível usar o disco permanente regional em uma VM que usa o tipo de máquina A3 Edge.
- O tipo de máquina A3 Edge está disponível apenas na plataforma Sapphire Rapids CPU .
- Você não pode alterar o tipo de máquina de uma VM do tipo máquina A3 Edge. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
- Não é possível alterar o tipo de máquina de uma VM para um tipo de máquina A3 Edge. Se precisar de uma VM que use um tipo de máquina A3 Edge, você deverá criar uma nova VM.
- Os tipos de máquina A3 Edge não suportam locação individual .
- Você não pode executar sistemas operacionais Windows em um tipo de máquina A3 Edge.
Tipos de disco suportados para a série A3
A3 Ultra
As VMs A3 Ultra podem usar os seguintes tipos de armazenamento em bloco:
- Hyperdisk Balanced (
hyperdisk-balanced
): este é o único tipo de disco compatível com o disco de inicialização - Hiperdisco Extremo (
hyperdisk-extreme
) - SSD local: que é adicionado automaticamente às VMs criadas usando qualquer um dos tipos de máquina A3
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Máquina tipos | Todos os discos † | Hiperdisco balanceado | Taxa de transferência do hiperdisco | ML de hiperdisco | Hiperdisco Extremo | Apegado SSD local discos |
a3-ultragpu-8g | 128 | 128 | N / D | N / D | 8 | 32 |
* O uso do hiperdisco é cobrado separadamente do preço do tipo de máquina . Para preços de disco, consulte Preços de hiperdiscos .
† Este limite se aplica ao hiperdisco, mas não inclui discos SSD locais.
A3Mega
As Mega VMs A3 podem usar os seguintes tipos de armazenamento em bloco:
- Disco permanente balanceado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Hiperdisco balanceado (
hyperdisk-balanced
) - Hiperdisco ML (
hyperdisk-ml
) - Hiperdisco Extremo (
hyperdisk-extreme
) - Taxa de transferência do hiperdisco (
hyperdisk-throughput
) - SSD local: que é adicionado automaticamente às VMs criadas usando qualquer um dos tipos de máquina A3
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Máquina tipos | Todos os discos † | Hiperdisco balanceado | Taxa de transferência do hiperdisco | ML de hiperdisco | Hiperdisco Extremo | Apegado SSD local discos |
a3-megagpu-8g | 128 | 32 | 64 | 64 | 8 | 16 |
* O uso de hiperdiscos e discos permanentes é cobrado separadamente do preço do tipo de máquina . Para preços de discos, consulte Preços de discos permanentes e hiperdiscos .
† Esse limite se aplica a discos permanentes e hiperdiscos, mas não inclui discos SSD locais.
A3 alto
As VMs A3 High podem usar os seguintes tipos de armazenamento em bloco:
- Disco permanente balanceado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Hyperdisk Balanced (
hyperdisk-balanced
): compatível apenas coma3-highgpu-8g
- Hiperdisco ML (
hyperdisk-ml
) - Hiperdisco Extremo (
hyperdisk-extreme
) - Taxa de transferência do hiperdisco (
hyperdisk-throughput
) - SSD local: que é adicionado automaticamente às VMs criadas usando qualquer um dos tipos de máquina A3
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Máquina tipos | Todos os discos † | Hiperdisco balanceado | Taxa de transferência do hiperdisco | ML de hiperdisco | Hiperdisco Extremo | Apegado SSD local discos |
a3-highgpu-1g | 128 | N / D | 64 | 64 | N / D | 2 |
a3-highgpu-2g | 128 | N / D | 64 | 64 | N / D | 4 |
a3-highgpu-4g | 128 | N / D | 64 | 64 | 8 | 8 |
a3-highgpu-8g | 128 | 32 | 64 | 64 | 8 | 16 |
* O uso de hiperdiscos e discos permanentes é cobrado separadamente do preço do tipo de máquina . Para preços de discos, consulte Preços de discos permanentes e hiperdiscos .
† Esse limite se aplica a discos permanentes e hiperdiscos, mas não inclui discos SSD locais.
Borda A3
As VMs A3 Edge podem usar os seguintes tipos de armazenamento em bloco:
- Disco permanente balanceado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Hiperdisco balanceado (
hyperdisk-balanced
) - Hiperdisco ML (
hyperdisk-ml
) - Hiperdisco Extremo (
hyperdisk-extreme
) - Taxa de transferência do hiperdisco (
hyperdisk-throughput
) - SSD local: que é adicionado automaticamente às VMs criadas usando qualquer um dos tipos de máquina A3
Número máximo de discos por VM * | ||||||
---|---|---|---|---|---|---|
Tipos de máquinas | Todos os discos † | Hiperdisco balanceado | Taxa de transferência do hiperdisco | ML de hiperdisco | Hiperdisco Extremo | SSD local anexado |
a3-edgegpu-8g | 128 | 32 | 64 | 64 | 8 | 16 |
* O uso de hiperdiscos e discos permanentes é cobrado separadamente do preço do tipo de máquina . Para preços de discos, consulte Preços de discos permanentes e hiperdiscos .
† Esse limite se aplica a discos permanentes e hiperdiscos, mas não inclui discos SSD locais.
Limites de disco e capacidade
Se for compatível com o tipo de máquina, você poderá usar uma combinação de volumes de hiperdisco e disco permanente em uma VM, mas as seguintes restrições serão aplicadas:
- O número combinado de volumes de hiperdisco e disco permanente não pode exceder 128 por VM.
A capacidade total máxima do disco (em TiB) em todos os tipos de disco não pode exceder:
Para tipos de máquinas com menos de 32 vCPUs:
- 257 TiB para todos os hiperdiscos ou todos os discos permanentes
- 257 TiB para uma mistura de hiperdisco e disco permanente
Para tipos de máquinas com 32 ou mais vCPUs:
- 512 TiB para todos os hiperdiscos
- 512 TiB para uma mistura de hiperdisco e disco permanente
- 257 TiB para todos os discos permanentes
Para obter detalhes sobre os limites de capacidade, consulte Limites de capacidade do hiperdisco por VM e Capacidade máxima do disco permanente .
A série de máquinas A2
A série de máquinas A2 está disponível nos tipos de máquina A2 Standard e A2 Ultra. Esses tipos de máquinas têm de 12 a 96 vCPUs e até 1.360 GB de memória.
A série de máquinas A2 também oferece os seguintes recursos:
GPUs NVIDIA conectadas : cada tipo de máquina A2 possui GPUs NVIDIA A100 . Eles estão disponíveis nas opções A100 de 40 GB e A100 de 80 GB.
Escala NVLink líder do setor que fornece largura de banda de pico de GPU para GPU NVLink de 600 GBps. Por exemplo, sistemas com 16 GPUs têm uma largura de banda NVLink agregada de até 9,6 TBps. Essas 16 GPUs podem ser usadas como um único acelerador de alto desempenho com espaço de memória unificado para fornecer até 10 petaFLOPS de poder de computação e até 20 petaFLOPS de poder de computação de inferência que podem ser usados para cargas de trabalho de inteligência artificial, aprendizado profundo e aprendizado de máquina.
Velocidade de computação aprimorada : as GPUs NVIDIA A100 conectadas oferecem melhorias de até 10x na velocidade de computação em comparação com as GPUs NVIDIA V100 da geração anterior.
Com a série de máquinas A2, você pode obter largura de banda de rede de até 100 Gbps.
Armazenamento : para discos de trabalho rápidos ou para alimentar dados nas GPUs enquanto evita gargalos de E/S, os tipos de máquinas A2 suportam SSD local da seguinte forma:
- Para os tipos de máquina A2 Standard, você pode adicionar até 3.000 GiB de SSD local.
- Para os tipos de máquina A2 Ultra, o SSD local é anexado automaticamente quando você cria a VM.
Você também pode anexar até 257 TiB de armazenamento em disco permanente a VMs A2 para aplicativos que exigem esse desempenho de armazenamento mais alto.
Suporte à política de posicionamento compacto : fornece mais controle sobre o posicionamento físico de suas VMs nos data centers. Isso permite menor latência e maior largura de banda para posicionamento de VM em uma única zona de disponibilidade. Para obter mais informações, consulte Reduzir a latência usando políticas de posicionamento compacto .
Tipos de máquinas A2 Ultra
Esses tipos de máquinas têm um número fixo de GPUs A100 de 80 GB . O SSD local é anexado automaticamente às VMs criadas usando os tipos de máquina A2 Ultra.
Tipo de máquina | Contagem de GPU | Memória GPU * (GB HBM3) | Contagem de vCPUs † | Memória VM (GB) | SSD local anexado (GiB) | Largura de banda máxima da rede (Gbps) ‡ |
---|---|---|---|---|---|---|
a2-ultragpu-1g | 1 | 80 | 12 | 170 | 375 | 24 |
a2-ultragpu-2g | 2 | 160 | 24 | 340 | 750 | 32 |
a2-ultragpu-4g | 4 | 320 | 48 | 680 | 1.500 | 50 |
a2-ultragpu-8g | 8 | 640 | 96 | 1.360 | 3.000 | 100 |
* A memória GPU é a memória de um dispositivo GPU que pode ser usada para armazenamento temporário de dados. Ele é separado da memória da VM e foi projetado especificamente para lidar com as maiores demandas de largura de banda de suas cargas de trabalho com uso intensivo de gráficos.
† Uma vCPU é implementada como um hiperthread de hardware único em uma das plataformas de CPU disponíveis.
‡ A largura de banda máxima de saída não pode exceder o número fornecido. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Consulte Largura de banda da rede .
Limitações do A2 Ultra
- Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A2 Ultra.
- Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A2 Ultra.
- Você só pode usar um tipo de máquina A2 Ultra em determinadas regiões e zonas .
- O tipo de máquina A2 Ultra está disponível apenas na plataforma Cascade Lake .
- Se sua VM usar um tipo de máquina A2 Ultra, você não poderá alterar o tipo de máquina. Se precisar usar um tipo de máquina A2 Ultra diferente ou qualquer outro tipo de máquina, você deverá criar uma nova VM.
- Você não pode alterar nenhum outro tipo de máquina para um tipo de máquina A2 Ultra. Se precisar de uma VM que use um tipo de máquina A2 Ultra, você deverá criar uma nova VM.
- Não é possível fazer uma formatação rápida dos SSDs locais anexados em VMs do Windows que usam tipos de máquina A2 Ultra. Para formatar esses SSDs locais, você deve fazer uma formatação completa usando o utilitário diskpart e especificando
format fs=ntfs label=tmpfs
.
Tipos de máquinas padrão A2
Esses tipos de máquinas têm um número fixo de GPUs A100 de 40 GB .
Tipo de máquina | Contagem de GPU | Memória GPU * (GB HBM3) | Contagem de vCPUs † | Memória VM (GB) | SSD local anexado (GiB) | Largura de banda máxima da rede (Gbps) ‡ |
---|---|---|---|---|---|---|
a2-highgpu-1g | 1 | 40 | 12 | 85 | Sim | 24 |
a2-highgpu-2g | 2 | 80 | 24 | 170 | Sim | 32 |
a2-highgpu-4g | 4 | 160 | 48 | 340 | Sim | 50 |
a2-highgpu-8g | 8 | 320 | 96 | 680 | Sim | 100 |
a2-megagpu-16g | 16 | 640 | 96 | 1.360 | Sim | 100 |
* A memória GPU é a memória de um dispositivo GPU que pode ser usada para armazenamento temporário de dados. Ele é separado da memória da VM e foi projetado especificamente para lidar com as maiores demandas de largura de banda de suas cargas de trabalho com uso intensivo de gráficos.
† Uma vCPU é implementada como um hiperthread de hardware único em uma das plataformas de CPU disponíveis.
‡ A largura de banda máxima de saída não pode exceder o número fornecido. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Consulte Largura de banda da rede .
Limitações do padrão A2
- Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A2 Standard.
- Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A2 Standard.
- Você só pode usar um tipo de máquina A2 Standard em determinadas regiões e zonas .
- O tipo de máquina A2 Standard está disponível apenas na plataforma Cascade Lake .
- Se sua VM usar um tipo de máquina A2 Standard, você só poderá alternar de um tipo de máquina A2 Standard para outro tipo de máquina A2 Standard. Você não pode mudar para nenhum outro tipo de máquina. Para obter mais informações, consulte Modificar VMs otimizadas por acelerador .
- Você não pode usar o sistema operacional Windows com
A2 Tipos de máquinas padrão. Ao usar sistemas operacionais Windows, escolha um tipo de máquina A2 Standard diferente. - Não é possível fazer uma formatação rápida dos SSDs locais anexados em VMs do Windows que usam tipos de máquina padrão A2. Para formatar esses SSDs locais, você deve fazer um formato completo usando o utilitário DiskPart e especificando
format fs=ntfs label=tmpfs
. - Os tipos de máquinas padrão A2 não suportam a sola de sola .
Tipos de disco suportados para a série A2
VMs A2 podem usar os seguintes tipos de armazenamento de bloco:
- Hyperdisk ML (
hyperdisk-ml
) - Disco persistente equilibrado (
pd-balanced
) - SSD (Performance) Disco persistente (
pd-ssd
) - Disco persistente padrão (
pd-standard
) - SSD local: que é conectado automaticamente às VMs criadas usando os tipos A2 Ultra Machine.
Se suportado pelo tipo de máquina, você pode usar uma mistura de hiperdisco e volumes de disco persistentes em uma VM, mas as seguintes restrições se aplicam:
- O número combinado de hiperdisco e volumes de disco persistente não podem exceder 128 por VM.
A capacidade máxima de disco total (no TIB) em todos os tipos de disco não pode exceder:
Para tipos de máquinas com menos de 32 vcpus:
- 257 TIB para todo o hiperdisco ou todo disco persistente
- 257 TIB para uma mistura de hiperdisco e disco persistente
Para tipos de máquinas com 32 ou mais VCPUs:
- 512 TIB para todos os hiperdisks
- 512 TIB para uma mistura de hiperdisco e disco persistente
- 257 TIB para todo disco persistente
Para detalhes sobre os limites da capacidade, consulte Limites de capacidade de hiperdisco por VM e capacidade máxima de disco persistente .
A série de máquinas G2
A série de máquinas G2 está disponível em tipos de máquina padrão que possuem 4 a 96 VCPUs e até 432 GB de memória. Esta série de máquinas é otimizada para cargas de trabalho de inferência e gráficos.
A série G2 Machine também fornece os seguintes recursos:
Nvidia GPUs anexada : Cada tipo de máquina G2 possui GPUs NVIDIA L4 .
Taxas de inferência aprimoradas : os tipos de máquina G2 fornecem suporte para o tipo de dados FP8 (ponto flutuante de 8 bits) que acelera as taxas de inferência de ML e reduz os requisitos de memória.
Desempenho gráfico da próxima geração : o NVIDIA L4 GPUS fornece até 3x melhoria no desempenho gráfico usando os núcleos RT de terceira geração e a tecnologia NVIDIA DLSS 3 (Deep Learning Super Sampling) .
Largura de banda de rede de alto desempenho : com a série de máquinas G2, você pode obter largura de banda de rede de até 100 Gbps.
Armazenamento : você pode adicionar até 3.000 Gib de SSD local a VMs G2. Isso pode ser usado para discos de arranhões rápidos ou para alimentar dados nas GPUs, evitando gargalos de E/S.
Você também pode conectar o hiperdisco e os volumes de disco persistente às VMs G2, para aplicativos que exigem armazenamento mais persistente. A capacidade máxima de armazenamento depende do número de VCPUs que a VM possui. Para detalhes, consulte os tipos de disco suportados .
Suporte da política de colocação compacta : fornece mais controle sobre a colocação física de suas VMs dentro dos data centers. Isso permite a largura de banda de menor latência e maior para a colocação da VM em uma única zona de disponibilidade. Para obter mais informações, consulte Reduza a latência usando políticas de posicionamento compactas .
Tipos de máquina G2
Cada tipo de máquina G2 possui um número fixo de GPUs NVIDIA L4 e VCPUs conectados. Cada tipo de máquina G2 também possui uma memória padrão e um intervalo de memória personalizado. O intervalo de memória personalizado define a quantidade de memória que você pode alocar para sua VM para cada tipo de máquina. Você pode especificar sua memória personalizada durante a criação da VM.
Tipo de máquina | Contagem de GPU | Memória da GPU * (GB GDDR6) | contagem de vcpu † | Memória VM padrão (GB) | Faixa de memória VM personalizada (GB) | MAX SSD local suportado (GIB) | Largura de banda de rede máxima (GBPS) ‡ |
---|---|---|---|---|---|---|---|
g2-standard-4 | 1 | 24 | 4 | 16 | 16 a 32 | 375 | 10 |
g2-standard-8 | 1 | 24 | 8 | 32 | 32 a 54 | 375 | 16 |
g2-standard-12 | 1 | 24 | 12 | 48 | 48 a 54 | 375 | 16 |
g2-standard-16 | 1 | 24 | 16 | 64 | 54 a 64 | 375 | 32 |
g2-standard-24 | 2 | 48 | 24 | 96 | 96 a 108 | 750 | 32 |
g2-standard-32 | 1 | 24 | 32 | 128 | 96 a 128 | 375 | 32 |
g2-standard-48 | 4 | 96 | 48 | 192 | 192 a 216 | 1.500 | 50 |
g2-standard-96 | 8 | 192 | 96 | 384 | 384 a 432 | 3.000 | 100 |
* A memória da GPU é a memória em um dispositivo GPU que pode ser usado para armazenamento temporário de dados. É separado da memória da VM e foi projetado especificamente para lidar com as demandas de largura de banda mais altas das suas cargas de trabalho com uso intensivo de gráficos.
† Um VCPU é implementado como um único hiper-thread de hardware em uma das plataformas de CPU disponíveis.
‡ A largura de banda máxima de saída não pode exceder o número fornecido. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Veja a largura de banda da rede .
G2 Limitações
- Você só pode solicitar capacidade usando as opções de provisionamento suportadas para um tipo de máquina G2.
- Você não recebe descontos de uso sustentado e descontos flexíveis de uso comprometido para VMs que usam um tipo de máquina G2.
- Você só pode usar um tipo de máquina G2 em determinadas regiões e zonas .
- O tipo de máquina G2 está disponível apenas na plataforma Cascade Lake .
- O disco persistente padrão (
pd-standard
) não é suportado em VMs que usam tipos de máquina padrão G2. Para tipos de disco suportados, consulte os tipos de disco suportados para G2 . - Você não pode criar GPUs multi-instância nos tipos de máquina G2.
- Se você precisar alterar o tipo de máquina de uma vm G2, a revisão modifique as VMs optmizadas com acelerador .
- Você não pode usar imagens de VM de aprendizado profundo como discos de inicialização para suas VMs que usam tipos de máquina G2.
- O driver padrão atual para o sistema operacional otimizado para contêineres não suporta GPUs L4 em execução em tipos de máquina G2. O sistema operacional otimizado para contêineres também suporta apenas um conjunto selecionado de drivers. Se você deseja usar o sistema operacional otimizado para contêineres nos tipos de máquina G2, revise as seguintes notas:
- Use uma versão OS otimizada para contêineres que suporta o driver NVIDIA mínimo, versão
525.60.13
ou posterior. Para obter mais informações, revise as notas de liberação do sistema operacional otimizado para contêineres . - Ao instalar o driver , especifique a versão mais recente disponível para as GPUs L4. Por exemplo,
sudo cos-extensions install gpu -- -version=525.60.13
.
- Use uma versão OS otimizada para contêineres que suporta o driver NVIDIA mínimo, versão
- Você deve usar o Google Cloud CLI ou REST para criar VMs G2 para os seguintes cenários:
- Você deseja especificar valores de memória personalizados.
- Você deseja personalizar o número de núcleos de CPU visíveis.
Tipos de disco suportados para série G2
VMs G2 podem usar os seguintes tipos de armazenamento de bloco:
- Disco persistente equilibrado (
pd-balanced
) - SSD (Performance) Disco persistente (
pd-ssd
) - Hyperdisk ML (
hyperdisk-ml
) - Taxa de transferência de hiperdisco (
hyperdisk-throughput
) - SSD local
Se suportado pelo tipo de máquina, você pode usar uma mistura de hiperdisco e volumes de disco persistentes em uma VM, mas as seguintes restrições se aplicam:
- O número combinado de hiperdisco e volumes de disco persistente não podem exceder 128 por VM.
A capacidade máxima de disco total (no TIB) em todos os tipos de disco não pode exceder:
Para tipos de máquinas com menos de 32 vcpus:
- 257 TIB para todo o hiperdisco ou todo disco persistente
- 257 TIB para uma mistura de hiperdisco e disco persistente
Para tipos de máquinas com 32 ou mais VCPUs:
- 512 TIB para todos os hiperdisks
- 512 TIB para uma mistura de hiperdisco e disco persistente
- 257 TIB para todo disco persistente
Para detalhes sobre os limites da capacidade, consulte Limites de capacidade de hiperdisco por VM e capacidade máxima de disco persistente .