Visão geral da criação de uma instância com GPUs anexadas


O Compute Engine fornece unidades de processamento gráfico (GPUs) que você pode adicionar às suas máquinas virtuais (VMs). Você pode usar essas GPUs para acelerar cargas de trabalho específicas em suas VMs, como aprendizado de máquina e processamento de dados.

Este documento fornece uma visão geral das etapas necessárias para criar uma VM com GPUs anexadas.

Para obter mais informações sobre GPUs no Compute Engine, consulte Sobre GPUs .

Selecione o modelo de GPU

Para obter uma lista de modelos de GPU disponíveis, consulte Plataformas de GPU . Anote também o tipo de máquina compatível com o modelo de GPU selecionado.

Para cada modelo, também pode ser útil revisar o seguinte:

Limitações

Além das restrições para todas as VMs com GPUs , cada série de máquinas com GPUs anexadas tem as seguintes limitações:

VMs A4

  • Você só pode solicitar capacidade usando as opções de provisionamento suportadas para um tipo de máquina A4.
  • Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A4.
  • Você só pode usar um tipo de máquina A4 em determinadas regiões e zonas .
  • Não é possível usar disco permanente (regional ou zonal) em uma VM que usa tipo de máquina A4.
  • O tipo de máquina A4 está disponível apenas na plataforma Emerald Rapids CPU .
  • Não é possível alterar o tipo de máquina de uma VM do tipo A4. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
  • Não é possível alterar o tipo de máquina de uma VM para um tipo de máquina A4. Se precisar de uma VM que use um tipo de máquina A4, você deverá criar uma nova VM.
  • Os tipos de máquina A4 não suportam locação individual .
  • Você não pode executar sistemas operacionais Windows em máquinas do tipo A4.

VMs A3 Ultra

  • Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A3 Ultra.
  • Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A3 Ultra.
  • Você só pode usar um tipo de máquina A3 Ultra em determinadas regiões e zonas .
  • Não é possível usar disco permanente (regional ou zonal) em uma VM que usa o tipo de máquina A3 Ultra.
  • O tipo de máquina A3 Ultra está disponível apenas na plataforma Emerald Rapids CPU .
  • Não é possível alterar o tipo de máquina de uma VM do tipo máquina A3 Ultra. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
  • Não é possível alterar o tipo de máquina de uma VM para um tipo de máquina A3 Ultra. Se precisar de uma VM que use um tipo de máquina A3 Ultra, você deverá criar uma nova VM.
  • Os tipos de máquina A3 Ultra não suportam locação individual .
  • Você não pode executar sistemas operacionais Windows em máquinas do tipo A3 Ultra.

Mega VMs A3

  • Você só pode solicitar capacidade usando as opções de provisionamento suportadas para um tipo de máquina A3 Mega.
  • Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A3 Mega.
  • Você só pode usar um tipo de máquina A3 Mega em determinadas regiões e zonas .
  • Não é possível usar o disco permanente regional em uma VM que usa o tipo de máquina A3 Mega.
  • O tipo de máquina A3 Mega está disponível apenas na plataforma Sapphire Rapids CPU .
  • Você não pode alterar o tipo de máquina de uma VM do tipo máquina A3 Mega. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
  • Você não pode alterar o tipo de máquina de uma VM para um tipo de máquina A3 Mega. Se você precisar de uma VM que use um tipo de máquina A3 Mega, deverá criar uma nova VM.
  • Os tipos de máquinas A3 Mega não suportam locação individual .
  • Você não pode executar sistemas operacionais Windows em um tipo de máquina A3 Mega.

VMs altas A3

  • Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A3 High.
  • Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A3 High.
  • Você só pode usar um tipo de máquina A3 High em determinadas regiões e zonas .
  • Não é possível usar o disco permanente regional em uma VM que usa o tipo de máquina A3 High.
  • O tipo de máquina A3 High está disponível apenas na plataforma Sapphire Rapids CPU .
  • Não é possível alterar o tipo de máquina de uma VM do tipo A3 High. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
  • Não é possível alterar o tipo de máquina de uma VM para um tipo de máquina A3 High. Se precisar de uma VM que use um tipo de máquina A3 High, você deverá criar uma nova VM.
  • Os tipos de máquinas A3 High não suportam locação individual .
  • Você não pode executar sistemas operacionais Windows em um tipo de máquina A3 High.
  • Para os tipos de máquina a3-highgpu-1g , a3-highgpu-2g e a3-highgpu-4g , aplicam-se as seguintes limitações:
    • Para esses tipos de máquinas, você deve usar VMs Spot ou um recurso que use o Dynamic Workload Scheduler (DWS), como solicitações de redimensionamento em um MIG. Para obter instruções detalhadas sobre qualquer uma dessas opções, revise o seguinte:
    • Você não pode usar o Hyperdisk Balanced com esses tipos de máquinas.
    • Você não pode criar reservas.
    Se você tentar criar uma VM usando o provisionamento padrão ou tentar criar uma reserva para esses tipos de máquina, receberá uma mensagem de erro .

VMs de borda A3

  • Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A3 Edge.
  • Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A3 Edge.
  • Você só pode usar um tipo de máquina A3 Edge em determinadas regiões e zonas .
  • Não é possível usar o disco permanente regional em uma VM que usa o tipo de máquina A3 Edge.
  • O tipo de máquina A3 Edge está disponível apenas na plataforma Sapphire Rapids CPU .
  • Você não pode alterar o tipo de máquina de uma VM do tipo máquina A3 Edge. Se precisar alterar o tipo de máquina, você deverá criar uma nova VM.
  • Não é possível alterar o tipo de máquina de uma VM para um tipo de máquina A3 Edge. Se precisar de uma VM que use um tipo de máquina A3 Edge, você deverá criar uma nova VM.
  • Os tipos de máquina A3 Edge não suportam locação individual .
  • Você não pode executar sistemas operacionais Windows em um tipo de máquina A3 Edge.

VMs padrão A2

  • Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A2 Standard.
  • Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A2 Standard.
  • Você só pode usar um tipo de máquina A2 Standard em determinadas regiões e zonas .
  • O tipo de máquina A2 Standard está disponível apenas na plataforma Cascade Lake .
  • Se sua VM usar um tipo de máquina A2 Standard, você só poderá alternar de um tipo de máquina A2 Standard para outro tipo de máquina A2 Standard. Você não pode mudar para nenhum outro tipo de máquina. Para obter mais informações, consulte Modificar VMs otimizadas por acelerador .
  • Você não pode usar o sistema operacional Windows com A2 Tipos de máquinas padrão. Ao usar sistemas operacionais Windows, escolha um tipo de máquina A2 Standard diferente.
  • Não é possível fazer uma formatação rápida dos SSDs locais anexados em VMs do Windows que usam tipos de máquina padrão A2. Para formatar esses SSDs locais, você deve fazer uma formatação completa usando o utilitário diskpart e especificando format fs=ntfs label=tmpfs .
  • Os tipos de máquina A2 Standard não suportam locação individual .

VMs A2 Ultra

  • Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina A2 Ultra.
  • Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina A2 Ultra.
  • Você só pode usar um tipo de máquina A2 Ultra em determinadas regiões e zonas .
  • O tipo de máquina A2 Ultra está disponível apenas na plataforma Cascade Lake .
  • Se sua VM usar um tipo de máquina A2 Ultra, você não poderá alterar o tipo de máquina. Se precisar usar um tipo de máquina A2 Ultra diferente ou qualquer outro tipo de máquina, você deverá criar uma nova VM.
  • Você não pode alterar nenhum outro tipo de máquina para um tipo de máquina A2 Ultra. Se precisar de uma VM que use um tipo de máquina A2 Ultra, você deverá criar uma nova VM.
  • Não é possível fazer uma formatação rápida dos SSDs locais anexados em VMs do Windows que usam tipos de máquina A2 Ultra. Para formatar esses SSDs locais, você deve fazer uma formatação completa usando o utilitário diskpart e especificando format fs=ntfs label=tmpfs .

VMs G2

  • Você só pode solicitar capacidade usando as opções de provisionamento compatíveis para um tipo de máquina G2.
  • Você não recebe descontos por uso sustentado e descontos flexíveis por uso contínuo para VMs que usam um tipo de máquina G2.
  • Você só pode usar um tipo de máquina G2 em determinadas regiões e zonas .
  • O tipo de máquina G2 está disponível apenas na plataforma Cascade Lake .
  • O disco permanente padrão ( pd-standard ) não é compatível com VMs que usam tipos de máquina padrão G2. Para tipos de discos suportados, consulte Tipos de discos suportados para G2 .
  • Não é possível criar GPUs de múltiplas instâncias em tipos de máquinas G2.
  • Se você precisar alterar o tipo de máquina de uma VM G2, revise Modificar VMs otimizadas por acelerador .
  • Você não pode usar imagens de VM de aprendizado profundo como discos de inicialização para suas VMs que usam tipos de máquina G2.
  • O driver padrão atual do Container-Optimized OS não oferece suporte a GPUs L4 em execução em tipos de máquina G2. O Container-Optimized OS também oferece suporte apenas a um conjunto selecionado de drivers. Se você quiser usar o Container-Optimized OS em tipos de máquina G2, revise as seguintes notas:
    • Use uma versão do Container-Optimized OS que suporte a versão mínima recomendada do driver NVIDIA 525.60.13 ou posterior. Para obter mais informações, revise as notas de versão do Container-Optimized OS .
    • Ao instalar o driver , especifique a versão mais recente disponível que funciona para GPUs L4. Por exemplo, sudo cos-extensions install gpu -- -version=525.60.13 .
  • Você deve usar a Google Cloud CLI ou REST para criar VMs G2 para os seguintes cenários:
    • Você deseja especificar valores de memória personalizados.
    • Você deseja personalizar o número de núcleos de CPU visíveis.

VMs N1+GPU

Para saber mais sobre as limitações das instâncias N1 com GPUs, consulte Recursos para a série de máquinas N1 e GPUs para a série de máquinas N1 .

Escolha um sistema operacional

Se você estiver usando GPUs para aprendizado de máquina, use um dos seguintes sistemas operacionais:

  • Imagens otimizadas para cargas de trabalho de IA. Você pode usar imagens Ubuntu e Rocky, que estão disponíveis em versões otimizadas para acelerador com drivers e kit de ferramentas CUDA pré-instalados. Consulte as imagens do sistema operacional na documentação do AI Hypercomputer.
  • Imagens de VM de aprendizado profundo. Cada VM de Deep Learning possui uma ferramenta de instalação de driver de GPU e inclui pacotes como TensorFlow e PyTorch. Você também pode usar uma VM de Deep Learning para cargas de trabalho gerais de GPU. Para saber mais sobre imagens disponíveis e pacotes instalados nessas imagens, consulte Escolhendo uma imagem .

Alternativamente, você pode usar qualquer imagem pública ou imagem personalizada . Observe que algumas imagens podem exigir um driver exclusivo ou ter um processo de instalação que está fora do escopo da documentação do Compute Engine. Para ajudar a identificar quais drivers são apropriados para a imagem do seu sistema operacional, consulte instalação de drivers de GPU .

Verifique a cota de GPU

Para proteger os sistemas e usuários do Compute Engine, novos projetos têm uma cota global de GPU, o que limita o número total de GPUs que você pode criar em qualquer zona compatível. Para revisar a cota de GPU, consulte Cota de GPU .

Se precisar de cota adicional de GPU, solicite um aumento de cota . Ao solicitar cota de GPU, você deve solicitar cota para os tipos de GPU que deseja criar em cada região e uma cota global adicional para o número total de GPUs de todos os tipos em todas as zonas.

Se o seu projeto tiver um histórico de faturamento estabelecido, ele receberá a cota automaticamente após o envio da solicitação.

VMs GPU e cotas de alocação preemptivas

Os recursos para VMs que usam o modelo de provisionamento padrão padrão (VMs padrão) normalmente não podem usar cotas de alocação preemptivas, que são destinadas a cargas de trabalho temporárias e geralmente mais disponíveis. Se o seu projeto não tiver cota preemptiva e você nunca tiver solicitado cota preemptiva, todas as VMs desse projeto consumirão cotas de alocação padrão.

No entanto, depois de solicitar a cota de alocação preemptiva, as VMs padrão que atendem a todos os critérios a seguir poderão consumir apenas a cota de alocação preemptiva.

Ao consumir a cota de alocação preemptiva para essas cargas de trabalho, você obtém os benefícios do tempo de execução ininterrupto das VMs padrão e melhor capacidade de obtenção da cota de alocação preemptiva.

Independentemente da cota usada, as VMs padrão não se qualificam para os preços das VMs spot e não estão sujeitas a preempção.

Para obter mais informações, consulte Cotas preemptivas .

Crie uma VM que tenha GPUs anexadas

Para criar uma VM que tenha GPUs anexadas, conclua as seguintes etapas:

  1. Crie a VM. O método usado para criar uma VM depende do modelo de GPU selecionado.

  2. Para que a VM use a GPU, você precisa instalar o driver da GPU na sua VM . Se você habilitou uma estação de trabalho virtual NVIDIA RTX (anteriormente conhecida como NVIDIA GRID), instale um driver para estação de trabalho virtual .

O que vem a seguir?