GPUs disponíveis

As GPUs são usadas para acelerar as cargas de trabalho, e as estações de trabalho na nuvem suportam a associação de GPUs a estações de trabalho. O Cloud Workstations suporta muitos dos vários modelos de GPU que estão disponíveis para anexar a VMs do Compute Engine. O modelo e a quantidade de GPUs a associar a cada estação de trabalho são especificados na configuração da estação de trabalho. As estações de trabalho na nuvem processam a associação das GPUs e a instalação dos respetivos controladores de dispositivos.

A associação de GPUs a estações de trabalho afeta os custos, conforme descrito na vista geral dos preços do Cloud Workstations.

Limitações

Uma configuração da estação de trabalho pode especificar GPUs, sujeitas às seguintes limitações:

  • O Cloud Workstations só suporta GPUs para configurações que especificam tipos de máquinas na série de máquinas N1, na série de máquinas A2 ou na série de máquinas A3. Consulte os modelos de GPU suportados para ver detalhes.
  • A configuração tem de especificar zonas de réplicas onde o modelo de GPU escolhido está disponível.
  • Não é possível configurar estações de trabalho para terem mais do que um modelo de GPU anexado de cada vez.
  • As configurações que especificam tipos de máquinas A2 Ultra ou a série de máquinas A3 não podem especificar armazenamento persistente. Considere usar uma solução baseada em NFS, como o Filestore ou o Cloud Storage FUSE, se for necessário um armazenamento de ficheiros persistente. Tenha em atenção que os tipos de máquinas A2 Standard suportam o armazenamento persistente. Para criar configurações sem armazenamento persistente, use o seguinte comando da CLI gcloud:

      gcloud workstations configs create CONFIG_NAME \
        --project=PROJECT_ID \
        --cluster=CLUSTER_NAME \
        --region=LOCATION \
        --machine-type=A2_MACHINE_TYPE \
        --no-persistent-storage
    

    Substitua o seguinte:

    • PROJECT_ID: o ID do projeto que contém a configuração da estação de trabalho.
    • LOCATION: a região do cluster de estações de trabalho.
    • CLUSTER_NAME: o nome do cluster de estações de trabalho que contém a configuração da estação de trabalho.
    • CONFIG_NAME: o nome da configuração da estação de trabalho.
    • A2_MACHINE_TYPE: o tipo da máquina A2.

Modelos de GPU suportados

O Cloud Workstations suporta muitos dos modelos de GPU que o Compute Engine disponibiliza. Os modelos suportados dependem da série de máquinas escolhida para a configuração da estação de trabalho, conforme resumido na tabela seguinte.

Série de máquinas N1

A série de máquinas de uso geral N1 suporta vários modelos de GPU e as configurações de estações de trabalho que especificam qualquer um dos tipos de máquinas N1 também podem especificar um dos seguintes modelos de GPU. Para o modelo de GPU escolhido, a configuração pode especificar uma contagem de quantas placas de GPU anexar a cada estação de trabalho.

Modelo da GPU Número de GPUs
NVIDIA T4 (nvidia-tesla-t4) 1, 2 ou 4 GPUs
NVIDIA P4 (nvidia-tesla-p4) 1, 2 ou 4 GPUs
NVIDIA V100 (nvidia-tesla-v100) 1, 2, 4 ou 8 GPUs
NVIDIA P100 (nvidia-tesla-p100) 1, 2 ou 4 GPUs

Série de máquinas A2

A série de máquinas padrão A2 otimizada para aceleradores tem um número fixo de GPUs NVIDIA A100 anexadas, com base apenas no tipo de máquina escolhido.

A tabela seguinte mostra o mapeamento do tipo de máquina para o número de cartões que vão ser anexados.

Modelo da GPU Tipo de máquina Número de GPUs
NVIDIA A100 40GB (nvidia-tesla-a100) a2-highgpu-1g 1 GPU
a2-highgpu-2g 2 GPUs
a2-highgpu-4g 4 GPUs
a2-highgpu-8g 8 GPUs
a2-megagpu-16g 16 GPUs

O Cloud Workstations não suporta tipos de máquinas A2 ultra.

Série de máquinas A3

A série de máquinas otimizadas para aceleradores A3 Mega e A3 High tem um número fixo de GPUs NVIDIA H100 anexadas, com base apenas no tipo de máquina escolhido.

A tabela seguinte mostra o mapeamento do tipo de máquina para o número de cartões que vão ser anexados.

Modelo da GPU Tipo de máquina Número de GPUs
NVIDIA H100 80GB (nvidia-tesla-h100) a3-highgpu-1g 1 GPU
a3-highgpu-2g 2 GPUs
a3-highgpu-4g 4 GPUs
a3-highgpu-8g 8 GPUs
a3-megagpu-8g 8 GPUs

Adicione GPUs a uma configuração de estação de trabalho existente

Para adicionar GPUs a uma configuração de estação de trabalho, conclua os passos num dos seguintes separadores.

Antes de começar

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:

gcloud init

Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro, tem de iniciar sessão na CLI com a sua identidade federada.gcloud

Reveja a vista geral dos preços do Cloud Workstations para compreender como os seus custos são afetados pela configuração de GPUs. Tenha em atenção que as GPUs estão associadas às máquinas virtuais (VMs) pré-iniciadas especificadas pelo tamanho do conjunto de início rápido de uma configuração.

Atualizar a configuração existente

Consola

Configure GPUs numa configuração de estação de trabalho existente a partir da Google Cloud consola, fazendo o seguinte:

  1. Na Google Cloud consola, aceda à página Configurações da estação de trabalho.

    Aceda a Configurações da estação de trabalho

  2. Na lista Configurações da estação de trabalho, clique no Nome da configuração à qual quer adicionar GPUs.

  3. Na página Detalhes da configuração da estação de trabalho, clique em editar Editar.

  4. Na página Editar configuração da estação de trabalho, clique em Definições da máquina no menu de navegação.

  5. Clique no botão para selecionar GPUs em vez da família de máquinas de uso geral.

    No campo Tipo de GPU, selecione o modelo de GPU que quer usar.

    No campo Número de GPUs, selecione o número de placas de GPU que quer anexar a cada estação de trabalho.

    No campo Tipo de máquina, selecione o tipo de máquina que quer usar.

  6. Clique em Guardar para atualizar a configuração.

gcloud

Configure GPUs numa configuração de estação de trabalho existente executando o comando gcloud workstations configs update.

No entanto, primeiro, recolha algumas informações para ver que modelos de GPU estão disponíveis e escolher um para a sua configuração:

  1. Verifique as zonas de réplica especificadas pela configuração executando o seguinte comando da CLI gcloud:

    gcloud workstations configs describe \
      --format="table(name.scope(workstationConfigs),replicaZones.list())" \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME
    

    Substitua o seguinte:

    • PROJECT_ID: o ID do projeto que contém a configuração da estação de trabalho.
    • LOCATION: a localização do cluster de estações de trabalho.
    • CLUSTER_NAME: o nome do cluster de estações de trabalho que contém a configuração da estação de trabalho.
    • CONFIG_NAME: o nome da configuração da estação de trabalho.
  2. Escolha um modelo de GPU suportado que esteja disponível em ambas as zonas de réplica da configuração executando o comando gcloud compute accelerator-types list:

    gcloud compute accelerator-types list \
      --format="table(name:sort=1,zone,description,maximumCardsPerInstance)" \
      --filter='zone.basename()=(ZONES) AND name~"nvidia-tesla-(a100|p100|p4|t4|v100)$"' \
      --project=PROJECT_ID
    

    Substitua ZONES por uma lista separada por vírgulas das zonas de réplica determinadas no passo anterior (por exemplo, us-central1-a,us-central1-c).

    Escolha um modelo de GPU que esteja listado duas vezes na tabela, o que indica que está disponível em ambas as zonas de réplica.

    Tenha em atenção o número máximo de placas que pode anexar para o modelo de GPU escolhido.

  3. Determine quais dos tipos de máquinas suportados estão disponíveis em ambas as zonas de réplica da configuração através do comando gcloud compute machine-types list.

    1. Se escolheu o modelo de GPU NVIDIA A100 de 40 GB no passo anterior, a sua configuração tem de usar a série de máquinas A2:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:a2-highgpu- OR name:a2-megagpu-" \
        --zones=ZONES \
        --project=PROJECT_ID
      
    2. Se escolheu qualquer outro modelo de GPU no passo anterior, a sua configuração tem de usar a série de máquinas N1:

      gcloud compute machine-types list \
        --format="table(name,zone,guestCpus:sort=1)" \
        --filter="name:n1-standard-" \
        --zones=ZONES \
        --project=PROJECT_ID
      

    Escolha um tipo de máquina que esteja listado duas vezes na tabela, o que indica que está disponível em ambas as zonas de réplica.

  4. Agora que selecionou um modelo de GPU e um tipo de máquina compatível, atualize a configuração:

    1. Para GPUs NVIDIA A100 de 40 GB, execute este comando para atualizar a sua configuração:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=A2_MACHINE_TYPE
      

      Substitua A2_MACHINE_TYPE pelo tipo de máquina A2 escolhido determinado no passo anterior (por exemplo, a2-highgpu-1g).

    2. Para todos os outros modelos de GPU, execute este comando:

      gcloud beta workstations configs update \
        --project=PROJECT_ID \
        --region=LOCATION \
        --cluster=CLUSTER_NAME \
        CONFIG_NAME \
        --machine-type=N1_MACHINE_TYPE \
        --accelerator-type=ACCELERATOR_TYPE \
        --accelerator-count=ACCELERATOR_COUNT
      

      Substitua o seguinte:

      • N1_MACHINE_TYPE: o tipo de máquina escolhido da série N1 (por exemplo, n1-standard-2).
      • ACCELERATOR_TYPE: o nome do modelo de GPU escolhido (por exemplo, nvidia-tesla-t4).
      • ACCELERATOR_COUNT: o número de GPUs a associar a cada estação de trabalho (por exemplo, 1, 2, 4). Tem de ser uma potência de dois inferior ao máximo para o modelo de GPU.

Crie uma nova configuração de estação de trabalho com GPUs

Para criar uma nova configuração de estação de trabalho que anexe GPUs a estações de trabalho baseadas na mesma, conclua os passos num dos seguintes separadores.

Antes de começar

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

gcloud

Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:

gcloud init

Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro, tem de iniciar sessão na CLI com a sua identidade federada.gcloud

REST

Para usar os exemplos da API REST nesta página num ambiente de desenvolvimento local, usa as credenciais que fornece à CLI gcloud.

    Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:

    gcloud init

    Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro, tem de iniciar sessão na CLI com a sua identidade federada.gcloud

Para mais informações, consulte o artigo Autenticar para usar REST na Google Cloud documentação de autenticação.

Escolha um modelo de GPU e consulte a tabela de disponibilidade de GPUs para selecionar uma região onde o modelo de GPU escolhido esteja disponível em, pelo menos, duas zonas.

Se ainda não tiver um cluster na região escolhida onde possa criar uma nova configuração, siga os passos para criar um cluster de estações de trabalho na região.

Reveja a vista geral dos preços do Cloud Workstations para compreender como os seus custos são afetados pela configuração de GPUs. Tenha em atenção que as GPUs estão associadas às máquinas virtuais (VMs) pré-iniciadas especificadas pelo tamanho do conjunto de início rápido de uma configuração.

Criar uma nova configuração

Consola

Crie uma nova configuração da estação de trabalho com GPUs a partir da Google Cloud consola, fazendo o seguinte:

  1. Na Google Cloud consola, aceda à página Configurações da estação de trabalho.

    Aceda a Configurações da estação de trabalho

  2. Na página Configurações da estação de trabalho, clique em add_box Criar.

  3. No passo Informações básicas da página Criar configuração da estação de trabalho, especifique um nome para a configuração no campo Nome.

    No campo Cluster da estação de trabalho, selecione um cluster na região escolhida.

    Clique em Continuar para avançar para o passo Definições da máquina.

  4. No passo Definições da máquina da página Criar configuração da estação de trabalho, comece por clicar no botão para selecionar GPUs em vez da família de máquinas Uso geral.

    1. Em seguida, no campo Zonas, selecione as caixas de verificação junto a duas zonas onde o modelo de GPU escolhido está disponível (consulte a tabela de disponibilidade de GPUs).

    2. No campo Tipo de GPU, selecione o modelo de GPU que quer usar.

    3. No campo Número de GPUs, selecione o número de placas de GPU que quer associar a cada estação de trabalho.

    4. No campo Tipo de máquina, selecione um tipo de máquina compatível.

  5. Clique em Continuar para configurar as definições do ambiente e a política de IAM antes de clicar em Criar para aprovisionar a nova configuração da estação de trabalho.

gcloud

Crie uma nova configuração de estação de trabalho com GPUs através da CLI, executando o comando gcloud workstations configs create.gcloud

  • Para GPUs NVIDIA A100 de 40 GB, execute este comando para criar a sua configuração:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=A2_MACHINE_TYPE
    

    Substitua o seguinte:

    • PROJECT_ID: o ID do projeto que vai conter a nova configuração da estação de trabalho.
    • LOCATION: a localização do cluster de estações de trabalho onde a configuração vai estar contida.
    • CLUSTER_NAME: o nome do cluster de estações de trabalho que vai conter a nova configuração de estação de trabalho.
    • CONFIG_NAME: o nome da nova configuração da estação de trabalho.
    • REPLICA_ZONES: exatamente duas zonas na região do cluster onde o modelo de GPU escolhido está disponível (por exemplo, us-central1-a,us-central1-c).
    • A2_MACHINE_TYPE: o tipo de máquina da série A2 escolhido (por exemplo, a2-highgpu-1g).
  • Para todos os outros modelos de GPU, execute este comando para criar a sua configuração:

    gcloud beta workstations configs create \
      --project=PROJECT_ID \
      --region=LOCATION \
      --cluster=CLUSTER_NAME \
      CONFIG_NAME \
      --replica-zones=REPLICA_ZONES \
      --machine-type=N1_MACHINE_TYPE \
      --accelerator-type=ACCELERATOR_TYPE \
      --accelerator-count=ACCELERATOR_COUNT
    

    Substitua o seguinte:

    • PROJECT_ID: o ID do projeto que vai conter a nova configuração da estação de trabalho.
    • LOCATION: a localização do cluster de estações de trabalho onde a configuração vai estar contida.
    • CLUSTER_NAME: o nome do cluster de estações de trabalho que vai conter a nova configuração de estação de trabalho.
    • CONFIG_NAME: o nome da nova configuração da estação de trabalho.
    • REPLICA_ZONES: exatamente duas zonas na região do cluster onde o modelo de GPU escolhido está disponível (por exemplo, us-central1-a,us-central1-c).
    • N1_MACHINE_TYPE: o tipo de máquina da série N1 escolhido (por exemplo, n1-standard-2).
    • ACCELERATOR_TYPE: o nome do modelo de GPU escolhido (por exemplo, nvidia-tesla-t4).
    • ACCELERATOR_COUNT: o número de GPUs a associar a cada estação de trabalho (por exemplo, 1, 2, 4).

Controladores de dispositivos de GPU NVIDIA

O Cloud Workstations instala os controladores de dispositivos NVIDIA nas VMs anfitriãs das estações de trabalho durante o arranque da VM.

Para determinar que versão do controlador do dispositivo foi instalada numa estação de trabalho, execute o seguinte comando:

nvidia-smi --query-gpu=name,driver_version --format=csv

Disponibilidade de GPUs por região e zona

Pode pesquisar por localização ou modelo de GPU, ou uma combinação de ambos.

Zonas Location Plataformas de GPU
asia-east1-a Condado de Changhua, Taiwan, APAC T4 e P100
asia-east1-b Condado de Changhua, Taiwan, APAC
asia-east1-c Condado de Changhua, Taiwan, APAC T4, V100, P100 e H100
asia-east2-a Hong Kong, APAC T4
asia-east2-b Hong Kong, APAC
asia-east2-c Hong Kong, APAC T4
asia-northeast1-a Tóquio, Japão, APAC A100 40 GB e T4
asia-northeast1-b Tóquio, Japão, APAC H100
asia-northeast1-c Tóquio, Japão, APAC A100 40 GB e T4
asia-northeast3-a Seul, Coreia do Sul, APAC A100 40GB, H100
asia-northeast3-b Seul, Coreia do Sul, APAC A100 40 GB e T4
asia-northeast3-c Seul, Coreia do Sul, APAC T4 e H100
asia-south1-a Mumbai, Índia, APAC T4
asia-south1-b Mumbai, Índia, APAC T4
asia-south1-c Mumbai, Índia, APAC H100
asia-southeast1-a Jurong West, Singapura, APAC T4
asia-southeast1-b Jurong West, Singapura, APAC A100 40 GB, T4, P4 e H100
asia-southeast1-c Jurong West, Singapura, APAC A100 40 GB, A100 80 GB, T4, P4 e H100
australia-southeast1-a Sydney, Austrália, APAC T4 e P4
australia-southeast1-b Sydney, Austrália, APAC P4 e P100
australia-southeast1-c Sydney, Austrália, APAC T4 e H100
europe-central2-b
europe-central2-c
Varsóvia, Polónia, Europa T4
europe-north1-a
europe-north1-b
Hamina, Finlândia, Europa
europe-north1-c Hamina, Finlândia, Europa H100
europe-southwest1-a
europe-southwest1-b
europe-southwest1-c
Madrid, Espanha, Europa
europe-west1-b St. Ghislain, Bélgica, Europa H100, T4 e P100
europe-west1-c St. Ghislain, Bélgica, Europa H100 e T4
europe-west1-d St. Ghislain, Bélgica, Europa T4 e P100
europe-west2-a Londres, Inglaterra, Europa T4
europe-west2-b Londres, Inglaterra, Europa T4 e H100
europe-west2-c Londres, Inglaterra, Europa
europe-west3-a Frankfurt, Alemanha, Europa H100
europe-west3-b Frankfurt, Alemanha, Europa T4
europe-west3-c Frankfurt, Alemanha, Europa H100
europe-west4-a Eemshaven, Países Baixos, Europa A100 40 GB, A100 80 GB, T4, V100 e P100
europe-west4-b Eemshaven, Países Baixos, Europa A100 40 GB, T4, P4, V100 e H100
europe-west4-c Eemshaven, Países Baixos, Europa T4, P4, V100 e H100
europe-west6-a
europe-west6-b
europe-west6-c
Zurique, Suíça, Europa
europe-west8-a
europe-west8-b
europe-west8-c
Milão, Itália, Europa
europe-west9-a
europe-west9-b
europe-west9-c
Paris, França, Europa
europe-west12-a
europe-west12-b
europe-west12-c
Turim, Itália, Europa
me-west1-a Telavive, Israel, Médio Oriente A100 40GB
me-west1-b Telavive, Israel, Médio Oriente A100 40 GB e T4
me-west1-c Telavive, Israel, Médio Oriente A100 40 GB e T4
northamerica-northeast1-a Montréal, Québec, América do Norte P4
northamerica-northeast1-b Montréal, Québec, América do Norte P4
northamerica-northeast1-c Montréal, Québec, América do Norte T4 e P4
southamerica-east1-a Osasco, São Paulo, Brasil, América do Sul T4
southamerica-east1-c Osasco, São Paulo, Brasil, América do Sul T4
southamerica-west1-a
southamerica-west1-b
southamerica-west1-c
Santiago, Chile, América do Sul
us-central1-a Council Bluffs, Iowa, América do Norte A100 40 GB, A100 80 GB, T4, P4, V100 e H100
us-central1-b Council Bluffs, Iowa, América do Norte A100 40 GB, T4, V100 e H100
us-central1-c Council Bluffs, Iowa, América do Norte A100 40 GB, A100 80 GB, T4, P4, V100, P100 e H100
us-central1-f Council Bluffs, Iowa, América do Norte A100 40 GB, T4, V100 e P100
us-east1-b Moncks Corner, Carolina do Sul, América do Norte A100 40GB, P100
us-east1-c Moncks Corner, Carolina do Sul, América do Norte T4, V100 e P100
us-east1-d Moncks Corner, Carolina do Sul, América do Norte T4
us-east4-a
us-east4-b
Ashburn, Virgínia, América do Norte T4, P4 e H100
us-east4-c Ashburn, Virgínia, América do Norte A100 80 GB, T4, P4 e H100
us-east5-a Columbus, Ohio, América do Norte H100
us-east5-b Columbus, Ohio, América do Norte A100 80GB
us-east5-c Columbus, Ohio, América do Norte
us-west1-a The Dalles, Oregon, América do Norte T4, V100, P100 e H100
us-west1-b The Dalles, Oregon, América do Norte A100 40 GB, T4, V100, P100 e H100
us-west1-c The Dalles, Oregon, América do Norte
us-west4-a Las Vegas, Nevada, América do Norte T4 e H100
us-west4-b Las Vegas, Nevada, América do Norte A100 40 GB e T4
us-west4-c Las Vegas, Nevada, América do Norte

O que se segue?