Neste documento, explicamos como criar e executar um job que usa uma unidade de processamento gráfico (GPU). Para saber mais sobre os recursos e restrições das GPUs, consulte Sobre GPUs na documentação do Compute Engine.
Ao criar um job do Batch, é possível usar GPUs para acelerar cargas de trabalho específicas. Os casos de uso comuns para jobs que usam GPUs incluem processamento de dados intensivo e cargas de trabalho de inteligência artificial (IA), como machine learning (ML).
Antes de começar
- Se você nunca usou o Batch, leia Começar a usar o Batch e ative o serviço concluindo os pré-requisitos para projetos e usuários.
-
Para receber as permissões necessárias para criar um job, peça ao administrador para conceder a você os seguintes papéis do IAM:
-
Editor de jobs em lote (
roles/batch.jobsEditor
) no projeto -
Usuário da conta de serviço (
roles/iam.serviceAccountUser
) na conta de serviço do job, que por padrão é a conta de serviço padrão do Compute Engine
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
-
Editor de jobs em lote (
Criar um job que usa GPUs
Para criar um job que usa GPUs, faça o seguinte:
- Planejar os requisitos de um job que usa GPUs.
- Crie um job com os requisitos e métodos identificados. Para exemplos de como criar um job usando as opções recomendadas, consulte Criar um job de exemplo que usa GPUs neste documento.
Planejar os requisitos de um job que usa GPUs
Antes de criar um job que usa GPUs, planeje os requisitos dele conforme explicado nas seções a seguir:
- Selecione o tipo de máquina de GPU e o método de provisionamento
- Instale os drivers da GPU.
- Definir recursos de VM compatíveis
Etapa 1: selecionar o tipo de máquina de GPU e o método de provisionamento
Os requisitos de um job variam de acordo com o tipo de máquina de GPU e o método de provisionamento preferidos, e as opções para cada um podem ser interdependentes. Com base nos seus requisitos e prioridades, você pode selecionar primeiro o tipo de máquina com GPU ou o método de provisionamento. Em geral, o tipo de máquina com GPU afeta principalmente o desempenho e os preços básicos, e o método de provisionamento afeta principalmente a disponibilidade de recursos e custos ou descontos adicionais.
Selecionar o tipo de máquina de GPU
Os tipos de máquinas com GPU disponíveis (as combinações válidas de tipo de GPU, número de GPUs e tipo de máquina (vCPUs e memória)) e os casos de uso deles estão listados na página Tipos de máquinas com GPU na documentação do Compute Engine.
Os campos necessários para que um job especifique um tipo de máquina com GPU variam de acordo com as categorias na tabela a seguir:
Tipos de máquina de GPU e requisitos de job | |
---|---|
GPUs para VMs otimizadas para aceleradores: as VMs com um tipo de máquina da família de máquinas otimizadas para aceleradores têm um tipo e um número específicos dessas GPUs anexados automaticamente. |
Para usar GPUs em VMs otimizadas para aceleradores, recomendamos que você especifique o tipo de máquina. Cada tipo de máquina com otimização para acelerador aceita apenas um tipo e um número específicos de GPUs. Portanto, é funcionalmente equivalente especificar ou não esses valores além do tipo de máquina com otimização para acelerador. Especificamente, o Batch também permite especificar apenas o tipo e o número de GPUs para VMs otimizadas para aceleradores, mas as opções de vCPU e memória resultantes geralmente são muito limitadas. Por isso, recomendamos que você verifique se as opções de vCPU e memória disponíveis são compatíveis com os requisitos de tarefa do job. |
GPUs para VMs N1: é necessário especificar o tipo e a quantidade a serem anexados a cada VM. Além disso, elas precisam ser anexadas a VMs com um tipo de máquina da série N1. |
Para usar GPUs em VMs N1, recomendamos que você especifique pelo menos o tipo e o número de GPUs. Verifique se a combinação de valores corresponde a uma das opções de GPU válidas para os tipos de máquina N1. As opções de vCPU e memória para VMs N1 que usam qualquer tipo e número específicos de GPUs são bastante flexíveis. A menos que você crie o job usando o console Google Cloud , deixe o Batch selecionar automaticamente um tipo de máquina que atenda aos requisitos de tarefa do job. |
Selecione o método de provisionamento
O Batch usa métodos diferentes para provisionar os recursos de VM para jobs que usam GPUs com base no tipo de recursos que seu job solicita. Os métodos de provisionamento disponíveis e os requisitos deles são explicados na tabela a seguir, que os lista com base nos casos de uso: da maior para a menor disponibilidade de recursos.
Em resumo, recomendamos que a maioria dos usuários faça o seguinte:
Quando você pretende usar tipos de máquinas de GPU A3 sem uma reserva, use o Dynamic Workload Scheduler para Batch (prévia).
Para todos os outros tipos de máquina com GPU, use o método de provisionamento padrão. O método de provisionamento padrão geralmente é sob demanda, exceto se o projeto tiver reservas não utilizadas que o job possa consumir automaticamente.
Métodos de provisionamento e requisitos de trabalho | |
---|---|
Reservas
|
O Batch usa reservas para jobs que podem consumir reservas não utilizadas. Para mais informações sobre reservas e requisitos, consulte a página Garantir a disponibilidade de recursos usando reservas de VM. |
Programador dinâmico de carga de trabalho para o Batch (prévia)
|
O Batch usa o Dynamic Workload Scheduler para jobs que atendem a todos os requisitos a seguir:
|
Sob demanda
|
O Batch usa sob demanda para todos os outros jobs. |
Spot VMs
|
O Batch usa VMs spot para jobs que definem o campo
|
Etapa 2: instalar os drivers da GPU
Para usar GPUs em um job, é necessário instalar os drivers de GPU. Para instalar os drivers da GPU, selecione um dos seguintes métodos:
Instalar drivers de GPU automaticamente (recomendado, se possível): conforme mostrado nos exemplos, para permitir que o Batch busque os drivers de GPU necessários em um local de terceiros e os instale em seu nome, defina o campo
installGpuDrivers
do job comotrue
. Esse método é recomendado se o trabalho não exigir a instalação manual de drivers.Se você precisar especificar qual versão do driver de GPU o Batch instala, defina também o campo
driverVersion
.Instale os drivers da GPU manualmente:esse método é necessário se alguma das seguintes condições for verdadeira:
- Um job usa executáveis de script e contêiner e não tem acesso à Internet. Para mais informações sobre o acesso de um job, consulte Visão geral da rede em lote.
- Um job usa uma imagem de VM personalizada. Para saber mais sobre imagens de SO de VM e quais imagens de SO de VM você pode usar, consulte Visão geral do ambiente de SO de VM.
Para instalar manualmente os drivers de GPU necessários, recomendamos o seguinte método:
Crie uma imagem de VM personalizada que inclua os drivers de GPU.
Para instalar drivers de GPU, execute um script de instalação com base no SO que você quer usar:
Se o job tiver executáveis de contêiner e não usar o Container-Optimized OS, também será necessário instalar o NVIDIA Container Toolkit
Ao criar e enviar um job que usa GPUs, especifique a imagem de VM personalizada que inclui os drivers de GPU e defina o campo
installGpuDrivers
do job comofalse
(padrão).
Etapa 3: definir recursos de VM compatíveis
Para saber mais sobre os requisitos e as opções de definição dos recursos de VM para um job, consulte Recursos de job.
Em resumo, é preciso fazer o seguinte ao definir os recursos da VM para um job que usa GPUs:
Verifique se o tipo de máquina com GPU está disponível no local das VMs do seu job.
Para saber onde os tipos de máquinas com GPU estão disponíveis, consulte Disponibilidade de GPUs por regiões e zonas na documentação do Compute Engine.
Se você especificar o tipo de máquina do job, verifique se ele tem vCPUs e memória suficientes para os requisitos de tarefa do job. É necessário especificar o tipo de máquina do job sempre que você criar um job usando o console Google Cloud . Isso também é recomendado quando você cria um job que usa GPUs para VMs otimizadas para aceleradores.
Defina os recursos da VM para um job usando um método válido:
- Defina os recursos da VM diretamente usando o campo
instances[].policy
(recomendado, se possível). Esse método é mostrado nos exemplos. - Defina recursos de VM usando um modelo com o campo
instances[].instanceTemplate
. Esse método é necessário para instalar manualmente os drivers de GPU usando uma imagem personalizada. Para mais informações, consulte Definir recursos de job usando um modelo de instância de VM.
- Defina os recursos da VM diretamente usando o campo
Criar um job de exemplo que usa GPUs
As seções a seguir explicam como criar um job de exemplo para cada tipo de máquina com GPU usando as opções recomendadas. Especificamente, todos os jobs de exemplo instalam drivers de GPU automaticamente, definem recursos de VM diretamente e especificam o método de provisionamento ou usam o método padrão.
- Usar GPUs para VMs A3 com o Dynamic Workload Scheduler (prévia)
- Usar GPUs para VMs otimizadas para aceleradores
- Usar GPUs para VMs N1
Usar GPUs para VMs A3 com o Dynamic Workload Scheduler para Batch (prévia)
É possível criar um job que usa GPUs para VMs A3 com o Dynamic Workload Scheduler usando a CLI gcloud ou a API Batch.
gcloud
Crie um arquivo JSON que instale drivers de GPU, especifique um tipo de máquina da série A3, bloqueie reservas e seja executado em um local que tenha o tipo de máquina de GPU.
Por exemplo, para criar um job de script básico que usa GPUs para VMs A3 pelo Dynamic Workload Scheduler, crie um arquivo JSON com o seguinte conteúdo:
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}." } } ] }, "taskCount": 3, "parallelism": 1 } ], "allocationPolicy": { "instances": [ { "installGpuDrivers": INSTALL_GPU_DRIVERS, "policy": { "machineType": "MACHINE_TYPE", "reservation": "NO_RESERVATION" } } ], "location": { "allowedLocations": [ "ALLOWED_LOCATIONS" ] } }, "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Substitua:
INSTALL_GPU_DRIVERS
: quando definido comotrue
, o Batch busca os drivers necessários para o tipo de GPU especificado no campopolicy
em um local de terceiros e os instala em seu nome. Se você definir esse campo comofalse
(padrão), será necessário instalar manualmente os drivers de GPU para usar qualquer GPU nesse job.MACHINE_TYPE
: um tipo de máquina da série de máquinas A3.ALLOWED_LOCATIONS
: você pode usar o campo allowedLocations[]
para especificar uma região ou zonas específicas em uma região em que as VMs do seu job podem ser executadas. Por exemplo,regions/us-central1
permite todas as zonas na regiãous-central1
. Verifique se você especificou locais que oferecem o tipo de máquina com GPU desejado para esse job. Caso contrário, se você omitir esse campo, verifique se o local do job oferece o tipo de máquina com GPU.
Para criar e executar o job, use o comando
gcloud batch jobs submit
:gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Substitua:
JOB_NAME
: o nome do job.LOCATION
: o local do job.JSON_CONFIGURATION_FILE
: o caminho para um arquivo JSON com os detalhes de configuração do job.
API
Faça uma solicitação POST
para o
método jobs.create
que instala drivers de GPU, especifica um tipo de máquina da série A3,
bloqueia reservas e é executado em um local que tem o tipo de máquina
de GPU.
Por exemplo, para criar um job de script básico que usa GPUs para VMs A3 com o Dynamic Workload Scheduler, faça a seguinte solicitação:
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}."
}
}
]
},
"taskCount": 3,
"parallelism": 1
}
],
"allocationPolicy": {
"instances": [
{
"installGpuDrivers": INSTALL_GPU_DRIVERS,
"policy": {
"machineType": "MACHINE_TYPE",
"reservation": "NO_RESERVATION"
}
}
],
"location": {
"allowedLocations": [
"ALLOWED_LOCATIONS"
]
}
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Substitua:
PROJECT_ID
: o ID do projeto do seu projeto.LOCATION
: o local do job.JOB_NAME
: o nome do job.INSTALL_GPU_DRIVERS
: quando definido comotrue
, o Batch busca os drivers necessários para o tipo de GPU especificado no campopolicy
em um local de terceiros e os instala em seu nome. Se você definir esse campo comofalse
(padrão), será necessário instalar manualmente os drivers de GPU para usar qualquer GPU nesse job.MACHINE_TYPE
: um tipo de máquina da série de máquinas A3.ALLOWED_LOCATIONS
: você pode usar o campo allowedLocations[]
para especificar uma região ou zonas específicas em uma região em que as VMs do seu job podem ser executadas. Por exemplo,regions/us-central1
permite todas as zonas na regiãous-central1
. Verifique se você especificou locais que oferecem o tipo de máquina com GPU desejado para esse job. Caso contrário, se você omitir esse campo, verifique se o local do job oferece o tipo de máquina com GPU.
Usar GPUs para VMs otimizadas para aceleradores
É possível criar um job que usa GPUs para VMs otimizadas para aceleradores usando o console, a CLI gcloud, a API Batch, Java, Node.js ou Python.Google Cloud
Console
Para criar um job que usa GPUs usando o console Google Cloud , faça o seguinte:
No console Google Cloud , acesse a página Lista de jobs.
Clique em
Criar. A página Criar job em lote é aberta. No painel à esquerda, a página Detalhes do job está selecionada.Configure a página Detalhes do job:
Opcional: no campo Nome do job, personalize o nome do job.
Por exemplo, insira
example-gpu-job
.Configure a seção Detalhes da tarefa:
Na janela Novo executável, adicione pelo menos um script ou contêiner para que o job seja executado.
Por exemplo, para criar um job de script básico, faça o seguinte:
Marque a caixa de seleção Script. Um campo vai aparecer.
No campo, insira o script a seguir:
echo Hello world from task ${BATCH_TASK_INDEX}.
Clique em Concluído.
No campo Contagem de tarefas, insira o número de tarefas para este job.
Por exemplo, insira
3
.Opcional: no campo Paralelismo, insira o número de tarefas a serem executadas simultaneamente.
Por exemplo, insira
1
(padrão).
Configure a página Especificações de recursos:
No painel à esquerda, clique em Especificações de recursos. A página Especificações de recursos é aberta.
Opcional: na seção Modelo de provisionamento de VM, selecione uma das seguintes opções para o modelo de provisionamento das VMs deste job:
Se o job puder resistir à preempção e você quiser VMs com desconto, selecione Spot.
Caso contrário, selecione Padrão (padrão).
Selecione o local para esse job.
No campo Região, selecione uma região.
No campo Zona, faça o seguinte:
Se você quiser restringir a execução do job a uma zona específica, selecione uma.
Caso contrário, selecione qualquer (padrão).
Selecione o tipo de máquina de GPU para as VMs deste job:
Nas opções de família de máquinas, clique em GPUs.
No campo Tipo de GPU, selecione o tipo de GPUs. Em seguida, no campo Número de GPUs, selecione o número de GPUs para cada VM.
Se você selecionou um dos tipos de GPU para VMs otimizadas para acelerador, o campo Tipo de máquina só permite uma opção de tipo de máquina com base no tipo e no número de GPUs selecionados.
Para instalar automaticamente os drivers de GPU, selecione Instalação do driver de GPU (padrão).
Configure a quantidade de recursos de VM necessários para cada tarefa:
.No campo Núcleos, insira a quantidade de vCPUs por tarefa.
Por exemplo, insira
1
(padrão).No campo Memória, insira a quantidade de RAM em GB por tarefa.
Por exemplo, insira
0.5
(padrão).
Clique em Concluído.
Opcional: configure os outros campos deste job.
Opcional: para revisar a configuração do job, no painel esquerdo, clique em Visualizar.
Clique em Criar.
A página Detalhes do job mostra o job que você criou.
gcloud
Crie um arquivo JSON que instale drivers de GPU, especifique um tipo de máquina da família de máquinas otimizadas para aceleradores e seja executado em um local que tenha o tipo de máquina de GPU.
Por exemplo, para criar um job de script básico que usa GPUs para VMs otimizadas para aceleradores, crie um arquivo JSON com o seguinte conteúdo:
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}." } } ] }, "taskCount": 3, "parallelism": 1 } ], "allocationPolicy": { "instances": [ { "installGpuDrivers": INSTALL_GPU_DRIVERS, "policy": { "machineType": "MACHINE_TYPE" } } ], "location": { "allowedLocations": [ "ALLOWED_LOCATIONS" ] } }, "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Substitua:
INSTALL_GPU_DRIVERS
: quando definido comotrue
, o Batch busca os drivers necessários para o tipo de GPU especificado no campopolicy
em um local de terceiros e os instala em seu nome. Se você definir esse campo comofalse
(padrão), será necessário instalar manualmente os drivers de GPU para usar qualquer GPU nesse job.MACHINE_TYPE
: um tipo de máquina da família de máquinas com otimização de acelerador.ALLOWED_LOCATIONS
: você pode usar o campo allowedLocations[]
para especificar uma região ou zonas específicas em uma região em que as VMs do seu job podem ser executadas. Por exemplo,regions/us-central1
permite todas as zonas na regiãous-central1
. Verifique se você especificou locais que oferecem o tipo de máquina com GPU desejado para esse job. Caso contrário, se você omitir esse campo, verifique se o local do job oferece o tipo de máquina com GPU.
Para criar e executar o job, use o comando
gcloud batch jobs submit
:gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Substitua:
JOB_NAME
: o nome do job.LOCATION
: o local do job.JSON_CONFIGURATION_FILE
: o caminho para um arquivo JSON com os detalhes de configuração do job.
API
Faça uma solicitação POST
ao
método jobs.create
que instala drivers de GPU, especifica um tipo de máquina da família de máquinas
otimizadas para aceleradores e é executado em um local que tem o
tipo de máquina de GPU.
Por exemplo, para criar um job de script básico que usa GPUs para VMs otimizadas para aceleradores, faça a seguinte solicitação:
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}."
}
}
]
},
"taskCount": 3,
"parallelism": 1
}
],
"allocationPolicy": {
"instances": [
{
"installGpuDrivers": INSTALL_GPU_DRIVERS,
"policy": {
"machineType": "MACHINE_TYPE"
}
}
],
"location": {
"allowedLocations": [
"ALLOWED_LOCATIONS"
]
}
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Substitua:
PROJECT_ID
: o ID do projeto do seu projeto.LOCATION
: o local do job.JOB_NAME
: o nome do job.INSTALL_GPU_DRIVERS
: quando definido comotrue
, o Batch busca os drivers necessários para o tipo de GPU especificado no campopolicy
em um local de terceiros e os instala em seu nome. Se você definir esse campo comofalse
(padrão), será necessário instalar manualmente os drivers de GPU para usar qualquer GPU nesse job.MACHINE_TYPE
: um tipo de máquina da família de máquinas com otimização de acelerador.ALLOWED_LOCATIONS
: você pode usar o campo allowedLocations[]
para especificar uma região ou zonas específicas em uma região em que as VMs do seu job podem ser executadas. Por exemplo,regions/us-central1
permite todas as zonas na regiãous-central1
. Verifique se você especificou locais que oferecem o tipo de máquina com GPU desejado para esse job. Caso contrário, se você omitir esse campo, verifique se o local do job oferece o tipo de máquina com GPU.
Java
Node.js
Python
Usar GPUs para VMs N1
É possível criar um job que usa GPUs para VMs N1 usando o console Google Cloud , a CLI gcloud, a API Batch, Java, Node.js ou Python.
Console
Para criar um job que usa GPUs usando o console Google Cloud , faça o seguinte:
No console Google Cloud , acesse a página Lista de jobs.
Clique em
Criar. A página Criar job em lote é aberta. No painel à esquerda, a página Detalhes do job está selecionada.Configure a página Detalhes do job:
Opcional: no campo Nome do job, personalize o nome do job.
Por exemplo, insira
example-gpu-job
.Configure a seção Detalhes da tarefa:
Na janela Novo executável, adicione pelo menos um script ou contêiner para que o job seja executado.
Por exemplo, para criar um job de script básico, faça o seguinte:
Marque a caixa de seleção Script. Um campo vai aparecer.
No campo, insira o script a seguir:
echo Hello world from task ${BATCH_TASK_INDEX}.
Clique em Concluído.
No campo Contagem de tarefas, insira o número de tarefas para este job.
Por exemplo, insira
3
.Opcional: no campo Paralelismo, insira o número de tarefas a serem executadas simultaneamente.
Por exemplo, insira
1
(padrão).
Configure a página Especificações de recursos:
No painel à esquerda, clique em Especificações de recursos. A página Especificações de recursos é aberta.
Opcional: na seção Modelo de provisionamento de VM, selecione uma das seguintes opções para o modelo de provisionamento das VMs deste job:
Se o job puder resistir à preempção e você quiser VMs com desconto, selecione Spot.
Caso contrário, selecione Padrão (padrão).
Selecione o local para esse job.
No campo Região, selecione uma região.
No campo Zona, faça o seguinte:
Se você quiser restringir a execução do job a uma zona específica, selecione uma.
Caso contrário, selecione qualquer (padrão).
Selecione o tipo de máquina de GPU para as VMs deste job:
Nas opções de família de máquinas, clique em GPUs.
No campo Tipo de GPU, selecione o tipo de GPUs.
Se você selecionou um dos tipos de GPU para VMs N1, o campo Série será definido como N1.
No campo Número de GPUs, selecione o número de GPUs para cada VM.
No campo Tipo de máquina, selecione o tipo de máquina.
Para instalar automaticamente os drivers de GPU, selecione Instalação do driver de GPU (padrão).
Configure a quantidade de recursos de VM necessários para cada tarefa:
.No campo Núcleos, insira a quantidade de vCPUs por tarefa.
Por exemplo, insira
1
(padrão).No campo Memória, insira a quantidade de RAM em GB por tarefa.
Por exemplo, insira
0.5
(padrão).
Clique em Concluído.
Opcional: configure os outros campos deste job.
Opcional: para revisar a configuração do job, no painel esquerdo, clique em Visualizar.
Clique em Criar.
A página Detalhes do job mostra o job que você criou.
gcloud
Crie um arquivo JSON que instale drivers de GPU, defina os subcampos
type
ecount
do campoaccelerators[]
e seja executado em um local que tenha o tipo de máquina de GPU.Por exemplo, para criar um job de script básico que usa GPUs para VMs N1 e permite que o Batch selecione o tipo de máquina N1 exato, crie um arquivo JSON com o seguinte conteúdo:
{ "taskGroups": [ { "taskSpec": { "runnables": [ { "script": { "text": "echo Hello world from task ${BATCH_TASK_INDEX}." } } ] }, "taskCount": 3, "parallelism": 1 } ], "allocationPolicy": { "instances": [ { "installGpuDrivers": INSTALL_GPU_DRIVERS, "policy": { "accelerators": [ { "type": "GPU_TYPE", "count": GPU_COUNT } ] } } ], "location": { "allowedLocations": [ "ALLOWED_LOCATIONS" ] } }, "logsPolicy": { "destination": "CLOUD_LOGGING" } }
Substitua:
INSTALL_GPU_DRIVERS
: quando definido comotrue
, o Batch busca os drivers necessários para o tipo de GPU especificado no campopolicy
em um local de terceiros e os instala em seu nome. Se você definir esse campo comofalse
(padrão), será necessário instalar manualmente os drivers de GPU para usar qualquer GPU nesse job.GPU_TYPE
: o tipo de GPU. Para conferir uma lista dos tipos de GPU disponíveis, use o comandogcloud compute accelerator-types list
. Use este campo apenas para GPUs de VMs N1.GPU_COUNT
: o número de GPUs do tipo especificado. Para mais informações sobre as opções válidas, consulte os tipos de máquinas com GPU para a série de máquinas N1. Use este campo apenas para GPUs de VMs N1.ALLOWED_LOCATIONS
: você pode usar o campo allowedLocations[]
para especificar uma região ou zonas específicas em uma região em que as VMs do seu job podem ser executadas. Por exemplo,regions/us-central1
permite todas as zonas na regiãous-central1
. Verifique se você especificou locais que oferecem o tipo de máquina com GPU desejado para esse job. Caso contrário, se você omitir esse campo, verifique se o local do job oferece o tipo de máquina com GPU.
Para criar e executar o job, use o comando
gcloud batch jobs submit
:gcloud batch jobs submit JOB_NAME \ --location LOCATION \ --config JSON_CONFIGURATION_FILE
Substitua:
JOB_NAME
: o nome do job.LOCATION
: o local do job.JSON_CONFIGURATION_FILE
: o caminho para um arquivo JSON com os detalhes de configuração do job.
API
Faça uma solicitação POST
para o
método jobs.create
que instala drivers de GPU, define os
subcampos type
e count
do campo accelerators[]
e usa um local que tem o tipo de máquina
de GPU.
Por exemplo, para criar um job de script básico que usa GPUs para VMs N1 e permite que o Batch selecione o tipo de máquina N1 exato, faça a seguinte solicitação:
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
{
"taskGroups": [
{
"taskSpec": {
"runnables": [
{
"script": {
"text": "echo Hello world from task ${BATCH_TASK_INDEX}."
}
}
]
},
"taskCount": 3,
"parallelism": 1
}
],
"allocationPolicy": {
"instances": [
{
"installGpuDrivers": INSTALL_GPU_DRIVERS,
"policy": {
"accelerators": [
{
"type": "GPU_TYPE",
"count": GPU_COUNT
}
]
}
}
],
"location": {
"allowedLocations": [
"ALLOWED_LOCATIONS"
]
}
},
"logsPolicy": {
"destination": "CLOUD_LOGGING"
}
}
Substitua:
PROJECT_ID
: o ID do projeto do seu projeto.LOCATION
: o local do job.JOB_NAME
: o nome do job.INSTALL_GPU_DRIVERS
: quando definido comotrue
, o Batch busca os drivers necessários para o tipo de GPU especificado no campopolicy
em um local de terceiros e os instala em seu nome. Se você definir esse campo comofalse
(padrão), será necessário instalar manualmente os drivers de GPU para usar qualquer GPU nesse job.GPU_TYPE
: o tipo de GPU. Para conferir uma lista dos tipos de GPU disponíveis, use o comandogcloud compute accelerator-types list
. Use este campo apenas para GPUs de VMs N1.GPU_COUNT
: o número de GPUs do tipo especificado. Para mais informações sobre as opções válidas, consulte Tipos de máquinas com GPU para a série de máquinas N1. Use este campo apenas para GPUs de VMs N1.ALLOWED_LOCATIONS
: você pode usar o campo allowedLocations[]
para especificar uma região ou zonas específicas em uma região em que as VMs do seu job podem ser executadas. Por exemplo,regions/us-central1
permite todas as zonas na regiãous-central1
. Verifique se você especificou locais que oferecem o tipo de máquina com GPU desejado para esse job. Caso contrário, se você omitir esse campo, verifique se o local do job oferece o tipo de máquina com GPU.
Java
Node.js
Python
A seguir
- Se você tiver problemas para criar ou executar um job, consulte Solução de problemas.
- Ver jobs e tarefas.
- Saiba mais sobre outras opções de criação de jobs.