Usar reservas com instâncias do Vertex AI Workbench
Neste documento, explicamos como usar as reservas do Compute Engine para garantir que as instâncias do Vertex AI Workbench tenham recursos suficientes de máquina virtual (VM) para serem executadas.
As reservas são um recurso do Compute Engine. Elas ajudam a garantir que você tenha os recursos disponíveis para criar VMs com o mesmo hardware (memória e vCPUs) e recursos opcionais (GPUs e discos SSD locais) sempre que precisar deles.
Ao criar uma reserva, o Compute Engine verifica se a capacidade solicitada está disponível na zona especificada. Se sim, o Compute Engine reserva os recursos, cria a reserva e acontece o seguinte:
Os recursos reservados ficam disponíveis imediatamente para consumo e permanecem disponíveis até que você exclua a reserva.
Você vai receber cobranças pelos recursos reservados com a mesma taxa sob demanda das VMs em execução, incluindo os descontos aplicáveis, até que a reserva seja excluída. Ao consumir uma reserva, uma VM não gera cobranças duplicadas de recursos, já que a reserva já é cobrada pelo custo dos recursos reservados. Para saber mais, consulte Reservas para recursos zonais do Compute Engine.
Limitações e requisitos
Todas as limitações das reservas do Compute Engine se aplicam quando instâncias do Vertex AI Workbench consomem reservas. Saiba Como funcionam as reservas.
Além disso, ao usar reservas com instâncias do Vertex AI Workbench, as seguintes limitações e requisitos se aplicam:
Sua reserva precisa ser uma das seguintes:
- No mesmo projeto da sua instância do Vertex AI Workbench.
- Compartilhados com o mesmo projeto da sua instância do Vertex AI Workbench.
As propriedades da VM de uma reserva precisam corresponder exatamente à sua instância do Vertex AI Workbench para consumir a reserva. Por exemplo, se uma reserva especificar um tipo de máquina
e2-standard-8
, a instância do Vertex AI Workbench só poderá consumir a reserva se também usar um tipo de máquinae2-standard-8
. Consulte os requisitos.
Antes de começar
- Revise os requisitos e restrições para reservas.
- Revise os requisitos de cota e as restrições para reservas compartilhadas.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
Administrador do Compute (
roles/compute.admin
) -
Administrador de notebooks (
roles/notebooks.admin
) PROJECT_ID
: ID do projeto;LOCATION
: a zona em que a instância está localizadaINSTANCE_NAME
: o nome da instânciaMACHINE_TYPE
: o tipo de máquina da instânciaRESERVATION_TYPE
: o tipo de reserva, que precisa serRESERVATION_ANY
ouRESERVATION_SPECIFIC
RESERVATION_NAME
: o nome da sua reserva ao usar o tipoRESERVATION_SPECIFIC
- Para reservas no mesmo projeto, use o ID da reserva.
- Para reservas em um projeto diferente, use o caminho completo da reserva.
Os recursos do Compute Engine, incluindo os descontos por compromisso de uso (CUDs) aplicáveis, de acordo com os preços do Compute Engine. Essas taxas têm o rótulo
goog-vertex-ai-product: workbench-instances
no SKU. Consulte Preços do Compute Engine.Taxas de gerenciamento do Vertex AI Workbench além do uso da infraestrutura. Consulte os preços do Vertex AI Workbench.
- Saiba mais sobre as reservas do Compute Engine em Reservas de recursos zonais do Compute Engine.
Funções exigidas
Para receber as permissões necessárias para usar reservas com instâncias do Vertex AI Workbench, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
Criar uma reserva
Crie uma reserva do Compute Engine. Pode ser uma reserva de projeto único ou compartilhada. Confira mais informações nestes documentos:
A reserva pode incluir aceleradores de GPU.
Usar uma reserva com uma nova instância
É possível adicionar sua reserva ao criar uma instância do Vertex AI Workbench usando a API REST.
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
Método HTTP e URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Corpo JSON da solicitação:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Para enviar a solicitação, escolha uma destas opções:
curl
Salve o corpo da solicitação em um arquivo com o nome request.json
e execute o comando a seguir:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Salve o corpo da solicitação em um arquivo com o nome request.json
e execute o comando a seguir:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Parar de usar sua reserva
Para deixar de usar sua reserva, exclua-a.
Se você quiser continuar usando sua reserva com outros recursos, mas não quiser que sua instância atual do Vertex AI Workbench a utilize, exclua a instância.
Faturamento
Ao consumir uma reserva do Compute Engine, você recebe uma fatura pelos seguintes itens:
Resolver problemas
Para encontrar métodos de diagnóstico e resolução de erros relacionados ao uso de reservas com instâncias do Vertex AI Workbench, consulte Solução de problemas das instâncias do Vertex AI Workbench.