Esta página foi traduzida pela API Cloud Translation.

Usar reservas com instâncias do Vertex AI Workbench

Neste documento, explicamos como usar as reservas do Compute Engine para garantir que as instâncias do Vertex AI Workbench tenham recursos suficientes de máquina virtual (VM) para serem executadas.

As reservas são um recurso do Compute Engine. Elas ajudam a garantir que você tenha os recursos disponíveis para criar VMs com o mesmo hardware (memória e vCPUs) e recursos opcionais (GPUs e discos SSD locais) sempre que precisar.

Ao criar uma reserva, o Compute Engine verifica se a capacidade solicitada está disponível na zona especificada. Se sim, o Compute Engine reserva os recursos, cria a reserva e acontece o seguinte:

Os recursos reservados ficam disponíveis imediatamente para consumo e permanecem disponíveis até que você exclua a reserva.
Você vai receber cobranças pelos recursos reservados com a mesma taxa sob demanda das VMs em execução, incluindo os descontos aplicáveis, até que a reserva seja excluída. Ao consumir uma reserva, uma VM não gera cobranças duplicadas de recursos, já que a reserva já é cobrada pelo custo dos recursos reservados. Para saber mais, consulte Reservas para recursos zonais do Compute Engine.

Limitações e requisitos

Todas as limitações das reservas do Compute Engine se aplicam quando instâncias do Vertex AI Workbench consomem reservas. Saiba Como funcionam as reservas.

Além disso, ao usar reservas com instâncias do Vertex AI Workbench, as seguintes limitações e requisitos se aplicam:

Sua reserva precisa ser uma das seguintes:
- No mesmo projeto da sua instância do Vertex AI Workbench.
- Compartilhados com o mesmo projeto da sua instância do Vertex AI Workbench.
As propriedades de VM de uma reserva precisam corresponder exatamente à sua instância do Vertex AI Workbench para consumir a reserva. Por exemplo, se uma reserva especificar um tipo de máquina e2-standard-8, a instância do Vertex AI Workbench só poderá consumir a reserva se também usar um tipo de máquina e2-standard-8. Consulte os requisitos.

Antes de começar

Revise os requisitos e restrições para reservas.
Revise os requisitos de cota e as restrições para reservas compartilhadas.

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Compute Engine and Notebooks APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Compute Engine and Notebooks APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Funções exigidas

Para receber as permissões necessárias para usar reservas com instâncias do Vertex AI Workbench, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:

Administrador do Compute (roles/compute.admin)
Administrador de notebooks (roles/notebooks.admin)

Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.

Criar uma reserva

Crie uma reserva do Compute Engine. Pode ser uma reserva de projeto único ou compartilhada. A reserva pode ser sob demanda ou adiantada. Para mais informações, consulte Escolher um tipo de reserva.

Usar uma reserva com uma nova instância

Para criar uma instância do Vertex AI Workbench que consuma uma reserva, use o console Google Cloud ou a API REST.

Console

Para criar uma instância do Vertex AI Workbench que consuma uma reserva, faça o seguinte:

No console Google Cloud , acesse a página Instâncias.

Acesse "Instâncias"
Clique em Criar.
Na caixa de diálogo Nova instância, clique em Opções avançadas.
Na caixa de diálogo Criar instância, na seção Tipo de máquina, selecione o tipo de máquina e a configuração de GPU que correspondem à sua reserva.
Em Plataforma de CPU e GPU, no menu Reservas, selecione a reserva a ser consumida.
Clique em Criar.

O Vertex AI Workbench cria uma instância e a inicia automaticamente. Quando a instância estiver pronta para uso, o Vertex AI Workbench ativa um link Abrir JupyterLab.

REST

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

PROJECT_ID: ID do projeto;
LOCATION: a zona em que a instância está localizada
INSTANCE_NAME: o nome da instância
MACHINE_TYPE: o tipo de máquina da instância
RESERVATION_TYPE: o tipo de reserva, que precisa ser RESERVATION_ANY ou RESERVATION_SPECIFIC
RESERVATION_NAME: o nome da sua reserva ao usar o tipo RESERVATION_SPECIFIC

Para reservas no mesmo projeto, use o ID da reserva.
Para reservas em um projeto diferente, use o caminho completo da reserva. Por exemplo: projects/PROJECT_ID/reservations/RESERVATION_NAME.

Método HTTP e URL:

POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

Corpo JSON da solicitação:

{
  "gce_setup": {
    "machine_type": "MACHINE_TYPE",
    "reservation_affinity": {
      "consume_reservation_type": "RESERVATION_TYPE",
      "key": "compute.googleapis.com/reservation-name",
      "values": ["RESERVATION_NAME"]
    }
  }
}

Para enviar a solicitação, escolha uma destas opções:

curl

Observação: o comando a seguir pressupõe que você fez login na CLI gcloud com sua conta de usuário executando gcloud init ou gcloud auth login, ou usando o Cloud Shell, que faz login automaticamente na CLI gcloud. . É possível verificar a conta ativa atual executando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

PowerShell

Observação: o comando a seguir pressupõe que você fez login na CLI gcloud com sua conta de usuário executando gcloud init ou gcloud auth login . É possível verificar a conta ativa atual executando gcloud auth list.

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content

Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de Operation.

Para mais informações, consulte a documentação da API REST do projects.locations.instances.create.

Parar de usar sua reserva

Para deixar de usar sua reserva, exclua-a.

Se você quiser continuar usando sua reserva com outros recursos, mas não quiser que sua instância atual do Vertex AI Workbench a utilize, exclua a instância.

Faturamento

Ao consumir uma reserva do Compute Engine, você recebe uma fatura pelos seguintes itens:

Os recursos do Compute Engine, incluindo os descontos por compromisso de uso (CUDs) aplicáveis, aos preços do Compute Engine. Essas taxas têm o rótulo goog-vertex-ai-product: workbench-instances no SKU. Consulte Preços do Compute Engine.
Taxas de gerenciamento do Vertex AI Workbench além do uso da infraestrutura. Consulte os preços do Vertex AI Workbench.

Resolver problemas

Para encontrar métodos de diagnóstico e resolução de erros relacionados ao uso de reservas com instâncias do Vertex AI Workbench, consulte Solução de problemas das instâncias do Vertex AI Workbench.

A seguir

Saiba mais sobre as reservas do Compute Engine em Reservas de recursos zonais do Compute Engine.