Usar reservas com instâncias do Vertex AI Workbench

Neste documento, explicamos como usar as reservas do Compute Engine para garantir que as instâncias do Vertex AI Workbench tenham recursos suficientes de máquina virtual (VM) para serem executadas.

As reservas são um recurso do Compute Engine. Elas ajudam a garantir que você tenha os recursos disponíveis para criar VMs com o mesmo hardware (memória e vCPUs) e recursos opcionais (GPUs e discos SSD locais) sempre que precisar deles.

Ao criar uma reserva, o Compute Engine verifica se a capacidade solicitada está disponível na zona especificada. Se sim, o Compute Engine reserva os recursos, cria a reserva e acontece o seguinte:

  • Os recursos reservados ficam disponíveis imediatamente para consumo e permanecem disponíveis até que você exclua a reserva.

  • Você vai receber cobranças pelos recursos reservados com a mesma taxa sob demanda das VMs em execução, incluindo os descontos aplicáveis, até que a reserva seja excluída. Ao consumir uma reserva, uma VM não gera cobranças duplicadas de recursos, já que a reserva já é cobrada pelo custo dos recursos reservados. Para saber mais, consulte Reservas para recursos zonais do Compute Engine.

Limitações e requisitos

Todas as limitações das reservas do Compute Engine se aplicam quando instâncias do Vertex AI Workbench consomem reservas. Saiba Como funcionam as reservas.

Além disso, ao usar reservas com instâncias do Vertex AI Workbench, as seguintes limitações e requisitos se aplicam:

  • Sua reserva precisa ser uma das seguintes:

    • No mesmo projeto da sua instância do Vertex AI Workbench.
    • Compartilhados com o mesmo projeto da sua instância do Vertex AI Workbench.
  • As propriedades da VM de uma reserva precisam corresponder exatamente à sua instância do Vertex AI Workbench para consumir a reserva. Por exemplo, se uma reserva especificar um tipo de máquina e2-standard-8, a instância do Vertex AI Workbench só poderá consumir a reserva se também usar um tipo de máquina e2-standard-8. Consulte os requisitos.

Antes de começar

  1. Revise os requisitos e restrições para reservas.
  2. Revise os requisitos de cota e as restrições para reservas compartilhadas.
  3. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  7. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

  8. Funções exigidas

    Para receber as permissões necessárias para usar reservas com instâncias do Vertex AI Workbench, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:

    Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

    Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.

    Criar uma reserva

    Crie uma reserva do Compute Engine. Pode ser uma reserva de projeto único ou compartilhada. Confira mais informações nestes documentos:

    A reserva pode incluir aceleradores de GPU.

    Usar uma reserva com uma nova instância

    É possível adicionar sua reserva ao criar uma instância do Vertex AI Workbench usando a API REST.

    Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

    • PROJECT_ID: ID do projeto;
    • LOCATION: a zona em que a instância está localizada
    • INSTANCE_NAME: o nome da instância
    • MACHINE_TYPE: o tipo de máquina da instância
    • RESERVATION_TYPE: o tipo de reserva, que precisa ser RESERVATION_ANY ou RESERVATION_SPECIFIC
    • RESERVATION_NAME: o nome da sua reserva ao usar o tipo RESERVATION_SPECIFIC
      • Para reservas no mesmo projeto, use o ID da reserva.
      • Para reservas em um projeto diferente, use o caminho completo da reserva.

    Método HTTP e URL:

    POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

    Corpo JSON da solicitação:

    {
      "gce_setup": {
        "machine_type": "MACHINE_TYPE",
        "reservation_affinity": {
          "consume_reservation_type": "RESERVATION_TYPE",
          "key": "compute.googleapis.com/reservation-name",
          "values": ["RESERVATION_NAME"]
        }
      }
    }
    

    Para enviar a solicitação, escolha uma destas opções:

    curl

    Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

    PowerShell

    Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
    Se a solicitação for bem-sucedida, o corpo da resposta conterá uma instância de Operation.

    Parar de usar sua reserva

    Para deixar de usar sua reserva, exclua-a.

    Se você quiser continuar usando sua reserva com outros recursos, mas não quiser que sua instância atual do Vertex AI Workbench a utilize, exclua a instância.

    Faturamento

    Ao consumir uma reserva do Compute Engine, você recebe uma fatura pelos seguintes itens:

    • Os recursos do Compute Engine, incluindo os descontos por compromisso de uso (CUDs) aplicáveis, de acordo com os preços do Compute Engine. Essas taxas têm o rótulo goog-vertex-ai-product: workbench-instances no SKU. Consulte Preços do Compute Engine.

    • Taxas de gerenciamento do Vertex AI Workbench além do uso da infraestrutura. Consulte os preços do Vertex AI Workbench.

    Resolver problemas

    Para encontrar métodos de diagnóstico e resolução de erros relacionados ao uso de reservas com instâncias do Vertex AI Workbench, consulte Solução de problemas das instâncias do Vertex AI Workbench.

    A seguir