Configurar o ambiente do Cloud TPU
Antes de usar os recursos do Cloud TPU para treinar ou executar inferências em modelos, siga estas etapas:
- Configurar o Google Cloud projeto
- Configurar seu ambiente para usar o Cloud TPU
- Preparar-se para solicitar um Cloud TPU
Configurar o Google Cloud projeto
Você precisa ter uma Google Cloud conta e um projeto para usar o Cloud TPU.
No consoleGoogle Cloud , faça login na sua Conta do Google ou crie uma nova conta.
Crie um projeto do Google Cloud . Para saber mais, consulte Criar um projeto.
Ative o faturamento do projeto Google Cloud .
A configuração de faturamento é necessária para todo o uso do Google Cloud . Você só vai ser cobrado depois de começar a usar os recursos do Google Cloud . Para mais informações, consulte a documentação do Cloud Billing.
O faturamento do uso de todas as versões da Cloud TPU segue o preço regional padrão exibido na página de preços da Cloud TPU.
Instale a CLI do Google Cloud. A CLI do Google Cloud é um conjunto de bibliotecas e ferramentas para acessar e gerenciar Google Cloud recursos e serviços.
Configure o comando
gcloud
que você instalou como parte da CLI do Google Cloud.Execute os comandos a seguir para configurar o
gcloud
para usar o projeto Google Cloud.$ gcloud config set project PROJECT_ID
Verifique se o faturamento foi ativado para o projeto Google Cloud .
A configuração de faturamento é necessária para todo o uso do Google Cloud . Você só vai ser cobrado depois de começar a usar os recursos do Google Cloud . Para mais informações, consulte a documentação do Cloud Billing.
O faturamento do uso de todas as versões da Cloud TPU segue o preço regional padrão exibido na página de preços da Cloud TPU.
Configurar o ambiente para usar o Cloud TPU
Antes de solicitar um Cloud TPU, é necessário ativar a API Cloud TPU e verificar se você tem permissões para gerenciar o acesso no projeto e criar um Cloud TPU. Também é recomendável criar uma conta de serviço gerenciada pelo usuário para anexar à TPU.
Ative a API Cloud TPU no Google Cloud console ou usando a CLI do gcloud no Cloud Shell:
gcloud
$ gcloud services enable tpu.googleapis.com
Console
- No Google Cloud console, acesse a página da API Cloud TPU.
Acessar a página da API Cloud TPU
- Clique em Ativar.
Verifique se você tem os seguintes papéis no projeto:
- Administrador da conta de serviço: necessário para criar uma conta de serviço.
- Administrador do IAM do projeto: necessário para conceder um papel em um projeto.
- Administrador da TPU: necessário para criar uma TPU.
Siga as instruções em Conferir o acesso atual para saber quais administradores têm acesso ao seu projeto, pasta ou organização. Para conferir seu próprio acesso, na coluna Participante, encontre a linha que tem seu endereço de e-mail. Se o endereço de e-mail não estiver nessa coluna, isso significa que você não tem papéis. Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os papéis necessários.
Se você não tiver um papel obrigatório, conceda o papel ou peça a um administrador para fazer isso.
Crie um agente de serviço do Cloud TPU:
Os agentes de serviço, um tipo de identidade de serviço, são mantidos pelo Google e usados pelo serviço Cloud TPU para realizar operações no seu Google Cloud projeto. Por exemplo, o agente de serviço é usado para criar e gerenciar recursos do Cloud TPU.
$ gcloud beta services identity create --service tpu.googleapis.com --project PROJECT_ID
Crie uma conta de serviço do TPU:
As contas de serviço funcionam como credenciais para suas VMs do TPU. Os papéis associados a uma conta de serviço concedem acesso a recursos Google Cloud . Recomendamos o uso de uma conta de serviço gerenciada pelo usuário, concedendo apenas as permissões exigidas pela VM do TPU. Ao usar uma conta de serviço gerenciada pelo usuário, é necessário especificá-la ao criar uma VM de TPU usando a flag
--service-account
.Siga as instruções em Criar contas de serviço para criar uma conta de serviço gerenciada pelo usuário.
Siga as instruções em Gerenciar o acesso a projetos, pastas e organizações para conceder à sua conta de serviço acesso aos serviços Google Cloud que o TPU vai acessar. As seguintes funções são recomendadas para que a TPU acesse os serviços Google Cloud mais usados.
- Administrador da TPU: necessário para acesso total aos recursos da TPU
- Administrador do Storage: necessário para acessar o Cloud Storage.
- Gravador de registros: necessário para gravar registros com a API Logging.
- Gravador de métricas do Monitoring: necessário para gravar métricas no Cloud Monitoring.
Preparar-se para criar uma Cloud TPU
Antes de criar um Cloud TPU, é necessário solicitar a cota. Também é recomendável usar recursos em fila e quais parâmetros você quer usar para configurar a TPU.
Solicitar cota:
As cotas de TPU são limites no número de núcleos do Cloud TPU que você pode usar com um projetoGoogle Cloud . Cada versão da TPU está associada a uma cota. Para criar um Cloud TPU, seu projeto Google Cloud precisa ter cota para a versão e o tamanho da TPU que você quer criar e a zona em que ela vai ser criada. Para mais informações sobre a alocação de cotas, os tipos de cota e como solicitar cota, consulte Cotas.
Se você estiver criando TPUs com o Google Kubernetes Engine ou o Vertex AI, vai precisar de cota para esses serviços. Para mais informações sobre as cotas do GKE, consulte Planejar a configuração da TPU com o GKE. Para mais informações sobre as cotas da Vertex AI, consulte Cotas e limites da Vertex AI.
Determine se você quer usar recursos em fila.
Criar um Cloud TPU como um recurso enfileirado é uma prática recomendada. Os recursos em fila permitem que você receba capacidade quando ela estiver disponível. É possível especificar um horário de início e término opcional para quando a solicitação precisa ser preenchida.
Existem diferentes comandos da gcloud CLI para trabalhar com recursos em fila. Para mais informações, consulte o guia do usuário sobre recursos em fila.
Determine os parâmetros de criação do Cloud TPU:
Zona: defina a flag
--zone
para a zona em que você quer criar uma TPU. É necessário ter cota alocada nessa zona. Para mais informações, consulte Regiões e zonas de TPU.Configuração de TPU: se você não precisar especificar uma topologia personalizada ou estiver usando TPU v2 ou v3, defina a flag
--accelerator-type
comovVERSION-TENSORCORES
. Substitua VERSION pelo número da versão da TPU que você quer usar. Substitua TENSORCORES pelo número de TensorCores que você quer usar.Se você quiser personalizar a topologia física da TPU, use as flags
--version
e--topology
. Defina a flag--version
como a versão da TPU que você quer usar. Defina a flag--topology
como a topologia que você quer usar.Para mais informações sobre as configurações de TPU, incluindo as configurações com suporte e as variantes de topologia, consulte Versões de TPU.
Versão do software: se você estiver solicitando um recurso em fila, defina a flag
--runtime-version
como o nome da versão do software que você quer usar. Caso contrário, use a flag--version
. As versões do software de TPU estão disponíveis para os frameworks TensorFlow, PyTorch e JAX. Para mais informações sobre as versões de software com suporte, consulte Versões de software da VM de TPU.Conta de serviço: defina
--service-account
como o endereço de e-mail de uma conta de serviço, se você tiver criado uma, para anexar a conta de serviço ao TPU. Se estiver vazio, a conta de serviço padrão do Compute Engine será usada.Tipo de cota: adicione a flag que corresponde ao tipo de cota que você quer usar:
Tipo da cota Sinalização Reservado --reserved
VMs spot --spot
Preemptivo (não disponível para recursos em fila. Use --spot
).--preemptible
Sob demanda Nenhuma flag adicional é necessária Configuração avançada: é possível adicionar outras flags à solicitação para configurar o TPU. Consulte a documentação da
gcloud compute tpus tpu-vm create
e as seções a seguir para mais informações:
Para conferir exemplos de como criar uma Cloud TPU, consulte Começar.
A seguir
- Saiba como criar e gerenciar recursos de VM e TPU.
- Execute um guia de início rápido do Cloud TPU.