Esta página foi traduzida pela API Cloud Translation.

Executar código PySpark em notebooks do BigQuery Studio

Neste documento, mostramos como executar código PySpark em um notebook Python do BigQuery.

Antes de começar

Se ainda não tiver feito isso, crie um Google Cloud projeto e um bucket do Cloud Storage.

Configurar seu projeto
1. Crie um bucket do Cloud Storage no seu projeto se você não tiver um para usar.
2. Configurar o notebook
  1. Credenciais do notebook: por padrão, sua sessão do notebook usa suas credenciais de usuário. Se você quiser especificar credenciais de conta de serviço para sua sessão, ela precisará ter o papel Worker do Dataproc (roles/dataproc.worker). Para mais informações, consulte Conta de serviço do Dataproc sem servidor.
  2. Ambiente de execução do notebook: seu notebook usa um ambiente de execução padrão do Vertex, a menos que você selecione outro ambiente. Se quiser definir seu próprio ambiente de execução, crie-o na página Ambientes de execução no console do Google Cloud .