Creare flussi di lavoro
Per richiedere assistenza o fornire feedback su questa funzionalità, invia un'email all'indirizzo bigquery-workflows-preview-feedback@google.com.
Questo documento descrive come creare workflow in BigQuery. Workflows sono basati su Dataform.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the BigQuery, Dataform, and Vertex AI APIs.
- Segui le istruzioni riportate in Abilitare la gestione degli asset di codice per salvare, condividere e gestire le versioni degli asset di codice, ad esempio i flussi di lavoro.
- Se è la prima volta che crei un asset di codice, imposta la regione predefinita per l'archiviazione degli asset di codice. Non puoi modificare la regione di una risorsa di codice dopo la sua creazione.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare i workflow, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:
-
Per creare i flussi di lavoro:
Code Creator (
roles/dataform.codeCreator
) -
Per modificare ed eseguire i flussi di lavoro:
Editor Dataform (
roles/dataform.editor
)
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Per ulteriori informazioni su Dataform IAM, consulta Controllo dell'accesso con IAM.
Crea un flusso di lavoro
Per creare un flusso di lavoro:
Vai alla pagina BigQuery.
Nella barra delle schede del riquadro dell'editor, fai clic sul menu a discesa con la freccia
accanto al segno + e poi su Flusso di lavoro.(Facoltativo) Per rinominare il flusso di lavoro, fai clic sul nome del flusso di lavoro e poi digita un nuovo nome.
Fai clic su Inizia, poi vai alla scheda Impostazioni.
Nel campo Account di servizio, seleziona un account di servizio Dataform.
Nella sezione Località, seleziona una regione di elaborazione per il flusso di lavoro.
- Per selezionare una regione specifica, seleziona Regione e poi seleziona una regione nel menu a discesa Regione.
- Per selezionare più regioni, seleziona Più regioni e poi seleziona una più regioni nel menu a discesa Più regioni.
La regione di elaborazione del flusso di lavoro non deve corrispondere alla regione di archiviazione predefinita per gli asset di codice.
Se prevedi di aggiungere un notebook al tuo flusso di lavoro:
Nel campo Bucket Cloud Storage, fai clic su Sfoglia e seleziona o crea un bucket Cloud Storage per archiviare l'output dei notebook nel tuo flusso di lavoro.
Segui la procedura descritta in Aggiungere un'entità a un criterio a livello di bucket per aggiungere il tuo account di servizio Dataform personalizzato come entità al bucket Cloud Storage che prevedi di utilizzare per archiviare l'output delle esecuzioni pianificate del flusso di lavoro e concedi a questa entità il ruolo Amministratore dello spazio di archiviazione (
roles/storage.admin
).All'account di servizio Dataform personalizzato selezionato deve essere concesso il ruolo IAM Storage Admin per il bucket selezionato.
Aggiungere un'attività di flusso di lavoro
Per aggiungere un'attività a un flusso di lavoro:
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Workflow, quindi seleziona un flusso di lavoro.
Per aggiungere una query SQL o un notebook:
Query SQL
Fai clic su Aggiungi attività e poi seleziona Query.
(Facoltativo) Nel riquadro Dettagli attività di query, nel menu a discesa Esegui dopo, seleziona un'attività che precederà la query.
La query dipenderà dall'attività precedente.
Per creare la query, fai clic su Crea query.
Nella nuova query, aggiungi la sintassi della query e poi fai clic su Salva query.
(Facoltativo) Per rinominare la query, fai clic sul nome della query e digita un nuovo nome.
Notebook
Fai clic su Aggiungi attività e seleziona Notebook.
(Facoltativo) Nel riquadro Dettagli attività del notebook, nel menu a discesa Esegui dopo, seleziona un'attività che precederà il tuo blocco note.
Il tuo blocco note dipenderà dall'attività precedente.
Per creare il blocco note, fai clic su Crea blocco note.
Nel nuovo blocco note, aggiungi i contenuti e poi fai clic su Salva.
(Facoltativo) Per rinominare il blocco note, fai clic sul nome del blocco note e digita un nuovo nome.
Modificare un'attività del flusso di lavoro
Per modificare un'attività del flusso di lavoro:
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Workflow, quindi seleziona un flusso di lavoro.
Fai clic sull'attività selezionata.
Per modificare l'attività precedente, nel menu a discesa Esegui dopo, seleziona un'attività che precederà il blocco note.
Per modificare i contenuti dell'attività selezionata, fai clic su Modifica.
Nella nuova scheda che si apre, modifica i contenuti dell'attività e poi salva le modifiche apportate.
Eliminare un'attività del flusso di lavoro
Per eliminare un'attività da un flusso di lavoro:
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Workflow, quindi seleziona un flusso di lavoro.
Fai clic sull'attività selezionata.
Nel riquadro Dettagli attività, fai clic sull'icona EliminaElimina.
Esegui un flusso di lavoro
Per eseguire manualmente la versione corrente di un flusso di lavoro:
Nella console Google Cloud, vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Workflow, quindi seleziona un flusso di lavoro.
Fai clic su Esegui.
(Facoltativo) Per ispezionare l'esecuzione, visualizza le esecuzioni manuali precedenti.
Passaggi successivi
- Scopri di più sulle workflow in BigQuery.
- Scopri come gestire i flussi di lavoro.