Analizzare con il canvas di dati BigQuery
Questo documento descrive come utilizzare il canvas dei dati per l'analisi dei dati. Puoi anche gestire i metadati del canvas dei dati utilizzando Dataplex Universal Catalog.
Il canvas di dati di BigQuery Studio, una funzionalità di Gemini in BigQuery, ti consente di trovare, trasformare, sottoporre a query e visualizzare i dati utilizzando prompt in linguaggio naturale e un'interfaccia grafica per i workflow di analisi.
Per i workflow di analisi, il data canvas BigQuery utilizza un grafo aciclico diretto (DAG), che fornisce una visualizzazione grafica del workflow. Nel canvas di dati di BigQuery puoi iterare sui risultati delle query e lavorare con più rami di indagine in un unico posto.
BigQuery Data Canvas è progettato per accelerare le attività di analisi e aiutare i professionisti dei dati, come analisti e ingegneri dei dati, e altri nel loro percorso dai dati agli approfondimenti. Non richiede conoscenze tecniche di strumenti specifici, solo una familiarità di base con la lettura e la scrittura di SQL. Il canvas di dati BigQuery funziona con i metadati del Catalogo universale Dataplex per identificare le tabelle appropriate in base al linguaggio naturale.
Il canvas di dati di BigQuery non è destinato all'uso diretto da parte degli utenti aziendali.
Il canvas di dati BigQuery utilizza Gemini in BigQuery per trovare i dati, creare SQL, generare grafici e creare riepiloghi dei dati.
Scopri come e quando Gemini per Google Cloud utilizza i tuoi dati.
Funzionalità
Il canvas di dati BigQuery ti consente di:
Utilizza query in linguaggio naturale o sintassi di ricerca per parole chiave con i metadati di Dataplex Universal Catalog per trovare asset come tabelle, viste o viste materializzate.
Utilizza il linguaggio naturale per le query SQL di base, ad esempio:
- Query che contengono clausole
FROM
, funzioni matematiche, array e struct. JOIN
operazioni per due tabelle.
- Query che contengono clausole
Crea visualizzazioni personalizzate utilizzando il linguaggio naturale per descrivere ciò che vuoi.
Automatizzare gli approfondimenti sui dati.
Limitazioni
I comandi in linguaggio naturale potrebbero non funzionare correttamente con quanto segue:
- BigQuery ML
- Apache Spark
- Tabelle di oggetti
- BigLake
INFORMATION_SCHEMA
visualizzazioni- JSON
- Campi nidificati e ripetuti
- Funzioni e tipi di dati complessi come
DATETIME
eTIMEZONE
Le visualizzazioni dei dati non funzionano con i grafici della mappa geografica.
Best practice per la creazione di prompt
Con le giuste tecniche di prompt, puoi generare query SQL complesse. I suggerimenti riportati di seguito aiutano il canvas di dati di BigQuery a perfezionare i prompt in linguaggio naturale per aumentare l'accuratezza delle query:
Scrivi in modo chiaro. Formula la tua richiesta in modo chiaro ed evita di essere vago.
Poni domande dirette. Per ottenere la risposta più precisa, poni una domanda alla volta e mantieni i prompt concisi. Se inizialmente hai fornito un prompt con più di una domanda, elenca ogni parte distinta della domanda in modo che sia chiara per Gemini.
Fornisci istruzioni mirate ed esplicite. Enfatizza i termini chiave nei prompt.
Specifica l'ordine delle operazioni. Fornisci istruzioni in modo chiaro e ordinato. Dividi le attività in passaggi piccoli e mirati.
Perfeziona ed esegui l'iterazione. Prova frasi e approcci diversi per vedere quali danno i risultati migliori.
Per ulteriori informazioni, consulta Best practice per i prompt per il canvas di dati di BigQuery.
Prima di iniziare
- Assicurati che Gemini in BigQuery sia abilitato per il tuo progetto Google Cloud . In genere, questo passaggio viene eseguito da un amministratore.
- Assicurati di disporre delle autorizzazioni Identity and Access Management (IAM) necessarie per utilizzare il data canvas di BigQuery.
- Per gestire i metadati del canvas di dati in Dataplex Universal Catalog, assicurati che l'API Dataplex sia abilitata nel tuo progetto Google Cloud .
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per utilizzare il data canvas di BigQuery, chiedi all'amministratore di concederti i seguenti ruoli IAM per il progetto:
-
Utente BigQuery Studio (
roles/bigquery.studioUser
) -
Utente Gemini in Google Cloud (
roles/cloudaicompanion.user
)
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Per saperne di più sui ruoli e sulle autorizzazioni IAM in BigQuery, consulta Introduzione a IAM.
Per gestire i metadati del canvas dei dati in Dataplex Universal Catalog,
assicurati di disporre dei
ruoli Dataplex Universal Catalog richiesti e dell'autorizzazione
dataform.repositories.get
.
Tipi di nodo
Un canvas è una raccolta di uno o più nodi. I nodi possono essere collegati in qualsiasi ordine. Il canvas di dati di BigQuery ha i seguenti tipi di nodi:
- Testo
- Cerca
- Tabella
- SQL
- Visualizzazione
- Approfondimenti
Nodo di testo
Nel canvas di dati BigQuery, un nodo di testo ti consente di aggiungere contenuti di testo RTF al canvas. È utile per aggiungere spiegazioni, note o istruzioni al canvas, in modo che tu e gli altri possiate comprendere più facilmente il contesto e lo scopo dell'analisi. Puoi inserire qualsiasi contenuto di testo nell'editor del nodo di testo, incluso Markdown per la formattazione. Questa funzionalità ti consente di creare blocchi di testo informativi e visivamente accattivanti.
Dal nodo di testo puoi:
- Elimina il nodo.
- Esegui il debug del nodo.
- Duplica il nodo.
Nodo di ricerca
Nel data canvas di BigQuery, un nodo di ricerca ti consente di trovare e incorporare asset di dati nel canvas. Funge da ponte tra le query in linguaggio naturale o le ricerche di parole chiave e i dati effettivi con cui vuoi lavorare.
Fornisci una query di ricerca, utilizzando il linguaggio naturale o le parole chiave. Il nodo di ricerca esegue ricerche negli asset di dati. Sfrutta i metadati di Dataplex Universal Catalog per una maggiore consapevolezza del contesto. Il canvas di dati BigQuery suggerisce anche tabelle, query e query salvate utilizzate di recente.
Il nodo di ricerca restituisce un elenco di asset di dati pertinenti che corrispondono alla query. Tiene conto dei nomi delle colonne e delle descrizioni delle tabelle. Puoi quindi selezionare gli asset che vuoi aggiungere al canvas dei dati come nodi tabella, dove puoi analizzare e visualizzare ulteriormente i dati.
Dal nodo di ricerca puoi:
- Elimina il nodo.
- Esegui il debug del nodo.
- Duplica il nodo.
Nodo tabella
Nel canvas di dati BigQuery, un nodo tabella rappresenta una tabella specifica che hai incorporato nel flusso di lavoro di analisi. Rappresenta i dati con cui stai lavorando e ti consente di interagire direttamente con loro.
Un nodo tabella mostra informazioni sulla tabella, come il nome, lo schema e un'anteprima dei dati. Puoi interagire con la tabella visualizzando dettagli come lo schema, i dettagli e un'anteprima.
Dal nodo della tabella puoi:
- Elimina il nodo.
- Esegui il debug del nodo.
- Duplica il nodo.
- Esegui il nodo.
- Esegui il nodo e il nodo successivo.
All'interno del canvas dei dati, puoi:
- Esegui una query sui risultati in un nuovo nodo SQL.
- Unisci i risultati a un'altra tabella.
Nodo SQL
Nel canvas dei dati di BigQuery, un nodo SQL consente di eseguire query SQL personalizzate direttamente all'interno del canvas. Puoi scrivere codice SQL direttamente nell'editor del nodo SQL o utilizzare un prompt in linguaggio naturale per generare l'SQL.
Il nodo SQL esegue la query SQL fornita sulle origini dati specificate. Il nodo SQL produce una tabella dei risultati, che può essere collegata ad altri nodi nel canvas per ulteriori analisi o visualizzazioni.
Dopo l'esecuzione della query, puoi esportarla come query pianificata, esportare i risultati della query o condividere il canvas, in modo simile all'esecuzione di una query interattiva.
Dal nodo SQL puoi:
- Esporta l'istruzione SQL come query pianificata.
- Elimina il nodo.
- Esegui il debug del nodo.
- Duplica il nodo.
- Esegui il nodo.
- Esegui il nodo e il nodo successivo.
All'interno del canvas dei dati, puoi:
- Esegui una query sui risultati in un nuovo nodo SQL.
- Visualizza i risultati in un nodo di visualizzazione.
- Genera insight sui risultati in un nodo di insight.
- Unisci i risultati a un'altra tabella.
Nodo di visualizzazione
Nel canvas di dati di BigQuery, un nodo di visualizzazione consente di visualizzare i dati in modo visivo, semplificando la comprensione di tendenze, pattern e approfondimenti. Offre una varietà di tipi di grafici tra cui scegliere, consentendoti di selezionare e personalizzare la visualizzazione migliore per i tuoi dati.
Un nodo di visualizzazione accetta come input una tabella, che può essere il risultato di una query SQL o un nodo tabella. In base al tipo di grafico selezionato e ai dati della tabella di input, il nodo di visualizzazione genera un grafico. Puoi selezionare Grafico automatico per consentire a BigQuery di selezionare il tipo di grafico migliore per i tuoi dati. Il nodo di visualizzazione mostra quindi il grafico generato.
Il nodo di visualizzazione ti consente di personalizzare il grafico, ad esempio modificando i colori, le etichette e le origini dati. Puoi anche esportare il grafico come file PNG.
Visualizza i dati utilizzando i seguenti tipi di grafici:
- Grafico a barre
- Mappa termica
- Grafico lineare
- Grafico a torta
- Grafico a dispersione
Dal nodo di visualizzazione puoi:
- Esporta il grafico come file PNG.
- Esegui il debug del nodo.
- Duplica il nodo.
- Esegui il nodo.
- Esegui il nodo e il nodo successivo.
All'interno del canvas dei dati, puoi:
- Genera insight sui risultati in un nodo di insight.
- Modifica la visualizzazione.
Nodo Approfondimenti
Nel canvas di dati BigQuery, un nodo di approfondimento ti consente di generare approfondimenti e riepiloghi dai dati all'interno del canvas di dati. In questo modo, puoi scoprire pattern, valutare la qualità dei dati ed eseguire analisi statistiche sul canvas. Identifica tendenze, pattern, anomalie e correlazioni all'interno dei dati, oltre a generare riepiloghi concisi e chiari dei risultati dell'analisi dei dati.
Per saperne di più sugli approfondimenti sui dati, consulta Generare approfondimenti sui dati in BigQuery.
Dal nodo degli approfondimenti puoi:
- Elimina il nodo.
- Duplica il nodo.
- Esegui il nodo.
Utilizzare il data canvas di BigQuery
Puoi utilizzare il canvas di dati BigQuery nella console Google Cloud , in una query o in una tabella.
Vai alla pagina BigQuery.
Nell'editor di query, accanto a
Query SQL, fai clic su Crea nuovo e poi su Area dati.Nel campo del prompt Linguaggio naturale, inserisci un prompt in linguaggio naturale.
Ad esempio, se inserisci
Find me tables related to trees
, il canvas dei dati BigQuery restituisce un elenco di tabelle possibili, inclusi set di dati pubblici comebigquery-public-data.usfs_fia.plot_tree
obigquery-public-data.new_york_trees.tree_species
.Seleziona una tabella.
Al canvas dei dati BigQuery viene aggiunto un nodo della tabella per la tabella selezionata. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.
Gli esempi seguenti mostrano diversi modi per utilizzare il canvas di dati BigQuery nei flussi di lavoro di analisi.
Flusso di lavoro di esempio: trova, esegui query e visualizza i dati
In questo esempio, utilizzi prompt in linguaggio naturale nel canvas di dati di BigQuery per trovare dati, generare una query e modificarla. Poi, crea un grafico.
Prompt 1: trova i dati
Nella console Google Cloud , vai alla pagina BigQuery.
Nell'editor di query, accanto a
Query SQL, fai clic su Crea nuovo e poi su Area dati.Fai clic su Cerca i dati.
Fai clic su filter_list Modifica filtri di ricerca, quindi, nel riquadro Filtra ricerca, fai clic sul pulsante di attivazione/disattivazione Set di dati pubblici BigQuery per attivarlo.
Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt in linguaggio naturale:
Chicago taxi trips
Il canvas dei dati BigQuery genera un elenco di potenziali tabelle in base ai metadati di Dataplex Universal Catalog. Puoi selezionare più tabelle.
Seleziona la tabella
bigquery-public-data.chicago_taxi_trips.taxi_trips
e poi fai clic su Aggiungi al canvas.Al canvas di dati BigQuery viene aggiunto un nodo della tabella per
taxi_trips
. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.
Prompt 2: genera una query SQL nella tabella selezionata
Per generare una query SQL per la tabella
bigquery-public-data.chicago_taxi_trips.taxi_trips
, segui questi passaggi:
Nel canvas dei dati, fai clic su Query.
Nel campo del prompt Linguaggio naturale, inserisci quanto segue:
Get me the 100 longest trips
Data canvas di BigQuery genera una query SQL simile alla seguente:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `bigquery-public-data.chicago_taxi_trips.taxi_trips` ORDER BY trip_miles DESC LIMIT 100;
Prompt 3: modifica la query
Per modificare la query che hai generato, puoi modificarla manualmente oppure puoi cambiare il prompt in linguaggio naturale e rigenerare la query. In questo esempio, utilizzi un prompt in linguaggio naturale per modificare la query in modo da selezionare solo i viaggi in cui il cliente ha pagato in contanti.
Nel campo del prompt Linguaggio naturale, inserisci quanto segue:
Get me the 100 longest trips where the payment type is cash
Data canvas di BigQuery genera una query SQL simile alla seguente:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips` WHERE payment_type = 'Cash' ORDER BY trip_miles DESC LIMIT 100;
Nell'esempio precedente,
PROJECT_ID
è l'ID del tuo progetto Google Cloud .Per visualizzare i risultati della query, fai clic su Esegui.
Creare un grafico
- Nel canvas dei dati, fai clic su Visualizza.
Fai clic su Crea grafico a barre.
Il canvas dei dati BigQuery crea un grafico a barre che mostra le miglia percorse per ID viaggio. Oltre a fornire un grafico, il canvas dei dati BigQuery riepiloga alcuni dei dettagli chiave dei dati che supportano la visualizzazione.
(Facoltativo) Esegui una o più delle seguenti operazioni:
- Per modificare il grafico, fai clic su Modifica e poi modificalo nel riquadro Modifica visualizzazione.
- Per condividere il canvas di dati, fai clic su Condividi, quindi su Condividi link per copiare il link al canvas di dati BigQuery.
- Per pulire la tela dei dati, seleziona Altre azioni e poi seleziona Cancella tela. Questo passaggio comporta una tela vuota.
Flusso di lavoro di esempio: unire tabelle
In questo esempio, utilizzi prompt in linguaggio naturale nel data canvas BigQuery per trovare dati e unire tabelle. Quindi, esporta una query come notebook.
Prompt 1: trova i dati
Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:
Information about trees
Il data canvas di BigQuery suggerisce diverse tabelle contenenti informazioni sugli alberi.
Per questo esempio, seleziona la tabella
bigquery-public-data.new_york_trees.tree_census_1995
e poi fai clic su Aggiungi al canvas.La tabella viene visualizzata nel canvas.
Prompt 2: unisci le tabelle in base all'indirizzo
Nella tela dei dati, fai clic su Unisci.
Il canvas di dati BigQuery suggerisce le tabelle da unire.
Per aprire un nuovo campo del prompt Linguaggio naturale, fai clic su Cerca tabelle.
Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:
Information about trees
Seleziona la tabella
bigquery-public-data.new_york_trees.tree_census_2005
e poi fai clic su Aggiungi al canvas.La tabella viene visualizzata nel canvas.
Nella tela dei dati, fai clic su Unisci.
Nella sezione Su questo canvas, seleziona la casella di controllo Cella della tabella e poi fai clic su Ok.
Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:
Join on address
Il data canvas di BigQuery suggerisce la query SQL per unire queste due tabelle in base all'indirizzo:
SELECT * FROM `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015 JOIN `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995 ON t2015.address = t1995.address;
Per eseguire la query e visualizzare i risultati, fai clic su Esegui.
Esportare la query come notebook
Il canvas dei dati BigQuery ti consente di esportare le query come blocco note.
- Nel canvas dei dati, fai clic su Esporta come blocco note.
- Nel riquadro Salva blocco note, inserisci il nome del blocco note e la regione in cui vuoi salvarlo.
- Fai clic su Salva. Il notebook è stato creato.
- (Facoltativo) Per visualizzare il blocco note creato, fai clic su Apri.
Flusso di lavoro di esempio: modifica di un grafico utilizzando un prompt
In questo esempio, utilizzi prompt in linguaggio naturale nel canvas di dati di BigQuery per trovare, sottoporre a query e filtrare i dati, quindi modifichi i dettagli della visualizzazione.
Prompt 1: trova i dati
Per trovare dati sui nomi statunitensi, inserisci il seguente prompt:
Find data about USA names
Il data canvas di BigQuery genera un elenco di tabelle.
Per questo esempio, seleziona la tabella
bigquery-public-data.usa_names.usa_1910_current
, quindi fai clic su Aggiungi al canvas.
Prompt 2: esegui query sui dati
Per eseguire una query sui dati, nel canvas dei dati fai clic su Query e poi inserisci il seguente prompt:
Summarize this data
Data canvas di BigQuery genera una query simile alla seguente:
SELECT state, gender, year, name, number FROM `bigquery-public-data.usa_names.usa_1910_current`
Fai clic su Esegui. Vengono visualizzati i risultati della query.
Prompt 3: filtra i dati
- Nel canvas dei dati, fai clic su Esegui query su questi risultati.
Per filtrare i dati, nel campo del prompt SQL, inserisci il seguente prompt:
Get me the top 10 most popular names in 1980
Data canvas di BigQuery genera una query simile alla seguente:
SELECT name, SUM(number) AS total_count FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE year = 1980 GROUP BY name ORDER BY total_count DESC LIMIT 10;
Quando esegui la query, ottieni una tabella con i dieci nomi più comuni di bambini nati nel 1980.
Creare e modificare un grafico
Nel canvas dei dati, fai clic su Visualizza.
Il data canvas BigQuery suggerisce diverse opzioni di visualizzazione, tra cui un grafico a barre, un grafico a torta, un grafico a linee e una visualizzazione personalizzata.
Per questo esempio, fai clic su Crea grafico a barre.
Il canvas dei dati BigQuery crea un grafico a barre simile al seguente:
Oltre a fornire un grafico, il canvas di dati BigQuery riepiloga alcuni dei dettagli chiave dei dati che supportano la visualizzazione. Puoi modificare il grafico facendo clic su Dettagli visualizzazione e modificandolo nel riquadro laterale.
Prompt 4: modifica i dettagli della visualizzazione
Nel campo del prompt Visualizzazione, inserisci quanto segue:
Create a bar chart sorted high to low, with a gradient
Il canvas dei dati BigQuery crea un grafico a barre simile al seguente:
(Facoltativo) Per apportare ulteriori modifiche, fai clic su Modifica.
Viene visualizzato il riquadro Modifica visualizzazione. Puoi modificare i dettagli come il titolo del grafico, il nome dell'asse X e il nome dell'asse Y. Inoltre, se fai clic sulla scheda Editor JSON, puoi modificare direttamente il grafico in base ai valori JSON.
Lavorare con un assistente Gemini
Puoi utilizzare un'esperienza di chat basata su Gemini per lavorare con il canvas di dati BigQuery. L'assistente per la chat può creare nodi in base alle tue richieste, eseguire query e creare visualizzazioni. Puoi scegliere le tabelle con cui l'assistente deve lavorare e puoi aggiungere istruzioni per indirizzare il suo comportamento. L'assistente funziona con canvas di dati nuovi o esistenti.
Per utilizzare l'assistente Gemini:
- Per aprire l'assistente, fai clic su Scintilla Apri assistente Data Canvas nel canvas dei dati.
Nel campo Fai una domanda sui dati, inserisci un prompt in linguaggio naturale, ad esempio uno dei seguenti:
Show me interesting statistics of my data.
Make a chart based on my data, sorted high to low.
I want to see sample data from my table.
La risposta include uno o più nodi in base alla richiesta. Ad esempio, se chiedi all'assistente di creare un grafico dei tuoi dati, viene creato un nodo di visualizzazione nel canvas dei dati.
Quando fai clic sul campo Poni una domanda sui dati, puoi anche fare quanto segue:
- Per aggiungere dati, fai clic su Impostazioni.
- Per aggiungere istruzioni, fai clic su Impostazioni.
Per continuare a lavorare con l'assistente, aggiungi altri prompt in linguaggio naturale.
Puoi continuare a creare prompt in linguaggio naturale mentre lavori con il canvas dei dati.
Aggiungi dati
Quando lavori con l'interfaccia di Gemini Chat, puoi aggiungere dati in modo che l'assistente sappia a quale set di dati fare riferimento. L'assistente ti chiede di selezionare una tabella prima di eseguire qualsiasi prompt. Quando cerchi dati all'interno dell'assistente, puoi limitare l'ambito dei dati ricercabili a tutti i progetti, ai progetti speciali o al progetto corrente. Puoi anche decidere se includere i set di dati pubblici nella ricerca.
Per aggiungere dati all'assistente Gemini:
- Per aprire l'assistente, fai clic su Scintilla Apri assistente Data Canvas nel canvas dei dati.
- Fai clic su Impostazioni e poi su Aggiungi dati.
- (Facoltativo) Per espandere i risultati di ricerca in modo da includere i set di dati pubblici, fai clic sul pulsante di attivazione/disattivazione Set di dati pubblici.
- (Facoltativo) Per modificare l'ambito dei risultati di ricerca in modo da includere progetti diversi, seleziona l'opzione del progetto appropriata dal menu Ambito.
- Seleziona la casella di controllo per ciascuna tabella da aggiungere all'assistente.
- Per cercare tabelle non suggerite dall'assistente, fai clic su Cerca tabelle.
- Nel campo del prompt Linguaggio naturale, inserisci un prompt che descriva la tabella che stai cercando e poi premi Invio.
- Seleziona la casella di controllo per ciascuna delle tabelle che vuoi aggiungere all'assistente, poi fai clic su Ok.
- Chiudi il riquadro Impostazioni dell'assistente Canvas.
L'assistente basa la sua analisi sui dati che scegli.
Aggiungi istruzioni
Quando lavori con l'interfaccia di Gemini Chat, puoi aggiungere istruzioni in modo che l'assistente sappia come comportarsi. Queste istruzioni vengono applicate a tutti i prompt all'interno del canvas dei dati. Ecco alcuni esempi di potenziali istruzioni:
Visualize trends over time.
Chart colors: Red (negative), Green (positive)
Domain: USA
Per aggiungere istruzioni all'assistente:
- Per aprire l'assistente, fai clic su Scintilla Apri assistente Data Canvas nel canvas dei dati.
- Fai clic su Impostazioni.
- Nel campo Istruzioni, aggiungi un elenco di istruzioni per l'assistente, quindi chiudi il riquadro Impostazioni dell'assistente Canvas.
L'assistente ricorda le istruzioni e le applica ai prompt futuri.
Best practice per Gemini Assistant
Per ottenere i risultati migliori quando lavori con l'assistente del canvas dei dati BigQuery, segui queste best practice:
Scrivi in modo specifico e non ambiguo. Indica chiaramente cosa vuoi calcolare, analizzare o visualizzare. Ad esempio, invece di
Analyze trip data
, di'Calculate the average trip duration for trips starting in council district eight
.Garantire un contesto dei dati accurato. L'assistente può utilizzare solo i dati che fornisci. Assicurati che tutte le tabelle e le colonne pertinenti siano state aggiunte al canvas.
Inizia in modo semplice, poi itera. Inizia con una domanda semplice per assicurarti che l'assistente comprenda la struttura e i dati di base. Ad esempio, prima di'
Show total trips by
e poisubscriber_type
Show total trips by
.subscriber_type
and break down the result bycouncil_district
Suddividi le domande complesse. Per i processi in più passaggi, valuta la possibilità di formulare il prompt in modo chiaro con parti distinte o di utilizzare prompt separati per ogni passaggio principale. Ad esempio, di'
First, find the top five busiest stations by trip count. Second, calculate the average trip duration for trips starting from only those top five stations
.Indica chiaramente i calcoli. Specifica il calcolo scelto, ad esempio
SUM
,MAX
oAVERAGE
. Ad esempio, di'Find the
.MAX
trip duration perbike_id
Utilizza le istruzioni di sistema per contesto e preferenze persistenti. Utilizza le istruzioni di sistema per indicare le regole relative alle informazioni e le preferenze che si applicano a tutti i prompt.
Rivedi il canvas. Rivedi sempre i nodi generati per verificare che la logica sia in linea con la tua richiesta e che i risultati siano accurati.
Esperimento. Prova diverse formulazioni, livelli di dettaglio e strutture dei prompt per scoprire come l'assistente risponde alle tue esigenze specifiche di dati e analisi.
Fai riferimento ai nomi delle colonne. Se possibile, utilizza i nomi delle colonne effettivi dei dati selezionati. Ad esempio, invece di
Show trips by subscriber type
, di'Show the count of trips grouped by
.subscriber_type
andstart_station_name
Flusso di lavoro di esempio: lavorare con un assistente Gemini
In questo esempio, utilizzerai prompt in linguaggio naturale con l'assistente Gemini per trovare, interrogare e visualizzare i dati.
Nella console Google Cloud , vai alla pagina BigQuery.
Nell'editor di query, accanto a
Query SQL, fai clic su Crea nuovo e poi su Area dati.Fai clic su Cerca i dati.
Fai clic su filter_list Modifica filtri di ricerca, quindi, nel riquadro Filtra ricerca, fai clic sul pulsante di attivazione/disattivazione Set di dati pubblici BigQuery per attivarlo.
Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt in linguaggio naturale:
bikeshare
Il canvas dei dati BigQuery genera un elenco di potenziali tabelle in base ai metadati di Dataplex Universal Catalog. Puoi selezionare più tabelle.
Seleziona la tabella
bigquery-public-data.austin_bikeshare.bikeshare_stations
ebigquery-public-data.austin_bikeshare.bikeshare_trips
, poi fai clic su Aggiungi al canvas.Al canvas dei dati BigQuery viene aggiunto un nodo tabella per ciascuna delle tabelle selezionate. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.
Per aprire l'assistente, fai clic su Scintilla Apri assistente Data Canvas nel canvas dei dati.
Fai clic su Impostazioni.
Nel campo Istruzioni, aggiungi le seguenti istruzioni per l'assistente:
Tasks: - Visualize findings with charts - Show many charts per question - Make sure to cover each part via a separate line of reasoning
Chiudi il riquadro Impostazioni dell'assistente Canvas.
Nel campo Poni una domanda sui dati, inserisci il seguente prompt in linguaggio naturale:
Show the number of trips by council district and subscriber type
Puoi continuare a inserire prompt nel campo Poni una domanda sui dati. Inserisci il seguente prompt in linguaggio naturale:
What are most popular stations among the top 5 subscriber types
Inserisci il prompt finale:
What station is least used to start and end a trip
Una volta inseriti tutti i prompt pertinenti, il canvas viene compilato con i nodi di query e visualizzazione pertinenti in base ai prompt e alle istruzioni che hai fornito all'assistente. Continua a inserire prompt o a modificare quelli esistenti per ottenere i risultati che stai cercando.
Visualizza tutti i canvas di dati
Per visualizzare un elenco di tutti i canvas di dati nel tuo progetto:
Nella console Google Cloud , vai alla pagina BigQuery.
Nel riquadro Explorer, fai clic su
Visualizza azioni accanto a Canvas di dati, quindi esegui una delle seguenti operazioni:
- Per aprire l'elenco nella scheda corrente, fai clic su Mostra tutto.
- Per aprire l'elenco in una nuova scheda, fai clic su Mostra tutto in > Nuova scheda.
- Per aprire l'elenco in una scheda suddivisa, fai clic su Mostra tutto in > Scheda suddivisa.
Visualizzare i metadati del canvas di dati
Per visualizzare i metadati del canvas dei dati:
Nella console Google Cloud , vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas dei dati di cui vuoi visualizzare i metadati.
Esamina il riquadro Riepilogo per visualizzare informazioni sul canvas dei dati, ad esempio la regione che utilizza e la data dell'ultima modifica.
Utilizzare le versioni del data canvas
Puoi scegliere di creare un canvas di dati all'interno o all'esterno di un repository. Il controllo delle versioni del canvas di dati viene gestito in modo diverso a seconda della posizione del canvas di dati.
Controllo delle versioni del data canvas nei repository
I repository sono repository Git che si trovano in BigQuery o presso un provider di terze parti. Puoi utilizzare gli spazi di lavoro nei repository per eseguire il controllo delle versioni sui canvas di dati. Per saperne di più, vedi Utilizzare il controllo delle versioni con un file.
Controllo delle versioni di Data Canvas al di fuori dei repository
Puoi visualizzare, confrontare e ripristinare le versioni di un canvas di dati.
Visualizzare e confrontare le versioni del data canvas
Per visualizzare diverse versioni di un canvas di dati e confrontarle con la versione attuale, procedi nel seguente modo:
Nella console Google Cloud , vai alla pagina BigQuery.
Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas di dati di cui vuoi visualizzare l'attività.
Fai clic su
Cronologia delle versioni per visualizzare un elenco delle versioni del canvas dei dati in ordine decrescente per data.Fai clic su
Visualizza azioni accanto a una versione del canvas dei dati, quindi fai clic su Confronta. Si apre il riquadro di confronto, che confronta la versione del canvas dei dati che hai selezionato con la versione attuale.(Facoltativo) Per confrontare le versioni in linea anziché in riquadri separati, fai clic su Confronta e poi su In linea.
Ripristinare una versione del canvas di dati
Il ripristino dal riquadro di confronto ti consente di confrontare la versione precedente del canvas dei dati con la versione attuale prima di scegliere se ripristinarla.
- Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas dei dati di cui vuoi ripristinare una versione precedente.
- Fai clic su Cronologia delle versioni.
Fai clic su
Visualizza azioni accanto alla versione del canvas dei dati che vuoi ripristinare, quindi fai clic su Confronta.Si apre il riquadro di confronto, che mette a confronto la versione del canvas dei dati selezionata con la versione più recente.
Per ripristinare la versione precedente del canvas dei dati dopo il confronto, fai clic su Ripristina.
Fai clic su Conferma.
Gestisci i metadati in Dataplex Universal Catalog
Dataplex Universal Catalog consente di visualizzare e gestire i metadati per i canvas di dati. I canvas di dati sono disponibili in Dataplex Universal Catalog per impostazione predefinita, senza configurazione aggiuntiva.
Puoi utilizzare Dataplex Universal Catalog per gestire i canvas di dati in tutte le posizioni BigQuery. La gestione dei canvas di dati in Dataplex Universal Catalog è soggetta a quote e limiti di Dataplex Universal Catalog e ai prezzi di Dataplex Universal Catalog.
Il Catalogo universale Dataplex recupera automaticamente i seguenti metadati dai canvas di dati:
- Nome dell'asset di dati
- Asset di dati padre
- Posizione dell'asset di dati
- Tipo di asset di dati
- Progetto Google Cloud corrispondente
Dataplex Universal Catalog registra i canvas di dati come voci con i seguenti valori delle voci:
- Gruppo di voci di sistema
- Il gruppo di voci di sistema
per i canvas di dati è
@dataform
. Per visualizzare i dettagli delle voci del canvas di dati in Dataplex Universal Catalog, devi visualizzare il gruppo di voci di sistemadataform
. Per istruzioni su come visualizzare un elenco di tutte le voci in un gruppo di voci, consulta Visualizzare i dettagli di un gruppo di voci nella documentazione di Dataplex Universal Catalog. - Tipo di voce di sistema
- Il tipo di voce di sistema
per i canvas di dati è
dataform-code-asset
. Per visualizzare i dettagli dei canvas di dati, devi visualizzare il tipo di voce di sistemadataform-code-asset
, filtrare i risultati con un filtro basato sugli aspetti e impostare il campotype
all'interno dell'aspettodataform-code-asset
suDATA_CANVAS
. Quindi, seleziona una voce del canvas dei dati selezionato. Per istruzioni su come visualizzare i dettagli di un tipo di voce selezionato, consulta Visualizzare i dettagli di un tipo di voce nella documentazione di Dataplex Universal Catalog. Per istruzioni su come visualizzare i dettagli di una voce selezionata, consulta Visualizzare i dettagli di una voce nella documentazione di Dataplex Universal Catalog. - Tipo di aspetto del sistema
- Il tipo di aspetto di sistema
per i canvas di dati è
dataform-code-asset
. Per fornire un contesto aggiuntivo ai canvas di dati in Dataplex Universal Catalog annotando le voci del canvas di dati con aspetti, visualizza il tipo di aspettodataform-code-asset
, filtra i risultati con un filtro basato sugli aspetti e imposta il campotype
all'interno dell'aspettodataform-code-asset
suDATA_CANVAS
. Per istruzioni su come annotare le voci con gli aspetti, consulta Gestire gli aspetti e arricchire i metadati nella documentazione di Dataplex Universal Catalog. - Tipo
- Il tipo per i canvas di dati è
DATA_CANVAS
. Questo tipo ti consente di filtrare i canvas di dati nel tipo di voce di sistemadataform-code-asset
e nel tipo di aspettodataform-code-asset
utilizzando la queryaspect:dataplex-types.global.dataform-code-asset.type=DATA_CANVAS
in un filtro basato sugli aspetti.
Per istruzioni su come cercare asset in Dataplex Universal Catalog, consulta Cercare asset di dati in Dataplex Universal Catalog nella documentazione di Dataplex Universal Catalog.
Prezzi
Per informazioni dettagliate sui prezzi di questa funzionalità, consulta la panoramica dei prezzi di Gemini in BigQuery.
Quote e limiti
Per informazioni su quote e limiti per questa funzionalità, vedi Quote per Gemini in BigQuery.
Località
Puoi utilizzare il canvas di dati BigQuery in tutte le località BigQuery. Gemini in BigQuery opera a livello globale, quindi non puoi limitare il trattamento dei dati a una regione specifica. Per scoprire di più sulle località in cui Gemini in BigQuery elabora i dati, consulta Località di pubblicazione di Gemini.
Invia il tuo feedback
Puoi contribuire a migliorare i suggerimenti del canvas di dati BigQuery inviando feedback a Google. Per fornire un feedback:
Nella barra degli strumenti della console Google Cloud , fai clic su Invia feedback.
(Facoltativo) Per copiare le informazioni JSON del DAG e fornire un contesto aggiuntivo al tuo feedback, fai clic su
Copia.Per compilare il modulo e fornire un feedback, fai clic su modulo.
Le impostazioni di condivisione dei dati si applicano all'intero progetto e possono essere impostate solo da un amministratore del progetto con le autorizzazioni IAM serviceusage.services.enable
e serviceusage.services.list
. Per ulteriori informazioni sull'utilizzo dei dati nel programma Trusted Tester, vedi Gemini nel programma Trusted Tester di Google Cloud .
Per fornire un feedback diretto su questa funzionalità, puoi anche contattare datacanvas-feedback@google.com.
Passaggi successivi
Scopri come scrivere query con l'assistenza di Gemini.
Scopri come creare notebook.