Analizzare con il canvas di dati BigQuery

Questo documento descrive come utilizzare il canvas dei dati per l'analisi dei dati. Puoi anche gestire i metadati del canvas dei dati utilizzando Dataplex Universal Catalog.

Il canvas di dati di BigQuery Studio, una funzionalità di Gemini in BigQuery, ti consente di trovare, trasformare, sottoporre a query e visualizzare i dati utilizzando prompt in linguaggio naturale e un'interfaccia grafica per i workflow di analisi.

Per i workflow di analisi, il data canvas BigQuery utilizza un grafo aciclico diretto (DAG), che fornisce una visualizzazione grafica del workflow. Nel canvas di dati di BigQuery puoi iterare sui risultati delle query e lavorare con più rami di indagine in un unico posto.

BigQuery Data Canvas è progettato per accelerare le attività di analisi e aiutare i professionisti dei dati, come analisti e ingegneri dei dati, e altri nel loro percorso dai dati agli approfondimenti. Non richiede conoscenze tecniche di strumenti specifici, solo una familiarità di base con la lettura e la scrittura di SQL. Il canvas di dati BigQuery funziona con i metadati del Catalogo universale Dataplex per identificare le tabelle appropriate in base al linguaggio naturale.

Il canvas di dati di BigQuery non è destinato all'uso diretto da parte degli utenti aziendali.

Il canvas di dati BigQuery utilizza Gemini in BigQuery per trovare i dati, creare SQL, generare grafici e creare riepiloghi dei dati.

Scopri come e quando Gemini per Google Cloud utilizza i tuoi dati.

Funzionalità

Il canvas di dati BigQuery ti consente di:

  • Utilizza query in linguaggio naturale o sintassi di ricerca per parole chiave con i metadati di Dataplex Universal Catalog per trovare asset come tabelle, viste o viste materializzate.

  • Utilizza il linguaggio naturale per le query SQL di base, ad esempio:

    • Query che contengono clausole FROM, funzioni matematiche, array e struct.
    • JOIN operazioni per due tabelle.
  • Crea visualizzazioni personalizzate utilizzando il linguaggio naturale per descrivere ciò che vuoi.

  • Automatizzare gli approfondimenti sui dati.

Limitazioni

  • I comandi in linguaggio naturale potrebbero non funzionare correttamente con quanto segue:

    • BigQuery ML
    • Apache Spark
    • Tabelle di oggetti
    • BigLake
    • INFORMATION_SCHEMA visualizzazioni
    • JSON
    • Campi nidificati e ripetuti
    • Funzioni e tipi di dati complessi come DATETIME e TIMEZONE
  • Le visualizzazioni dei dati non funzionano con i grafici della mappa geografica.

Best practice per la creazione di prompt

Con le giuste tecniche di prompt, puoi generare query SQL complesse. I suggerimenti riportati di seguito aiutano il canvas di dati di BigQuery a perfezionare i prompt in linguaggio naturale per aumentare l'accuratezza delle query:

  • Scrivi in modo chiaro. Formula la tua richiesta in modo chiaro ed evita di essere vago.

  • Poni domande dirette. Per ottenere la risposta più precisa, poni una domanda alla volta e mantieni i prompt concisi. Se inizialmente hai fornito un prompt con più di una domanda, elenca ogni parte distinta della domanda in modo che sia chiara per Gemini.

  • Fornisci istruzioni mirate ed esplicite. Enfatizza i termini chiave nei prompt.

  • Specifica l'ordine delle operazioni. Fornisci istruzioni in modo chiaro e ordinato. Dividi le attività in passaggi piccoli e mirati.

  • Perfeziona ed esegui l'iterazione. Prova frasi e approcci diversi per vedere quali danno i risultati migliori.

Per ulteriori informazioni, consulta Best practice per i prompt per il canvas di dati di BigQuery.

Prima di iniziare

  1. Assicurati che Gemini in BigQuery sia abilitato per il tuo progetto Google Cloud . In genere, questo passaggio viene eseguito da un amministratore.
  2. Assicurati di disporre delle autorizzazioni Identity and Access Management (IAM) necessarie per utilizzare il data canvas di BigQuery.
  3. Per gestire i metadati del canvas di dati in Dataplex Universal Catalog, assicurati che l'API Dataplex sia abilitata nel tuo progetto Google Cloud .

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per utilizzare il data canvas di BigQuery, chiedi all'amministratore di concederti i seguenti ruoli IAM per il progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Per saperne di più sui ruoli e sulle autorizzazioni IAM in BigQuery, consulta Introduzione a IAM.

Per gestire i metadati del canvas dei dati in Dataplex Universal Catalog, assicurati di disporre dei ruoli Dataplex Universal Catalog richiesti e dell'autorizzazione dataform.repositories.get.

Tipi di nodo

Un canvas è una raccolta di uno o più nodi. I nodi possono essere collegati in qualsiasi ordine. Il canvas di dati di BigQuery ha i seguenti tipi di nodi:

  • Testo
  • Cerca
  • Tabella
  • SQL
  • Visualizzazione
  • Approfondimenti

Nodo di testo

Nel canvas di dati BigQuery, un nodo di testo ti consente di aggiungere contenuti di testo RTF al canvas. È utile per aggiungere spiegazioni, note o istruzioni al canvas, in modo che tu e gli altri possiate comprendere più facilmente il contesto e lo scopo dell'analisi. Puoi inserire qualsiasi contenuto di testo nell'editor del nodo di testo, incluso Markdown per la formattazione. Questa funzionalità ti consente di creare blocchi di testo informativi e visivamente accattivanti.

Dal nodo di testo puoi:

  • Elimina il nodo.
  • Esegui il debug del nodo.
  • Duplica il nodo.

Nodo di ricerca

Nel data canvas di BigQuery, un nodo di ricerca ti consente di trovare e incorporare asset di dati nel canvas. Funge da ponte tra le query in linguaggio naturale o le ricerche di parole chiave e i dati effettivi con cui vuoi lavorare.

Fornisci una query di ricerca, utilizzando il linguaggio naturale o le parole chiave. Il nodo di ricerca esegue ricerche negli asset di dati. Sfrutta i metadati di Dataplex Universal Catalog per una maggiore consapevolezza del contesto. Il canvas di dati BigQuery suggerisce anche tabelle, query e query salvate utilizzate di recente.

Il nodo di ricerca restituisce un elenco di asset di dati pertinenti che corrispondono alla query. Tiene conto dei nomi delle colonne e delle descrizioni delle tabelle. Puoi quindi selezionare gli asset che vuoi aggiungere al canvas dei dati come nodi tabella, dove puoi analizzare e visualizzare ulteriormente i dati.

Dal nodo di ricerca puoi:

  • Elimina il nodo.
  • Esegui il debug del nodo.
  • Duplica il nodo.

Nodo tabella

Nel canvas di dati BigQuery, un nodo tabella rappresenta una tabella specifica che hai incorporato nel flusso di lavoro di analisi. Rappresenta i dati con cui stai lavorando e ti consente di interagire direttamente con loro.

Un nodo tabella mostra informazioni sulla tabella, come il nome, lo schema e un'anteprima dei dati. Puoi interagire con la tabella visualizzando dettagli come lo schema, i dettagli e un'anteprima.

Dal nodo della tabella puoi:

  • Elimina il nodo.
  • Esegui il debug del nodo.
  • Duplica il nodo.
  • Esegui il nodo.
  • Esegui il nodo e il nodo successivo.

All'interno del canvas dei dati, puoi:

  • Esegui una query sui risultati in un nuovo nodo SQL.
  • Unisci i risultati a un'altra tabella.

Nodo SQL

Nel canvas dei dati di BigQuery, un nodo SQL consente di eseguire query SQL personalizzate direttamente all'interno del canvas. Puoi scrivere codice SQL direttamente nell'editor del nodo SQL o utilizzare un prompt in linguaggio naturale per generare l'SQL.

Il nodo SQL esegue la query SQL fornita sulle origini dati specificate. Il nodo SQL produce una tabella dei risultati, che può essere collegata ad altri nodi nel canvas per ulteriori analisi o visualizzazioni.

Dopo l'esecuzione della query, puoi esportarla come query pianificata, esportare i risultati della query o condividere il canvas, in modo simile all'esecuzione di una query interattiva.

Dal nodo SQL puoi:

  • Esporta l'istruzione SQL come query pianificata.
  • Elimina il nodo.
  • Esegui il debug del nodo.
  • Duplica il nodo.
  • Esegui il nodo.
  • Esegui il nodo e il nodo successivo.

All'interno del canvas dei dati, puoi:

  • Esegui una query sui risultati in un nuovo nodo SQL.
  • Visualizza i risultati in un nodo di visualizzazione.
  • Genera insight sui risultati in un nodo di insight.
  • Unisci i risultati a un'altra tabella.

Nodo di visualizzazione

Nel canvas di dati di BigQuery, un nodo di visualizzazione consente di visualizzare i dati in modo visivo, semplificando la comprensione di tendenze, pattern e approfondimenti. Offre una varietà di tipi di grafici tra cui scegliere, consentendoti di selezionare e personalizzare la visualizzazione migliore per i tuoi dati.

Un nodo di visualizzazione accetta come input una tabella, che può essere il risultato di una query SQL o un nodo tabella. In base al tipo di grafico selezionato e ai dati della tabella di input, il nodo di visualizzazione genera un grafico. Puoi selezionare Grafico automatico per consentire a BigQuery di selezionare il tipo di grafico migliore per i tuoi dati. Il nodo di visualizzazione mostra quindi il grafico generato.

Il nodo di visualizzazione ti consente di personalizzare il grafico, ad esempio modificando i colori, le etichette e le origini dati. Puoi anche esportare il grafico come file PNG.

Visualizza i dati utilizzando i seguenti tipi di grafici:

  • Grafico a barre
  • Mappa termica
  • Grafico lineare
  • Grafico a torta
  • Grafico a dispersione

Dal nodo di visualizzazione puoi:

  • Esporta il grafico come file PNG.
  • Esegui il debug del nodo.
  • Duplica il nodo.
  • Esegui il nodo.
  • Esegui il nodo e il nodo successivo.

All'interno del canvas dei dati, puoi:

  • Genera insight sui risultati in un nodo di insight.
  • Modifica la visualizzazione.

Nodo Approfondimenti

Nel canvas di dati BigQuery, un nodo di approfondimento ti consente di generare approfondimenti e riepiloghi dai dati all'interno del canvas di dati. In questo modo, puoi scoprire pattern, valutare la qualità dei dati ed eseguire analisi statistiche sul canvas. Identifica tendenze, pattern, anomalie e correlazioni all'interno dei dati, oltre a generare riepiloghi concisi e chiari dei risultati dell'analisi dei dati.

Per saperne di più sugli approfondimenti sui dati, consulta Generare approfondimenti sui dati in BigQuery.

Dal nodo degli approfondimenti puoi:

  • Elimina il nodo.
  • Duplica il nodo.
  • Esegui il nodo.

Utilizzare il data canvas di BigQuery

Puoi utilizzare il canvas di dati BigQuery nella console Google Cloud , in una query o in una tabella.

  1. Vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, accanto a Query SQL, fai clic su Crea nuovo e poi su Area dati.

    Icona Crea canvas di dati.

  3. Nel campo del prompt Linguaggio naturale, inserisci un prompt in linguaggio naturale.

    Ad esempio, se inserisci Find me tables related to trees, il canvas dei dati BigQuery restituisce un elenco di tabelle possibili, inclusi set di dati pubblici come bigquery-public-data.usfs_fia.plot_tree o bigquery-public-data.new_york_trees.tree_species.

  4. Seleziona una tabella.

    Al canvas dei dati BigQuery viene aggiunto un nodo della tabella per la tabella selezionata. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.

Gli esempi seguenti mostrano diversi modi per utilizzare il canvas di dati BigQuery nei flussi di lavoro di analisi.

Flusso di lavoro di esempio: trova, esegui query e visualizza i dati

In questo esempio, utilizzi prompt in linguaggio naturale nel canvas di dati di BigQuery per trovare dati, generare una query e modificarla. Poi, crea un grafico.

Prompt 1: trova i dati

  1. Nella console Google Cloud , vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, accanto a Query SQL, fai clic su Crea nuovo e poi su Area dati.

    Icona Crea canvas di dati.

  3. Fai clic su Cerca i dati.

  4. Fai clic su filter_list Modifica filtri di ricerca, quindi, nel riquadro Filtra ricerca, fai clic sul pulsante di attivazione/disattivazione Set di dati pubblici BigQuery per attivarlo.

  5. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt in linguaggio naturale:

    Chicago taxi trips
    

    Il canvas dei dati BigQuery genera un elenco di potenziali tabelle in base ai metadati di Dataplex Universal Catalog. Puoi selezionare più tabelle.

  6. Seleziona la tabella bigquery-public-data.chicago_taxi_trips.taxi_trips e poi fai clic su Aggiungi al canvas.

    Al canvas di dati BigQuery viene aggiunto un nodo della tabella per taxi_trips. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.

Prompt 2: genera una query SQL nella tabella selezionata

Per generare una query SQL per la tabella bigquery-public-data.chicago_taxi_trips.taxi_trips, segui questi passaggi:

  1. Nel canvas dei dati, fai clic su Query.

  2. Nel campo del prompt Linguaggio naturale, inserisci quanto segue:

    Get me the 100 longest trips
    

    Data canvas di BigQuery genera una query SQL simile alla seguente:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

Prompt 3: modifica la query

Per modificare la query che hai generato, puoi modificarla manualmente oppure puoi cambiare il prompt in linguaggio naturale e rigenerare la query. In questo esempio, utilizzi un prompt in linguaggio naturale per modificare la query in modo da selezionare solo i viaggi in cui il cliente ha pagato in contanti.

  1. Nel campo del prompt Linguaggio naturale, inserisci quanto segue:

    Get me the 100 longest trips where the payment type is cash
    

    Data canvas di BigQuery genera una query SQL simile alla seguente:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

    Nell'esempio precedente, PROJECT_ID è l'ID del tuo progetto Google Cloud .

  2. Per visualizzare i risultati della query, fai clic su Esegui.

Creare un grafico

  1. Nel canvas dei dati, fai clic su Visualizza.
  2. Fai clic su Crea grafico a barre.

    Il canvas dei dati BigQuery crea un grafico a barre che mostra le miglia percorse per ID viaggio. Oltre a fornire un grafico, il canvas dei dati BigQuery riepiloga alcuni dei dettagli chiave dei dati che supportano la visualizzazione.

  3. (Facoltativo) Esegui una o più delle seguenti operazioni:

    • Per modificare il grafico, fai clic su Modifica e poi modificalo nel riquadro Modifica visualizzazione.
    • Per condividere il canvas di dati, fai clic su Condividi, quindi su Condividi link per copiare il link al canvas di dati BigQuery.
    • Per pulire la tela dei dati, seleziona Altre azioni e poi seleziona Cancella tela. Questo passaggio comporta una tela vuota.

Flusso di lavoro di esempio: unire tabelle

In questo esempio, utilizzi prompt in linguaggio naturale nel data canvas BigQuery per trovare dati e unire tabelle. Quindi, esporta una query come notebook.

Prompt 1: trova i dati

  1. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:

    Information about trees
    

    Il data canvas di BigQuery suggerisce diverse tabelle contenenti informazioni sugli alberi.

  2. Per questo esempio, seleziona la tabella bigquery-public-data.new_york_trees.tree_census_1995 e poi fai clic su Aggiungi al canvas.

    La tabella viene visualizzata nel canvas.

Prompt 2: unisci le tabelle in base all'indirizzo

  1. Nella tela dei dati, fai clic su Unisci.

    Il canvas di dati BigQuery suggerisce le tabelle da unire.

  2. Per aprire un nuovo campo del prompt Linguaggio naturale, fai clic su Cerca tabelle.

  3. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:

    Information about trees
    
  4. Seleziona la tabella bigquery-public-data.new_york_trees.tree_census_2005 e poi fai clic su Aggiungi al canvas.

    La tabella viene visualizzata nel canvas.

  5. Nella tela dei dati, fai clic su Unisci.

  6. Nella sezione Su questo canvas, seleziona la casella di controllo Cella della tabella e poi fai clic su Ok.

  7. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt:

    Join on address
    

    Il data canvas di BigQuery suggerisce la query SQL per unire queste due tabelle in base all'indirizzo:

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
  8. Per eseguire la query e visualizzare i risultati, fai clic su Esegui.

Esportare la query come notebook

Il canvas dei dati BigQuery ti consente di esportare le query come blocco note.

  1. Nel canvas dei dati, fai clic su Esporta come blocco note.
  2. Nel riquadro Salva blocco note, inserisci il nome del blocco note e la regione in cui vuoi salvarlo.
  3. Fai clic su Salva. Il notebook è stato creato.
  4. (Facoltativo) Per visualizzare il blocco note creato, fai clic su Apri.

Flusso di lavoro di esempio: modifica di un grafico utilizzando un prompt

In questo esempio, utilizzi prompt in linguaggio naturale nel canvas di dati di BigQuery per trovare, sottoporre a query e filtrare i dati, quindi modifichi i dettagli della visualizzazione.

Prompt 1: trova i dati

  1. Per trovare dati sui nomi statunitensi, inserisci il seguente prompt:

    Find data about USA names
    

    Il data canvas di BigQuery genera un elenco di tabelle.

  2. Per questo esempio, seleziona la tabella bigquery-public-data.usa_names.usa_1910_current, quindi fai clic su Aggiungi al canvas.

Prompt 2: esegui query sui dati

  1. Per eseguire una query sui dati, nel canvas dei dati fai clic su Query e poi inserisci il seguente prompt:

    Summarize this data
    

    Data canvas di BigQuery genera una query simile alla seguente:

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
  2. Fai clic su Esegui. Vengono visualizzati i risultati della query.

Prompt 3: filtra i dati

  1. Nel canvas dei dati, fai clic su Esegui query su questi risultati.
  2. Per filtrare i dati, nel campo del prompt SQL, inserisci il seguente prompt:

    Get me the top 10 most popular names in 1980
    

    Data canvas di BigQuery genera una query simile alla seguente:

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;

    Quando esegui la query, ottieni una tabella con i dieci nomi più comuni di bambini nati nel 1980.

Creare e modificare un grafico

  1. Nel canvas dei dati, fai clic su Visualizza.

    Il data canvas BigQuery suggerisce diverse opzioni di visualizzazione, tra cui un grafico a barre, un grafico a torta, un grafico a linee e una visualizzazione personalizzata.

  2. Per questo esempio, fai clic su Crea grafico a barre.

    Il canvas dei dati BigQuery crea un grafico a barre simile al seguente:

    Grafico a barre dei primi 10 nomi.

Oltre a fornire un grafico, il canvas di dati BigQuery riepiloga alcuni dei dettagli chiave dei dati che supportano la visualizzazione. Puoi modificare il grafico facendo clic su Dettagli visualizzazione e modificandolo nel riquadro laterale.

Prompt 4: modifica i dettagli della visualizzazione

  1. Nel campo del prompt Visualizzazione, inserisci quanto segue:

    Create a bar chart sorted high to low, with a gradient
    

    Il canvas dei dati BigQuery crea un grafico a barre simile al seguente:

    Grafico a barre dei primi dieci nomi ordinati.

  2. (Facoltativo) Per apportare ulteriori modifiche, fai clic su Modifica.

    Viene visualizzato il riquadro Modifica visualizzazione. Puoi modificare i dettagli come il titolo del grafico, il nome dell'asse X e il nome dell'asse Y. Inoltre, se fai clic sulla scheda Editor JSON, puoi modificare direttamente il grafico in base ai valori JSON.

Lavorare con un assistente Gemini

Puoi utilizzare un'esperienza di chat basata su Gemini per lavorare con il canvas di dati BigQuery. L'assistente per la chat può creare nodi in base alle tue richieste, eseguire query e creare visualizzazioni. Puoi scegliere le tabelle con cui l'assistente deve lavorare e puoi aggiungere istruzioni per indirizzare il suo comportamento. L'assistente funziona con canvas di dati nuovi o esistenti.

Per utilizzare l'assistente Gemini:

  1. Per aprire l'assistente, fai clic su Scintilla Apri assistente Data Canvas nel canvas dei dati.
  2. Nel campo Fai una domanda sui dati, inserisci un prompt in linguaggio naturale, ad esempio uno dei seguenti:

    • Show me interesting statistics of my data.
    • Make a chart based on my data, sorted high to low.
    • I want to see sample data from my table.

    La risposta include uno o più nodi in base alla richiesta. Ad esempio, se chiedi all'assistente di creare un grafico dei tuoi dati, viene creato un nodo di visualizzazione nel canvas dei dati.

    Quando fai clic sul campo Poni una domanda sui dati, puoi anche fare quanto segue:

    • Per aggiungere dati, fai clic su Impostazioni.
    • Per aggiungere istruzioni, fai clic su Impostazioni.
  3. Per continuare a lavorare con l'assistente, aggiungi altri prompt in linguaggio naturale.

Puoi continuare a creare prompt in linguaggio naturale mentre lavori con il canvas dei dati.

Aggiungi dati

Quando lavori con l'interfaccia di Gemini Chat, puoi aggiungere dati in modo che l'assistente sappia a quale set di dati fare riferimento. L'assistente ti chiede di selezionare una tabella prima di eseguire qualsiasi prompt. Quando cerchi dati all'interno dell'assistente, puoi limitare l'ambito dei dati ricercabili a tutti i progetti, ai progetti speciali o al progetto corrente. Puoi anche decidere se includere i set di dati pubblici nella ricerca.

Per aggiungere dati all'assistente Gemini:

  1. Per aprire l'assistente, fai clic su Scintilla Apri assistente Data Canvas nel canvas dei dati.
  2. Fai clic su Impostazioni e poi su Aggiungi dati.
  3. (Facoltativo) Per espandere i risultati di ricerca in modo da includere i set di dati pubblici, fai clic sul pulsante di attivazione/disattivazione Set di dati pubblici.
  4. (Facoltativo) Per modificare l'ambito dei risultati di ricerca in modo da includere progetti diversi, seleziona l'opzione del progetto appropriata dal menu Ambito.
  5. Seleziona la casella di controllo per ciascuna tabella da aggiungere all'assistente.
    1. Per cercare tabelle non suggerite dall'assistente, fai clic su Cerca tabelle.
    2. Nel campo del prompt Linguaggio naturale, inserisci un prompt che descriva la tabella che stai cercando e poi premi Invio.
    3. Seleziona la casella di controllo per ciascuna delle tabelle che vuoi aggiungere all'assistente, poi fai clic su Ok.
  6. Chiudi il riquadro Impostazioni dell'assistente Canvas.

L'assistente basa la sua analisi sui dati che scegli.

Aggiungi istruzioni

Quando lavori con l'interfaccia di Gemini Chat, puoi aggiungere istruzioni in modo che l'assistente sappia come comportarsi. Queste istruzioni vengono applicate a tutti i prompt all'interno del canvas dei dati. Ecco alcuni esempi di potenziali istruzioni:

  • Visualize trends over time.
  • Chart colors: Red (negative), Green (positive)
  • Domain: USA

Per aggiungere istruzioni all'assistente:

  1. Per aprire l'assistente, fai clic su Scintilla Apri assistente Data Canvas nel canvas dei dati.
  2. Fai clic su Impostazioni.
  3. Nel campo Istruzioni, aggiungi un elenco di istruzioni per l'assistente, quindi chiudi il riquadro Impostazioni dell'assistente Canvas.

L'assistente ricorda le istruzioni e le applica ai prompt futuri.

Best practice per Gemini Assistant

Per ottenere i risultati migliori quando lavori con l'assistente del canvas dei dati BigQuery, segui queste best practice:

  • Scrivi in modo specifico e non ambiguo. Indica chiaramente cosa vuoi calcolare, analizzare o visualizzare. Ad esempio, invece di Analyze trip data, di' Calculate the average trip duration for trips starting in council district eight.

  • Garantire un contesto dei dati accurato. L'assistente può utilizzare solo i dati che fornisci. Assicurati che tutte le tabelle e le colonne pertinenti siano state aggiunte al canvas.

  • Inizia in modo semplice, poi itera. Inizia con una domanda semplice per assicurarti che l'assistente comprenda la struttura e i dati di base. Ad esempio, prima di' Show total trips by subscriber_type e poi Show total trips by subscriber_type and break down the result by council_district.

  • Suddividi le domande complesse. Per i processi in più passaggi, valuta la possibilità di formulare il prompt in modo chiaro con parti distinte o di utilizzare prompt separati per ogni passaggio principale. Ad esempio, di' First, find the top five busiest stations by trip count. Second, calculate the average trip duration for trips starting from only those top five stations.

  • Indica chiaramente i calcoli. Specifica il calcolo scelto, ad esempio SUM, MAX o AVERAGE. Ad esempio, di' Find the MAX trip duration per bike_id.

  • Utilizza le istruzioni di sistema per contesto e preferenze persistenti. Utilizza le istruzioni di sistema per indicare le regole relative alle informazioni e le preferenze che si applicano a tutti i prompt.

  • Rivedi il canvas. Rivedi sempre i nodi generati per verificare che la logica sia in linea con la tua richiesta e che i risultati siano accurati.

  • Esperimento. Prova diverse formulazioni, livelli di dettaglio e strutture dei prompt per scoprire come l'assistente risponde alle tue esigenze specifiche di dati e analisi.

  • Fai riferimento ai nomi delle colonne. Se possibile, utilizza i nomi delle colonne effettivi dei dati selezionati. Ad esempio, invece di Show trips by subscriber type, di' Show the count of trips grouped by subscriber_type and start_station_name.

Flusso di lavoro di esempio: lavorare con un assistente Gemini

In questo esempio, utilizzerai prompt in linguaggio naturale con l'assistente Gemini per trovare, interrogare e visualizzare i dati.

  1. Nella console Google Cloud , vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nell'editor di query, accanto a Query SQL, fai clic su Crea nuovo e poi su Area dati.

    Icona Crea canvas di dati.

  3. Fai clic su Cerca i dati.

  4. Fai clic su filter_list Modifica filtri di ricerca, quindi, nel riquadro Filtra ricerca, fai clic sul pulsante di attivazione/disattivazione Set di dati pubblici BigQuery per attivarlo.

  5. Nel campo del prompt Linguaggio naturale, inserisci il seguente prompt in linguaggio naturale:

    bikeshare
    

    Il canvas dei dati BigQuery genera un elenco di potenziali tabelle in base ai metadati di Dataplex Universal Catalog. Puoi selezionare più tabelle.

  6. Seleziona la tabella bigquery-public-data.austin_bikeshare.bikeshare_stations e bigquery-public-data.austin_bikeshare.bikeshare_trips, poi fai clic su Aggiungi al canvas.

    Al canvas dei dati BigQuery viene aggiunto un nodo tabella per ciascuna delle tabelle selezionate. Per visualizzare le informazioni sullo schema, i dettagli della tabella o l'anteprima dei dati, seleziona le varie schede nel nodo della tabella.

  7. Per aprire l'assistente, fai clic su Scintilla Apri assistente Data Canvas nel canvas dei dati.

  8. Fai clic su Impostazioni.

  9. Nel campo Istruzioni, aggiungi le seguenti istruzioni per l'assistente:

    Tasks:
      - Visualize findings with charts
      - Show many charts per question
      - Make sure to cover each part via a separate line of reasoning
    
  10. Chiudi il riquadro Impostazioni dell'assistente Canvas.

  11. Nel campo Poni una domanda sui dati, inserisci il seguente prompt in linguaggio naturale:

    Show the number of trips by council district and subscriber type
    
  12. Puoi continuare a inserire prompt nel campo Poni una domanda sui dati. Inserisci il seguente prompt in linguaggio naturale:

    What are most popular stations among the top 5 subscriber types
    
  13. Inserisci il prompt finale:

    What station is least used to start and end a trip
    

    Una volta inseriti tutti i prompt pertinenti, il canvas viene compilato con i nodi di query e visualizzazione pertinenti in base ai prompt e alle istruzioni che hai fornito all'assistente. Continua a inserire prompt o a modificare quelli esistenti per ottenere i risultati che stai cercando.

Visualizza tutti i canvas di dati

Per visualizzare un elenco di tutti i canvas di dati nel tuo progetto:

  1. Nella console Google Cloud , vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, fai clic su Visualizza azioni accanto a Canvas di dati, quindi esegui una delle seguenti operazioni:

  • Per aprire l'elenco nella scheda corrente, fai clic su Mostra tutto.
  • Per aprire l'elenco in una nuova scheda, fai clic su Mostra tutto in > Nuova scheda.
  • Per aprire l'elenco in una scheda suddivisa, fai clic su Mostra tutto in > Scheda suddivisa.

Visualizzare i metadati del canvas di dati

Per visualizzare i metadati del canvas dei dati:

  1. Nella console Google Cloud , vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas dei dati di cui vuoi visualizzare i metadati.

  3. Esamina il riquadro Riepilogo per visualizzare informazioni sul canvas dei dati, ad esempio la regione che utilizza e la data dell'ultima modifica.

Utilizzare le versioni del data canvas

Puoi scegliere di creare un canvas di dati all'interno o all'esterno di un repository. Il controllo delle versioni del canvas di dati viene gestito in modo diverso a seconda della posizione del canvas di dati.

Controllo delle versioni del data canvas nei repository

I repository sono repository Git che si trovano in BigQuery o presso un provider di terze parti. Puoi utilizzare gli spazi di lavoro nei repository per eseguire il controllo delle versioni sui canvas di dati. Per saperne di più, vedi Utilizzare il controllo delle versioni con un file.

Controllo delle versioni di Data Canvas al di fuori dei repository

Puoi visualizzare, confrontare e ripristinare le versioni di un canvas di dati.

Visualizzare e confrontare le versioni del data canvas

Per visualizzare diverse versioni di un canvas di dati e confrontarle con la versione attuale, procedi nel seguente modo:

  1. Nella console Google Cloud , vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas di dati di cui vuoi visualizzare l'attività.

  3. Fai clic su Cronologia delle versioni per visualizzare un elenco delle versioni del canvas dei dati in ordine decrescente per data.

  4. Fai clic su Visualizza azioni accanto a una versione del canvas dei dati, quindi fai clic su Confronta. Si apre il riquadro di confronto, che confronta la versione del canvas dei dati che hai selezionato con la versione attuale.

  5. (Facoltativo) Per confrontare le versioni in linea anziché in riquadri separati, fai clic su Confronta e poi su In linea.

Ripristinare una versione del canvas di dati

Il ripristino dal riquadro di confronto ti consente di confrontare la versione precedente del canvas dei dati con la versione attuale prima di scegliere se ripristinarla.

  1. Nel riquadro Explorer, espandi il progetto e la cartella Canvas di dati e, se necessario, la cartella Canvas di dati condivisi. Fai clic sul nome del canvas dei dati di cui vuoi ripristinare una versione precedente.
  2. Fai clic su Cronologia delle versioni.
  3. Fai clic su Visualizza azioni accanto alla versione del canvas dei dati che vuoi ripristinare, quindi fai clic su Confronta.

    Si apre il riquadro di confronto, che mette a confronto la versione del canvas dei dati selezionata con la versione più recente.

  4. Per ripristinare la versione precedente del canvas dei dati dopo il confronto, fai clic su Ripristina.

  5. Fai clic su Conferma.

Gestisci i metadati in Dataplex Universal Catalog

Dataplex Universal Catalog consente di visualizzare e gestire i metadati per i canvas di dati. I canvas di dati sono disponibili in Dataplex Universal Catalog per impostazione predefinita, senza configurazione aggiuntiva.

Puoi utilizzare Dataplex Universal Catalog per gestire i canvas di dati in tutte le posizioni BigQuery. La gestione dei canvas di dati in Dataplex Universal Catalog è soggetta a quote e limiti di Dataplex Universal Catalog e ai prezzi di Dataplex Universal Catalog.

Il Catalogo universale Dataplex recupera automaticamente i seguenti metadati dai canvas di dati:

  • Nome dell'asset di dati
  • Asset di dati padre
  • Posizione dell'asset di dati
  • Tipo di asset di dati
  • Progetto Google Cloud corrispondente

Dataplex Universal Catalog registra i canvas di dati come voci con i seguenti valori delle voci:

Gruppo di voci di sistema
Il gruppo di voci di sistema per i canvas di dati è @dataform. Per visualizzare i dettagli delle voci del canvas di dati in Dataplex Universal Catalog, devi visualizzare il gruppo di voci di sistema dataform. Per istruzioni su come visualizzare un elenco di tutte le voci in un gruppo di voci, consulta Visualizzare i dettagli di un gruppo di voci nella documentazione di Dataplex Universal Catalog.
Tipo di voce di sistema
Il tipo di voce di sistema per i canvas di dati è dataform-code-asset. Per visualizzare i dettagli dei canvas di dati, devi visualizzare il tipo di voce di sistema dataform-code-asset, filtrare i risultati con un filtro basato sugli aspetti e impostare il campo type all'interno dell'aspetto dataform-code-asset su DATA_CANVAS. Quindi, seleziona una voce del canvas dei dati selezionato. Per istruzioni su come visualizzare i dettagli di un tipo di voce selezionato, consulta Visualizzare i dettagli di un tipo di voce nella documentazione di Dataplex Universal Catalog. Per istruzioni su come visualizzare i dettagli di una voce selezionata, consulta Visualizzare i dettagli di una voce nella documentazione di Dataplex Universal Catalog.
Tipo di aspetto del sistema
Il tipo di aspetto di sistema per i canvas di dati è dataform-code-asset. Per fornire un contesto aggiuntivo ai canvas di dati in Dataplex Universal Catalog annotando le voci del canvas di dati con aspetti, visualizza il tipo di aspetto dataform-code-asset, filtra i risultati con un filtro basato sugli aspetti e imposta il campo type all'interno dell'aspetto dataform-code-asset su DATA_CANVAS. Per istruzioni su come annotare le voci con gli aspetti, consulta Gestire gli aspetti e arricchire i metadati nella documentazione di Dataplex Universal Catalog.
Tipo
Il tipo per i canvas di dati è DATA_CANVAS. Questo tipo ti consente di filtrare i canvas di dati nel tipo di voce di sistema dataform-code-asset e nel tipo di aspetto dataform-code-asset utilizzando la query aspect:dataplex-types.global.dataform-code-asset.type=DATA_CANVAS in un filtro basato sugli aspetti.

Per istruzioni su come cercare asset in Dataplex Universal Catalog, consulta Cercare asset di dati in Dataplex Universal Catalog nella documentazione di Dataplex Universal Catalog.

Prezzi

Per informazioni dettagliate sui prezzi di questa funzionalità, consulta la panoramica dei prezzi di Gemini in BigQuery.

Quote e limiti

Per informazioni su quote e limiti per questa funzionalità, vedi Quote per Gemini in BigQuery.

Località

Puoi utilizzare il canvas di dati BigQuery in tutte le località BigQuery. Gemini in BigQuery opera a livello globale, quindi non puoi limitare il trattamento dei dati a una regione specifica. Per scoprire di più sulle località in cui Gemini in BigQuery elabora i dati, consulta Località di pubblicazione di Gemini.

Invia il tuo feedback

Puoi contribuire a migliorare i suggerimenti del canvas di dati BigQuery inviando feedback a Google. Per fornire un feedback:

  1. Nella barra degli strumenti della console Google Cloud , fai clic su Invia feedback.

  2. (Facoltativo) Per copiare le informazioni JSON del DAG e fornire un contesto aggiuntivo al tuo feedback, fai clic su Copia.

  3. Per compilare il modulo e fornire un feedback, fai clic su modulo.

Le impostazioni di condivisione dei dati si applicano all'intero progetto e possono essere impostate solo da un amministratore del progetto con le autorizzazioni IAM serviceusage.services.enable e serviceusage.services.list. Per ulteriori informazioni sull'utilizzo dei dati nel programma Trusted Tester, vedi Gemini nel programma Trusted Tester di Google Cloud .

Per fornire un feedback diretto su questa funzionalità, puoi anche contattare datacanvas-feedback@google.com.

Passaggi successivi