Mit BigQuery Data Canvas analysieren
In diesem Dokument wird beschrieben, wie Sie Data Canvas für die Datenanalyse verwenden. Sie können Metadaten für Data Canvas auch mit Dataplex verwalten.
Mit dem Data Canvas von BigQuery Studio, einem Feature von Gemini in BigQuery, können Sie Daten mithilfe natürlicher Sprach-Prompts und einer grafischen Benutzeroberfläche für Analyse-Workflows Daten transformieren, abfragen und visualisieren.
Für Analyse-Workflows verwendet BigQuery Data Canvas einen gerichteten azyklischen Graphen (Directed Acyclic Graph, DAG), der eine grafische Ansicht des Workflows bietet. Im BigQuery-Data-Canvas können Sie zentralisiert Abfrageergebnisse iterieren und mit mehreren Abfragezweigen arbeiten.
Der BigQuery-Daten-Canvas soll Analyseaufgaben beschleunigen und Datenexperten wie Datenanalysten, Dateningenieure und andere bei der Umwandlung von Daten in Erkenntnisse unterstützen. Sie benötigen keine technischen Kenntnisse zu bestimmten Tools, sondern nur grundlegende Kenntnisse zum Lesen und Schreiben von SQL. Der Daten-Canvas in BigQuery funktioniert mit Dataplex-Metadaten zur Identifizierung entsprechender Tabellen auf Basis natürlicher Sprache.
Das BigQuery-Daten-Canvas ist nicht für die direkte Verwendung durch Geschäftsnutzer gedacht.
BigQuery-Daten-Canvas verwendet Gemini in BigQuery, um Ihre Daten zu suchen, SQL zu erstellen, Diagramme zu generieren und Datenzusammenfassungen auszugeben.
Weitere Informationen dazu, wie und wann Gemini für Google Cloud Ihre Daten verwendet
Leistungsspektrum
Mit BigQuery-Daten-Canvas haben Sie folgende Möglichkeiten:
Verwenden Sie Suchanfragen in natürlicher Sprache oder die Syntax für die Keyword-Suche mit Dataplex-Metadaten, um Assets wie Tabellen, Ansichten oder materialisierte Ansichten zu finden.
Verwenden Sie natürliche Sprache für grundlegende SQL-Abfragen wie die folgenden:
- Abfragen mit
FROM
-Klauseln, mathematischen Funktionen, Arrays und Strukturen JOIN
-Vorgänge für zwei Tabellen.
- Abfragen mit
Sie können benutzerdefinierte Visualisierungen erstellen, indem Sie Ihre Anforderungen in natürlicher Sprache beschreiben.
Automatische Datenerkenntnisse
Beschränkungen
Befehle in natürlicher Sprache funktionieren möglicherweise nicht gut mit folgenden Elementen:
- BigQuery ML
- Apache Spark
- Objekttabellen
- BigLake
INFORMATION_SCHEMA
Ansichten- JSON
- Verschachtelte und wiederkehrende Felder
- Komplexe Funktionen und Datentypen wie
DATETIME
undTIMEZONE
Datenvisualisierungen funktionieren nicht mit Geokartendiagrammen.
Best Practices für Prompts
Mit den richtigen Prompt-Techniken können Sie komplexe SQL-Abfragen generieren. Mit den folgenden Vorschlägen können Sie im BigQuery-Data Canvas Ihre Prompts in natürlicher Sprache optimieren, um die Genauigkeit Ihrer Abfragen zu erhöhen:
Schreiben Sie klar und verständlich. Formulieren Sie Ihre Anfrage klar und vermeiden Sie Unklarheiten.
Stellen Sie direkte Fragen. Die genauesten Antworten erhalten Sie, wenn Sie jeweils nur eine Frage stellen und Ihre Prompts prägnant formulieren. Wenn Sie ursprünglich einen Prompt mit mehreren Fragen gegeben haben, listen Sie jeden einzelnen Teil der Frage auf, damit Gemini sie verstehen kann.
Geben Sie klare und eindeutige Anweisungen. Heben Sie wichtige Begriffe in Ihren Prompts hervor.
Geben Sie die Operatorrangfolge an. Geben Sie die Anleitung klar und geordnet an. Aufgaben in kleine, fokussierte Schritte aufteilen
Optimieren und iterieren. Probieren Sie verschiedene Formulierungen und Ansätze aus, um herauszufinden, was die besten Ergebnisse erzielt.
Weitere Informationen finden Sie unter Best Practices für Prompts für BigQuery-Datenpläne.
Hinweise
- Achten Sie darauf, dass Gemini in BigQuery für Ihr Google Cloud -Projekt aktiviert ist. Dieser Schritt wird in der Regel von einem Administrator ausgeführt.
- Sie benötigen die erforderliche IAM-Berechtigungen (Identity and Access Management), um den BigQuery-Daten-Canvas zu verwenden.
- Wenn Sie Daten-Canvas-Metadaten in Dataplex verwalten möchten, muss die Dataplex API in Ihrem Google Cloud Projekt aktiviert sein.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zur Verwendung von BigQuery-Daten-Canvas benötigen:
-
BigQuery Studio User (
roles/bigquery.studioUser
) -
Gemini für Google Cloud-Nutzer (
roles/cloudaicompanion.user
)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Weitere Informationen zu IAM-Rollen und Berechtigungen in BigQuery finden Sie unter Einführung in IAM.
Wenn Sie Data Canvas-Metadaten in Dataplex verwalten möchten, benötigen Sie die erforderlichen Dataplex-Rollen und die Berechtigung dataform.repositories.get
.
Knotentypen
Ein Canvas besteht aus einem oder mehreren Knoten. Knoten können in beliebiger Reihenfolge verbunden werden. BigQuery-Daten-Canvas hat die folgenden Knotentypen:
- Text
- Suchen
- Tabelle
- SQL
- Visualisierung
- Statistiken
Textknoten
Mit einem Textknoten können Sie Ihrem BigQuery-Daten-Canvas Rich-Text-Inhalte hinzufügen. Sie können damit Ihrem Canvas Erklärungen, Notizen oder Anleitungen hinzufügen, damit Sie und andere den Kontext und Zweck Ihrer Analyse leichter nachvollziehen können. Sie können beliebigen Text in den Textknoten-Editor eingeben, einschließlich Markdown für die Formatierung. So können Sie visuell ansprechende und informative Textblöcke erstellen.
Im Textknoten haben Sie folgende Möglichkeiten:
- Löschen Sie den Knoten.
- Den Knoten debuggen.
- Duplizieren Sie den Knoten.
Suchknoten
Im BigQuery-Daten-Canvas können Sie mit einem Suchknoten Daten-Assets finden und in Ihr Canvas einbinden. Er dient als Brücke zwischen Ihren Abfragen in natürlicher Sprache oder Suchbegriffen und den tatsächlichen Daten, mit denen Sie arbeiten möchten.
Sie geben eine Suchanfrage ein, entweder in natürlicher Sprache oder mithilfe von Suchbegriffen. Über den Suchknoten werden Ihre Datenassets durchsucht. Dabei werden Dataplex-Metadaten für eine bessere Kontexterkennung genutzt. Im BigQuery-Daten-Canvas werden auch kürzlich verwendete Tabellen, Abfragen und gespeicherte Abfragen vorgeschlagen.
Der Suchknoten gibt eine Liste relevanter Daten-Assets zurück, die Ihrer Suchanfrage entsprechen. Dabei werden Spaltennamen und Tabellenbeschreibungen berücksichtigt. Sie können dann die Assets auswählen, die Sie Ihrem Datencanvas als Tabellenknoten hinzufügen möchten. Dort können Sie die Daten weiter analysieren und visualisieren.
Über den Suchknoten haben Sie folgende Möglichkeiten:
- Löschen Sie den Knoten.
- Den Knoten debuggen.
- Duplizieren Sie den Knoten.
Tabellenknoten
Im BigQuery-Daten-Canvas steht ein Tabellenknoten für eine bestimmte Tabelle, die Sie in Ihren Analyse-Workflow aufgenommen haben. Sie repräsentiert die Daten, mit denen Sie arbeiten, und ermöglicht es Ihnen, direkt mit ihnen zu interagieren.
Ein Tabellenknoten enthält Informationen zur Tabelle, z. B. ihren Namen, ihr Schema und eine Vorschau der Daten. Sie können mit der Tabelle interagieren, indem Sie Details wie das Tabellenschema, Tabellendetails und eine Tabellenvorschau aufrufen.
Über den Tabellenknoten haben Sie folgende Möglichkeiten:
- Löschen Sie den Knoten.
- Den Knoten debuggen.
- Duplizieren Sie den Knoten.
- Führen Sie den Knoten aus.
- Führen Sie den Knoten und den folgenden Knoten aus.
Im Datencanvas haben Sie folgende Möglichkeiten:
- Erstellen Sie eine Abfrage für die Ergebnisse in einem neuen SQL-Knoten.
- Verknüpfen Sie die Ergebnisse mit einer anderen Tabelle.
SQL-Knoten
In BigQuery Data Canvas können Sie mit einem SQL-Knoten benutzerdefinierte SQL-Abfragen direkt in Ihrem Canvas ausführen. Sie können SQL-Code entweder direkt im SQL-Node-Editor schreiben oder SQL mit einem Prompt in natürlicher Sprache generieren.
Der SQL-Knoten führt die angegebene SQL-Abfrage für die angegebenen Datenquellen aus. Der SQL-Knoten generiert eine Ergebnistabelle, die dann für weitere Analysen oder Visualisierungen mit anderen Knoten im Canvas verbunden werden kann.
Nachdem die Abfrage ausgeführt wurde, können Sie sie als geplante Abfrage, Abfrageergebnisse oder Canvas exportieren. Das funktioniert ähnlich wie beim Ausführen einer interaktiven Abfrage.
Über den SQL-Knoten haben Sie folgende Möglichkeiten:
- Exportieren Sie die SQL-Anweisung als geplante Abfrage.
- Löschen Sie den Knoten.
- Den Knoten debuggen.
- Duplizieren Sie den Knoten.
- Führen Sie den Knoten aus.
- Führen Sie den Knoten und den folgenden Knoten aus.
Im Datencanvas haben Sie folgende Möglichkeiten:
- Erstellen Sie eine Abfrage für die Ergebnisse in einem neuen SQL-Knoten.
- Visualisieren Sie die Ergebnisse in einem Visualisierungsknoten.
- In einem Statistikknoten Statistiken zu den Ergebnissen generieren
- Verknüpfen Sie die Ergebnisse mit einer anderen Tabelle.
Visualisierungsknoten
In BigQuery Data Canvas können Sie mit einem Visualisierungsknoten Daten visuell darstellen, um Trends, Muster und Statistiken leichter zu verstehen. Es bietet eine Vielzahl von Diagrammtypen, mit denen Sie die für Ihre Daten am besten geeignete Visualisierung auswählen und anpassen können.
Ein Visualisierungsknoten nimmt eine Tabelle als Eingabe an, die das Ergebnis einer SQL-Abfrage oder eines Tabellenknotens sein kann. Basierend auf dem ausgewählten Diagrammtyp und den Daten in der Eingabetabelle generiert der Visualisierungsknoten ein Diagramm. Sie können Automatisches Diagramm auswählen, damit BigQuery den für Ihre Daten am besten geeigneten Diagrammtyp auswählt. Der Visualisierungsknoten zeigt dann das generierte Diagramm an.
Mit dem Visualisierungsknoten können Sie Ihr Diagramm anpassen, z. B. Farben, Labels und Datenquellen ändern. Sie können das Diagramm auch als PNG-Datei exportieren.
Sie können Daten mithilfe der folgenden Grafiktypen visualisieren:
- Balkendiagramm
- Heatmap
- Liniendiagramm
- Kreisdiagramm
- Streudiagramm
Über den Visualisierungsknoten haben Sie folgende Möglichkeiten:
- Exportieren Sie das Diagramm als PNG-Datei.
- Den Knoten debuggen.
- Duplizieren Sie den Knoten.
- Führen Sie den Knoten aus.
- Führen Sie den Knoten und den folgenden Knoten aus.
Im Datencanvas haben Sie folgende Möglichkeiten:
- In einem Statistikknoten Statistiken zu den Ergebnissen generieren
- Bearbeiten Sie die Visualisierung.
Statistikknoten
Im BigQuery-Daten-Canvas können Sie mit einem Knoten für Statistiken Statistiken und Zusammenfassungen aus den Daten in Ihrem Daten-Canvas generieren. So können Sie Muster erkennen, die Datenqualität bewerten und statistische Analysen auf Ihrem Canvas ausführen. Sie identifiziert Trends, Muster, Anomalien und Korrelationen in Ihren Daten und generiert kompakte und übersichtliche Zusammenfassungen der Ergebnisse der Datenanalyse.
Weitere Informationen zu Data Insights finden Sie unter Data Insights in BigQuery generieren.
Über den Knoten „Statistiken“ haben Sie folgende Möglichkeiten:
- Löschen Sie den Knoten.
- Duplizieren Sie den Knoten.
- Führen Sie den Knoten aus.
BigQuery-Daten-Canvas verwenden
Sie können den BigQuery-Datencanvas in der Google Cloud Konsole, in einer Abfrage oder in einer Tabelle verwenden.
Rufen Sie die Seite BigQuery auf.
Klicken Sie im Abfrageeditor neben
SQL-Abfrage auf Neu erstellen und dann auf Datenplakat.Geben Sie im Feld Natürliche Sprache einen Prompt in natürlicher Sprache ein.
Wenn Sie beispielsweise
Find me tables related to trees
eingeben, gibt das BigQuery-Daten-Canvas eine Liste möglicher Tabellen zurück, einschließlich öffentlicher Datasets wiebigquery-public-data.usfs_fia.plot_tree
oderbigquery-public-data.new_york_trees.tree_species
.Wählen Sie eine Tabelle aus.
Dem BigQuery-Daten-Canvas wird ein Tabellenknoten für die ausgewählte Tabelle hinzugefügt. Wenn Sie sich Schemainformationen, Tabellendetails oder eine Datenvorschau ansehen möchten, wählen Sie die verschiedenen Tabs im Tabellenknoten aus.
Die folgenden Beispiele zeigen verschiedene Möglichkeiten, wie Sie das BigQuery-Daten-Canvas in Analyseworkflows verwenden können.
Beispiel für einen Workflow: Daten suchen, abfragen und visualisieren
In diesem Beispiel verwenden Sie Prompts in natürlicher Sprache im BigQuery-Daten-Canvas, um Daten zu finden, eine Abfrage zu generieren und die Abfrage zu bearbeiten. Anschließend erstellen Sie ein Diagramm.
Prompt 1: Daten finden
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Klicken Sie im Abfrageeditor neben
SQL-Abfrage auf Neu erstellen und dann auf Datenplakat.Klicken Sie auf Daten suchen.
Klicken Sie auf filter_list Suchfilter bearbeiten und dann im Bereich Filtersuche auf die Ein/Aus-Schaltfläche für Öffentliche BigQuery-Datasets.
Geben Sie im Feld Natürliche Sprache den folgenden Natural Language Prompt ein:
Chicago taxi trips
Der BigQuery-Daten-Canvas generiert eine Liste potenzieller Tabellen anhand von Dataplex-Metadaten. Sie können mehrere Tabellen auswählen.
Wählen Sie die Tabelle
bigquery-public-data.chicago_taxi_trips.taxi_trips
aus und klicken Sie dann auf Zum Canvas hinzufügen.Dem BigQuery-Daten-Canvas wird ein Tabellenknoten für
taxi_trips
hinzugefügt. Wenn Sie sich Schemainformationen, Tabellendetails oder eine Datenvorschau ansehen möchten, wählen Sie die verschiedenen Tabs im Tabellenknoten aus.
Prompt 2: SQL-Abfrage in der ausgewählten Tabelle generieren
Um eine SQL-Abfrage für den
bigquery-public-data.chicago_taxi_trips.taxi_trips
zu erstellen, gehen Sie so vor:
Klicken Sie im Daten-Canvas auf Abfrage.
Geben Sie im Prompt-Feld Natürliche Sprache Folgendes ein:
Get me the 100 longest trips
Das BigQuery-Daten-Canvas generiert eine SQL-Abfrage, die etwa so aussieht:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `bigquery-public-data.chicago_taxi_trips.taxi_trips` ORDER BY trip_miles DESC LIMIT 100;
Prompt 3: Abfrage bearbeiten
Sie können die generierte Abfrage manuell bearbeiten oder die Eingabeaufforderung in natürlicher Sprache ändern und die Abfrage neu generieren. In diesem Beispiel bearbeiten Sie die Abfrage mit einem Prompt in natürlicher Sprache, um nur Fahrten auszuwählen, bei denen der Kunde bar bezahlt hat.
Geben Sie im Prompt-Feld Natürliche Sprache Folgendes ein:
Get me the 100 longest trips where the payment type is cash
Das BigQuery-Daten-Canvas generiert eine SQL-Abfrage, die etwa so aussieht:
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips` WHERE payment_type = 'Cash' ORDER BY trip_miles DESC LIMIT 100;
Im vorherigen Beispiel ist
PROJECT_ID
die ID Ihres Google Cloud Projekts.Klicken Sie auf Ausführen, um die Ergebnisse der Abfrage aufzurufen.
Diagramme erstellen
- Klicken Sie im Daten-Canvas auf Visualisieren.
Klicken Sie auf Balkendiagramm erstellen.
Der BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das die Fahrten mit den meisten gefahrenen Kilometer nach Fahrt-ID anzeigt. Neben einem Diagramm werden in BigQuery Data Canvas einige der wichtigsten Details der Daten zusammengefasst, die der Visualisierung zugrunde liegen.
Optional: Führen Sie eine oder mehrere der folgenden Aktionen aus:
- Klicken Sie zum Ändern des Diagramms auf Bearbeiten und bearbeiten Sie dann das Diagramm im Bereich Visualisierung bearbeiten.
- Wenn Sie das Daten-Canvas freigeben möchten, klicken Sie auf Freigeben und dann auf Link freigeben, um den BigQuery-Daten-Canvas-Link zu kopieren.
- Wählen Sie zum Bereinigen des Daten-Canvas Weitere Aktionen und dann Canvas löschen aus. Dadurch wird ein leeres Canvas erstellt.
Beispiel für einen Workflow: Tabellen zusammenführen
In diesem Beispiel verwenden Sie Prompts in natürlicher Sprache im BigQuery-Daten-Canvas, um Daten zu finden und Tabellen zusammenzuführen. Anschließend exportieren Sie eine Abfrage als Notebook.
Prompt 1: Daten finden
Geben Sie im Feld Natürliche Sprache den folgenden Prompt ein:
Information about trees
Das BigQuery-Daten-Canvas schlägt mehrere Tabellen mit Informationen zu Bäumen vor.
Wählen Sie in diesem Beispiel die Tabelle
bigquery-public-data.new_york_trees.tree_census_1995
aus und klicken Sie dann auf Zum Canvas hinzufügen.Die Tabelle wird auf dem Canvas angezeigt.
Prompt 2: Tabellen unter ihrer Adresse zusammenführen
Klicken Sie im Daten-Canvas auf Join (Zusammenführen).
BigQuery-Daten-Canvas schlägt Tabellen vor, die zusammengeführt werden könnten.
Wenn Sie ein neues Prompt-Feld für natürliche Sprache öffnen möchten, klicken Sie auf Nach Tabellen suchen.
Geben Sie im Feld Natürliche Sprache den folgenden Prompt ein:
Information about trees
Wählen Sie die Tabelle
bigquery-public-data.new_york_trees.tree_census_2005
aus und klicken Sie dann auf Zum Canvas hinzufügen.Die Tabelle wird auf dem Canvas angezeigt.
Klicken Sie im Daten-Canvas auf Join (Zusammenführen).
Klicken Sie im Bereich Auf diesem Canvas das Kästchen Tabellenzelle an und klicken Sie dann auf OK.
Geben Sie im Feld Natürliche Sprache den folgenden Prompt ein:
Join on address
BigQuery-Daten-Canvas schlägt eine SQL-Abfrage vor, um diese beiden Tabellen anhand ihrer Adresse zusammenzuführen.
SELECT * FROM `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015 JOIN `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995 ON t2015.address = t1995.address;
Klicken Sie auf Ausführen, um die Abfrage auszuführen und die Ergebnisse anzusehen.
Abfrage als Notebook exportieren
Mit BigQuery-Daten-Canvas können Sie Ihre Abfragen als Notebook exportieren.
- Klicken Sie im Daten-Canvas auf Als Notebook exportieren.
- Geben Sie im Bereich Notebook speichern den Namen des Notebooks und die Region ein, in der Sie es speichern möchten.
- Klicken Sie auf Speichern. Das Notebook wird erstellt.
- Optional: Klicken Sie auf Öffnen, um das erstellte Notizbuch aufzurufen.
Beispiel für einen Workflow: Diagramm mithilfe eines Prompts bearbeiten
In diesem Beispiel verwenden Sie Prompts in natürlicher Sprache im BigQuery-Daten-Canvas, um Daten zu finden, abzufragen und zu filtern und dann die Details der Visualisierung zu bearbeiten.
Prompt 1: Daten finden
Wenn Sie Daten zu US-Namen finden möchten, geben Sie Folgendes ein:
Find data about USA names
Mit dem BigQuery-Daten-Canvas wird eine Liste von Tabellen generiert.
Wählen Sie in diesem Beispiel die Tabelle
bigquery-public-data.usa_names.usa_1910_current
aus und klicken Sie dann auf Zum Canvas hinzufügen.
Prompt 2: Daten abfragen
Klicken Sie im Daten-Canvas auf Abfrage und geben Sie dann den folgenden Prompt ein:
Summarize this data
Das BigQuery-Daten-Canvas generiert eine Abfrage, die etwa so aussieht:
SELECT state, gender, year, name, number FROM `bigquery-public-data.usa_names.usa_1910_current`
Klicken Sie auf Ausführen. Die Abfrageergebnisse werden angezeigt.
Prompt 3: Daten filtern
- Klicken Sie im Daten-Canvas auf Diese Ergebnisse abfragen.
Geben Sie im Prompt-Feld SQL den folgenden Prompt ein, um die Daten zu filtern:
Get me the top 10 most popular names in 1980
Das BigQuery-Daten-Canvas generiert eine Abfrage, die etwa so aussieht:
SELECT name, SUM(number) AS total_count FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE year = 1980 GROUP BY name ORDER BY total_count DESC LIMIT 10;
Wenn Sie die Abfrage ausführen, erhalten Sie eine Tabelle mit den zehn häufigsten Namen von Kindern, die 1980 geboren wurden.
Diagramme erstellen und bearbeiten
Klicken Sie im Daten-Canvas auf Visualisieren.
Im BigQuery-Daten-Canvas werden verschiedene Visualisierungsoptionen vorgeschlagen (Balkendiagramm, Kreisdiagramm, Liniendiagramm, benutzerdefinierte Visualisierung usw.).
Klicken Sie in diesem Beispiel auf Balkendiagramm erstellen.
Das BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das etwa so aussieht:
Neben einem Diagramm enthält der BigQuery-Daten-Canvas einige der wichtigsten Details zu den Daten, die der Visualisierung zugrunde liegen. Um das Diagramm anzupassen, klicken Sie auf Visualisierungsdetails und bearbeiten das Diagramm in der Seitenleiste.
Prompt 4: Visualisierungsdetails bearbeiten
Geben Sie im Prompt-Feld Visualisierung Folgendes ein:
Create a bar chart sorted high to low, with a gradient
Das BigQuery-Daten-Canvas erstellt ein Balkendiagramm, das etwa so aussieht:
Optional: Wenn Sie weitere Änderungen vornehmen möchten, klicken Sie auf Bearbeiten.
Der Bereich Visualisierung bearbeiten wird angezeigt. Sie können Details wie den Diagrammtitel, den Namen der X-Achse und den Namen der Y-Achse bearbeiten. Wenn Sie auf den Tab JSON-Editor klicken, können Sie außerdem basierend auf den JSON-Werten direkt Änderungen am Diagramm vornehmen.
Mit einem Gemini-Assistenten arbeiten
Sie können einen Gemini-basierten Chat verwenden, um mit dem BigQuery-Daten-Canvas zu arbeiten. Der Chatassistent kann Knoten basierend auf Ihren Anfragen erstellen, Abfragen ausführen und Visualisierungen erstellen. Sie können Tabellen für den Assistenten auswählen und ihm Anweisungen hinzufügen, um sein Verhalten zu steuern. Der Assistant funktioniert mit neuen oder vorhandenen Datencanvases.
So verwenden Sie den Gemini-Assistenten:
- Klicken Sie auf dem Data Canvas auf Spark Data Canvas-Assistenten öffnen, um den Assistenten zu öffnen.
Geben Sie im Feld Datenfrage stellen einen Prompt in natürlicher Sprache ein, z. B. einen der folgenden:
Show me interesting statistics of my data.
Make a chart based on my data, sorted high to low.
I want to see sample data from my table.
Die Antwort enthält einen oder mehrere Knoten, die auf der Anfrage basieren. Wenn Sie den Assistant beispielsweise bitten, ein Diagramm Ihrer Daten zu erstellen, wird ein Visualisierungsknoten auf dem Datencanvas erstellt.
Wenn Sie auf das Feld Datenfrage stellen klicken, haben Sie folgende Möglichkeiten:
- Klicken Sie auf Einstellungen, um Daten hinzuzufügen.
- Klicken Sie auf Einstellungen, um eine Anleitung hinzuzufügen.
Wenn Sie mit dem Assistenten weiterarbeiten möchten, fügen Sie weitere Prompts in natürlicher Sprache hinzu.
Sie können weiterhin Prompts in natürlicher Sprache eingeben, während Sie mit dem Datencanvas arbeiten.
Daten hinzufügen
Wenn Sie mit der Gemini-Chatoberfläche arbeiten, können Sie Daten hinzufügen, damit der Assistant weiß, auf welchen Datensatz er verweisen soll. Der Assistant fordert Sie auf, eine Tabelle auszuwählen, bevor Sie Prompts ausführen. Wenn Sie im Assistant nach Daten suchen, können Sie den Umfang der suchbaren Daten auf alle Projekte, markierte Projekte oder Ihr aktuelles Projekt beschränken. Sie können auch festlegen, ob öffentliche Datasets in die Suche einbezogen werden sollen.
So fügen Sie dem Gemini-Assistenten Daten hinzu:
- Klicken Sie auf dem Data Canvas auf Spark Data Canvas-Assistenten öffnen, um den Assistenten zu öffnen.
- Klicken Sie auf Einstellungen und dann auf Daten hinzufügen.
- Optional: Wenn Sie die Suchergebnisse um öffentliche Datasets erweitern möchten, klicken Sie auf die Ein-/Aus-Schaltfläche Öffentliche Datasets.
- Optional: Wenn Sie den Umfang der Suchergebnisse auf andere Projekte ändern möchten, wählen Sie im Menü Umfang die entsprechende Projektoption aus.
- Klicken Sie das Kästchen für jede Tabelle an, die Sie dem Assistenten hinzufügen möchten.
- Wenn Sie nach Tabellen suchen möchten, die nicht vom Assistant vorgeschlagen werden, klicken Sie auf Nach Tabellen suchen.
- Geben Sie im Feld Natürliche Sprache einen Prompt ein, der die gesuchte Tabelle beschreibt, und drücken Sie dann die Eingabetaste.
- Klicken Sie die Kästchen für alle Tabellen an, die Sie dem Assistenten hinzufügen möchten, und klicken Sie dann auf OK.
- Schließen Sie den Bereich Einstellungen für Canvas-Assistenten.
Die Analyse basiert auf den von Ihnen ausgewählten Daten.
Anleitung hinzufügen
Wenn Sie mit der Gemini-Chat-Benutzeroberfläche arbeiten, können Sie Anweisungen hinzufügen, damit der Assistent weiß, wie er sich verhalten soll. Diese Anleitung gilt für alle Prompts im Datencanvas. Beispiele für mögliche Anweisungen:
Visualize trends over time.
Chart colors: Red (negative), Green (positive)
Domain: USA
So fügen Sie dem Assistant Anweisungen hinzu:
- Klicken Sie auf dem Data Canvas auf Spark Data Canvas-Assistenten öffnen, um den Assistenten zu öffnen.
- Klicken Sie auf Einstellungen.
- Fügen Sie im Feld Anleitung eine Liste Ihrer Anweisungen für den Assistant hinzu und schließen Sie den Bereich Canvas Assistant-Einstellungen.
Der Assistant merkt sich die Anweisungen und wendet sie auf zukünftige Prompts an.
Best Practices für Gemini Assistant
Beachten Sie die folgenden Best Practices, um bei der Arbeit mit dem BigQuery-Daten-Canvas-Assistenten die besten Ergebnisse zu erzielen:
Sie müssen konkret und eindeutig sein. Geben Sie klar an, was Sie berechnen, analysieren oder visualisieren möchten. Sagen Sie beispielsweise anstelle von
Analyze trip data
Calculate the average trip duration for trips starting in council district eight
.Achten Sie auf den korrekten Datenkontext. Assistant kann nur mit den von Ihnen bereitgestellten Daten arbeiten. Achten Sie darauf, dass dem Canvas alle relevanten Tabellen und Spalten hinzugefügt wurden.
Beginnen Sie einfach und iterieren Sie dann. Beginnen Sie mit einer einfachen Frage, damit der Assistent die grundlegende Struktur und die Daten versteht. Sagen Sie beispielsweise zuerst
Show total trips by
und dannsubscriber_type
Show total trips by
.subscriber_type
and break down the result bycouncil_district
Komplexe Fragen in einzelne Teile zerlegen. Bei mehrstufigen Prozessen sollten Sie Ihren Prompt klar formulieren und in verschiedene Teile unterteilen oder für jeden wichtigen Schritt einen separaten Prompt verwenden. Sagen Sie beispielsweise
First, find the top five busiest stations by trip count. Second, calculate the average trip duration for trips starting from only those top five stations
.Berechnungen klar angeben. Geben Sie die ausgewählte Berechnung an, z. B.
SUM
,MAX
oderAVERAGE
. Sagen Sie beispielsweiseFind the
.MAX
trip duration perbike_id
Verwenden Sie die Systemanweisungen für persistenten Kontext und Einstellungen. Verwenden Sie Systemanweisungen, um Informationsregeln und Einstellungen anzugeben, die für alle Prompts gelten.
Canvas ansehen Prüfen Sie immer die generierten Knoten, um sicherzustellen, dass die Logik Ihrer Anfrage entspricht und die Ergebnisse korrekt sind.
Testen. Probieren Sie verschiedene Formulierungen, Detailebenen und Promptstrukturen aus, um zu erfahren, wie der Assistant auf Ihre spezifischen Daten und Analyseanforderungen reagiert.
Spaltennamen für Verweise Verwenden Sie nach Möglichkeit die tatsächlichen Spaltennamen aus den ausgewählten Daten. Sagen Sie beispielsweise
Show the count of trips grouped by
anstelle vonsubscriber_type
andstart_station_name
Show trips by subscriber type
.
Beispiel-Workflow: Mit einem Gemini-Assistenten arbeiten
In diesem Beispiel verwenden Sie Prompts in natürlicher Sprache mit dem Gemini-Assistenten, um Daten zu finden, abzufragen und zu visualisieren.
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Klicken Sie im Abfrageeditor neben
SQL-Abfrage auf Neu erstellen und dann auf Datenplakat.Klicken Sie auf Daten suchen.
Klicken Sie auf filter_list Suchfilter bearbeiten und dann im Bereich Filtersuche auf die Ein/Aus-Schaltfläche für Öffentliche BigQuery-Datasets.
Geben Sie im Feld Natürliche Sprache den folgenden Natural Language Prompt ein:
bikeshare
Der BigQuery-Daten-Canvas generiert eine Liste potenzieller Tabellen anhand von Dataplex-Metadaten. Sie können mehrere Tabellen auswählen.
Wählen Sie die Tabelle
bigquery-public-data.austin_bikeshare.bikeshare_stations
undbigquery-public-data.austin_bikeshare.bikeshare_trips
aus und klicken Sie dann auf Zum Canvas hinzufügen.Dem BigQuery-Daten-Canvas wird für jede der ausgewählten Tabellen ein Tabellenknoten hinzugefügt. Wenn Sie sich Schemainformationen, Tabellendetails oder eine Datenvorschau ansehen möchten, wählen Sie die verschiedenen Tabs im Tabellenknoten aus.
Klicken Sie auf dem Data Canvas auf Spark Data Canvas-Assistenten öffnen, um den Assistenten zu öffnen.
Klicken Sie auf Einstellungen.
Fügen Sie im Feld Anleitung die folgende Anleitung für den Assistenten hinzu:
Tasks: - Visualize findings with charts - Show many charts per question - Make sure to cover each part via a separate line of reasoning
Schließen Sie den Bereich Einstellungen für Canvas-Assistenten.
Geben Sie in das Feld Datenfrage stellen den folgenden Prompt in natürlicher Sprache ein:
Show the number of trips by council district and subscriber type
Sie können weiterhin Prompts in das Feld Datenfrage stellen eingeben. Geben Sie den folgenden Natural Language Prompt ein:
What are most popular stations among the top 5 subscriber types
Geben Sie den letzten Prompt ein:
What station is least used to start and end a trip
Sobald Sie alle relevanten Prompts gestellt haben, werden Ihre Canvas-Elemente gemäß den Prompts und Anweisungen, die Sie dem Assistenten gegeben haben, mit den relevanten Abfrage- und Visualisierungsknoten gefüllt. Geben Sie weitere Prompts ein oder ändern Sie vorhandene Prompts, um die gewünschten Ergebnisse zu erhalten.
Alle Daten-Canvasse ansehen
So rufen Sie eine Liste aller Datenkanäle in Ihrem Projekt auf:
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Klicken Sie im Bereich Explorer neben Datenpräsentationen auf
Aktionen anzeigen und führen Sie einen der folgenden Schritte aus:
- Wenn Sie die Liste im aktuellen Tab öffnen möchten, klicken Sie auf Alle anzeigen.
- Wenn Sie die Liste in einem neuen Tab öffnen möchten, klicken Sie auf Alle anzeigen in > Neuer Tab.
- Wenn Sie die Liste in einem geteilten Tab öffnen möchten, klicken Sie auf Alle anzeigen in > Tab aufteilen.
Metadaten für Daten-Canvas ansehen
So rufen Sie die Metadaten des Datencanvas auf:
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Datenpräsentationen und gegebenenfalls den Ordner Freigegebene Datenpräsentationen. Klicken Sie auf den Namen des Datencanvas, für den Sie Metadaten aufrufen möchten.
Im Bereich Zusammenfassung finden Sie Informationen zum Datencanvas, z. B. die verwendete Region und das Datum der letzten Änderung.
Mit Data Canvas-Versionen arbeiten
Sie können einen Datencanvas entweder innerhalb oder außerhalb eines Repositorys erstellen. Die Versionierung von Data Canvas wird je nach Speicherort des Data Canvas unterschiedlich behandelt.
Versionierung von Daten-Canvas in Repositories
Repositories sind Git-Repositories, die sich entweder in BigQuery oder bei einem Drittanbieter befinden. Sie können Arbeitsbereiche in Repositories verwenden, um eine Versionskontrolle für Datenkanäle durchzuführen. Weitere Informationen finden Sie unter Versionskontrolle für eine Datei verwenden.
Versionierung von Data Canvas außerhalb von Repositories
Sie können Versionen eines Datencanvas aufrufen, vergleichen und wiederherstellen.
Daten-Canvas-Versionen ansehen und vergleichen
So rufen Sie verschiedene Versionen eines Datencanvas auf und vergleichen sie mit der aktuellen Version:
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Datenpräsentationen und gegebenenfalls den Ordner Freigegebene Datenpräsentationen. Klicken Sie auf den Namen des Datencanvas, für den Sie die Aktivitäten aufrufen möchten.
Klicken Sie auf
Versionsverlauf, um eine Liste der Data Canvas-Versionen in absteigender Reihenfolge nach Datum aufzurufen.Klicken Sie neben einer Data Canvas-Version auf
Aktionen ansehen und dann auf Vergleichen. Der Vergleichsbereich wird geöffnet und die ausgewählte Data Canvas-Version wird mit der aktuellen Data Canvas-Version verglichen.Optional: Wenn Sie die Versionen inline und nicht in separaten Bereichen vergleichen möchten, klicken Sie auf Vergleichen und dann auf Inline.
Daten-Canvas-Version wiederherstellen
Wenn Sie über den Vergleichsbereich wiederherstellen, können Sie die vorherige Version des Datencanvas mit der aktuellen Version vergleichen, bevor Sie entscheiden, ob Sie sie wiederherstellen möchten.
- Maximieren Sie im Bereich Explorer Ihr Projekt und den Ordner Datenpräsentationen und gegebenenfalls den Ordner Freigegebene Datenpräsentationen. Klicken Sie auf den Namen des Datencanvas, von dem Sie eine vorherige Version wiederherstellen möchten.
- Klicken Sie auf Versionsverlauf.
Klicken Sie neben der Version des Datencanvas, die Sie wiederherstellen möchten, auf
Aktionen ansehen und dann auf Vergleichen.Der Vergleichsbereich wird geöffnet und die ausgewählte Data Canvas-Version wird mit der neuesten Data Canvas-Version verglichen.
Wenn Sie nach dem Vergleich die vorherige Data Canvas-Version wiederherstellen möchten, klicken Sie auf Wiederherstellen.
Klicken Sie auf Bestätigen.
Metadaten in Dataplex verwalten
Mit Dataplex können Sie Metadaten für Datencanvasse aufrufen und verwalten. Datenkanäle sind in Dataplex standardmäßig ohne zusätzliche Konfiguration verfügbar.
Mit Dataplex können Sie Datencanvasse an allen BigQuery-Standorten verwalten. Die Verwaltung von Datenkanvas in Dataplex unterliegt den Kontingenten und Limits für Dataplex und den Dataplex-Preisen.
Dataplex ruft automatisch die folgenden Metadaten aus Datenkanvas ab:
- Name des Daten-Assets
- Übergeordnetes Daten-Asset
- Speicherort des Daten-Assets
- Daten-Asset-Typ
- Entsprechendes Google Cloud -Projekt
In Dataplex werden Datenkanäle als Einträge mit den folgenden Eintragswerten protokolliert:
- Systemeintragsgruppe
- Die Systemeingabegruppe für Datenkanäle ist
@dataform
. Wenn Sie Details zu Data Canvas-Einträgen in Dataplex aufrufen möchten, müssen Sie die Systemeintragsgruppedataform
aufrufen. Eine Anleitung zum Aufrufen einer Liste aller Einträge in einer Eintragsgruppe finden Sie in der Dataplex-Dokumentation unter Details einer Eintragsgruppe aufrufen. - Systemeintragstyp
- Der Systemeintragstyp für Datenkanäle ist
dataform-code-asset
. Wenn Sie Details zu Datenkanvas sehen möchten, müssen Sie den Systemeintragstypdataform-code-asset
aufrufen, die Ergebnisse mit einem aspektbasierten Filter herausfiltern und das Feldtype
im Aspektdataform-code-asset
aufDATA_CANVAS
setzen. Wählen Sie dann einen Eintrag des ausgewählten Datencanvas aus. Eine Anleitung zum Aufrufen von Details zu einem ausgewählten Eintragstyp finden Sie in der Dataplex-Dokumentation unter Details zu einem Eintragstyp aufrufen. Eine Anleitung zum Aufrufen der Details eines ausgewählten Eintrags finden Sie in der Dataplex-Dokumentation unter Details eines Eintrags ansehen. - Systemaspekttyp
- Der Systemaspekttyp für Datenkanäle ist
dataform-code-asset
. Wenn Sie Data Canvases in Dataplex durch Anmerkungen von Data Canvas-Einträgen mit Aspekten zusätzlichen Kontext geben möchten, rufen Sie den Aspekttypdataform-code-asset
auf, filtern Sie die Ergebnisse mit einem aspektbasierten Filter und setzen Sie das Feldtype
im Aspektdataform-code-asset
aufDATA_CANVAS
. Eine Anleitung zum Anhängen von Aspekten an Einträge finden Sie in der Dataplex-Dokumentation unter Aspekte verwalten und Metadaten anreichern. - Typ
- Der Typ für Datenkanäle ist
DATA_CANVAS
. Mit diesem Typ können Sie Datencanvasse im Systemeintragstypdataform-code-asset
und im Aspekttypdataform-code-asset
filtern, indem Sie die Abfrageaspect:dataplex-types.global.dataform-code-asset.type=DATA_CANVAS
in einem aspektbasierten Filter verwenden.
Eine Anleitung zum Suchen nach Assets in Dataplex finden Sie in der Dataplex-Dokumentation unter Daten-Assets in Dataplex suchen.
Preise
Weitere Informationen zu den Preisen für diese Funktion finden Sie unter Preisübersicht für Gemini in BigQuery.
Kontingente und Limits
Informationen zu Kontingenten und Limits für diese Funktion finden Sie unter Kontingente für Gemini in BigQuery.
Feedback geben
Um dazu beitragen, die Vorschläge im BigQuery-Data Canvas zu verbessern, senden Sie Ihr Feedback an Google. So geben Sie Feedback:
Klicken Sie in der Google Cloud Symbolleiste der Console auf Feedback geben.
Optional: Wenn Sie die DAG-JSON-Informationen kopieren möchten, um Ihrem Feedback zusätzlichen Kontext zu verleihen, klicken Sie auf
Kopieren.Klicken Sie auf das Formular, um es auszufüllen und Feedback zu geben.
Datenfreigabeeinstellungen gelten für das gesamte Projekt und können nur von einem Projektadministrator mit den IAM-Berechtigungen serviceusage.services.enable
und serviceusage.services.list
festgelegt werden. Weitere Informationen zur Datennutzung im Trusted Tester-Programm finden Sie unter Gemini im Google Cloud -Trusted-Tester-Programm.
Wenn Sie direkt Feedback zu dieser Funktion geben möchten, können Sie sich auch an datacanvas-feedback@google.com wenden.