Auf Datenstatistiken im Dataplex Universal Catalog zugreifen
Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Über Data Insights können Sie Ihre Daten automatisch untersuchen und verstehen. Bei Daten-Insights verwendet Gemini Metadaten, um Fragen in natürlicher Sprache zu Ihrer Tabelle und die Abfragen zu generieren, mit denen diese Fragen beantwortet werden. So können Sie Muster erkennen, die Datenqualität bewerten und statistische Analysen ausführen.
In diesem Dokument werden die wichtigsten Funktionen von Data Insights und die Vorgehensweise zum Aufrufen von Data Insights für eine aufschlussreiche Datenexploration beschrieben.
Hinweise
Datenstatistiken werden mit Gemini in BigQuery generiert und können nur in BigQuery Studio generiert werden.
Richten Sie zuerst Gemini in BigQuery ein und generieren Sie dann Statistiken in BigQuery.
Gemini verarbeitet Ihre Metadaten für Statistiken ausschließlich in der Region us-central1. Weitere Informationen finden Sie unter Gemini-Bereitstellungsstandorte.
Nachdem Sie Statistiken generiert haben, können Sie sie im Dataplex Universal Catalog ansehen.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgende IAM-Rolle zuzuweisen, um Lesezugriff auf die generierten Statistiken zu erhalten:
Dataplex DataScan DataViewer (roles/dataplex.dataScanDataViewer)
im Projekt mit den BigQuery-Tabellen, für die Sie die
Statistiken ansehen.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die genauen Berechtigungen anzuzeigen, die zum Generieren von Statistiken erforderlich sind:
Erforderliche Berechtigungen
dataplex.datascans.get
dataplex.datascans.getData
APIs aktivieren
Aktivieren Sie die folgenden APIs in Ihrem Projekt, um Data Insights zu verwenden:
Bei der explorativen Datenanalyse einer neuen, unbekannten Tabelle stehen Datenanalysten oft vor dem Kaltstartproblem. Das Problem beinhaltet häufig Unsicherheiten in Bezug auf die Datenstruktur, Schlüsselmuster und relevante Einblicke in den Daten, was den Einstieg in das Schreiben von Abfragen erschwert.
Data Insights beheben das Kaltstartproblem, indem automatisch Abfragen in natürlicher Sprache und ihre SQL-Entsprechungen anhand der Metadaten einer Tabelle generiert werden.
Anstatt bei Null anzufangen, können Sie die Datenexploration schneller über aussagekräftige Abfragen starten, die wertvolle Informationen bieten. Wenn Sie die Daten weiter untersuchen möchten, können Sie im Daten-Canvas Folgefragen stellen.
Beispiel für eine Ausführung von Statistiken
Angenommen, Sie haben eine Tabelle mit dem Namen telco_churn mit den folgenden Metadaten:
Feldname
Typ
Kundennummer
STRING
Geschlecht
STRING
Zugehörigkeit zum Unternehmen
INT64
InternetService
STRING
StreamingTV
STRING
OnlineBackup
STRING
Vertrag
STRING
TechSupport
STRING
Zahlungsmethode
STRING
Monatliche Gebühren
FLOAT
Abwanderung
BOOLEAN
Im Folgenden finden Sie einige der Beispielabfragen, die von Data Insights für diese Tabelle generiert werden:
Kunden ermitteln, die alle Premiumdienste abonniert haben und seit mehr als 50 Monaten Kunde sind.
Wenn Sie Statistiken für eine BigQuery-Tabelle aufrufen möchten, greifen Sie mit der Dataplex Universal Catalog-Suche auf den Tabelleneintrag im Dataplex Universal Catalog zu.
Rufen Sie in der Google Cloud Console die Seite Suche des Dataplex Universal Catalog auf.
Suchen Sie im Dataplex Universal Catalog nach dem Tabelleneintrag.
Klicken Sie auf den Tab Statistiken. Wenn der Tab leer ist, wurden die Statistiken für diese Tabelle noch nicht generiert. In BigQuery Studio können Sie Data Insights generieren.
Gemini ist weltweit verfügbar. Sie können die Datenverarbeitung daher nicht auf eine bestimmte Region beschränken. Weitere Informationen zu den Standorten, an denen Daten von Gemini in BigQuery verarbeitet werden, finden Sie unter Gemini-Bereitstellungsstandorte.
Beschränkungen
Data Insights sind für BigQuery-Tabellen, BigLake-Tabellen, externe Tabellen und Ansichten verfügbar.
Für Kunden mit mehreren Clouds sind keine Daten aus anderen Clouds verfügbar.
Data Insights unterstützen die Spaltentypen Geo und JSON nicht.
Insights-Ausführungen bedeuten nicht, dass jedes Mal Abfragen dargestellt werden. Wenn Sie die Wahrscheinlichkeit erhöhen möchten, nützlichere Abfragen zu erzeugen, können Sie Statistiken in BigQuery Studio neu generieren.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-08-21 (UTC)."],[[["\u003cp\u003eData insights leverage Gemini to automatically generate natural language questions and SQL queries based on a table's metadata, aiding in data exploration and analysis.\u003c/p\u003e\n"],["\u003cp\u003eTo use data insights, you must first set up Gemini in BigQuery, enable the required APIs (Dataplex, BigQuery, and Gemini for Google Cloud), and have the appropriate IAM roles, like \u003ccode\u003eDataplex DataScan DataViewer\u003c/code\u003e, for read-only access.\u003c/p\u003e\n"],["\u003cp\u003eData insights addresses the cold-start problem for data analysts by providing meaningful queries that uncover patterns, assess data quality, and offer valuable insights, which can be further explored in data canvas.\u003c/p\u003e\n"],["\u003cp\u003eInsights can be viewed in Dataplex by searching for the BigQuery table and selecting the "Insights" tab, but if they are not present, they need to be generated in BigQuery Studio.\u003c/p\u003e\n"],["\u003cp\u003eData insights has certain limitations, such as not supporting \u003ccode\u003eGeo\u003c/code\u003e or \u003ccode\u003eJSON\u003c/code\u003e column types and being available only for BigQuery tables, BigLake tables, external tables, and views.\u003c/p\u003e\n"]]],[],null,["Data insights offers an automated way to explore and understand\nyour data. With data insights, Gemini in BigQuery uses\nmetadata to generate natural language questions about your table and the queries\nto answer them. This helps you uncover patterns, assess data\nquality, and perform statistical analysis.\n\nThis document describes the key features of data insights and how to view them\nfor insightful data exploration.\n| **Note:** To give feedback for this feature, send email to [dataplex-data-insights-help@google.com](mailto:dataplex-data-insights-help@google.com).\n\nBefore you begin\n\nData insights are generated using\n[Gemini in BigQuery](/gemini/docs/bigquery/overview)\nand can only be generated in BigQuery Studio.\nFirst\n[set up Gemini in BigQuery](/gemini/docs/bigquery/set-up-gemini),\nthen\n[generate insights in BigQuery](/bigquery/docs/data-insights#insights-bigquery-table).\nGemini processes your metadata for insights exclusively in the\n`us-central1` region. For more information, see\n[Gemini serving locations](/gemini/docs/locations).\nAfter you generate insights, you can view them in Dataplex Universal Catalog.\n| **Note** : Gemini in BigQuery is part of Gemini for Google Cloud and doesn't support the same compliance and security offerings as BigQuery. You should only set up Gemini in BigQuery for BigQuery projects that don't require [compliance offerings that aren't supported by Gemini for Google Cloud](/gemini/docs/discover/certifications). For information about how to turn off or prevent access to Gemini in BigQuery, see [Turn off Gemini for Google Cloud products](/gemini/docs/turn-off-gemini).\n\nRequired roles\n\nTo get read-only access to the generated insights, ask your administrator\nto grant you the following IAM role:\n\n- [Dataplex DataScan DataViewer](/iam/docs/understanding-roles#dataplex.dataScanDataViewer) (`roles/dataplex.dataScanDataViewer`) on the project containing the BigQuery tables for which you want to view insights.\n\nFor more information about granting roles, see\n[Manage access to projects, folders, and organizations](/iam/docs/granting-changing-revoking-access).\n\nYou might also be able to get the required permissions through\n[custom roles](/iam/docs/creating-custom-roles) or other\n[predefined roles](/iam/docs/understanding-roles). To see the exact permissions\nthat are required generate insights, expand the **Required permissions**\nsection: \n\nRequired permissions\n\n- `dataplex.datascans.get`\n- `dataplex.datascans.getData`\n\nEnable APIs **Important:** To enable any API in your project, ask your administrator to grant you the `serviceusage.services.enable` permission on your project.\n\nTo use data insights, enable the following APIs in your project:\nDataplex API, BigQuery API, and Gemini for Google Cloud API.\n\n\n[Enable the APIs](https://console.cloud.google.com/flows/enableapi?apiid=dataplex.googleapis.com,bigquery.googleapis.com,cloudaicompanion.googleapis.com)\n\nFor more information about enabling the Gemini for Google Cloud API, see\n[Enable the Gemini for Google Cloud API in a Google Cloud project](/gemini/docs/discover/set-up-gemini#enable-api).\n\nAbout data insights\n\nWhen exploring a new, unfamiliar table, data analysts often face the cold-start\nproblem. The problem often involves uncertainties about\nthe data structure, key patterns, and relevant insights in\nthe data, making it hard to get started writing queries.\n\nData insights\naddresses the cold-start problem by automatically generating natural language\nqueries and their SQL equivalents based on a table's metadata.\nRather than starting\nwith an empty query editor, you can quickly start data exploration with\nmeaningful queries that offer valuable insights. To investigate further, you\ncan ask follow-up questions in [data canvas](/bigquery/docs/data-canvas).\n\nExample of an insights run\n\nConsider a table called `telco_churn` with the following metadata:\n\n| Field name | Type |\n|-----------------|-----------|\n| CustomerID | `STRING` |\n| Gender | `STRING` |\n| Tenure | `INT64` |\n| InternetService | `STRING` |\n| StreamingTV | `STRING` |\n| OnlineBackup | `STRING` |\n| Contract | `STRING` |\n| TechSupport | `STRING` |\n| PaymentMethod | `STRING` |\n| MonthlyCharges | `FLOAT` |\n| Churn | `BOOLEAN` |\n\nThe following are some of the sample queries that data insights\ngenerates for this table:\n\n- Identify customers who have subscribed to all premium services and have been\n a customer for more than 50 months.\n\n SELECT\n CustomerID,\n Contract,\n Tenure\n FROM\n agentville_datasets.telco_churn\n WHERE\n OnlineBackup = 'Yes'\n AND TechSupport = 'Yes'\n AND StreamingTV = 'Yes'\n AND Tenure \u003e 50;\n\n- Identify which internet service has the most churned customers.\n\n SELECT\n InternetService,\n COUNT(DISTINCT CustomerID) AS total_customers\n FROM\n agentville_datasets.telco_churn\n WHERE\n Churn = TRUE\n GROUP BY\n InternetService\n ORDER BY\n total_customers DESC\n LIMIT 1;\n\n- Identify churn rates by segment among high-value customers.\n\n SELECT\n Contract,\n InternetService,\n Gender,\n PaymentMethod,\n COUNT(DISTINCT CustomerID) AS total_customers,\n SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers,\n (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID))\n * 100 AS churn_rate\n FROM\n agentville_datasets.telco_churn\n WHERE\n MonthlyCharges \u003e 100\n GROUP BY\n Contract,\n InternetService,\n Gender,\n PaymentMethod;\n\nView insights\n\nTo view insights for a BigQuery table, access the\ntable entry in Dataplex Universal Catalog using Dataplex Universal Catalog Search.\n\n1. In the Google Cloud console, go to the Dataplex Universal Catalog **Search** page.\n\n [Go to Search](https://console.cloud.google.com/dataplex)\n2. Search for the table entry in Dataplex Universal Catalog.\n\n3. Click the **Insights** tab. If the tab is empty, it means that the insights\n for this table are not generated yet. You can\n [generate data insights](/bigquery/docs/data-insights) in BigQuery Studio.\n\nPricing\n\nFor details about pricing for this feature, see\n[Gemini in BigQuery pricing overview](/products/gemini/pricing#gemini-in-bigquery-pricing).\n\nQuotas and limits\n\nFor information about quotas and limits for this feature, see\n[Quotas for Gemini in BigQuery](/gemini/docs/quotas#bigquery).\n\nLocations\n\nGemini operates globally, so you can't\nrestrict data processing to a specific region. To learn more about locations where\nGemini in BigQuery\nprocesses data, see [Gemini serving locations](/gemini/docs/locations).\n\nLimitations\n\n- Data insights is available for BigQuery tables, BigLake tables, external tables, and views.\n- For multicloud customers, data from other clouds isn't available.\n- Data insights doesn't support `Geo` or `JSON` column types.\n- Insights runs don't guarantee the presentation of queries every time. To increase the likelihood of generating more engaging queries, regenerate insights in BigQuery Studio.\n\nWhat's next\n\n- Learn how to [generate insights in BigQuery](/bigquery/docs/data-insights#insights-bigquery-table).\n- Learn how to [generate a data profiling scan](/dataplex/docs/use-data-profiling).\n- Learn how to [write queries with Gemini assistance in BigQuery](/bigquery/docs/write-sql-gemini)."]]