Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
In diesem Dokument wird die Syntax für Suchanfragen an Cloud Data Catalog beschrieben. Bevor Sie dieses Dokument lesen, sollten Sie die Konzepte von Data Catalog kennen, z. B. Dateneingabe, Tags und Tag-Vorlagen sowie andere Arten von Metadaten. Weitere Informationen finden Sie unter Was ist Data Catalog?
Wenn Sie eine Data Catalog-Suchanfrage in der Google Cloud Console starten möchten, rufen Sie die Seite Data Catalog Search (Data Catalog-Suche) auf und wählen Sie als Suchmodus Data Catalog (Data Catalog) aus.
Eine Data Catalog-Suchanfrage besteht in der einfachsten Form aus einem einzelnen Prädikat. Ein solches Prädikat kann mit mehreren Metadaten übereinstimmen:
Ein Teilstring eines Namens, Anzeigenamens oder einer Beschreibung eines Daten-Assets
Der Wert eines öffentlichen Tags, der Name einer öffentlichen Tag-Vorlage oder ein Feldname in einer öffentlichen Tag-Vorlage, der an einen Dateneintrag angehängt ist.
(Vorabversion) Ein String für eine E-Mail-Adresse oder einen Namen für einen Datenbevollmächtigten
(Vorabversion) Ein String aus einer Übersichtsbeschreibung
Die einfache Suche unterstützt keine Tag-Vorlagenfelder vom Typ datetime.
Das Prädikat foo stimmt beispielsweise mit den folgenden Entitäten überein:
Datenasset mit dem Namen foo.bar
Datenasset mit dem Anzeigenamen Foo Bar
Datenasset mit der Beschreibung This is the foo script.
Datenasset mit dem genauen Typ foo
Spalte foo_bar im Schema eines Datenassets
Verschachtelte Spalte foo_bar im Schema eines Datenassets
Projekt prod-foo-bar
Öffentliche Tag-Vorlage mit dem Namen foo, Dateneinträge, die mit der Tag-Vorlage foo getaggt sind, Anzeigename der Tag-Vorlage foo, Tag-Vorlagen-Feldname foo und Tag-Feldwert foo in einem String, einer Aufzählung oder in Rich Text.
(Vorabversion) Datenasset mit einem Datenbetreuer namens foo.
(Vorabversion) Datenasset mit einer Übersicht, die das Wort foo enthält.
Sie können ein Prädikat qualifizieren, indem Sie ihm einen Schlüssel voranstellen, der die Übereinstimmung auf ein bestimmtes Metadatenelement einschränkt.
Ein Gleichheitszeichen (=) beschränkt die Suche auf eine genaue Übereinstimmung.
Ein Doppelpunkt (:), nachdem der Schlüssel das Prädikat mit einem Teilstring oder Token innerhalb des Werts in den Suchergebnissen vergleicht.
Bei der Tokenisierung wird der Textfluss in eine Reihe von Tokens unterteilt, wobei jedes Token in der Regel einem einzelnen Wort entspricht.
Beispiel:
Mit name:foo werden Entitäten mit Namen ausgewählt, die den Teilstring foo enthalten: foo1 und barfoo.
Mit description:foo werden Entitäten mit dem Token foo in der Beschreibung ausgewählt: bar and foo.
location=foo führt zu Übereinstimmung mit allen Daten-Assets an einem angegebenen Standort mit foo als Standortnamen.
Der Data Catalog unterstützt die folgenden Qualifier:
Kennzeichner
Beschreibung
name:x
Führt zu Übereinstimmung von x mit einem Teilstring der Daten-Asset-ID.
displayname:x
Führt zu Übereinstimmung von x mit einem Teilstring des Anzeigenamens des Daten-Assets.
column:x
Führt zu Übereinstimmung von x mit einem Teilstring des Spaltennamens (oder des verschachtelten Spaltennamens) im Schema des Datenassets. Sie können mit dem logischen Operator UND nach seiner verschachtelten Spalte suchen.. Beispielsweise stimmt column:(foo bar) mit einer verschachtelten Spalte mit dem Pfad foo.bar überein.
description:x
Führt zu Übereinstimmung von x mit einem Token in der Beschreibung des Daten-Assets.
label:bar
Führt zu Übereinstimmung mit BigQuery-Datenassets, die ein Label haben (mit einem Wert) und deren Labelschlüssel bar als Teilstring hat.
label=bar
Führt zu Übereinstimmung mit BigQuery-Daten-Assets, die ein Label haben (mit einem Wert) und deren Labelschlüssel dem String bar entspricht.
label:bar:x
Führt zu Übereinstimmung von x als Teilstring im Wert eines Labels mit Schlüssel bar, das mit einem BigQuery-Daten-Asset verknüpft ist.
label=foo:bar
Führt zu Übereinstimmung mit BigQuery-Daten-Assets, deren Schlüssel foo und deren Schlüsselwert bar ist.
label.foo=bar
Führt zu Übereinstimmung mit BigQuery-Daten-Assets, deren Schlüssel foo und deren Schlüsselwert bar ist.
label.foo
Führt zu Übereinstimmung mit BigQuery-Daten-Assets, die ein Label haben, dessen Schlüssel dem String foo entspricht.
type=<type>
Führt zu Übereinstimmung mit Datenassets eines bestimmten Objekttyps oder Subtyps. Subtypen können im folgenden Format hinzugefügt werden: <type>.<sub-type>. Zu den Typen und Untertypen gehören:
type=table führt zu Übereinstimmung mit allen Tabellen, Ansichten und materialisierten Ansichten.
type=dataset führt zu Übereinstimmung mit allen Datensätzen.
type=table.view oder type=view führt zu Übereinstimmung mit allen Ansichten, aber nicht mit materialisierten Ansichten.
type=materialized_view führt zu Übereinstimmung mit allen materialisierten Ansichten.
type=lake führt zu Übereinstimmung mit allen Seen.
type=zone führt zu Übereinstimmung mit allen Zonen.
type=tag_template führt zu Übereinstimmung mit allen Tag-Vorlagen.
type=entry_group führt zu Übereinstimmung mit allen Eintragsgruppen.
type=data_stream führt zu Übereinstimmung mit allen Pub/Sub-Themen.
(Vorabversion) type=dataset.linked entspricht allen mit Analytics Hub verknüpften Datasets.
projectid:bar
Führt zu Übereinstimmung mit Datenassets in Cloud-Projekten, die bar als Teilstring in der ID enthalten.
parent:x
Führt zu Übereinstimmung von x mit einem Teilstring des hierarchischen Pfads eines BigQuery-Daten-Assets. Der Pfad hat das Format <project_id>.<dataset_name>. parent:foo.bar entspricht beispielsweise allen Tabellen und Ansichten eines Datasets mit dem Pfad project-foo.bar-dataset.
orgid=number
Führt zu Übereinstimmung mit Datenassets in einer Cloudorganisation mit dem genauen ID-Wert number.
system=<system>
Führt zu Übereinstimmung mit allen Daten-Assets eines angegebenen Systems . Zu den Systemen gehören:
system=bigquery führt zu Übereinstimmung mit allen Datenassets von BigQuery.
system=cloud_bigtable führt zu Übereinstimmung mit allen Datenassets von Bigtable.
system=cloud_pubsub führt zu Übereinstimmung mit allen Datenassets von Pub/Sub.
system=cloud_spanner führt zu Übereinstimmung mit allen Datenassets von Spanner.
system=dataproc_metastore führt zu Übereinstimmung mit allen Datenassets von Dataproc Metastore.
system=data_catalog führt zu Übereinstimmung mit allen Datenassets, die in Data Catalog erstellt wurden.
system=dataplex führt zu Übereinstimmung mit allen Datenassets, die in Dataplex erstellt wurden.
location=<location>
Führt zu Übereinstimmung mit allen Daten-Assets an einem angegebenen Standort mit einem genauen Namen. Beispiel: location=us-central1 stimmt mit allen Assets überein, die in Iowa gehostet werden. Eine vollständige Liste der unterstützten Standorte finden Sie unter Data Catalog-Regionen.
cluster_location=<location>
Führt zu Übereinstimmung mit allen Bigtable-Daten-Assets an einem angegebenen Standort mit einem genauen Namen. Beispiel: cluster_location=us-central1 stimmt mit allen Assets überein, die in Iowa gehostet werden. Eine vollständige Liste der unterstützten Standorte finden Sie unter Bigtable-Regionen.
tag:x
Führt zu Übereinstimmung mit Daten-Assets, bei denen x mit einem beliebigen Teilstring in <tag_template_project_id>.<tag_template_id>.<tag_field_id> eines privaten oder öffentlichen Tags übereinstimmt. Beispiele:
tag:data_owner führt zu Übereinstimmung mit Daten-Assets, die das Tag data_owner enthalten.
tag:data_gov_template führt zu Übereinstimmung mit Datenassets, die mit der Tag-Vorlage data_gov_template getaggt wurden.
tag:mycloudproject.data_gov_template führt zu Übereinstimmung mit Datenassets, die mit der Vorlage data_gov_template im Projekt mycloudproject getaggt sind.
tag:key<operator>val
Führt zuerst zu Übereinstimmung von key mit einem beliebigen Teilstring der Tag-Feld-ID, der Tag-Vorlagen-ID oder der Google Cloud Projekt-ID einer Tag-Vorlage. Gleicht dann val mit dem Tag-Wert von key abhängig vom Tag-Feldtyp ab. Die typabhängigen <operator>-Sets, die für Tag-Werte zulässig sind, sind:
string/richtext: „:“ Hinweis: Ein Doppelpunkt in dieser Stringsuche gibt einen genauen Tokenabgleich an, keinen Teilstring.
boolesch und enum: "="
double: "=", "<", ">", "<=", ">="
Zeitstempel: ":", "=", "<", ">", "<=", ">="
Beispiele:
String: tag:data_owner:@mail.com führt zu Übereinstimmung mit Datenassets mit @mail.com -Werten.
boolesch: tag:data_gov_template.hasPII=true führt zu Übereinstimmung mit booleschen hasPII-Tags in data_gov_template die true sind.
enum: tag:certification_level_1=HIGHEST.
double: tag:datascore=9 führt zu Übereinstimmung mit Datenassets mit datascore-double-Tags mit dem Wert 9.
Zeitstempel: tag:expiredDate:2019-01-01 führt zu Übereinstimmung mit Datenassets mit einem expiredDate-Tag mit dem Wert 2019-01-01.
Zeitstempel: tag:expiredDate<2019-02 führt zu Übereinstimmung mit Daten-Assets, die ein expiredDate -Tag haben, dessen Zeitstempel zeitlich vor 2019-02-01T00:00:00 liegt.
Timestamp
createtime
Findet Datenassets, die an bzw. zu, vor oder nach einem bestimmten Datum oder einer bestimmten Uhrzeit erstellt wurden. Beispiele:
createtime:2019-01-01 führt zu Übereinstimmung mit Datenassets, die am 2019-01-01 erstellt wurden.
createtime<2019-02 führt zu Übereinstimmung mit Datenassets, die vor dem 2019-02-01T00:00:00 erstellt wurden.
createtime>2019-02 führt zu Übereinstimmung mit Datenassets, die nach dem 2019-02-01T00:00:00 erstellt wurden.
Timestamp
updatetime
Findet Datenassets, die an bzw. zu, vor oder nach einem bestimmten Datum oder einer bestimmten Uhrzeit aktualisiert wurden. Beispiele:
updatetime:2019-01-01 führt zu Übereinstimmung mit Datenassets, die am 2019-01-01 aktualisiert wurden.
updatetime<2019-02 führt zu Übereinstimmung mit Datenassets, die vor dem 2019-02-01T00:00:00 aktualisiert wurden.
updatetime>2019-02 führt zu Übereinstimmung mit Datenassets, die nach dem 2019-02-01T00:00:00 aktualisiert wurden.
Timestamp
policytag:x
Entspricht x als Teilstring des Anzeige-Tags des Anzeigenamens. Findet alle Assets mit einem passenden Richtlinien-Tag oder seinen untergeordneten Elementen.
policytagid=x
Entspricht x als Richtlinien-Tag- oder Taxonomie-ID. Findet alle Assets mit einem passenden Richtlinien-Tag oder seinen untergeordneten Elementen.
term:x
Führt zu Übereinstimmung mit Datenassets, die mit einem Begriff aus dem Glossar für Unternehmen verknüpft sind, bei dem ein Teilstring des Namens, der Beschreibung oder des Datenbetreuers mit x übereinstimmt.
fully_qualified_name:x
Führt zu Übereinstimmung von x mit einem Teilstring von fully_qualified_name.
fully_qualified_name=x
x stimmt mit fully_qualified_name überein.
Logische Operatoren
Eine Abfrage kann aus mehreren Prädikaten mit logischen Operatoren bestehen. Wenn Sie keinen Operator angeben, wird das logische AND als Operator angenommen. Beispiel: foo bar gibt Entitäten zurück, die sowohl dem Prädikat foo als auch dem Prädikat bar entsprechen.
Logisches AND und logisches OR werden unterstützt, z. B. foo OR bar.
Ein Prädikat kann mit einem Präfix - oder NOT negiert werden. Beispiel: -name:foo gibt alle Entitäten zurück, deren Namen nicht das Prädikat foo enthalten.
Abgekürzte Syntax
Außerdem ist eine abgekürzte Suchsyntax verfügbar, die | für OR-Operatoren und , für AND-Operatoren verwendet.
Für die Suche nach Einträgen in einem der zahlreichen Projekte mit dem Operator OR können Sie beispielsweise verwenden:
projectid:(pid1|pid2|pid3|pid4)
Anstelle von:
projectid:pid1 OR projectid:pid2 OR projectid:pid3 OR projectid:pid4
So suchen Sie nach Einträgen mit übereinstimmenden Spaltennamen:
AND: column:(name1, name2, name3)
OR: column:(name1|name2|name3)
Diese abgekürzte Syntax funktioniert für alle oben aufgeführten qualifizierten Prädikate, mit Ausnahme von tag, term, policytag, policytagid und label.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-02-01 (UTC)."],[[["\u003cp\u003eData Catalog search queries can be simple, using a single predicate to match substrings in data asset names, types, column names, project IDs, or tag values, among other criteria.\u003c/p\u003e\n"],["\u003cp\u003eQualified predicates refine searches by using keys like \u003ccode\u003ename:\u003c/code\u003e, \u003ccode\u003edescription:\u003c/code\u003e, \u003ccode\u003etype=\u003c/code\u003e, and \u003ccode\u003elocation=\u003c/code\u003e to specify the metadata field being searched, and whether the search should match a substring (\u003ccode\u003e:\u003c/code\u003e), or exact match (\u003ccode\u003e=\u003c/code\u003e).\u003c/p\u003e\n"],["\u003cp\u003eSearch queries support a wide array of qualifiers including \u003ccode\u003ename\u003c/code\u003e, \u003ccode\u003edisplayname\u003c/code\u003e, \u003ccode\u003ecolumn\u003c/code\u003e, \u003ccode\u003edescription\u003c/code\u003e, \u003ccode\u003elabel\u003c/code\u003e, \u003ccode\u003etype\u003c/code\u003e, \u003ccode\u003eprojectid\u003c/code\u003e, \u003ccode\u003eparent\u003c/code\u003e, \u003ccode\u003eorgid\u003c/code\u003e, \u003ccode\u003esystem\u003c/code\u003e, \u003ccode\u003elocation\u003c/code\u003e, \u003ccode\u003etag\u003c/code\u003e, \u003ccode\u003ecreatetime\u003c/code\u003e, \u003ccode\u003eupdatetime\u003c/code\u003e, \u003ccode\u003epolicytag\u003c/code\u003e, \u003ccode\u003epolicytagid\u003c/code\u003e, \u003ccode\u003eterm\u003c/code\u003e, \u003ccode\u003efully_qualified_name\u003c/code\u003e, allowing for detailed searches.\u003c/p\u003e\n"],["\u003cp\u003eLogical operators such as \u003ccode\u003eAND\u003c/code\u003e, \u003ccode\u003eOR\u003c/code\u003e, and negation (\u003ccode\u003e-\u003c/code\u003e or \u003ccode\u003eNOT\u003c/code\u003e) can combine multiple predicates to create complex search queries, with \u003ccode\u003eAND\u003c/code\u003e being the default operator when no operator is specified.\u003c/p\u003e\n"],["\u003cp\u003eAn abbreviated syntax using \u003ccode\u003e|\u003c/code\u003e for \u003ccode\u003eOR\u003c/code\u003e and \u003ccode\u003e,\u003c/code\u003e for \u003ccode\u003eAND\u003c/code\u003e is available for certain qualified predicates (excluding \u003ccode\u003etag\u003c/code\u003e, \u003ccode\u003eterm\u003c/code\u003e, \u003ccode\u003epolicytag\u003c/code\u003e, \u003ccode\u003epolicytagid\u003c/code\u003e and \u003ccode\u003elabel\u003c/code\u003e), streamlining the construction of complex queries.\u003c/p\u003e\n"]]],[],null,["# Data Catalog search syntax\n\nThis document describes the syntax for Data Catalog search queries. Before you read this document, it is important that you understand the concepts of Data Catalog such as data entry, tags and tag templates, and other kinds of metadata. See [What is Data Catalog?](/data-catalog/docs/concepts/overview).\n\nTo launch a Data Catalog search query in the\nGoogle Cloud console, go to the Data Catalog **Search** page and\nselect **Data Catalog** as the search mode.\n\n[Go to Search](https://console.cloud.google.com/dataplex/search)\n\nSimple search\n-------------\n\nIn its simplest form, a Data Catalog search query comprises a single predicate. Such a\npredicate can match several pieces of metadata:\n\n- A substring of a name, display name, or description of a data asset\n- Exact type of a data asset\n- A substring of a column name (or [nested column](/bigquery/docs/nested-repeated) name) in the schema of a data asset\n- A substring of a project ID\n- The value of a public tag, the name of a public tag template, or a field name in a public tag template attached to a data entry.\n- (Preview) A string for an email address or name for a data steward\n- (Preview) A string from an overview description\n\nThe simple search does not support tag template fields of type `datetime`.\n\nFor example, the predicate `foo` matches the following entities:\n\n- Data asset with the `foo.bar` name\n- Data asset with the `Foo Bar` display name\n- Data asset with the description `This is the foo script.`\n- Data asset with the exact `foo` type\n- Column `foo_bar` in the schema of a data asset\n- Nested column `foo_bar` in the schema of a data asset\n- Project `prod-foo-bar`\n- Public tag template named `foo`, data entries tagged with the `foo` tag template, tag template display name of `foo`, tag template field name of `foo`, and tag field value of `foo` in a string, enum, or rich text.\n- (Preview) Data asset with a data steward called `foo`.\n- (Preview) Data asset with an overview containing the word `foo`.\n\nTo know more about the roles and permissions to view public and private tags, see [Roles to view public and private tags](/data-catalog/docs/concepts/iam#roles_to_view_public_and_private_tags).\n\nQualified predicates\n--------------------\n\nYou can qualify a predicate by prefixing it with a key that restricts the\nmatching to a specific piece of metadata.\n\nAn equal sign (`=`) restricts the search to an exact match.\n\nA colon (`:`) after the key matches the predicate to either a substring or token within\nthe value in search results.\n\nTokenization breaks the stream of text up into a series of tokens, with\neach token usually corresponding to a single word.\n\nFor example:\n\n- `name:foo` selects entities with names that contain the `foo` substring: `foo1` and `barfoo`.\n- `description:foo` selects entities with the `foo` token in the description: `bar and foo`.\n- `location=foo` matches all data assets in a specified location with `foo` as the location name.\n\n| **Note:** You can only search for an exact `type=foo`, `system=foo`, `location=foo`, or `orgid=number`. The corresponding predicate keys can't be followed by a colon.\n\nData Catalog supports the following qualifiers:\n\nLogical operators\n-----------------\n\nA query can be comprised of several\npredicates with logical operators. If you don't specify an operator, logical\n`AND` is implied. For example, `foo bar` returns entities that match both\npredicate `foo` and predicate `bar`.\n\nLogical AND and logical OR are supported, for example, `foo OR bar`.\n\nYou can negate a predicate with a `-` or `NOT` prefix. For example, `-name:foo` returns\nall entities with names that don't match the predicate `foo`.\n| Logical operators are not case-sensitive (for example, \"or\" and \"OR\" are acceptable).\n\n### Abbreviated syntax\n\nAn abbreviated search syntax is also available, using `|` for `OR` operators and\n`,` for `AND` operators.\n\nFor example, to search for entries inside one of many projects using the `OR`\noperator, you can use:\n\n`projectid:(pid1|pid2|pid3|pid4)`\n\nInstead of:\n\n`projectid:pid1 OR projectid:pid2 OR projectid:pid3 OR projectid:pid4`\n\nTo search for entries with matching column names:\n\n- AND: `column:(name1, name2, name3)`\n- OR: `column:(name1|name2|name3)`\n\nThis abbreviated syntax works for the [qualified\npredicates](#qualified_predicates) listed earlier, except for `tag`, `term`,\n`policytag`, `policytagid` and `label`."]]