Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Dokumen ini menjelaskan sintaksis untuk kueri penelusuran Data Catalog. Sebelum membaca dokumen ini, Anda harus memahami konsep Data Catalog seperti entri data, tag dan template tag, serta jenis metadata lainnya. Lihat Apa yang dimaksud dengan Data Catalog?
Untuk meluncurkan kueri penelusuran Data Catalog di konsol Google Cloud, buka halaman Penelusuran Data Catalog, lalu pilih Data Catalog sebagai mode penelusuran.
Dalam bentuk yang paling sederhana, kueri penelusuran Data Catalog terdiri dari satu predikat. Predikat
tersebut dapat cocok dengan beberapa bagian metadata:
Substring nama, nama tampilan, atau deskripsi aset data
Jenis aset data yang tepat
Substring nama kolom (atau nama kolom bertingkat) dalam skema aset data
Substring project ID
Nilai tag publik, nama template tag publik, atau nama kolom dalam template tag publik yang dilampirkan ke entri data.
(Pratinjau) String untuk alamat email atau nama pengelola data
(Pratinjau) String dari deskripsi ringkasan
Penelusuran sederhana tidak mendukung kolom template tag jenis datetime.
Misalnya, predikat foo cocok dengan entitas berikut:
Aset data dengan nama foo.bar
Aset data dengan nama tampilan Foo Bar
Aset data dengan deskripsi This is the foo script.
Aset data dengan jenis foo yang tepat
Kolom foo_bar dalam skema aset data
Kolom bertingkat foo_bar dalam skema aset data
Project prod-foo-bar
Template tag publik bernama foo, entri data yang diberi tag dengan template tag foo, nama tampilan template tag foo, nama kolom template tag foo, dan nilai kolom tag foo dalam string, enum, atau teks panjang.
(Pratinjau) Aset data dengan pengelola data bernama foo.
(Pratinjau) Aset data dengan ringkasan yang berisi kata foo.
Anda dapat memenuhi syarat predikat dengan menambahkan awalan kunci yang membatasi
pencocokan ke bagian metadata tertentu.
Tanda sama dengan (=) membatasi penelusuran ke pencocokan persis.
Titik dua (:) setelah kunci cocok dengan predikat ke substring atau token dalam
nilai di hasil penelusuran.
Tokenisasi memecah aliran teks menjadi serangkaian token, dengan
setiap token biasanya sesuai dengan satu kata.
Contoh:
name:foo memilih entity dengan nama yang berisi substring foo:
foo1 dan barfoo.
description:foo memilih entitas dengan token foo dalam deskripsi:
bar and foo.
location=foo mencocokkan semua aset data di lokasi yang ditentukan dengan foo sebagai
nama lokasi.
Data Catalog mendukung penentu berikut:
Pengkualifikasi
Deskripsi
name:x
Mencocokkan x sebagai substring ID aset data.
displayname:x
Cocokkan x sebagai substring dari nama tampilan aset data.
column:x
Mencocokkan x sebagai substring dari nama kolom (atau nama kolom bertingkat) dalam skema aset data. Anda dapat menelusuri kolom bertingkat berdasarkan jalurnya menggunakan operator logika AND. Misalnya, column:(foo bar) mencocokkan kolom bertingkat dengan jalur foo.bar.
description:x
Mencocokkan x sebagai token dalam deskripsi aset data.
label:bar
Mencocokkan aset data BigQuery yang memiliki label (dengan beberapa nilai) dan kunci label memiliki bar sebagai substring.
label=bar
Mencocokkan aset data BigQuery yang memiliki label (dengan beberapa nilai) dan kunci label sama dengan bar sebagai string.
label:bar:x
Mencocokkan x sebagai substring dalam nilai label dengan kunci bar yang dilampirkan ke aset data BigQuery.
label=foo:bar
Mencocokkan aset data BigQuery dengan kunci sama dengan foo dan nilai kunci sama dengan bar.
label.foo=bar
Mencocokkan aset data BigQuery dengan kunci sama dengan foo dan nilai kunci sama dengan bar.
label.foo
Mencocokkan aset data BigQuery yang memiliki label dengan kunci yang sama dengan foo sebagai string.
type=<type>
Mencocokkan aset data dari jenis atau subjenis objek tertentu. Subjenis dapat ditambahkan dengan format <type>.<sub-type>. Jenis dan subjenis mencakup:
type=table cocok dengan semua tabel, tampilan, dan tampilan terwujud.
type=dataset cocok dengan semua set data.
type=table.view atau type=view cocok dengan semua tampilan, tetapi tidak cocok dengan tampilan terwujud.
type=materialized_view cocok dengan semua tampilan terwujud.
type=lake cocok dengan semua danau.
type=zone cocok dengan semua zona.
type=tag_template cocok dengan semua template tag.
type=entry_group cocok dengan semua grup entri.
type=data_stream cocok dengan semua topik Pub/Sub.
(Pratinjau) type=dataset.linked cocok dengan semua set data tertaut Analytics Hub.
projectid:bar
Mencocokkan aset data dalam project Cloud yang cocok dengan bar sebagai substring dalam ID.
parent:x
Mencocokkan x sebagai substring dari jalur hierarkis aset data BigQuery. Jalur memiliki format <project_id>.<dataset_name>. Misalnya, parent:foo.bar cocok dengan semua tabel dan tampilan set data dengan jalur project-foo.bar-dataset.
orgid=number
Mencocokkan aset data dalam organisasi Cloud dengan nilai ID persis number.
system=<system>
Mencocokkan semua aset data dari sistem yang ditentukan. Sistem mencakup:
system=bigquery cocok dengan semua aset data dari BigQuery.
system=cloud_bigtable cocok dengan semua aset data dari Bigtable.
system=cloud_pubsub cocok dengan semua aset data dari Pub/Sub.
system=cloud_spanner mencocokkan semua aset data dari Spanner.
system=dataproc_metastore cocok dengan semua aset data dari Dataproc Metastore.
system=data_catalog cocok dengan semua aset data yang dibuat di Katalog Data.
system=dataplex cocok dengan semua aset data yang dibuat di Dataplex.
location=<location>
Mencocokkan semua aset data di lokasi yang ditentukan dengan nama yang sama persis. Misalnya, location=us-central1 cocok dengan semua aset yang dihosting di Iowa. Untuk mengetahui daftar lengkap lokasi yang didukung, lihat Region Katalog Data.
cluster_location=<location>
Mencocokkan semua aset data Bigtable di lokasi yang ditentukan dengan nama yang sama persis. Misalnya, cluster_location=us-central1 cocok dengan semua aset yang dihosting di Iowa. Untuk mengetahui daftar lengkap lokasi yang didukung, lihat Region Bigtable.
tag:x
Mencocokkan aset data dengan x yang cocok dengan substring apa pun di <tag_template_project_id>.<tag_template_id>.<tag_field_id> dari tag pribadi atau publik. Contoh:
tag:data_owner cocok dengan aset data yang memiliki tag data_owner.
tag:data_gov_template mencocokkan aset data yang telah diberi tag dengan template tag data_gov_template.
tag:mycloudproject.data_gov_template cocok dengan aset data yang diberi tag dengan template data_gov_template dalam project mycloudproject.
tag:key<operator>val
Pertama, cocokkan key dengan substring ID kolom tag, ID template tag, atau Google Cloud project ID template tag. Kemudian, cocokkan val dengan nilai tag key bergantung pada jenis kolom tag. Set <operator> yang bergantung pada jenis yang diizinkan untuk nilai tag adalah:
string/richtext: ":" Catatan: Titik dua dalam penelusuran string ini menunjukkan pencocokan token persis, bukan substring.
boolean dan enum: "="
ganda: "=", "<", ">", "<=", ">="
stempel waktu: ":", "=", "<", ">", "<=", ">="
Contoh:
string: tag:data_owner:@mail.com cocok dengan aset data yang memiliki nilai @mail.com.
boolean: tag:data_gov_template.hasPII=true cocok dengan tag boolean hasPII di data_gov_template yang merupakan true.
enum: tag:certification_level_1=HIGHEST.
double: tag:datascore=9 mencocokkan aset data dengan tag ganda datascore yang memiliki nilai 9.
stempel waktu: tag:expiredDate:2019-01-01 cocok dengan aset data yang memiliki tag expiredDate2019-01-01.
stempel waktu: tag:expiredDate<2019-02 cocok dengan aset data yang memiliki tag expiredDate sebelum 2019-02-01T00:00:00.
createtime
Menemukan aset data yang dibuat dalam, sebelum, atau setelah tanggal atau waktu tertentu. Contoh:
createtime:2019-01-01 cocok dengan aset data yang dibuat pada 2019-01-01.
createtime<2019-02 cocok dengan aset data yang dibuat sebelum 2019-02-01T00:00:00.
createtime>2019-02 cocok dengan aset data yang dibuat setelah 2019-02-01T00:00:00.
updatetime
Menemukan aset data yang diperbarui dalam, sebelum, atau setelah tanggal atau waktu tertentu. Contoh:
updatetime:2019-01-01 cocok dengan aset data yang diperbarui pada 2019-01-01.
updatetime<2019-02 cocok dengan aset data yang diperbarui sebelum 2019-02-01T00:00:00.
updatetime>2019-02 cocok dengan aset data yang diperbarui setelah 2019-02-01T00:00:00.
policytag:x
Cocokkan x sebagai substring dari nama tampilan tag kebijakan. Menemukan semua aset yang menggunakan tag kebijakan yang cocok atau turunannya.
policytagid=x
Mencocokkan x sebagai ID tag atau taksonomi kebijakan. Menemukan semua aset yang menggunakan tag kebijakan yang cocok atau turunannya.
term:x
Mencocokkan aset data yang terhubung ke istilah glosarium bisnis dengan substring nama, deskripsi, atau pengelola data yang cocok dengan x.
fully_qualified_name:x
Mencocokkan x sebagai substring dari fully_qualified_name.
fully_qualified_name=x
Mencocokkan x sebagai fully_qualified_name.
Operator logika
Kueri dapat terdiri dari beberapa
predikat dengan operator logika. Jika Anda tidak menentukan operator, AND
logika akan tersirat. Misalnya, foo bar menampilkan entity yang cocok dengan prediket foo dan prediket bar.
Logika AND dan logika OR didukung, misalnya, foo OR bar.
Anda dapat menegasikan predikat dengan awalan - atau NOT. Misalnya, -name:foo menampilkan
semua entity dengan nama yang tidak cocok dengan predikat foo.
Sintaksis singkat
Sintaksis penelusuran singkat juga tersedia, menggunakan | untuk operator OR dan
, untuk operator AND.
Misalnya, untuk menelusuri entri di dalam salah satu dari banyak project menggunakan operator OR, Anda dapat menggunakan:
projectid:(pid1|pid2|pid3|pid4)
Daripada:
projectid:pid1 OR projectid:pid2 OR projectid:pid3 OR projectid:pid4
Untuk menelusuri entri dengan nama kolom yang cocok:
DAN: column:(name1, name2, name3)
ATAU: column:(name1|name2|name3)
Sintaksis singkat ini berfungsi untuk predikat
yang memenuhi syarat yang tercantum sebelumnya, kecuali untuk tag, term,
policytag, policytagid, dan label.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-02-01 UTC."],[[["\u003cp\u003eData Catalog search queries can be simple, using a single predicate to match substrings in data asset names, types, column names, project IDs, or tag values, among other criteria.\u003c/p\u003e\n"],["\u003cp\u003eQualified predicates refine searches by using keys like \u003ccode\u003ename:\u003c/code\u003e, \u003ccode\u003edescription:\u003c/code\u003e, \u003ccode\u003etype=\u003c/code\u003e, and \u003ccode\u003elocation=\u003c/code\u003e to specify the metadata field being searched, and whether the search should match a substring (\u003ccode\u003e:\u003c/code\u003e), or exact match (\u003ccode\u003e=\u003c/code\u003e).\u003c/p\u003e\n"],["\u003cp\u003eSearch queries support a wide array of qualifiers including \u003ccode\u003ename\u003c/code\u003e, \u003ccode\u003edisplayname\u003c/code\u003e, \u003ccode\u003ecolumn\u003c/code\u003e, \u003ccode\u003edescription\u003c/code\u003e, \u003ccode\u003elabel\u003c/code\u003e, \u003ccode\u003etype\u003c/code\u003e, \u003ccode\u003eprojectid\u003c/code\u003e, \u003ccode\u003eparent\u003c/code\u003e, \u003ccode\u003eorgid\u003c/code\u003e, \u003ccode\u003esystem\u003c/code\u003e, \u003ccode\u003elocation\u003c/code\u003e, \u003ccode\u003etag\u003c/code\u003e, \u003ccode\u003ecreatetime\u003c/code\u003e, \u003ccode\u003eupdatetime\u003c/code\u003e, \u003ccode\u003epolicytag\u003c/code\u003e, \u003ccode\u003epolicytagid\u003c/code\u003e, \u003ccode\u003eterm\u003c/code\u003e, \u003ccode\u003efully_qualified_name\u003c/code\u003e, allowing for detailed searches.\u003c/p\u003e\n"],["\u003cp\u003eLogical operators such as \u003ccode\u003eAND\u003c/code\u003e, \u003ccode\u003eOR\u003c/code\u003e, and negation (\u003ccode\u003e-\u003c/code\u003e or \u003ccode\u003eNOT\u003c/code\u003e) can combine multiple predicates to create complex search queries, with \u003ccode\u003eAND\u003c/code\u003e being the default operator when no operator is specified.\u003c/p\u003e\n"],["\u003cp\u003eAn abbreviated syntax using \u003ccode\u003e|\u003c/code\u003e for \u003ccode\u003eOR\u003c/code\u003e and \u003ccode\u003e,\u003c/code\u003e for \u003ccode\u003eAND\u003c/code\u003e is available for certain qualified predicates (excluding \u003ccode\u003etag\u003c/code\u003e, \u003ccode\u003eterm\u003c/code\u003e, \u003ccode\u003epolicytag\u003c/code\u003e, \u003ccode\u003epolicytagid\u003c/code\u003e and \u003ccode\u003elabel\u003c/code\u003e), streamlining the construction of complex queries.\u003c/p\u003e\n"]]],[],null,["# Data Catalog search syntax\n\nThis document describes the syntax for Data Catalog search queries. Before you read this document, it is important that you understand the concepts of Data Catalog such as data entry, tags and tag templates, and other kinds of metadata. See [What is Data Catalog?](/data-catalog/docs/concepts/overview).\n\nTo launch a Data Catalog search query in the\nGoogle Cloud console, go to the Data Catalog **Search** page and\nselect **Data Catalog** as the search mode.\n\n[Go to Search](https://console.cloud.google.com/dataplex/search)\n\nSimple search\n-------------\n\nIn its simplest form, a Data Catalog search query comprises a single predicate. Such a\npredicate can match several pieces of metadata:\n\n- A substring of a name, display name, or description of a data asset\n- Exact type of a data asset\n- A substring of a column name (or [nested column](/bigquery/docs/nested-repeated) name) in the schema of a data asset\n- A substring of a project ID\n- The value of a public tag, the name of a public tag template, or a field name in a public tag template attached to a data entry.\n- (Preview) A string for an email address or name for a data steward\n- (Preview) A string from an overview description\n\nThe simple search does not support tag template fields of type `datetime`.\n\nFor example, the predicate `foo` matches the following entities:\n\n- Data asset with the `foo.bar` name\n- Data asset with the `Foo Bar` display name\n- Data asset with the description `This is the foo script.`\n- Data asset with the exact `foo` type\n- Column `foo_bar` in the schema of a data asset\n- Nested column `foo_bar` in the schema of a data asset\n- Project `prod-foo-bar`\n- Public tag template named `foo`, data entries tagged with the `foo` tag template, tag template display name of `foo`, tag template field name of `foo`, and tag field value of `foo` in a string, enum, or rich text.\n- (Preview) Data asset with a data steward called `foo`.\n- (Preview) Data asset with an overview containing the word `foo`.\n\nTo know more about the roles and permissions to view public and private tags, see [Roles to view public and private tags](/data-catalog/docs/concepts/iam#roles_to_view_public_and_private_tags).\n\nQualified predicates\n--------------------\n\nYou can qualify a predicate by prefixing it with a key that restricts the\nmatching to a specific piece of metadata.\n\nAn equal sign (`=`) restricts the search to an exact match.\n\nA colon (`:`) after the key matches the predicate to either a substring or token within\nthe value in search results.\n\nTokenization breaks the stream of text up into a series of tokens, with\neach token usually corresponding to a single word.\n\nFor example:\n\n- `name:foo` selects entities with names that contain the `foo` substring: `foo1` and `barfoo`.\n- `description:foo` selects entities with the `foo` token in the description: `bar and foo`.\n- `location=foo` matches all data assets in a specified location with `foo` as the location name.\n\n| **Note:** You can only search for an exact `type=foo`, `system=foo`, `location=foo`, or `orgid=number`. The corresponding predicate keys can't be followed by a colon.\n\nData Catalog supports the following qualifiers:\n\nLogical operators\n-----------------\n\nA query can be comprised of several\npredicates with logical operators. If you don't specify an operator, logical\n`AND` is implied. For example, `foo bar` returns entities that match both\npredicate `foo` and predicate `bar`.\n\nLogical AND and logical OR are supported, for example, `foo OR bar`.\n\nYou can negate a predicate with a `-` or `NOT` prefix. For example, `-name:foo` returns\nall entities with names that don't match the predicate `foo`.\n| Logical operators are not case-sensitive (for example, \"or\" and \"OR\" are acceptable).\n\n### Abbreviated syntax\n\nAn abbreviated search syntax is also available, using `|` for `OR` operators and\n`,` for `AND` operators.\n\nFor example, to search for entries inside one of many projects using the `OR`\noperator, you can use:\n\n`projectid:(pid1|pid2|pid3|pid4)`\n\nInstead of:\n\n`projectid:pid1 OR projectid:pid2 OR projectid:pid3 OR projectid:pid4`\n\nTo search for entries with matching column names:\n\n- AND: `column:(name1, name2, name3)`\n- OR: `column:(name1|name2|name3)`\n\nThis abbreviated syntax works for the [qualified\npredicates](#qualified_predicates) listed earlier, except for `tag`, `term`,\n`policytag`, `policytagid` and `label`."]]