Dataplex Universal Catalog の検索構文

このドキュメントでは、Dataplex Universal Catalog の検索クエリの構文について説明します。このドキュメントを読む前に、Dataplex Universal Catalog のメタデータ管理のコンセプト（エントリ、アスペクト、アスペクトタイプ、エントリグループ、エントリタイプなど）について理解しておくことが重要です。詳細については、Dataplex Universal Catalog のメタデータ管理についてをご覧ください。

Dataplex Universal Catalog には、キーワード検索とセマンティック検索（プレビュー）の 2 つの検索モードがあります。

キーワード検索では、特定のキーワード、フィルタ、定義された構文を使用してリソースを検索できます。

セマンティック検索は、キーワード検索を拡張して自然言語クエリをサポートします。普段使う言葉でリソースを検索できます。複雑な構文を使用する必要はありません。

このドキュメントでは、キーワード検索とセマンティック検索の両方の構文について説明します。

Google Cloud コンソールで Dataplex Universal Catalog 検索クエリを起動するには、Dataplex Universal Catalog の [検索] ページに移動し、検索プラットフォームとして [Dataplex Universal Catalog] を選択します。

検索に移動

詳細については、Dataplex Universal Catalog でリソースを検索するをご覧ください。

全文検索

特定の構文を使用せずに、用語やフレーズを入力してアセットを検索できます。Dataplex Universal Catalog は、次のものを含む複数のメタデータフィールドをクエリすることで、広範な検索を実行します。

リソースの名前、表示名、説明
リソースのタイプ
プロジェクト ID
概要説明
リソースのスキーマにおける列名（またはネストされた列名）
列の説明
完全修飾名
コンタクト
アスペクト

クエリ構文で検索する

より正確な検索を行うには、修飾子、論理演算子、アスペクト検索など、特定の構文を使用してクエリを作成します。

修飾された述語

述語の先頭にキーを付けて修飾すると、照合範囲を特定のメタデータ部分に限定できます。

等号（=）は、検索の対象を完全一致に制限します。
キーの後のコロン（:）は、述語を検索結果内の値に含まれる部分文字列またはトークンと照合します。

トークン化により、テキストのストリームが一連のトークン（各トークンは通常 1 つの単語に対応）に分割されます。

例:

name:foo は、foo 部分文字列を含む名前（foo1、barfoo など）のリソースを選択します。
description:foo は、説明に foo トークンがあるリソース（bar、foo など）を選択します。
location=foo は、ロケーション名が foo で指定されたロケーションのリソースに一致します。

これらの修飾子の動作は、検索モードによって若干異なる場合があります（以降のセクションで詳しく説明します）。

キーワード検索の修飾子

述語キー type、system、location、orgid は、部分文字列修飾子（:）ではなく、完全一致修飾子（=）のみをサポートします（例: type=foo、orgid=number）。

Dataplex Universal Catalog は、キーワード検索で次の修飾子をサポートしています。

修飾子	説明
`name:x`	`x` をリソース ID の部分文字列として一致させます。
`displayname:x`	`x` をリソースの表示名の部分文字列と照合します。
`column:x`	`x` をリソースのスキーマの列名（またはネストされた列名）の部分文字列と照合します。
`description:x`	`x` をリソースの説明のトークンと照合します。
`label:bar`	ラベル（値があるもの）を持つ BigQuery リソースと一致させます。ラベルキーには部分文字列として `bar` があります。
`label=bar`	ラベル（値があるもの）を持つ BigQuery リソースと一致させます。ラベルキーは文字列として `bar` と等しくなります。
`label:bar:x`	`x` を BigQuery リソースに関連付けられたキー `bar` を含むラベルの値の部分文字列として一致させます。
`label=foo:bar`	キーが `foo` でキー値が `bar` である BigQuery リソースと一致させます。
`label.foo=bar`	キーが `foo` でキー値が `bar` である BigQuery リソースと一致させます。
`label.foo`	ラベルを持ち、ラベルキーが文字列として `foo` と等しい BigQuery リソースと一致させます。
`type=TYPE`	特定のエントリタイプまたはそのタイプエイリアスのリソースと照合します。
`projectid:bar`	ID の部分文字列として `bar` と一致する Google Cloud プロジェクト内のリソースと照合します。
`parent:x`	`x` をリソースの階層パスの部分文字列と照合します。親パスは、親リソースの `fully_qualified_name` です。
`orgid=number`	Google Cloud 組織内のリソースを `number` の正確な ID 値と一致させます。
`system=SYSTEM`	指定されたシステムのリソースを照合します。
`location=LOCATION`	指定されたロケーションのリソースを正確な名前と照合します。たとえば、`location=us-central1` はアイオワでホストされているアセットに一致します。 BigQuery Omni アセットは、BigQuery Omni のロケーション名を使用してこの修飾子をサポートしています。たとえば、`location=aws-us-east-1` は北バージニアの BigQuery Omni アセットに一致します。
`createtime`	指定した日時以前または以降に作成されたリソースを検索します。例: `createtime:2019-01-01` は、2019 年 1 月 1 日に作成されたリソースに一致します。 `createtime<2019-02` は、2019 年 2 月 1 日 00:00:00 より前に作成されたリソースに一致します。 `createtime>2019-02` は、2019 年 2 月 1 日 00:00:00 より後に作成されたリソースに一致します。タイムスタンプ形式（`YYYY-MM-DDThh:mm:ss`）すべてのタイムスタンプは GMT にする必要があります（タイムゾーンはサポートされていません）。部分的なタイムスタンプ、ハイフン（`-`）の日付区切り文字、スラッシュ（`/`）の日付区切り文字がサポートされています。例: `2010-10-22T05:36:24` `2010-10-22T05:36` `2010-10-22T05` `2010-10-22` `2010-10` `2010` `2010/10/22`
`updatetime`	指定した日時以前または以降に更新されたリソースを検索します。例: `updatetime:2019-01-01` は、2019 年 1 月 1 日に更新されたリソースに一致します。 `updatetime<2019-02` は、2019 年 2 月 1 日 00:00:00 より前に更新されたリソースに一致します。 `updatetime>2019-02` は、2019 年 2 月 1 日 00:00:00 より後に更新されたリソースに一致します。タイムスタンプ形式（`YYYY-MM-DDThh:mm:ss`）すべてのタイムスタンプは GMT にする必要があります（タイムゾーンはサポートされていません）。部分的なタイムスタンプ、ハイフン（`-`）の日付区切り文字、スラッシュ（`/`）の日付区切り文字がサポートされています。例: `2010-10-22T05:36:24` `2010-10-22T05:36` `2010-10-22T05` `2010-10-22` `2010-10` `2010` `2010/10/22`
`fully_qualified_name:x`	`x` を `fully_qualified_name` の部分文字列として一致させます。
`fully_qualified_name=x`	`x` を `fully_qualified_name` として一致させます。

セマンティック検索の修飾子

述語キー type、system、location、description、アスペクト検索（has を除く）は、部分文字列修飾子（:）ではなく、完全一致修飾子（=）のみをサポートします（例: type=foo）。

Dataplex Universal Catalog は、セマンティック検索で次の修飾子をサポートしています。

修飾子	説明
`name:x`	`x` をリソース ID またはリソースの表示名の部分文字列と照合します。
`displayname:x`	`x` をリソースの表示名の部分文字列と照合します。
`column:x`	`x` をリソースのスキーマの列名（またはネストされた列名）の部分文字列と照合します。
`description:x`	`x` をリソースの説明のトークンと照合します。
`labels:bar`	ラベル（値があるもの）を持つ BigQuery リソースと一致させます。ラベルキーには部分文字列として `bar` があります。
`labels=bar`	ラベル（値があるもの）を持つ BigQuery リソースと一致させます。ラベルキーは文字列として `bar` と等しくなります。
`labels.bar:x`	`x` を BigQuery リソースに関連付けられたキー `bar` を含むラベルの値の部分文字列として一致させます。
`labels.foo=bar`	キーが `foo` でキー値が `bar` である BigQuery リソースと一致させます。
`type=TYPE`	特定のエントリタイプまたはそのタイプエイリアスのリソースと照合します。
`projectid:bar`	ID の部分文字列として `bar` と一致する Google Cloud プロジェクト内のリソースと照合します。
`parent:x`	`x` をリソースの階層パスの部分文字列と照合します。
`system=SYSTEM`	指定されたシステムのリソースを照合します。
`location=LOCATION`	指定されたロケーションのリソースを正確な名前と照合します。たとえば、`location=us-central1` はアイオワでホストされているアセットに一致します。 BigQuery Omni アセットは、BigQuery Omni のロケーション名を使用してこの修飾子をサポートしています。たとえば、`location=aws-us-east-1` は北バージニアの BigQuery Omni アセットに一致します。
`createtime`	指定した日時以前または以降に作成されたリソースを検索します。例: `createtime:2019-01-01` は、2019 年 1 月 1 日に作成されたすべてのリソースに一致します。 `createtime<2019-02` は、2019 年 2 月 1 日 00:00:00 より前に作成されたすべてのリソースに一致します。 `createtime>2019-02` は、2019 年 2 月 1 日 00:00:00 より後に作成されたすべてのリソースに一致します。 `createtime>-30d` は、過去 30 日間に作成されたすべてのリソースに一致します。 `createtime<=-30d` は、30 日以上前に作成されたすべてのリソースに一致します。 `createtime<=-1d` は、前日に作成されたすべてのリソースに一致します。タイムスタンプ形式（`YYYY-MM-DDThh:mm:ss`）すべてのタイムスタンプは GMT にする必要があります（タイムゾーンはサポートされていません）。部分的なタイムスタンプ、ハイフン（`-`）の日付区切り文字、スラッシュ（`/`）の日付区切り文字がサポートされています。例: `2010-10-22T05:36:24` `2010-10-22T05:36` `2010-10-22T05` `2010-10-22` `2010-10` `2010` `2010/10/22`
`updatetime`	指定した日時以前または以降に更新されたリソースを検索します。例: `updatetime:2019-01-01` は、2019 年 1 月 1 日に更新されたすべてのリソースに一致します。 `updatetime<2019-02` は、2019 年 2 月 1 日 00:00:00 より前に更新されたすべてのリソースに一致します。 `updatetime>2019-02` は、2019 年 2 月 1 日 00:00:00 より後に更新されたすべてのリソースに一致します。 `updatetime>-30d` は、過去 30 日間に更新されたすべてのリソースと一致します。 `updatetime<-30d` は、30 日以上前に更新されたすべてのリソースに一致します。 `updatetime=-1d` は、前日に更新されたすべてのリソースに一致します。 `updatetime>=-30d` は、過去 30 日間に更新されたすべてのリソースと一致します。 `updatetime<=-30d` は、30 日以上前に更新されたすべてのリソースに一致します。タイムスタンプ形式（`YYYY-MM-DDThh:mm:ss`）すべてのタイムスタンプは GMT にする必要があります（タイムゾーンはサポートされていません）。部分的なタイムスタンプ、ハイフン（`-`）の日付区切り文字、スラッシュ（`/`）の日付区切り文字がサポートされています。例: `2010-10-22T05:36:24` `2010-10-22T05:36` `2010-10-22T05` `2010-10-22` `2010-10` `2010` `2010/10/22`

アスペクト検索

付加されたアスペクトに基づいてエントリを検索するには、次のクエリ構文を使用します。

キーワード検索

修飾子説明

aspect:x エントリに関連付けられているアスペクトのアスペクトタイプの完全パスの部分文字列として x と一致させます（projectid.location.ASPECT_TYPE_ID 形式）。

aspect=x エントリに関連付けられているアスペクトのアスペクトタイプの完全パスとして x と一致させます（projectid.location.ASPECT_TYPE_ID 形式）。

修飾子	説明
`aspect:x`	エントリに関連付けられているアスペクトのアスペクトタイプの完全パスの部分文字列として `x` と一致させます（`projectid.location.ASPECT_TYPE_ID` 形式）。
`aspect=x`	エントリに関連付けられているアスペクトのアスペクトタイプの完全パスとして `x` と一致させます（`projectid.location.ASPECT_TYPE_ID` 形式）。
`aspect:xOPERATORvalue`	アスペクトフィールドの値を検索します。エントリに関連付けられているアスペクトのアスペクトタイプとフィールド名の完全パスの部分文字列として `x` と一致させます（`projectid.location.ASPECT_TYPE_ID.FIELD_NAME` 形式）。サポートされる演算子のリストは、次のようにアスペクト内のフィールドのタイプによって異なります。文字列: `=`（完全一致）と `:`（部分文字列）すべての数値タイプ: `=`、`:`、`<`、`>`、`<=`、`>=`、`=>`、`=<` 列挙型: `=` 日時: 数値の場合と同じですが、比較する値は数値ではなく日時として扱われます。ブール値: `=` 検索できるのは、アスペクトの最上位フィールドのみです。たとえば、次のクエリはすべて、`employee-info` アスペクトの `is-enrolled` フィールドの値が `true` であるエントリに一致します。部分文字列に一致するほかのエントリも返されます。 `aspect:example-project.us-central1.employee-info.is-enrolled=true` `aspect:example-project.us-central1.employee=true` `aspect:employee=true`

aspect:xOPERATORvalue

アスペクトフィールドの値を検索します。エントリに関連付けられているアスペクトのアスペクトタイプとフィールド名の完全パスの部分文字列として x と一致させます（projectid.location.ASPECT_TYPE_ID.FIELD_NAME 形式）。

サポートされる演算子のリストは、次のようにアスペクト内のフィールドのタイプによって異なります。

文字列: =（完全一致）と :（部分文字列）
すべての数値タイプ: =、:、<、>、<=、>=、=>、=<
列挙型: =
日時: 数値の場合と同じですが、比較する値は数値ではなく日時として扱われます。
ブール値: =

検索できるのは、アスペクトの最上位フィールドのみです。

たとえば、次のクエリはすべて、employee-info アスペクトの is-enrolled フィールドの値が true であるエントリに一致します。部分文字列に一致するほかのエントリも返されます。

aspect:example-project.us-central1.employee-info.is-enrolled=true
aspect:example-project.us-central1.employee=true
aspect:employee=true

セマンティック検索

修飾子説明

has:x エントリに関連付けられているアスペクトのアスペクトタイプの完全パスの部分文字列として x と一致させます（projectid.location.ASPECT_TYPE_ID 形式）。

has=x エントリに関連付けられているアスペクトのアスペクトタイプの完全パスとして x と一致させます（projectid.location.ASPECT_TYPE_ID 形式）。

修飾子	説明
`has:x`	エントリに関連付けられているアスペクトのアスペクトタイプの完全パスの部分文字列として `x` と一致させます（`projectid.location.ASPECT_TYPE_ID` 形式）。
`has=x`	エントリに関連付けられているアスペクトのアスペクトタイプの完全パスとして `x` と一致させます（`projectid.location.ASPECT_TYPE_ID` 形式）。
`has:xOPERATORvalue`	アスペクトフィールドの値を検索します。エントリに関連付けられているアスペクトのアスペクトタイプとフィールド名の完全パスの部分文字列として次の形式で `x` と一致させます。システムアスペクトタイプの構文: `ASPECT_TYPE_ID.FIELD_NAME` `dataplex-types.ASPECT_TYPE_ID.FIELD_NAME` `dataplex-types.LOCATION.ASPECT_TYPE_ID.FIELD_NAME` たとえば、次のクエリは、`bigquery-dataset` アスペクトの `type` フィールドの値が `default` であるエントリに一致します。 `bigquery-dataset.type=default` `dataplex-types.bigquery-dataset.type=default` `dataplex-types.global.bigquery-dataset.type=default` カスタムアスペクトタイプの構文: アスペクトがグローバルリージョンに作成されている場合: `PROJECT_ID.ASPECT_TYPE_ID.FIELD_NAME` アスペクトが特定のリージョンに作成されている場合: `PROJECT_ID.REGION.ASPECT_TYPE_ID.FIELD_NAME` たとえば、次のクエリは、`employee-info` アスペクトの `is-enrolled` フィールドの値が `true` であるエントリに一致します。 `example-project.us-central1.employee-info.is-enrolled=true` `example-project.employee-info.is-enrolled=true` サポートされる演算子のリストは、次のようにアスペクト内のフィールドのタイプによって異なります。文字列: `=`（完全一致）すべての数値タイプ: `=`、`:`、`<`、`>`、`<=`、`>=`、`=>`、`=<` 列挙型: `=` 日時: 数値の場合と同じですが、比較する値は数値ではなく日時として扱われます。ブール値: `=` 検索できるのは、アスペクトの最上位フィールドのみです。

has:xOPERATORvalue

アスペクトフィールドの値を検索します。エントリに関連付けられているアスペクトのアスペクトタイプとフィールド名の完全パスの部分文字列として次の形式で x と一致させます。

システムアスペクトタイプの構文:
- ASPECT_TYPE_ID.FIELD_NAME
- dataplex-types.ASPECT_TYPE_ID.FIELD_NAME
- dataplex-types.LOCATION.ASPECT_TYPE_ID.FIELD_NAME
たとえば、次のクエリは、bigquery-dataset アスペクトの type フィールドの値が default であるエントリに一致します。
- bigquery-dataset.type=default
- dataplex-types.bigquery-dataset.type=default
- dataplex-types.global.bigquery-dataset.type=default
カスタムアスペクトタイプの構文:
- アスペクトがグローバルリージョンに作成されている場合: PROJECT_ID.ASPECT_TYPE_ID.FIELD_NAME
- アスペクトが特定のリージョンに作成されている場合: PROJECT_ID.REGION.ASPECT_TYPE_ID.FIELD_NAME
たとえば、次のクエリは、employee-info アスペクトの is-enrolled フィールドの値が true であるエントリに一致します。
- example-project.us-central1.employee-info.is-enrolled=true
- example-project.employee-info.is-enrolled=true
サポートされる演算子のリストは、次のようにアスペクト内のフィールドのタイプによって異なります。
- 文字列: =（完全一致）
- すべての数値タイプ: =、:、<、>、<=、>=、=>、=<
- 列挙型: =
- 日時: 数値の場合と同じですが、比較する値は数値ではなく日時として扱われます。
- ブール値: =

検索できるのは、アスペクトの最上位フィールドのみです。

論理演算子

クエリは、論理演算子を使用して複数の述語で構成できます。演算子を指定しない場合は、論理 AND が暗黙で指定されます。たとえば、foo bar は、述語 foo と述語 bar の両方に一致するリソースを返します。

論理 AND と論理 OR がサポートされています。例: foo OR bar

述語を否定するには、-（ハイフン）または NOT 接頭辞を使用します。たとえば、-name:foo は、述語 foo と一致しない名前のリソースを返します。

簡略構文

簡略化された検索構文も使用できます。OR 演算子には |（垂直バー）を、AND 演算子には ,（カンマ）を使用します。

たとえば、OR 演算子を使用して、複数のプロジェクトの 1 つのエントリを検索するには、次の簡略化された構文を使用できます。

projectid:(id1|id2|id3|id4)

簡略構文を使用しない同じ検索は次のようになります。

projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4

列名が一致するエントリを検索するには、以下を使用します。

AND: column:(name1, name2, name3)
OR: column:(name1|name2|name3)

この簡略構文は、キーワード検索の label を除く修飾された述語で使用できます。

次のステップ

Dataplex Universal Catalog でリソースを検索する方法を学習する。
Dataplex Universal Catalog のメタデータ管理の詳細を確認する。
アスペクトを使用してエントリをメタデータで強化する方法を学習する。
エントリの管理方法とカスタムソースを取り込む方法を学習する。