Neste documento, descrevemos a sintaxe das consultas de pesquisa do Dataplex Universal Catalog. Antes de ler este documento, é importante entender os conceitos de gerenciamento de metadados no Dataplex Universal Catalog, como entradas, aspectos, tipos de aspecto, grupos de entrada e tipos de entrada. Para mais informações, consulte Sobre o gerenciamento de metadados no Dataplex Universal Catalog.
O Dataplex Universal Catalog oferece dois modos de pesquisa: por palavra-chave e em linguagem natural (prévia).
Com a pesquisa por palavra-chave, você encontra recursos usando palavras-chave, filtros e uma sintaxe definida.
A pesquisa com linguagem natural estende a pesquisa de palavras-chave para oferecer suporte a consultas em linguagem natural. Ele permite encontrar recursos usando linguagem cotidiana, eliminando a necessidade de sintaxes complexas.
Este documento aborda a sintaxe para pesquisas por palavra-chave e em linguagem natural.
Para iniciar uma consulta de pesquisa do Universal Catalog do Dataplex no consoleGoogle Cloud , acesse a página Pesquisar do Universal Catalog do Dataplex e selecione Universal Catalog do Dataplex como a plataforma de pesquisa.
Para mais informações, consulte Pesquisar recursos no Dataplex Universal Catalog.
Pesquisa de texto livre
É possível encontrar recursos inserindo um termo ou uma frase sem sintaxe específica. O Dataplex Universal Catalog faz uma pesquisa ampla comparando sua consulta com vários campos de metadados, incluindo:
- Nome, nome de exibição ou descrição de um recurso
- Tipo de um recurso
- ID do projeto
- Descrição da visão geral
- Nome da coluna (ou nome da coluna aninhada) no esquema de um recurso.
- Descrição da coluna
- Nome totalmente qualificado
- Contatos
- Aspectos
Pesquisar com a sintaxe de consulta
Para pesquisas mais precisas, crie uma consulta usando uma sintaxe específica, incluindo qualificadores, operadores lógicos e pesquisas de aspectos.
Predicados qualificados
Você pode qualificar um predicado usando um prefixo com uma chave que restringe a correspondência a uma parte específica dos metadados:
- Um sinal de igual (
=
) restringe a pesquisa a uma correspondência exata. - Dois pontos (
:
) após a chave correspondem ao predicado em um substring ou um token dentro do valor nos resultados da pesquisa.
A tokenização divide o fluxo de texto em uma série de tokens, cada um geralmente correspondente a uma palavra.
Exemplo:
name:foo
seleciona recursos com nomes que contêm a substringfoo
, comofoo1
ebarfoo
.description:foo
seleciona recursos com o tokenfoo
na descrição, comobar
efoo
.location=foo
corresponde a recursos em um local especificado comfoo
como nome do local.
O comportamento desses qualificadores pode variar um pouco entre os modos de pesquisa, conforme detalhado nas seções a seguir.
Pesquisa por palavra-chave
As chaves de predicado type
, system
, location
e orgid
aceitam apenas o qualificador de correspondência exata (=
), não o de substring (:
). Por exemplo, type=foo
ou orgid=number
.
O Dataplex Universal Catalog oferece suporte aos seguintes qualificadores para pesquisa por palavra-chave:
Qualificador | Descrição |
---|---|
name:x |
Corresponde a x como uma substring do ID do recurso. |
displayname:x |
Corresponda x como substring do nome de exibição do recurso. |
column:x |
Corresponde x como uma substring do nome da coluna (ou nome da coluna aninhada) no esquema do recurso. |
description:x |
Corresponde x como um token na descrição do recurso. |
label:bar |
Corresponde a recursos do BigQuery que têm um rótulo (com algum valor) e a chave de rótulo tem bar como substring. |
label=bar |
Corresponde a recursos do BigQuery que têm um rótulo (com algum valor) e a chave de rótulo é igual a bar como uma string. |
label:bar:x |
Corresponde a x como uma substring no valor de um rótulo com a chave bar anexada a um recurso do BigQuery. |
label=foo:bar |
Corresponde a recursos do BigQuery em que a chave é igual a foo e o valor da chave é igual a bar . |
label.foo=bar |
Corresponde a recursos do BigQuery em que a chave é igual a foo e o valor da chave é igual a bar . |
label.foo |
Corresponde a recursos do BigQuery que têm um rótulo cuja
chave é igual a foo como uma string. |
type=TYPE |
Corresponde a recursos de um tipo de entrada específico ou ao alias dele. |
projectid:bar |
Corresponde a recursos em projetos Google Cloud que correspondem abar como uma substring no ID. |
parent:x |
Corresponde a x como uma substring do caminho hierárquico de um recurso. O caminho principal é um fully_qualified_name do recurso principal. |
orgid=number |
Corresponde os recursos em uma organização Google Cloud ao valor exato do ID de number . |
system=SYSTEM |
Corresponde a recursos de um sistema especificado. |
location=LOCATION |
Corresponde recursos em um local especificado com um nome exato.
Por exemplo, Os recursos do BigQuery Omni oferecem suporte a esse qualificador usando o
nome do local do BigQuery Omni.
Por exemplo, |
createtime |
Encontra recursos criados em, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar em GMT. Fusos horários não são aceitos. Timestamps parciais e separadores de data com hífen ( Exemplo:
|
updatetime |
Encontra recursos que foram atualizados em, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar em GMT. Fusos horários não são aceitos. Timestamps parciais e separadores de data com hífen ( Exemplo:
|
fully_qualified_name:x |
Corresponde a x como uma substring de fully_qualified_name . |
fully_qualified_name=x |
Corresponde a x como fully_qualified_name . |
Pesquisa com linguagem natural
As chaves de predicado type
, system
, location
e description
, e a pesquisa de aspectos (exceto has
) oferecem suporte apenas ao qualificador de correspondência exata (=
), não ao qualificador de substring (:
). Por exemplo, type=foo
.
O Dataplex Universal Catalog é compatível com os seguintes qualificadores para pesquisa em linguagem natural:
Qualificador | Descrição |
---|---|
name:x |
Corresponde a x como uma substring do ID ou do nome de exibição do recurso. |
displayname:x |
Corresponda x como substring do nome de exibição do recurso. |
column:x |
Corresponde x como uma substring do nome da coluna (ou nome da coluna aninhada) no esquema do recurso. |
description:x |
Corresponde x como um token na descrição do recurso. |
labels:bar |
Corresponde a recursos do BigQuery que têm um rótulo (com algum valor) e a chave de rótulo tem bar como substring. |
labels=bar |
Corresponde a recursos do BigQuery que têm um rótulo (com algum valor) e a chave de rótulo é igual a bar como uma string. |
labels.bar:x |
Corresponde a x como uma substring no valor de um rótulo com a chave bar anexada a um recurso do BigQuery. |
labels.foo=bar |
Corresponde a recursos do BigQuery em que a chave é igual a foo e o valor da chave é igual a bar . |
type=TYPE |
Corresponde a recursos de um tipo de entrada específico ou ao alias dele. |
projectid:bar |
Corresponde a recursos em projetos Google Cloud que correspondem abar como uma substring no ID. |
parent:x |
Corresponde a x como uma substring do caminho hierárquico de um recurso. |
system=SYSTEM |
Corresponde a recursos de um sistema especificado. |
location=LOCATION |
Corresponde recursos em um local especificado com um nome exato.
Por exemplo, Os recursos do BigQuery Omni oferecem suporte a esse qualificador usando o
nome do local do BigQuery Omni.
Por exemplo, |
createtime |
Encontra recursos criados em, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar em GMT. Fusos horários não são aceitos. Timestamps parciais e separadores de data com hífen ( Exemplo:
|
updatetime |
Encontra recursos que foram atualizados em, antes ou depois de uma determinada data ou hora. Exemplo:
Formato do carimbo de data/hora: Todos os carimbos de data/hora precisam estar em GMT. Fusos horários não são aceitos. Timestamps parciais e separadores de data com hífen ( Exemplo:
|
Pesquisa de aspectos
Para pesquisar entradas com base nos aspectos anexados, use a seguinte sintaxe de consulta.
Pesquisa por palavra-chave
Qualificador | Descrição |
---|---|
aspect:x |
Corresponde a x como uma substring do caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
aspect=x |
Corresponde a x como o caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
aspect:xOPERATORvalue |
Pesquisa valores de campo de aspecto. Corresponde a A lista de operadores compatíveis depende do tipo de campo no aspecto, da seguinte forma:
Somente campos de nível superior do aspecto podem ser pesquisados. Por exemplo, todas as consultas a seguir correspondem a entradas em que o valor do campo
|
Pesquisa com linguagem natural
Qualificador | Descrição |
---|---|
has:x |
Corresponde a x como uma substring do caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
has=x |
Corresponde a x como o caminho completo para o tipo de aspecto de um aspecto anexado à entrada, no formato projectid.location.ASPECT_TYPE_ID . |
has:xOPERATORvalue |
Pesquisa valores de campo de aspecto. Corresponde a
Somente campos de nível superior do aspecto podem ser pesquisados. |
Operadores lógicos
Uma consulta pode consistir em vários predicados com operadores lógicos. Se você não especificar um operador, o AND
lógico ficará implícito. Por exemplo, foo bar
retorna recursos que correspondem aos predicados foo
e bar
.
Os operadores lógicos AND
e OR
são compatíveis. Por exemplo, foo OR bar
.
É possível negar um predicado com um prefixo -
(hífen) ou NOT
. Por exemplo,
-name:foo
retorna recursos com nomes que não correspondem ao predicado foo
.
Sintaxe abreviada
Uma sintaxe de pesquisa abreviada também está disponível, usando |
(barra vertical) para operadores OR
e ,
(vírgula) para operadores AND
.
Por exemplo, para procurar entradas dentro de um dos vários projetos usando o operador OR
, use a seguinte sintaxe abreviada:
projectid:(id1|id2|id3|id4)
A mesma pesquisa sem usar a sintaxe abreviada seria assim:
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
Para pesquisar entradas com nomes de coluna correspondentes, use o seguinte:
- AND:
column:(name1, name2, name3)
- OR:
column:(name1|name2|name3)
Essa sintaxe abreviada funciona para os predicados qualificados, exceto label
na pesquisa de palavras-chave.
A seguir
- Saiba como pesquisar recursos no Catálogo Universal do Dataplex
- Saiba mais sobre o gerenciamento de metadados no Dataplex Universal Catalog.
- Saiba como enriquecer entradas com metadados usando aspectos.
- Saiba como gerenciar entradas e ingerir fontes personalizadas.