Sintassi di ricerca per il Catalogo universale Dataplex

Questo documento descrive la sintassi delle query di ricerca di Dataplex Universal Catalog. Prima di leggere questo documento, è importante comprendere i concetti relativi alla gestione dei metadati in Dataplex Universal Catalog, come voci, aspetti, tipi di aspetto, gruppi di voci e tipi di voci. Per saperne di più, vedi Informazioni sulla gestione dei metadati in Dataplex Universal Catalog.

Dataplex Universal Catalog offre due modalità di ricerca: ricerca per parole chiave e ricerca in linguaggio naturale (anteprima).

La ricerca per parole chiave consente di trovare risorse utilizzando parole chiave, filtri e una sintassi definiti.

La ricerca nel linguaggio naturale estende la ricerca per parole chiave per supportare le query in linguaggio naturale. Consente di trovare risorse utilizzando un linguaggio comune, eliminando la necessità di una sintassi complessa.

Questo documento descrive la sintassi per la ricerca per parole chiave e in linguaggio naturale.

Per avviare una query di ricerca di Dataplex Universal Catalog nella consoleGoogle Cloud , vai alla pagina Cerca di Dataplex Universal Catalog e seleziona Dataplex Universal Catalog come piattaforma di ricerca.

Vai a Cerca

Per saperne di più, consulta Cercare risorse in Dataplex Universal Catalog.

Puoi trovare gli asset inserendo un termine o una frase senza una sintassi specifica. Dataplex Universal Catalog esegue una ricerca ampia abbinando la query a diversi campi di metadati, tra cui i seguenti:

  • Nome, nome visualizzato o descrizione di una risorsa
  • Tipo di risorsa
  • ID progetto
  • Descrizione della panoramica
  • Nome della colonna (o della colonna nidificata) nello schema di una risorsa
  • Descrizione colonna
  • Nome completo
  • Contatti
  • Aspetti

Ricerca con la sintassi delle query

Per ricerche più precise, puoi creare una query utilizzando una sintassi specifica, inclusi qualificatori, operatori logici e ricerche di aspetti.

Predicati qualificati

Puoi qualificare un predicato anteponendogli una chiave che limita la corrispondenza a un metadato specifico:

  • Il segno di uguale (=) limita la ricerca a una corrispondenza esatta.
  • I due punti (:) dopo la chiave corrispondono al predicato a una sottostringa o a un token all'interno del valore nei risultati di ricerca.

La tokenizzazione divide il flusso di testo in una serie di token, con ogni token che di solito corrisponde a una singola parola.

Ad esempio:

  • name:foo seleziona le risorse con nomi che contengono la sottostringa foo, ad esempio foo1 e barfoo.
  • description:foo seleziona le risorse con il token foo nella descrizione, come bar e foo.
  • location=foo corrisponde alle risorse in una posizione specificata con foo come nome della posizione.

Il comportamento di questi qualificatori può variare leggermente tra le modalità di ricerca, come descritto nelle sezioni seguenti.

Le chiavi predicato type, system, location e orgid supportano solo il qualificatore corrispondenza esatta (=), non il qualificatore sottostringa (:). Ad esempio, type=foo o orgid=number.

Dataplex Universal Catalog supporta i seguenti qualificatori per la ricerca per parole chiave:

Qualificatore Descrizione
name:x Corrisponde a x come sottostringa dell'ID risorsa.
displayname:x Corrisponde a x come sottostringa del nome visualizzato della risorsa.
column:x Corrisponde a x come sottostringa del nome della colonna (o del nome della colonna nidificata) nello schema della risorsa.
description:x Corrisponde a x come token nella descrizione della risorsa.
label:bar Corrisponde alle risorse BigQuery che hanno un'etichetta (con un valore) e la cui chiave di etichetta ha bar come sottostringa.
label=bar Corrisponde alle risorse BigQuery che hanno un'etichetta (con un valore) e la cui chiave di etichetta è uguale a bar come stringa.
label:bar:x Corrisponde a x come sottostringa nel valore di un'etichetta con chiave bar collegata a una risorsa BigQuery.
label=foo:bar Corrisponde alle risorse BigQuery in cui la chiave è uguale a foo e il valore della chiave è uguale a bar.
label.foo=bar Corrisponde alle risorse BigQuery in cui la chiave è uguale a foo e il valore della chiave è uguale a bar.
label.foo Corrisponde alle risorse BigQuery che hanno un'etichetta la cui chiave è uguale a foo come stringa.
type=TYPE Corrisponde alle risorse di un tipo di voce specifico o al relativo alias di tipo.
projectid:bar Trova le risorse all'interno dei progetti Google Cloud che corrispondono a bar come sottostringa nell'ID.
parent:x Corrisponde a x come sottostringa del percorso gerarchico di una risorsa. Il percorso principale è un fully_qualified_name della risorsa padre.
orgid=number Corrisponde alle risorse all'interno di un'organizzazione Google Cloud con il valore ID esatto di number.
system=SYSTEM Corrisponde alle risorse di un sistema specificato.
location=LOCATION

Corrisponde alle risorse in una posizione specificata con un nome esatto. Ad esempio, location=us-central1 corrisponde agli asset ospitati in Iowa.

Gli asset BigQuery Omni supportano questo qualificatore utilizzando il nome della località BigQuery Omni. Ad esempio, location=aws-us-east-1 corrisponde agli asset BigQuery Omni in Virginia del Nord.

createtime

Trova le risorse create entro, prima o dopo una determinata data o ora.

Ad esempio:

  • createtime:2019-01-01 corrisponde alle risorse create il giorno 2019-01-01.
  • createtime<2019-02 corrisponde alle risorse create prima del 2019-02-01T00:00:00.
  • createtime>2019-02 corrisponde alle risorse create dopo il 2019-02-01T00:00:00.

Formato del timestamp: YYYY-MM-DDThh:mm:ss

Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati timestamp parziali, separatori di date con trattino (-) e separatori di date con barra (/).

Ad esempio:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
updatetime

Trova le risorse aggiornate entro, prima o dopo una determinata data o ora.

Ad esempio:

  • updatetime:2019-01-01 corrisponde alle risorse aggiornate il giorno 2019-01-01.
  • updatetime<2019-02 corrisponde alle risorse aggiornate prima del 2019-02-01T00:00:00.
  • updatetime>2019-02 corrisponde alle risorse aggiornate dopo il 2019-02-01T00:00:00.

Formato del timestamp: YYYY-MM-DDThh:mm:ss

Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati timestamp parziali, separatori di date con trattino (-) e separatori di date con barra (/).

Ad esempio:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
fully_qualified_name:x Corrisponde a x come sottostringa di fully_qualified_name.
fully_qualified_name=x Corrisponde a x come fully_qualified_name.

Le chiavi predicato type, system, location e description e la ricerca di aspetti (escluso has) supportano solo il qualificatore di corrispondenza esatta (=), non il qualificatore di sottostringa (:). Ad esempio, type=foo.

Dataplex Universal Catalog supporta i seguenti qualificatori per la ricerca in linguaggio naturale:

Qualificatore Descrizione
name:x Corrisponde a x come sottostringa dell'ID risorsa o del nome visualizzato della risorsa.
displayname:x Corrisponde a x come sottostringa del nome visualizzato della risorsa.
column:x Corrisponde a x come sottostringa del nome della colonna (o del nome della colonna nidificata) nello schema della risorsa.
description:x Corrisponde a x come token nella descrizione della risorsa.
labels:bar Corrisponde alle risorse BigQuery che hanno un'etichetta (con un valore) e la cui chiave di etichetta ha bar come sottostringa.
labels=bar Corrisponde alle risorse BigQuery che hanno un'etichetta (con un valore) e la cui chiave di etichetta è uguale a bar come stringa.
labels.bar:x Corrisponde a x come sottostringa nel valore di un'etichetta con chiave bar collegata a una risorsa BigQuery.
labels.foo=bar Corrisponde alle risorse BigQuery in cui la chiave è uguale a foo e il valore della chiave è uguale a bar.
type=TYPE Corrisponde alle risorse di un tipo di voce specifico o al relativo alias di tipo.
projectid:bar Trova le risorse all'interno dei progetti Google Cloud che corrispondono a bar come sottostringa nell'ID.
parent:x Corrisponde a x come sottostringa del percorso gerarchico di una risorsa.
system=SYSTEM Corrisponde alle risorse di un sistema specificato.
location=LOCATION

Corrisponde alle risorse in una posizione specificata con un nome esatto. Ad esempio, location=us-central1 corrisponde agli asset ospitati in Iowa.

Gli asset BigQuery Omni supportano questo qualificatore utilizzando il nome della località BigQuery Omni. Ad esempio, location=aws-us-east-1 corrisponde agli asset BigQuery Omni in Virginia del Nord.

createtime

Trova le risorse create entro, prima o dopo una determinata data o ora.

Ad esempio:

  • createtime:2019-01-01 corrisponde a tutte le risorse create il giorno 2019-01-01.
  • createtime<2019-02 corrisponde a tutte le risorse create prima del 01/02/2019 alle ore 00:00:00.
  • createtime>2019-02 corrisponde a tutte le risorse create dopo il 01/02/2019T00:00:00.
  • createtime>-30d corrisponde a tutte le risorse create negli ultimi 30 giorni.
  • createtime<=-30d corrisponde a tutte le risorse create 30 giorni prima o in una data precedente.
  • createtime<=-1d corrisponde a tutte le risorse create il giorno precedente.

Formato del timestamp: YYYY-MM-DDThh:mm:ss

Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati timestamp parziali, separatori di date con trattino (-) e separatori di date con barra (/).

Ad esempio:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
updatetime

Trova le risorse aggiornate entro, prima o dopo una determinata data o ora.

Ad esempio:

  • updatetime:2019-01-01 corrisponde a tutte le risorse aggiornate il 2019-01-01.
  • updatetime<2019-02 corrisponde a tutte le risorse aggiornate prima del 01/02/2019T00:00:00.
  • updatetime>2019-02 corrisponde a tutte le risorse aggiornate dopo il 01/02/2019 alle ore 00:00:00.
  • updatetime>-30d corrisponde a tutte le risorse aggiornate negli ultimi 30 giorni.
  • updatetime<-30d corrisponde a tutte le risorse aggiornate 30 giorni fa o in una data precedente.
  • updatetime=-1d corrisponde a tutte le risorse aggiornate il giorno precedente.
  • updatetime>=-30d corrisponde a tutte le risorse aggiornate negli ultimi 30 giorni.
  • updatetime<=-30d corrisponde a tutte le risorse aggiornate 30 giorni fa o in una data precedente.

Formato del timestamp: YYYY-MM-DDThh:mm:ss

Tutti i timestamp devono essere in GMT; i fusi orari non sono supportati. Sono supportati timestamp parziali, separatori di date con trattino (-) e separatori di date con barra (/).

Ad esempio:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22

Per cercare voci in base agli aspetti allegati, utilizza la seguente sintassi della query.

Ricerca per parole chiave

Qualificatore Descrizione
aspect:x Corrisponde a x come sottostringa del percorso completo del tipo di aspetto di un aspetto allegato alla voce, nel formato projectid.location.ASPECT_TYPE_ID
aspect=x Corrisponde a x come percorso completo del tipo di aspetto di un aspetto allegato alla voce, nel formato projectid.location.ASPECT_TYPE_ID
aspect:xOPERATORvalue

Cerca i valori dei campi degli aspetti. Corrisponde a x come sottostringa del percorso completo del tipo di aspetto e del nome del campo di un aspetto allegato alla voce, nel formato projectid.location.ASPECT_TYPE_ID.FIELD_NAME

L'elenco degli operatori supportati dipende dal tipo di campo nell'aspetto, come segue:

  • Stringa: = (corrispondenza esatta) e : (sottostringa)
  • Tutti i tipi di numeri: =, :, <, >, <=, >=, =>, =<
  • Enum: =
  • Data e ora: come per i numeri, ma i valori da confrontare vengono trattati come date e ore anziché come numeri
  • Valore booleano: =

Solo i campi di primo livello dell'aspetto sono ricercabili.

Ad esempio, tutte le seguenti query corrispondono alle voci in cui il valore del campo is-enrolled nell'aspetto employee-info è true. Vengono restituite anche altre voci che corrispondono alla sottostringa.

  • aspect:example-project.us-central1.employee-info.is-enrolled=true
  • aspect:example-project.us-central1.employee=true
  • aspect:employee=true

Ricerca in Natural Language

Qualificatore Descrizione
has:x Corrisponde a x come sottostringa del percorso completo del tipo di aspetto di un aspetto allegato alla voce, nel formato projectid.location.ASPECT_TYPE_ID
has=x Corrisponde a x come percorso completo del tipo di aspetto di un aspetto allegato alla voce, nel formato projectid.location.ASPECT_TYPE_ID
has:xOPERATORvalue

Cerca i valori dei campi degli aspetti. Corrisponde a x come sottostringa del percorso completo del tipo di aspetto e del nome del campo di un aspetto allegato alla voce, nei seguenti formati:

  • Sintassi per i tipi di aspetto di sistema:

    • ASPECT_TYPE_ID.FIELD_NAME
    • dataplex-types.ASPECT_TYPE_ID.FIELD_NAME
    • dataplex-types.LOCATION.ASPECT_TYPE_ID.FIELD_NAME

    Ad esempio, le seguenti query corrispondono alle voci in cui il valore del campo type nell'aspetto bigquery-dataset è default:

    • bigquery-dataset.type=default
    • dataplex-types.bigquery-dataset.type=default
    • dataplex-types.global.bigquery-dataset.type=default
  • Sintassi per i tipi di aspetto personalizzati:

    • Se l'aspetto viene creato nella regione globale: PROJECT_ID.ASPECT_TYPE_ID.FIELD_NAME
    • Se l'aspetto viene creato in una regione specifica: PROJECT_ID.REGION.ASPECT_TYPE_ID.FIELD_NAME

    Ad esempio, le seguenti query corrispondono alle voci in cui il valore del campo is-enrolled nell'aspetto employee-info è true.

    • example-project.us-central1.employee-info.is-enrolled=true
    • example-project.employee-info.is-enrolled=true

    L'elenco degli operatori supportati dipende dal tipo di campo nell'aspetto, come segue:

    • Stringa: = (corrispondenza esatta)
    • Tutti i tipi di numeri: =, :, <, >, <=, >=, =>, =<
    • Enum: =
    • Data e ora: come per i numeri, ma i valori da confrontare vengono trattati come date e ore anziché come numeri
    • Valore booleano: =

Solo i campi di primo livello dell'aspetto sono ricercabili.

Operatori logici

Una query può essere costituita da più predicati con operatori logici. Se non specifichi un operatore, viene utilizzato l'operatore logico AND. Ad esempio, foo bar restituisce le risorse che corrispondono sia al predicato foo sia al predicato bar.

Sono supportati gli operatori logici AND e OR. Ad esempio: foo OR bar.

Puoi negare un predicato con un prefisso - (trattino) o NOT. Ad esempio, -name:foo restituisce risorse con nomi che non corrispondono al predicato foo.

Sintassi abbreviata

È disponibile anche una sintassi di ricerca abbreviata, che utilizza | (barra verticale) per gli operatori OR e , (virgola) per gli operatori AND.

Ad esempio, per cercare voci all'interno di uno dei tanti progetti utilizzando l'operatore OR, puoi utilizzare la seguente sintassi abbreviata:

projectid:(id1|id2|id3|id4)

La stessa ricerca senza utilizzare la sintassi abbreviata ha il seguente aspetto:

projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4

Per cercare voci con nomi di colonne corrispondenti, utilizza quanto segue:

  • AND: column:(name1, name2, name3)
  • OPPURE: column:(name1|name2|name3)

Questa sintassi abbreviata funziona per i predicati qualificati, ad eccezione di label nella ricerca di parole chiave.

Passaggi successivi