Questa pagina mostra come creare una scansione del profilo dei dati utilizzando la consoleGoogle Cloud , Google Cloud CLI o l'API REST.
Per saperne di più sulle scansioni del profilo dati di Dataplex Universal Catalog, vedi Informazioni sulla profilazione dei dati.
Prima di iniziare
Nella Google Cloud console, abilita l'API Dataplex.
Autorizzazioni
Per profilare le tabelle BigQuery, devi disporre delle seguenti autorizzazioni:
Per eseguire una scansione del profilo dati su una tabella BigQuery, devi disporre dell'autorizzazione per leggere la tabella BigQuery e dell'autorizzazione per creare un job BigQuery nel progetto utilizzato per scansionare la tabella.
Se la tabella BigQuery e la scansione del profilo dati si trovano in progetti diversi, devi concedere all'account di servizio Dataplex Universal Catalog l'autorizzazione di lettura sulla tabella BigQuery corrispondente.
Se i dati BigQuery sono organizzati in un lake Dataplex Universal Catalog, per creare una scansione del profilo dati, devi disporre dei ruoli Dataplex Universal Catalog
roles/dataplex.metadataReader
eroles/dataplex.viewer
. In questo modo vengono concesse le seguenti autorizzazioni:dataplex.lakes.list
dataplex.lakes.get
dataplex.zones.list
dataplex.zones.get
dataplex.entities.list
dataplex.entities.get
dataplex.operations.get
Se esegui la scansione di una tabella esterna BigQuery da Cloud Storage, assegna all'account di servizio del Catalogo universale Dataplex il ruolo Visualizzatore oggetti Cloud Storage (
roles/storage.objectViewer
) o le seguenti autorizzazioni per il bucket:storage.buckets.get
storage.objects.get
Se vuoi pubblicare i risultati della scansione del profilo dati nelle pagine del catalogo universale di BigQuery e Dataplex nella consoleGoogle Cloud per le tabelle di origine, devi disporre del ruolo IAM Editor dati BigQuery (
roles/bigquery.dataEditor
) nella tabella. In alternativa, devi disporre di tutte le seguenti autorizzazioni:bigquery.tables.get
bigquery.tables.update
bigquery.tables.updateData
bigquery.tables.delete
Per esportare i risultati della scansione in una tabella BigQuery, il account di servizio del Catalogo universale Dataplex deve disporre del ruolo Editor dati BigQuery (
roles/bigquery.dataEditor
). Ciò concede le seguenti autorizzazioni:bigquery.datasets.get
bigquery.tables.create
bigquery.tables.get
bigquery.tables.getData
bigquery.tables.update
bigquery.tables.updateData
Se devi accedere a colonne protette da criteri di accesso a livello di colonna di BigQuery, assegna all'account di servizio Dataplex Universal Catalog le autorizzazioni per queste colonne. L'utente che crea o aggiorna una scansione dei dati deve disporre anche delle autorizzazioni per le colonne.
Se una tabella ha abilitato i criteri di accesso a livello di riga BigQuery, puoi analizzare solo le righe visibili all'account di servizio Dataplex Universal Catalog. Tieni presente che i privilegi di accesso del singolo utente non vengono valutati per le norme a livello di riga.
Ruoli e autorizzazioni per la scansione dei dati
Per utilizzare la profilazione dei dati, un amministratore del progetto assegna un ruolo predefinito con le autorizzazioni già concesse o concede singole autorizzazioni. I ruoli sono i seguenti:
roles/dataplex.dataScanAdmin
: Accesso completo alle risorseDataScan
.roles/dataplex.dataScanEditor
: accesso in scrittura alle risorseDataScan
.roles/dataplex.dataScanViewer
: accesso in lettura alle risorseDataScan
, esclusi i risultati.roles/dataplex.dataScanDataViewer
: Accesso in lettura alle risorseDataScan
, inclusi i risultati.
La seguente tabella elenca le autorizzazioni di scansione dei dati:
Nome dell'autorizzazione | Concede l'autorizzazione a svolgere le seguenti operazioni: |
---|---|
dataplex.datascans.create |
Crea un DataScan |
dataplex.datascans.delete |
Eliminare un DataScan |
dataplex.datascans.get |
Visualizza i dettagli di DataScan escludendo i risultati |
dataplex.datascans.getData |
Visualizza i dettagli di DataScan , inclusi i risultati |
dataplex.datascans.list |
Elenco DataScan |
dataplex.datascans.run |
Esegui un DataScan |
dataplex.datascans.update |
Aggiornare la descrizione di un DataScan |
dataplex.datascans.getIamPolicy |
Visualizza le autorizzazioni IAM correnti nella scansione |
dataplex.datascans.setIamPolicy |
Imposta le autorizzazioni IAM per la scansione |
Crea una scansione del profilo di dati
Console
Nella console Google Cloud , vai alla pagina Profilo.
Fai clic su Crea scansione del profilo di dati.
Inserisci un nome visualizzato.
Per modificare l'ID scansione generato automaticamente, fornisci il tuo. Consulta Convenzioni di denominazione delle risorse.
(Facoltativo) Inserisci una Descrizione.
Nel campo Table (Tabella), fai clic su Sfoglia.
Seleziona una tabella e fai clic su Seleziona.
Nel campo Ambito, scegli Incrementale o Tutti i dati.
- Se scegli Dati incrementali, nel campo Colonna timestamp,
seleziona una colonna di tipo
DATE
oTIMESTAMP
dalla tabella BigQuery che aumenti in modo monotonico e possa essere utilizzata per identificare nuovi record. Per le tabelle partizionate in base a una colonna di tipoDATE
oTIMESTAMP
, consigliamo di utilizzare la colonna di partizionamento come campo timestamp.
- Se scegli Dati incrementali, nel campo Colonna timestamp,
seleziona una colonna di tipo
Per applicare il campionamento alla scansione del profilo dati, seleziona una percentuale di campionamento nell'elenco Dimensione campionamento.
- Scegli un valore percentuale compreso tra 0,0% e 100,0% con un massimo di 3 cifre decimali.
- Per set di dati più grandi, scegli una percentuale di campionamento inferiore. Ad esempio, per una tabella di circa 1 PB, se inserisci un valore compreso tra 0,1% e 1,0%, Dataplex Universal Catalog esegue il campionamento di 1-10 TB di dati.
- Per restituire un risultato, i dati campionati devono contenere almeno 100 record.
- Per le scansioni incrementali dei dati, Dataplex Universal Catalog applica il campionamento all'ultimo incremento.
Per filtrare per riga, fai clic su Filtri e seleziona Filtra righe.
Inserisci un'espressione SQL valida che può essere utilizzata in una clausola
WHERE
nella sintassi GoogleSQL. Ad esempio:col1 >= 0
.Il filtro può essere una combinazione di condizioni SQL su più colonne. Ad esempio:
col1 >= 0 AND col2 < 10
.
(Facoltativo) Fai clic su Filtri. Seleziona la casella di controllo Filtra colonne.
a. Nel campo Includi colonne, fai clic su Sfoglia.
- Specifica le colonne da includere nella scansione del profilo. Seleziona le colonne che preferisci selezionando le caselle e facendo clic su Seleziona.
b. Nel campo Escludi colonne, fai clic su Sfoglia.
- Specifica le colonne da escludere dalla scansione del profilo. Seleziona le colonne che preferisci selezionando le caselle e facendo clic su Seleziona.
(Facoltativo) Pubblica i risultati della scansione del profilo dati nelle pagine BigQuery e Dataplex Universal Catalog nella consoleGoogle Cloud per la tabella di origine. Fai clic sulla casella di controllo Pubblica i risultati nell'interfaccia utente del catalogo BigQuery e Dataplex.
Puoi visualizzare i risultati dell'ultima scansione nella scheda Profilo dati nelle pagine di BigQuery e Dataplex Universal Catalog per la tabella di origine. Per consentire agli utenti di accedere ai risultati dell'analisi pubblicati, consulta Condividere i risultati pubblicati.
L'opzione di pubblicazione potrebbe non essere disponibile nei seguenti casi:
- Non disponi delle autorizzazioni necessarie per la tabella.
- È impostata un'altra scansione della qualità dei dati per pubblicare i risultati.
Per ulteriori informazioni sulle autorizzazioni necessarie per visualizzare i risultati pubblicati, consulta Autorizzazioni.
(Facoltativo) Esporta i risultati della scansione in una tabella standard BigQuery. Fai clic su Sfoglia per selezionare un set di dati BigQuery esistente in cui archiviare i risultati della scansione del profilo dati.
Se la tabella specificata non esiste, Dataplex Universal Catalog la crea per te. Se utilizzi una tabella esistente, assicurati che sia compatibile con lo schema della tabella descritto più avanti in questa sezione.
(Facoltativo) Aggiungi etichette. Le etichette sono coppie
key:value
che consentono di raggruppare oggetti correlati fra loro o con altre risorse Google Cloud .In Opzioni di pianificazione, scegli una delle seguenti opzioni:
Ripeti: esegui il job di scansione del profilo di dati in base a una pianificazione: giornaliera, settimanale, mensile o personalizzata. Specifica la frequenza di esecuzione della scansione e l'ora. Se scegli l'opzione personalizzata, utilizza il formato cron per specificare la pianificazione.
On demand: crea la scansione del profilo di dati ed eseguila in qualsiasi momento utilizzando l'azione Esegui ora.
Fai clic su Crea.
gcloud
Per creare una scansione del profilo di dati, esegui questo comando:
gcloud dataplex datascans create data-profile DATASCAN \ --location=LOCATION \ --data-source-entity=DATA_SOURCE_ENTITY | --data-source-resource=DATA_SOURCE_RESOURCE
Sostituisci le seguenti variabili:
DATASCAN
: Il nome della scansione di profilazione dei dati.LOCATION
: La Google Cloud regione in cui creare la scansione del profilo dei dati.DATA_SOURCE_ENTITY
: l'entità Dataplex Universal Catalog che contiene i dati per l'analisi del profilo dati. Ad esempio,projects/test-project/locations/test-location/lakes/test-lake/zones/test-zone/entities/test-entity
.DATA_SOURCE_RESOURCE
: il nome della risorsa che contiene i dati per la scansione del profilo dei dati. Ad esempio,//bigquery.googleapis.com/projects/test-project/datasets/test-dataset/tables/test-table
.
Per gli argomenti facoltativi, consulta la documentazione di riferimento di gcloud CLI.
REST
Utilizza Explorer API per creare una scansione del profilo di dati.
Crea più scansioni del profilo dati
Console
Nella console Google Cloud, vai alla pagina Profilo.
Fai clic su Crea più scansioni del profilo.
Inserisci un prefisso ID. Il catalogo universale Dataplex genera automaticamente gli ID scansione utilizzando il prefisso fornito e i suffissi univoci.
Inserisci una Descrizione per tutte le scansioni del profilo dati.
Nel campo Dataset, fai clic su Sfoglia. Seleziona un set di dati da cui scegliere le tabelle. Fai clic su Seleziona.
Se il set di dati è multiregionale, seleziona una regione in cui creare le scansioni dei profili dei dati.
Seleziona Opzioni di configurazione comuni:
Nel campo Ambito, scegli Incrementale o Tutti i dati.
Per applicare il campionamento alle scansioni del profilo dati, seleziona una percentuale di campionamento nell'elenco Dimensione campionamento.
Scegli un valore percentuale compreso tra 0,0% e 100,0% con un massimo di tre cifre decimali.
Per visualizzare i risultati di tutte le scansioni, seleziona Pubblicazione. Puoi visualizzare i risultati nella scheda Profilo dei dettagli della tabella BigQuery o Dataplex Universal Catalog. Assicurati di disporre delle autorizzazioni
bigquery.tables.update
sulle tabelle di origine.In Opzioni di pianificazione, scegli una delle seguenti opzioni:
Ripeti: esegui i job di scansione del profilo di dati in base a una pianificazione. Specifica la frequenza di esecuzione della scansione (giornaliera, settimanale, mensile o personalizzata) e l'ora. Se scegli Personalizzato, utilizza il formato cron per specificare la pianificazione.
On demand: crea i job di scansione del profilo di dati ed eseguili in qualsiasi momento facendo clic su Esegui.
Nell'opzione Scegli tabelle, fai clic su Sfoglia. Scegli una o più tabelle da scansionare. Fai clic su Seleziona.
Seleziona Impostazioni aggiuntive:
Per salvare i risultati delle scansioni del profilo dati in una tabella BigQuery a tua scelta, scegli una tabella in Esporta i risultati della scansione in una tabella BigQuery. Dataplex Universal Catalog copia e salva automaticamente i risultati in questa tabella per ogni job di scansione.
Fai clic su Sfoglia per selezionare un set di dati.
Inserisci una tabella BigQuery in cui salvare i risultati. Può trattarsi di una tabella esistente, utilizzata da altre analisi dei profili dei dati di Dataplex Universal Catalog per salvare i risultati. Se non esiste una tabella con il nome specificato, Dataplex Universal Catalog la crea.
Aggiungi etichette per annotare la scansione del profilo di dati.
Fai clic su Esegui scansione per creare ed eseguire tutte le scansioni. Questa opzione è disponibile solo per le scansioni on demand.
Fai clic su Crea per creare tutte le scansioni.
gcloud
Non supportati.
REST
Non supportati.
Esporta schema tabella
Se vuoi esportare i risultati della scansione del profilo di dati in una tabella BigQuery esistente, assicurati che sia compatibile con lo schema della tabella seguente:
Nome colonna | Tipo di dati della colonna | Nome del campo secondario (se applicabile) |
Tipo di dati del campo secondario | Modalità | Esempio |
---|---|---|---|---|---|
data_profile_scan | struct/record |
resource_name |
string |
nullable | //dataplex.googleapis.com/projects/test-project/locations/europe-west2/datascans/test-datascan |
project_id |
string |
nullable | test-project |
||
location |
string |
nullable | us-central1 |
||
data_scan_id |
string |
nullable | test-datascan |
||
data_source | struct/record |
resource_name |
string |
nullable | Entity case://dataplex.googleapis.com/projects/test-project/locations/europe-west2/lakes/test-lake/zones/test-zone/entities/test-entity
Table case: //bigquery.googleapis.com/projects/test-project/datasets/test-dataset/tables/test-table
|
dataplex_entity_project_id |
string |
nullable | test-project |
||
dataplex_entity_project_number |
integer |
nullable | 123456789012 |
||
dataplex_lake_id |
string |
nullable | (Valido solo se l'origine è un'entità)test-lake
|
||
dataplex_zone_id |
string |
nullable | (Valido solo se l'origine è un'entità)test-zone |
||
dataplex_entity_id |
string |
nullable | (Valido solo se l'origine è un'entità)test-entity |
||
table_project_id |
string |
nullable | dataplex-table |
||
table_project_number |
int64 |
nullable | 345678901234 |
||
dataset_id |
string |
nullable | (Valido solo se l'origine è una tabella)test-dataset |
||
table_id |
string |
nullable | (Valido solo se l'origine è una tabella)test-table |
||
data_profile_job_id | string |
nullable | caeba234-cfde-4fca-9e5b-fe02a9812e38 |
||
data_profile_job_configuration | json |
trigger |
string |
nullable | ondemand /schedule |
incremental |
boolean |
nullable | true /false |
||
sampling_percent |
float |
nullable | (0-100)20.0 (indica il 20%) |
||
row_filter |
string |
nullable | col1 >= 0 AND col2 < 10 |
||
column_filter |
json |
nullable | {"include_fields":["col1","col2"], "exclude_fields":["col3"]} |
||
job_labels | json |
nullable | {"key1":value1} |
||
job_start_time | timestamp |
nullable | 2023-01-01 00:00:00 UTC |
||
job_end_time | timestamp |
nullable | 2023-01-01 00:00:00 UTC |
||
job_rows_scanned | integer |
nullable | 7500 |
||
column_name | string |
nullable | column-1 |
||
column_type | string |
nullable | string |
||
column_mode | string |
nullable | repeated |
||
percent_null | float |
nullable | (0,0-100,0)20.0 (indica il 20%) |
||
percent_unique | float |
nullable | (0,0-100,0)92.5 |
||
min_string_length | integer |
nullable | (Valido solo se il tipo di colonna è stringa)10 |
||
max_string_length | integer |
nullable | (Valido solo se il tipo di colonna è stringa)4 |
||
average_string_length | float |
nullable | (Valido solo se il tipo di colonna è stringa)7.2 |
||
min_value | float |
nullable | (Valido solo se il tipo di colonna è numerico: intero/float) | ||
max_value | float |
nullable | (Valido solo se il tipo di colonna è numerico: intero/float) | ||
average_value | float |
nullable | (Valido solo se il tipo di colonna è numerico: intero/float) | ||
standard_deviation | float |
nullable | (Valido solo se il tipo di colonna è numerico: intero/float) | ||
quartile_lower | integer |
nullable | (Valido solo se il tipo di colonna è numerico: intero/float) | ||
quartile_median | integer |
nullable | (Valido solo se il tipo di colonna è numerico: intero/float) | ||
quartile_upper | integer |
nullable | (Valido solo se il tipo di colonna è numerico: intero/float) | ||
top_n | struct/record - repeated |
value |
string |
nullable | "4009" |
count |
integer |
nullable | 20 |
||
percent |
float |
nullable | 10 (indica il 10%) |
Configurazione della tabella di esportazione
Quando esegui l'esportazione nelle tabelle BigQueryExport, segui queste linee guida:
- Per il campo
resultsTable
, utilizza il formato://bigquery.googleapis.com/projects/{project-id}/datasets/{dataset-id}/tables/{table-id}
. - Utilizza una tabella standard BigQuery.
- Se la tabella non esiste quando viene creata o aggiornata la scansione, Dataplex Universal Catalog la crea automaticamente.
- Per impostazione predefinita, la tabella viene partizionata in base alla colonna
job_start_time
ogni giorno. - Se vuoi che la tabella sia partizionata in altre configurazioni o se non vuoi la partizione, ricrea la tabella con lo schema e le configurazioni richiesti e poi fornisci la tabella precreata come tabella dei risultati.
- Assicurati che la tabella dei risultati si trovi nella stessa posizione della tabella di origine.
- Se i controlli di servizio VPC sono configurati nel progetto, la tabella dei risultati deve trovarsi nello stesso perimetro dei controlli di servizio VPC della tabella di origine.
- Se la tabella viene modificata durante la fase di esecuzione della scansione, il job in esecuzione corrente viene esportato nella tabella dei risultati precedente e la modifica alla tabella ha effetto a partire dal job di scansione successivo.
- Non modificare lo schema della tabella. Se hai bisogno di colonne personalizzate, crea una vista della tabella.
- Per ridurre i costi, imposta una scadenza per la partizione in base al tuo caso d'uso. Per saperne di più, scopri come impostare la scadenza della partizione.
Esegui una scansione del profilo di dati
Console
- Nella console Google Cloud , vai alla pagina Profilo di Dataplex Universal Catalog. Vai al profilo
- Fai clic sulla scansione del profilo dati da eseguire.
- Fai clic su Esegui ora.
gcloud
Per eseguire una scansione del profilo dei dati, esegui questo comando:
gcloud dataplex datascans run DATASCAN \ --location=LOCATION
Sostituisci le seguenti variabili:
DATASCAN
: Il nome della scansione di profilazione dei dati.LOCATION
: la Google Cloud regione in cui è stata creata la scansione del profilo di dati.
Per gli argomenti facoltativi, consulta la documentazione di riferimento di gcloud CLI.
REST
Utilizza Explorer API per eseguire la scansione del profilo di dati.
Visualizzare i risultati del job di scansione del profilo di dati
Console
Tutte le scansioni del profilo di dati che crei vengono visualizzate nella pagina Profilo.
Per visualizzare i risultati dettagliati di una scansione, fai clic sul nome della scansione.
La sezione Panoramica mostra le esecuzioni dell'analisi, l'ora di ogni esecuzione, il numero di record della tabella analizzati e lo stato del job.
La sezione Configurazione scansione profilo contiene i dettagli della scansione.
gcloud
Per visualizzare i risultati di un job di scansione del profilo di dati, esegui questo comando:
gcloud dataplex datascans jobs describe JOB \ --location=LOCATION \ --datascan=DATASCAN \ --view=FULL
Sostituisci le seguenti variabili:
JOB
: l'ID job del job di scansione di profilazione dei dati.LOCATION
: la Google Cloud regione in cui è stata creata la scansione del profilo di dati.DATASCAN
: Il nome della scansione del profilo dei dati a cui appartiene il job.--view=FULL
: per visualizzare il risultato del job di scansione, specificaFULL
.
Per gli argomenti facoltativi, consulta la documentazione di riferimento di gcloud CLI.
REST
Utilizza Explorer API per visualizzare i risultati di una scansione del profilo dati.
Visualizza il job di scansione del profilo di dati più recente
Console
La scheda Risultati del job più recente, quando è presente almeno un'esecuzione completata correttamente, fornisce informazioni sull'ultimo job. Elenca le colonne e le statistiche della tabella scansionata relative alle colonne trovate nella scansione.
gcloud
Per visualizzare l'ultima scansione riuscita del profilo di dati, esegui questo comando:
gcloud dataplex datascans describe DATASCAN \ --location=LOCATION \ --view=FULL
Sostituisci le seguenti variabili:
DATASCAN
: Il nome della scansione del profilo dei dati da visualizzare per il job più recente.LOCATION
: la Google Cloud regione in cui è stata creata la scansione del profilo di dati.--view=FULL
: per visualizzare il risultato del job di scansione, specificaFULL
.
Per gli argomenti facoltativi, consulta la documentazione di riferimento di gcloud CLI.
REST
Utilizza Explorer API per visualizzare l'ultimo job di scansione.
Visualizza tutti i job di scansione del profilo di dati
Dataplex Universal Catalog salva la cronologia delle scansioni del profilo dati degli ultimi 300 job o dell'ultimo anno, a seconda di quale si verifica per primo.
Console
La scheda Cronologia job fornisce informazioni sui job passati. Elenca tutti i job, il numero di record scansionati in ogni job, lo stato del job, il tempo di esecuzione del job e altro ancora.
Per visualizzare le informazioni dettagliate su un job, fai clic su uno qualsiasi dei job in ID job.
gcloud
Per visualizzare tutti i job di una scansione del profilo di dati, esegui questo comando:
gcloud dataplex datascans jobs list \ --location=LOCATION \ --datascan=DATASCAN
Sostituisci le seguenti variabili:
LOCATION
: la Google Cloud regione in cui è stata creata la scansione del profilo di dati.DATASCAN
: Il nome della scansione del profilo dei dati da visualizzare per tutti i job.
Per gli argomenti facoltativi, consulta la documentazione di riferimento di gcloud CLI.
REST
Utilizza Explorer API per visualizzare tutti i job di scansione.
Condividere i risultati pubblicati
Quando crei una scansione del profilo dati, se hai scelto di pubblicare i risultati della scansione nelle pagine del catalogo universale di BigQuery e Dataplex nella consoleGoogle Cloud , gli ultimi risultati della scansione saranno disponibili nella scheda Profilo dati di queste pagine.
Puoi consentire agli utenti della tua organizzazione di accedere ai risultati della scansione pubblicati. Per concedere l'accesso ai risultati della scansione:
Nella console Google Cloud , vai alla pagina Profilo.
Fai clic sulla scansione del profilo dati di cui vuoi condividere i risultati.
Vai alla scheda Autorizzazioni.
Fai clic su Concedi accesso.
Nel campo Nuove entità, aggiungi l'entità a cui vuoi concedere l'accesso.
Nel campo Seleziona un ruolo, seleziona Dataplex Universal Catalog DataScan DataViewer.
Fai clic su Salva.
Per rimuovere l'accesso ai risultati della scansione pubblicati per un'entità, segui questi passaggi:
Nella console Google Cloud , vai alla pagina Profilo.
Fai clic sulla scansione del profilo dati di cui vuoi condividere i risultati.
Vai alla scheda Autorizzazioni.
Seleziona l'entità per cui vuoi rimuovere il ruolo Visualizzatore dati DataScan di Dataplex Universal Catalog.
Fai clic su Rimuovi accesso.
Fai clic su Conferma.
Aggiorna una scansione del profilo di dati
Console
Nella console Google Cloud , vai alla pagina Profilo.
Nella riga relativa alla scansione che vuoi modificare, fai clic su > Modifica.
Modifica i valori.
Fai clic su Salva.
gcloud
Per aggiornare una scansione del profilo dei dati, esegui questo comando:
gcloud dataplex datascans update data-profile DATASCAN \ --location=LOCATION \ --description=DESCRIPTION
Sostituisci le seguenti variabili:
DATASCAN
: Il nome della scansione del profilo dei dati da aggiornare.LOCATION
: la Google Cloud regione in cui è stata creata la scansione del profilo di dati.DESCRIPTION
: La nuova descrizione della scansione del profilo dei dati.
Per i campi delle specifiche da aggiornare, consulta la documentazione di riferimento di gcloud CLI.
REST
Utilizza Explorer API per modificare una scansione del profilo di dati.
Eliminare una scansione del profilo di dati
Console
Nella console Google Cloud , vai alla pagina Profilo. Vai al profilo Dataplex Universal Catalog
Fai clic sulla scansione che vuoi eliminare.
Fai clic su Elimina.
gcloud
Per eliminare una scansione del profilo dati, esegui questo comando:
gcloud dataplex datascans delete \ DATASCAN --location=LOCATION \ --async
Sostituisci le seguenti variabili:
DATASCAN
: Il nome della scansione del profilo dei dati da eliminare.LOCATION
: la Google Cloud regione in cui è stata creata la scansione del profilo di dati.
Per gli argomenti facoltativi, consulta la documentazione di riferimento di gcloud CLI.
REST
Utilizza Explorer API per eliminare la scansione del profilo dati.
Passaggi successivi
- Scopri come esplorare i dati generando insight.
- Scopri di più sulla profilazione dei dati.
- Scopri di più sulla qualità dei dati automatica.
- Scopri come utilizzare la qualità dei dati automatica.