Esportare i risultati delle query in Blob Storage

Questo documento descrive come esportare il risultato di una query eseguita su una tabella BigLake in Archiviazione BLOB di Azure.

Per informazioni su come i dati fluiscono tra BigQuery e Azure Blob Storage, consulta Flusso di dati durante l'esportazione dei dati.

Limitazioni

Per un elenco completo delle limitazioni che si applicano alle tabelle BigLake basate su Amazon S3 e Blob Storage, consulta Limitazioni.

Prima di iniziare

Assicurati di disporre delle seguenti risorse:

  • Una connessione per accedere a Blob Storage. All'interno della connessione, devi creare un criterio per il percorso del contenitore di Archiviazione BLOB in cui vuoi eseguire l'esportazione. Poi, all'interno di questo criterio, crea un ruolo che disponga dell'autorizzazioneMicrosoft.Storage/storageAccounts/blobServices/containers/write.
  • Una tabella BigLake di Archiviazione blob.

Esportare i risultati delle query

BigQuery Omni scrive nella posizione di Blob Storage specificata indipendentemente dai contenuti esistenti. La query di esportazione può sovrascrivere i dati esistenti o combinare il risultato della query con i dati esistenti. Ti consigliamo di esportare il risultato della query in un contenitore Blob Storage vuoto.

  1. Nella console Google Cloud, vai alla pagina BigQuery.

    Vai a BigQuery

  2. Nel campo Editor query, inserisci una query di esportazione GoogleSQL:

    EXPORT DATA WITH CONNECTION \`CONNECTION_REGION.CONNECTION_NAME\`
    OPTIONS(
      uri="azure://AZURE_STORAGE_ACCOUNT_NAME.blob.core.windows.net/CONTAINER_NAME/FILE_PATH/*",
      format="FORMAT"
    )
    AS QUERY

    Sostituisci quanto segue:

    • CONNECTION_REGION: la regione in cui è stata creata la connessione.
    • CONNECTION_NAME: il nome della connessione che hai creato con l'autorizzazione necessaria per scrivere nel contenitore.
    • AZURE_STORAGE_ACCOUNT_NAME: il nome dell'account Blob Storage in cui vuoi scrivere il risultato della query.
    • CONTAINER_NAME: il nome del contenitore in cui vuoi scrivere il risultato della query.
    • FILE_PATH: il percorso in cui vuoi scrivere il file esportato. Deve contenere esattamente un carattere jolly * in qualsiasi punto della directory finale della stringa del percorso, ad esempio ../aa/*, ../aa/b*c, ../aa/*bc e ../aa/bc*. BigQuery sostituisce * con 0000..N a seconda del numero di file esportati. BigQuery determina il numero e le dimensioni dei file. Se BigQuery decide di esportare due file, * nel nome del primo file viene sostituito da 000000000000 e * nel nome del secondo file viene sostituito da 000000000001.
    • FORMAT: i formati supportati sono JSON, AVRO, CSV e PARQUET.
    • QUERY: la query per analizzare i dati memorizzati in una tabella BigLake.

Risoluzione dei problemi

Se ricevi un errore relativo a quota failure, controlla se hai riservato la capacità per le tue query. Per ulteriori informazioni sulle prenotazioni degli slot, consulta la sezione Prima di iniziare di questo documento.

Passaggi successivi