Log di trasferimento del file system

Questo documento descrive il formato attuale dei log di trasferimento del file system.

Visualizza i log di trasferimento

I trasferimenti del file system generano log di trasferimento dettagliati che puoi utilizzare per verificare i risultati del job di trasferimento. Ogni job produce una raccolta di log di trasferimento memorizzati nel bucket Cloud Storage del trasferimento: il bucket di origine, il bucket di destinazione o il bucket intermedio, a seconda della direzione del trasferimento.

I log vengono generati durante l'esecuzione del job di trasferimento. I log completi sono solitamente disponibili entro 15 minuti dal completamento del job.

Visualizza i log nel bucket Cloud Storage

I log di trasferimento vengono archiviati nel bucket Cloud Storage del trasferimento nel seguente percorso:

bucket-name/storage-transfer/logs/transferJobs/job-name/transferOperations/operation-name

dove:

  • bucket-name è il nome del bucket Cloud Storage coinvolto in questo trasferimento.
  • job-name è il nome del job, visualizzato nell'elenco dei job.
  • operation-name è il nome della singola operazione di trasferimento, composta dal timestamp ISO8601 e dall'ID generato.

I log vengono aggregati e archiviati come oggetti. Ogni batch di log viene denominato in base alla data di creazione. Ad esempio:

my bucket/storage-transfer/logs/transferOperations/job1/2019-10-19T10_52_56.519081644-07_00.log

Esegui query BigQuery sui log di trasferimento

Per eseguire query BigQuery sui log di trasferimento:

  1. Carica i dati dei log CSV in BigQuery.

  2. Esegui la query BigQuery.

Esempi di query

Mostrare il numero di file di cui è stato tentato il trasferimento e se sono riusciti o meno

select ActionStatus, count(*) as num_files
from big-query-table
where Action="TRANSFER"
group by 1;

dove big-query-table è il nome della tabella BigQuery contenente il log di trasferimento.

Visualizzare tutti i file di cui non è stato completato il trasferimento

select Src_File_Path
from big-query-table
where Action="TRANSFER" and ActionStatus="FAILED";

dove big-query-table è il nome della tabella BigQuery contenente il log di trasferimento.

Mostra il checksum e il timestamp di ogni file trasferito correttamente

select Timestamp, Action, ActionStatus, Src_File_Path, Src_File_Size,
Src_File_Crc32C, Dst_Gcs_BucketName, Dst_Gcs_ObjectName, Dst_Gcs_Size,
Dst_Gcs_Crc32C, Dst_Gcs_Md5
from big-query-table
where Action="TRANSFER" and ActionStatus="SUCCEEDED";

dove big-query-table è il nome della tabella BigQuery contenente il log di trasferimento.

Visualizza tutte le informazioni sugli errori per le directory di cui non è stato eseguito il trasferimento

select FailureDetails_ErrorType, FailureDetails_GrpcCode, FailureDetails_Message
from big-query-table
where Action="FIND" and ActionStatus="FAILED";

dove big-query-table è il nome della tabella BigQuery contenente il log di trasferimento.

Descrizione del formato

I log di trasferimento del file system vengono salvati in formato TSV (valori separati da tabulazioni) e contengono una riga di intestazione con i nomi dei campi. L'ordine in cui vengono visualizzati i campi è generalmente stabile, ma non è garantito e deve essere dedotto dalla riga di intestazione.

Ogni riga rappresenta un singolo record del log, ovvero un aggiornamento dello stato di parte dell'operazione di trasferimento complessiva.

La tabella seguente descrive i campi nel file di log:

Campo log Descrizione
Timestamp Timestamp conforme allo standard ISO 8601 al momento della registrazione dell'evento.
Nome dell'operazione Il nome completo dell'operazione.
Azione

Descrive l'azione di questa particolare attività. Il valore sarà uno dei seguenti:

  • TROVA: trovare lavoro da svolgere, ad esempio elencare i file on-premise
  • TRANSFER: trasferimento di file
  • DELETE: eliminazione dei file nella destinazione
ActionStatus

Lo stato generale dell'azione. Il valore sarà uno dei seguenti:

  • RISULTATO: SUCCESSO: l'azione è stata completata correttamente.
  • NON ANDATA A BUON FINE: l'azione non è riuscita. Ulteriori dettagli sull'errore sono disponibili nei campi FailureDetails.
FailureDetails.ErrorType Una stringa che rappresenta il tipo di errore rilevato. Ad esempio, FILE_NOT_FOUND. Viene compilato solo se si è verificato un errore.
FailureDetails.GrpcCode Un valore stringa del codice RPC di Google. Ad esempio, FAILED_PRECONDITION. Viene compilato solo se si è verificato un errore.
FailureDetails.Message Un messaggio di errore leggibile relativo all'errore. Viene compilato solo se si è verificato un errore.
Src.Type Stringa che descrive il tipo di sistema di archiviazione dell'origine. È sempre ON_PREM.
Src.File.Path Percorso del file on-premise trasferito.
Src.File.LastModified L'ora di modifica (mtime) POSIX del file on-premise.
Src.FileSize Le dimensioni del file in byte.
Src.File.Crc32C Il checksum CRC32C dei contenuti del file.
Dst.Type Stringa che descrive il tipo di sistema di archiviazione di destinazione. È sempre GCS.
Dst.Gcs.BucketName Il nome del bucket Cloud Storage di destinazione.
Dst.Gcs.ObjectName Il prefisso dell'oggetto per l'oggetto di destinazione.
Dst.Gcs.LastModified L'ora di modifica (mtime) POSIX dell'oggetto di destinazione.
Dst.Gcs.Size Le dimensioni dell'oggetto in byte.
Dst.Gcs.Crc23C Il checksum CRC32C dei contenuti dell'oggetto.
Dst.Md5 La somma di controllo MD5 dell'oggetto finale in Cloud Storage.

Voce di log di esempio

Di seguito è riportato un esempio di due righe di output del log, l'intestazione e una riga di dati:

Timestamp       OperationName   Action  ActionStatus    FailureDetails.ErrorType        FailureDetails.GrpcCode FailureDetails.Message     Src.Type        Src.File.Path   Src.File.LastModified   Src.File.Size   Src.File.Crc32C Dst.Type   Dst.Gcs.BucketName      Dst.Gcs.ObjectName      Dst.Gcs.LastModified    Dst.Gcs.Size    Dst.Gcs.Crc32C  Dst.Gcs.Md5
2019-10-18T21:06:17Z    transferOperations/agent-manual_transferJobs/OPI1494275376193533620_0000000001571432448     TRANSFER        SUCCEEDED                               ON_PREM_FILE    /mnt/disks/disk-1/directory1/file.txt      1561409931      406     3089075447      GCS_OBJECT      destination-gcs-bucket    file.txt  1571432776      406     3089075447      FDjya7dWbd0OrgnZ7g9ZJw==