Trasferimento dei dati

Transfer Appliance supporta i seguenti metodi per copiare i dati sull'appliance:

Dopo aver copiato i dati in Transfer Appliance, verifica che il trasferimento dei dati nel bucket Cloud Storage sia completato prima di eliminare i dati di origine.

Requisiti relativi alle dimensioni e alla denominazione dei file

I file caricati nell'appliance devono rispettare i limiti di dimensione dei file e le linee guida per i nomi di Cloud Storage:

Transfer Appliance non convalida le dimensioni o i nomi dei file. Se l'appliance contiene file non conformi a queste regole quando viene rispedita a Google, potremmo non essere in grado di trasferirli.

Utilizza SCP o SFTP per copiare i dati

Per copiare i dati nell'appliance utilizzando SCP o SFTP:

Microsoft Windows

  1. Scarica un client SCP o SFTP che supporti i nomi file UTF-8, ad esempio WinSCP.

  2. Utilizzando lo strumento SCP, connettiti all'appliance utilizzando le seguenti impostazioni:

    • Protocollo file: SFTP
    • Nome host: l'indirizzo IP dell'appliance.
    • Numero porta: 22
    • Nome utente: il nome utente dell'appliance fornito dal team di Transfer Appliance.
    • Password: la password dell'appliance fornita dal team di Transfer Appliance.

    La directory di destinazione sull'appliance di trasferimento deve essere /mnt/ta_data.

Linux

  1. Esegui questo comando:

    scp PATH_TO_FILES USERNAME@IP_ADDRESS:/mnt/ta_data
    

    Sostituisci quanto segue:

    • PATH_TO_FILES: il percorso dei file che stai copiando.
    • USERNAME: il nome utente dell'appliance fornito dal team di Transfer Appliance.
    • IP_ADDRESS: l'indirizzo IP dell'appliance.
  2. Quando richiesto, inserisci la password dell'appliance fornita dal team Transfer Appliance.

macOS di Apple

  1. Esegui questo comando:

    scp PATH_TO_FILES USERNAME@IP_ADDRESS:/mnt/ta_data
    

    Sostituisci quanto segue:

    • PATH_TO_FILES: il percorso dei file che stai copiando.
    • USERNAME: il nome utente dell'appliance fornito dal team di Transfer Appliance.
    • IP_ADDRESS: l'indirizzo IP dell'appliance.
  2. Quando richiesto, inserisci la password dell'appliance fornita dal team Transfer Appliance.

Utilizzare la condivisione NFS per copiare i dati

Per copiare i dati nell'appliance utilizzando la condivisione NFS:

  1. Per montare l'appliance di trasferimento, esegui i seguenti comandi sull'origine dati:

    Linux

    1. sudo mkdir /mnt/data
      
    2. sudo mount -o vers=4 IP_ADDRESS:/mnt/ta_data /mnt/data
      

      Sostituisci IP_ADDRESS con l'indirizzo IP dell'appliance.

    macOS di Apple

    1. cd ~
      
    2. mkdir ta_data
      
    3. sudo mount -t nfs -o vers=4,resvport IP_ADDRESS:/mnt/ta_data ~/ta_data
      

      Sostituisci IP_ADDRESS con l'indirizzo IP dell'appliance.

  2. Per copiare i dati nell'appliance, utilizza un'utilità di copia a tua scelta.

    La copia dei dati è un'operazione a lunga esecuzione. Su Apple macOS o Linux, consigliamo di utilizzare tmux o screen per assicurarti che la procedura di copia venga mantenuta in caso di disconnessione dalla rete o dal sistema.

Salva la chiave SSH

Salva la chiave SSH per accedere più rapidamente all'appliance di trasferimento. Il salvataggio della chiave SSH può anche migliorare le velocità di trasferimento.

  1. Sulla workstation, genera una coppia di chiavi utilizzando il seguente comando:

    posix-terminal
    ssh-keygen -t rsa
    
  2. Crea un file /tmp/ssh_key sull'appliance.

  3. Copia i contenuti del file della chiave pubblica dalla tua workstation in/tmp/ssh_key sull'appliance. Il file della chiave pubblica si trova nella seguente posizione sulla tua workstation:

    • Linux: ~/.ssh/id_rsa.pub
    • Windows: C:Users/USERNAME/.ssh

    Per autorizzare più chiavi, aggiungi ogni chiave su una nuova riga in /tmp/ssh_key.

  4. Esegui il comando seguente sull'appliance. Eventuali chiavi esistenti vengono sovrascritte.

    ta copy_ssh_keys
    
  5. Accedi all'appliance.

    • Se la chiave privata si trova nella posizione predefinita sulla tua workstation, utilizza il seguente comando per accedere all'appliance:

      ssh ta_customer@IP_ADDRESS
      
    • Se la chiave privata non si trova nella posizione predefinita, utilizza il seguente comando per accedere all'appliance:

      ssh -i PRIVATE_KEY_PATH ta_customer@IP_ADDRESS
      

Utilizzare SMB per trasferire i dati

Per attivare la condivisione file SMB:

  1. Configura l'appliance in modo che utilizzi SMB utilizzando il seguente flag del protocollo di condivisione file:

     ta config --data_port=PORT --ip=IP_ADDRESS --fileshare=smb
    

    La directory ta_data è condivisa e viene creato il seguente utente:

    • Nome utente: ta_customer
    • Password: ta_customer
  2. In base al tipo di host, connettiti alla condivisione file SMB:

    Microsoft Windows

    Gestore di file

    1. Apri il file manager e modifica il percorso del file in \\IP_ADDRESS\ta_data.

    2. Inserisci il tuo nome utente e la password quando richiesto.

    Riga di comando

    1. Inserisci quanto segue nel prompt dei comandi di Windows: net use X: \\IP_ADDRESS\ta_data

    2. Inserisci il tuo nome utente e la password quando richiesto.

    Linux

    Gestore di file

    1. Apri il gestore file predefinito e fai clic su Connetti al server.

    2. Inserisci smb://IP_ADDRESS/ta_data.

    3. Inserisci il tuo nome utente e la password quando richiesto.

    Riga di comando

    1. Installa il client SMB: sudo apt-get install smbclient.

    2. Connettiti alla condivisione file SMB: smbclient //IP_ADDRESS/ta_data -U USERNAME

      Viene visualizzato il prompt smb:\>.

Utilizzare le tue condivisioni file sull'appliance

L'appliance utilizza un comando di montaggio Linux con wrapping per montare le condivisioni sull'appliance:

  1. Esegui questi comandi:

    NFS

    1. Aggiorna il file /etc/exports sul dispositivo che ospita il server NFS concedendo l'accesso IP_ADDRESS al server.

    2. Esegui i seguenti comandi sull'appliance:

      mkdir /mnt/ta_data_base/ta_mounts/MOUNT_POINT
      
      ta mount --types=nfs --source=NFS_SERVER_IP:/NFS_DIRECTORY
      --target=/mnt/ta_data_base/ta_mounts/MOUNT_POINT
      --options=OPTIONS
      

      Sostituisci quanto segue:

      • IP_ADDRESS: l'indirizzo IP dell'appliance.
      • MOUNT_POINT: il nome del punto di montaggio per questa condivisione.
      • NFS_SERVER_IP: l'indirizzo IP del dispositivo che ospita il server NFS
      • NFS_DIRECTORY: il percorso della condivisione NFS.
      • OPTIONS: l'elenco delle opzioni separate da virgole. Queste opzioni sono quelle consentite dal comando mount di Linux.

    CIFS

    1. Esegui i seguenti comandi sull'appliance:

      mkdir /mnt/ta_data_base/ta_mounts/MOUNT_POINT
      
      ta mount --types=cifs --source=//CIFS_SERVER_IP/CIFS_NAME
      --target=/mnt/ta_data_base/ta_mounts/MOUNT_POINT
      --options=OPTIONS
      

      Sostituisci quanto segue:

      • MOUNT_POINT: il nome del punto di montaggio per questa condivisione.
      • CIFS_SERVER_IP: l'indirizzo IP del dispositivo che ospita il server CIFS.
      • CIFS_NAME: il nome della condivisione CIFS.
      • OPTIONS: l'elenco delle opzioni separate da virgola, tra cui la password e il nome utente della condivisione CIFS. Queste opzioni sono quelle consentite dal comando mount di Linux.

    Se non diversamente specificato nelle opzioni di montaggio, il punto di montaggio verrà rimontato al riavvio finché non lo rimuovi con il comando "ta unmount".

  2. Per smontare eventuali mount sull'appliance, esegui quanto segue:

     ta unmount --target=/mnt/ta_data_base/ta_mounts/MOUNT_POINT

  3. Per copiare i dati nell'appliance, utilizza un'utilità di copia a tua scelta.

    RClone

    1. Per eseguire un comando di copia con RClone sull'appliance, esegui quanto segue:

      rclone copy /mnt/ta_data_base/ta_mounts/MOUNT_POINT /mnt/ta_data

      Sostituisci quanto segue:

      • MOUNT_POINT: la directory contenente i dati da trasferire.

    Estrazione dall'archivio

    1. Per archiviare i dati in file tar durante il trasferimento, esegui quanto segue:

      ta pull --target=/mnt/ta_data_base/ta_mounts/MOUNT_POINT --size=ARCHIVE_SIZE_BYTES
      --destination=/mnt/ta_data --count=THREAD_COUNT

      Sostituisci quanto segue:

      • MOUNT_POINT: la directory contenente i dati da trasferire.
      • ARCHIVE_SIZE_BYTES: le dimensioni target dei pacchetti tar da generare in destinazione. Il valore predefinito è 1 GB, ma deve essere compreso tra 5 MB e 20 GB inclusi.
      • THREAD_COUNT: il numero di thread in esecuzione contemporaneamente per la creazione degli archivi. Il valore predefinito è 20, deve essere compreso tra 1 e 10000 inclusi.

      Il pull dell'archivio viene eseguito in background, quindi puoi uscire in sicurezza dal terminale. L'estrazione inizia con una fase di elencazione dei dati prima che possa iniziare il trasferimento.

    2. Quando inizi un pull, viene restituito un ID che può essere utilizzato per interagire con il pull:

      Per controllare lo stato di un pull, esegui quanto segue:

      ta pull --id=ID --status

      Per mettere in pausa un pull, esegui il seguente comando:

      ta pull --id=ID --pause

      Per riprendere un pull in pausa o interrotto, esegui quanto segue:

      ta pull --id=ID --resume

      Sostituisci quanto segue:

      • ID: l'ID pull.
    3. Al termine del pull, i pacchetti tar sono disponibili nella directory /mnt/ta_data/TA_ARCHIVE_ID/. Verrà generato e salvato un file manifest in /mnt/ta_data/manifest_ID.tsv. Questo file conterrà informazioni sui file trasferiti, che indicano quali file sono contenuti nel file tarball. Analogamente, verrà salvato un file manifest degli errori in /mnt/ta_data/manifest_ID_ERROR.tsv che descriverà gli errori riscontrati durante il pull.

    Ti consigliamo di eseguire un solo comando pull alla volta.

    I test di velocità sono stati eseguiti su un set di dati di 100 GB su un TA7. Questi valori vengono forniti per aiutarti a scegliere tra le due utilità di copia disponibili. Le velocità di trasferimento possono variare in base al tipo di appliance e alla connettività di rete.

    Metodo Dimensioni file Dimensioni dell'archivio in byte (solo estrazione dall'archivio) Tariffa (NFS) Tariffa (PMI)
    RClone 100 MB N/D 600 MB/s 620 MB/s
    Estrazione dall'archivio 100 MB 10 GB 750 MB/s 850 MB/s
    RClone 1 MB N/D 280 MB/s 270 MB/s
    Estrazione dall'archivio 1 MB 500 MB 630 MB/s 380 MB/s
    RClone 100 kB N/D 150 MB/s 150 MB/s
    Estrazione dall'archivio 100 kB 5 MB 270 MB/s 90 MB/s

Benchmark di trasferimento dati

Queste velocità di trasferimento dei dati rappresentano le prestazioni di scrittura massime di Transfer Appliance quando si utilizzano strumenti di copia standard. Per isolare le prestazioni di scrittura ed eliminare potenziali colli di bottiglia di lettura dall'origine dati, i dati sono stati generati direttamente sulla condivisione NFS montata dell'appliance. L'appliance (TA40) è stata collegata all'origine dati con una porta da 10 Gb e le velocità sono state misurate per le seguenti dimensioni dei file:

  • File da 10 GB, 1 GB e 100 MB (set di dati da 5 TB)
  • File di 10 MB e 1 MB (set di dati di 1 TB)
Dimensioni file Velocità di copia media(NFS) Tempo stimato per il trasferimento di 40 TB Tempo stimato per il trasferimento di 300 TB
10 GB 560 MB/s 21 ore 6 giorni e 12 ore
1 GB 400 MB/s 1 giorno e 5 ore 9 giorni
100 MB 300 MB/s 1 giorno e 15 ore 12 giorni
10 MB 130 MB/s 3 giorni e 18 ore 28 giorni
1 MB 30 MB/s 16 giorni 120 giorni