Storage Transfer Service supporta i trasferimenti da sistemi di archiviazione di oggetti on-premise o cloud compatibili con l'API Amazon S3.
Storage Transfer Service accede ai tuoi dati nello spazio di archiviazione compatibile con S3 utilizzando agenti di trasferimento di cui è stato eseguito il deployment su VM vicine all'origine dati. Questi agenti vengono eseguiti in un container Docker e appartengono a un pool di agenti, ovvero una raccolta di agenti che utilizzano la stessa configurazione e che spostano collettivamente i dati in parallelo.
Questa funzionalità ti consente di eseguire la migrazione dall'archiviazione di oggetti on-premise o cloud a Cloud Storage, archiviare i dati per liberare capacità di archiviazione on-premise, replicare i dati inGoogle Cloud per la continuità operativa o trasferire i dati inGoogle Cloud per l'analisi e l'elaborazione. Per i clienti che eseguono la migrazione da AWS S3 a Cloud Storage, questa funzionalità offre un'opzione per controllare le route di rete a Google Cloud, con conseguenti addebiti per il trasferimento di dati in uscita notevolmente inferiori.
Prima di iniziare
Prima di configurare i trasferimenti, completa i seguenti passaggi:
- Installa gcloud CLI.
- Soddisfa i requisiti per i trasferimenti del file system, inclusa l'installazione di Docker sulla macchina dell'agente di trasferimento.
Ottenere le credenziali dell'origine
Il trasferimento dallo spazio di archiviazione compatibile con S3 richiede un ID chiave di accesso e una chiave di accesso segreta.
I passaggi per ottenerli dipendono dal tuo provider di spazio di archiviazione.
L'account da cui vengono generati l'ID e la chiave richiede una delle seguenti autorizzazioni:
- Autorizzazione di sola lettura sugli oggetti di origine, se non vuoi eliminare gli oggetti nell'origine.
- Accesso completo agli oggetti di origine, se scegli di eliminarli nell'origine nell'ambito del trasferimento.
Dopo aver creato l'account, aggiunto le autorizzazioni e scaricato l'ID chiave di accesso e la chiave di accesso segreta, memorizza l'ID e la chiave in un luogo sicuro.
Configurare le autorizzazioni di Google Cloud
Prima di creare un trasferimento, devi configurare le autorizzazioni per le seguenti entità:
L'account utente utilizzato per creare il trasferimento. Questo è l'account con cui è stato eseguito l'accesso alla console Google Cloud oppure l'account specificato durante l'autenticazione a gcloud CLI. L'account utente può essere un account utente normale o un account di servizio gestito dall'utente. | |
Il service account gestito da Google, noto anche come agente di servizio, utilizzato da Storage Transfer Service. Questo account è generalmente identificato dal suo indirizzo email, che utilizza il formato project-PROJECT_NUMBER@storage-transfer-service.iam.gserviceaccount.com .
|
|
![]() |
L'account agente di trasferimento che fornisce Google Cloud autorizzazioni per gli agenti di trasferimento. Gli account agente di trasferimento utilizzano le credenziali dell'utente che li installa o le credenziali di un account di serviziont gestito dall'utente per l'autenticazione. |
Per istruzioni, consulta la sezione Autorizzazioni di trasferimento basate sull'agente.
Opzioni di trasferimento
Le seguenti funzionalità di Storage Transfer Service sono disponibili per i trasferimenti da un archivio compatibile con S3 a Cloud Storage:
- Trasferire file specifici utilizzando un manifest
- Puoi trasmettere un elenco di file su cui Storage Transfer Service deve intervenire. Per maggiori dettagli, vedi Trasferimento di file o oggetti specifici utilizzando un manifest.
- Specifica la classe di archiviazione
- Puoi specificare la
classe di archiviazione Cloud Storage da utilizzare per i dati nel bucket di destinazione. Consulta le opzioni
StorageClass
per i dettagli di REST oppure utilizza il flag--custom-storage-class
con Google Cloud CLI.Tieni presente che tutte le impostazioni della classe di archiviazione vengono ignorate se nel bucket di destinazione è abilitata la funzionalità Autoclass. Se Autoclass è abilitata, gli oggetti trasferiti nel bucket vengono inizialmente impostati su Standard Storage.
- Conservazione dei metadati
-
Quando trasferisce file dallo spazio di archiviazione compatibile con S3, Storage Transfer Service può conservare facoltativamente determinati attributi come metadati personalizzati.
Per informazioni dettagliate su quali metadati possono essere conservati e su come configurare il trasferimento, consulta la sezione Da Amazon S3 o da un sistema di archiviazione compatibile con S3 a Cloud Storage della pagina Conservazione dei metadati.
- Logging e monitoraggio
- I trasferimenti dallo spazio di archiviazione compatibile con S3 possono essere visualizzati in Cloud Logging e Cloud Monitoring. Per maggiori dettagli, consulta Cloud Logging per Storage Transfer Service e Monitorare i job di trasferimento. Puoi anche configurare le notifiche Pub/Sub.
Crea un pool di agenti
Per creare un pool di agenti:
Google Cloud console
Nella console Google Cloud , vai alla pagina Pool di agenti.
Viene visualizzata la pagina Pool di agenti, che elenca i pool di agenti esistenti.
Fai clic su Crea un altro pool.
Assegna un nome al pool e, facoltativamente, descrivilo.
Puoi scegliere di impostare un limite di larghezza di banda che verrà applicato al pool nel suo complesso. La larghezza di banda specificata in MB/s verrà suddivisa tra tutti gli agenti del pool. Per ulteriori informazioni, consulta la sezione Gestire la larghezza di banda di rete.
Fai clic su Crea.
API REST
Utilizza projects.agentPools.create:
POST https://storagetransfer.googleapis.com/v1/projects/PROJECT_ID/agentPools?agent_pool_id=AGENT_POOL_ID
Dove:
PROJECT_ID
: l'ID progetto in cui stai creando il pool di agenti.AGENT_POOL_ID
: l'ID del pool di agenti che stai creando.
Se un pool di agenti rimane nello stato Creating
per più di 30 minuti,
ti consigliamo di eliminarlo e ricrearlo.
La revoca delle autorizzazioni richieste di Storage Transfer Service da un progetto mentre
un pool di agenti si trova nello stato Creating
comporta un comportamento errato del servizio.
Interfaccia a riga di comando gcloud
Per creare un pool di agenti con lo strumento a riga di comando gcloud
, esegui
[gcloud transfer agent-pools create
][agent-pools-create].
gcloud transfer agent-pools create AGENT_POOL
Dove sono disponibili le seguenti opzioni:
AGENT_POOL è un identificatore univoco e permanente per questo pool.
--no-async
blocca altre attività nel terminale finché il pool non è stato creato. Se non è incluso, la creazione del pool viene eseguita in modo asincrono.--bandwidth-limit
definisce la quantità di larghezza di banda in MB/s da rendere disponibile agli agenti del pool. Un limite di larghezza di banda si applica a tutti gli agenti in un pool e può contribuire a impedire che il workload di trasferimento del pool interrompa altre operazioni che condividono la tua larghezza di banda. Ad esempio, inserisci "50" per impostare un limite di larghezza di banda di 50 MB/s. Se non specifichi questo flag, gli agenti di questo pool utilizzeranno tutta la larghezza di banda disponibile.--display-name
è un nome modificabile che ti aiuta a identificare questo pool. Puoi includere dettagli che potrebbero non rientrare nel nome completo della risorsa univoco del pool.
Installare gli agenti di trasferimento
Gli agenti di trasferimento sono agenti software che coordinano le attività di trasferimento dall'origine tramite Storage Transfer Service. Devono essere installati su un sistema con accesso ai dati di origine.
Interfaccia a riga di comando gcloud
Per installare gli agenti da utilizzare con un'origine compatibile con S3 utilizzando l'interfaccia a riga di comando gcloud
,
utilizza il comando transfer agents install
.
Devi fornire le credenziali di accesso come variabili di ambiente come valori di AWS_ACCESS_KEY_ID
e AWS_SECRET_ACCESS_KEY
o memorizzate come credenziali predefinite nei file di configurazione del sistema.
export AWS_ACCESS_KEY_ID=ID
export AWS_SECRET_ACCESS_KEY=SECRET
gcloud transfer agents install --pool=POOL_NAME
Per eseguire gli agenti utilizzando una
chiave dell'account di servizio, utilizza
l'opzione --creds-file
:
gcloud transfer agents install --pool=POOL_NAME \
--creds-file=/relative/path/to/service-account-key.json
Creare un job di trasferimento
Google Cloud console
Segui questi passaggi per creare un trasferimento da un'origine compatibile con S3 a un bucket Cloud Storage.
Vai alla pagina Storage Transfer Service nella Google Cloud console.
Fai clic su Crea job di trasferimento. Viene visualizzata la pagina Crea un job di trasferimento.
Seleziona Archiviazione di oggetti compatibile con S3 come Tipo di origine. La destinazione deve essere Google Cloud Storage.
Fai clic su Passaggio successivo.
Configura l'origine
Specifica le informazioni richieste per questo trasferimento:
Seleziona il pool di agenti che hai configurato per questo trasferimento.
Inserisci il nome del bucket relativo all'endpoint. Ad esempio, se i tuoi dati si trovano in:
https://example.com/bucket_a
Inserisci:
bucket_a
Inserisci l'endpoint. Non includere il protocollo (
http://
ohttps://
) o il nome del bucket. Ad esempio:example.com
Specifica eventuali attributi facoltativi per questo trasferimento:
Inserisci la Regione di firma da utilizzare per la firma delle richieste.
Scegli la procedura di firma per questa richiesta.
Seleziona lo stile di indirizzamento. Determina se il nome del bucket viene fornito in stile percorso (ad es.
https://example.com/bucket-name/key-name
) o con hosting virtuale (ad es.https://bucket-name.example.com/key-name
). Per saperne di più, leggi Hosting virtuale dei bucket nella documentazione di Amazon.Seleziona il protocollo di rete.
Seleziona la versione dell'API di schede da utilizzare. Per saperne di più, consulta la documentazione di ListObjectsV2 e ListObjects.
Fai clic su Passaggio successivo.
Configurare il sink
Nel campo Bucket o cartella, inserisci il nome del bucket di destinazione e (facoltativamente) della cartella oppure fai clic su Sfoglia per selezionare un bucket da un elenco di bucket esistenti nel progetto corrente. Per creare un nuovo bucket, fai clic su
Crea nuovo bucket.
Fai clic su Passaggio successivo.
Scegliere le impostazioni di trasferimento
Nel campo Descrizione, inserisci una descrizione del trasferimento. Come best practice, inserisci una descrizione significativa e univoca in modo da poter distinguere i job.
In Opzioni metadati, scegli di utilizzare le opzioni predefinite o fai clic su Visualizza e seleziona opzioni per specificare i valori per tutti i metadati supportati. Per i dettagli, vedi Conservazione dei metadati.
In Quando sovrascrivere, seleziona una delle seguenti opzioni:
Se diverso: sovrascrive i file di destinazione se il file di origine con lo stesso nome ha ETag o valori di checksum diversi.
Sempre: sovrascrive sempre i file di destinazione quando il file di origine ha lo stesso nome, anche se sono identici.
In Quando eliminare, seleziona una delle seguenti opzioni:
Mai: non eliminare mai i file dall'origine o dalla destinazione.
Elimina i file dall'origine dopo il trasferimento: elimina i file dall'origine dopo il trasferimento alla destinazione. Se un file di origine non viene trasferito, ad esempio perché esiste già nella destinazione, non viene eliminato.
Elimina i file dalla destinazione se non sono presenti anche nell'origine: se i file nel bucket Cloud Storage di destinazione non sono presenti anche nell'origine, elimina i file dal bucket Cloud Storage.
Questa opzione garantisce che il bucket Cloud Storage di destinazione corrisponda esattamente all'origine.
Nella sezione Opzioni di notifica, seleziona l'argomento Pub/Sub e gli eventi per cui ricevere notifiche. Per maggiori dettagli, consulta Notifiche Pub/Sub.
Fai clic su Passaggio successivo.
Pianificare il trasferimento
Puoi pianificare l'esecuzione del trasferimento una sola volta o configurare un trasferimento ricorrente.
Fai clic su Crea per creare il job di trasferimento.
Interfaccia a riga di comando gcloud
Prima di utilizzare la CLI gcloud
per creare un trasferimento, segui le istruzioni riportate in
Configura l'accesso a un sink Cloud Storage.
Per utilizzare la CLI gcloud
per creare un trasferimento da un'origine compatibile con S3 a un bucket Cloud Storage, utilizza il seguente comando.
gcloud transfer jobs create s3://SOURCE_BUCKET_NAME gs://SINK_BUCKET_NAME \
--source-agent-pool=POOL_NAME \
--source-endpoint=ENDPOINT \
--source-signing-region=REGION \
--source-auth-method=AWS_SIGNATURE_V2 | AWS_SIGNATURE_V4 \
--source-request-model=PATH_STYLE | VIRTUAL_HOSTED_STYLE \
--source-network-protocol=HTTP | HTTPS \
--source-list-api=LIST_OBJECTS | LIST_OBJECTS_V2
Sono necessari i seguenti flag:
--source-agent-pool
è il nome del pool di agenti da utilizzare per questo trasferimento.--source-endpoint
specifica l'endpoint del sistema di archiviazione. Ad esempio,s3.us-east.example.com
. Rivolgiti al tuo fornitore per la formattazione corretta. Non includere il protocollo (ad es.https://
) o il nome del bucket.
I flag rimanenti sono facoltativi:
--source-signing-region
specifica una regione per la firma delle richieste. Ometti questo flag se il provider di spazio di archiviazione non richiede una regione di firma.--source-auth-method
specifica il metodo di autenticazione da utilizzare. I valori validi sonoAWS_SIGNATURE_V2
oAWS_SIGNATURE_V4
. Per saperne di più, consulta la documentazione di Amazon su SigV4 e SigV2.--source-request-model
specifica lo stile di indirizzamento da utilizzare. I valori validi sonoPATH_STYLE
oVIRTUAL_HOSTED_STYLE
. Lo stile del percorso utilizza il formatohttps://s3.REGION.example.com/BUCKET_NAME/KEY_NAME
. Lo stile con hosting virtuale utilizza il formato `https://BUCKET_NAME.s3.REGION.example.com/KEY_NAME.--source-network-protocol
specifica il protocollo di rete che gli agenti devono utilizzare per questo job. I valori validi sonoHTTP
oHTTPS
.--source-list-api
specifica la versione dell'API Listing S3 per restituire gli oggetti dal bucket. I valori validi sonoLIST_OBJECTS
oLIST_OBJECTS_V2
. Per saperne di più, consulta la documentazione di Amazon su ListObjectsV2 e ListObjects.
Per ulteriori opzioni per i job di trasferimento, esegui gcloud transfer jobs create --help
o consulta la documentazione di riferimento di gcloud
.
API REST
Prima di utilizzare l'API REST per creare un trasferimento, segui le istruzioni riportate in Configurare l'accesso a un sink Cloud Storage.
Per creare un trasferimento da un'origine compatibile con S3 utilizzando l'API REST, crea un oggetto JSON simile al seguente esempio.
POST https://storagetransfer.googleapis.com/v1/transferJobs
{
...
"transferSpec": {
"source_agent_pool_name":"POOL_NAME",
"awsS3CompatibleData": {
"region":"us-east-1",
"s3Metadata":{
"protocol": "NETWORK_PROTOCOL_HTTPS",
"requestModel": "REQUEST_MODEL_VIRTUAL_HOSTED_STYLE",
"authMethod": "AUTH_METHOD_AWS_SIGNATURE_V4"
},
"endpoint": "example.com",
"bucketName": "BUCKET_NAME",
"path": "PATH",
},
"gcsDataSink": {
"bucketName": "SINK_NAME",
"path": "SINK_PATH"
},
"transferOptions": {
"deleteObjectsFromSourceAfterTransfer": false
}
}
}
Per le descrizioni dei campi, consulta il riferimento dell'API AwsS3CompatibleData
.
Librerie client
Prima di utilizzare le librerie client per creare un trasferimento, segui le istruzioni riportate in Configura l'accesso a un sink Cloud Storage.
Go
Per scoprire come installare e utilizzare la libreria client per Storage Transfer Service, consulta Librerie client di Storage Transfer Service. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Go di Storage Transfer Service.
Per eseguire l'autenticazione in Storage Transfer Service, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Storage Transfer Service, consulta Librerie client di Storage Transfer Service. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Java di Storage Transfer Service.
Per eseguire l'autenticazione in Storage Transfer Service, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Storage Transfer Service, consulta Librerie client di Storage Transfer Service. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Node.js di Storage Transfer Service.
Per eseguire l'autenticazione in Storage Transfer Service, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Storage Transfer Service, consulta Librerie client di Storage Transfer Service. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Python di Storage Transfer Service.
Per eseguire l'autenticazione in Storage Transfer Service, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Domande frequenti
È previsto un costo per il trasferimento dallo spazio di archiviazione compatibile con S3?
I trasferimenti dallo spazio di archiviazione compatibile con S3 non comportano la commissione "Trasferimenti di Storage Transfer Service che richiedono agenti". Consulta la sezione Prezzi per eventuali altre tariffe che potrebbero essere addebitate. Potrebbero essere applicati costi operativi e per il trasferimento di dati in uscita dal tuo cloud provider di origine.
Cloud Logging è supportato per i trasferimenti di spazio di archiviazione compatibile con S3?
Sì, puoi abilitare Cloud Logging per i trasferimenti seguendo le istruzioni riportate in Cloud Logging per Storage Transfer Service.
I trasferimenti che utilizzano un manifest sono supportati?
Sì, i file manifest sono supportati per i trasferimenti compatibili con S3.
Se aggiungo un oggetto al bucket di origine dopo l'avvio del job, l'oggetto viene trasferito?
Storage Transfer Service esegue un'operazione di elenco sul bucket di origine per calcolare la differenza rispetto alla destinazione. Se l'operazione di elenco è già stata completata quando viene aggiunto il nuovo oggetto, questo viene ignorato fino al trasferimento successivo.
Storage Transfer Service esegue la corrispondenza dei checksum sulle origini compatibili con S3?
Storage Transfer Service si basa sui dati di checksum restituiti dall'origine. Per l'archiviazione compatibile con S3, Storage Transfer Service prevede che l'Etag dell'oggetto sia l'hash MD5 dell'oggetto.
Tuttavia, gli oggetti trasferiti all'archiviazione compatibile con S3 utilizzando il caricamento in più parti di S3 non hanno ETag MD5. In questo caso, Storage Transfer Service utilizza le dimensioni del file per convalidare l'oggetto trasferito.
Quale throughput è possibile ottenere per i trasferimenti dallo spazio di archiviazione compatibile con S3?
La velocità effettiva di trasferimento può essere scalata aggiungendo altri agenti di trasferimento. Consigliamo di utilizzare tre agenti per la tolleranza agli errori e per riempire una pipe da <10 Gbps. Per aumentare ulteriormente le dimensioni, aggiungi altri agenti. Gli agenti possono essere aggiunti e rimossi durante l'elaborazione di un trasferimento.
Dove devono essere implementati gli agenti di trasferimento per trasferire i dati da Amazon S3 a Cloud Storage?
Puoi installare agenti in Amazon EC2 o EKS nella stessa regione del tuo bucket. Puoi anche eseguire gli agenti su Google Cloud nella regione più vicina.