HDFS
Il connettore HDFS consente di eseguire azioni di inserimento, eliminazione, aggiornamento e lettura sui dati HDFS.
Versioni supportate
Questo connettore supporta HDFS Hadoop versione 3.4.0.
Prima di iniziare
Prima di utilizzare il connettore HDFS, esegui le seguenti operazioni:
- Nel tuo progetto Google Cloud:
- Concedi il ruolo IAM roles/connectors.admin all'utente che configura il connettore.
- Concedi i seguenti ruoli IAM al account di servizio che vuoi utilizzare per il connettore:
roles/secretmanager.viewer
roles/secretmanager.secretAccessor
Un account di servizio è un tipo speciale di Account Google destinato a rappresentare un utente non umano che deve eseguire l'autenticazione ed essere autorizzato ad accedere ai dati nelle API di Google. Se non hai un account di servizio, devi crearne uno. Per maggiori informazioni, vedi Creare un service account.
- Attiva i seguenti servizi:
secretmanager.googleapis.com
(API Secret Manager)connectors.googleapis.com
(API Connectors)
Per capire come abilitare i servizi, consulta Abilitazione dei servizi.
Se questi servizi o queste autorizzazioni non sono stati attivati in precedenza per il tuo progetto, ti viene chiesto di attivarli durante la configurazione del connettore.
Configura il connettore
Una connessione è specifica per un'origine dati. Ciò significa che se hai molte origini dati, devi creare una connessione separata per ciascuna origine dati. Per creare una connessione:
- Nella console Cloud, vai alla pagina Integration Connectors > Connessioni e poi seleziona o crea un progetto Google Cloud.
- Fai clic su + CREA NUOVA per aprire la pagina Crea connessione.
- Nella sezione Località, scegli la località per la connessione.
- Regione: seleziona una località dall'elenco a discesa.
Per l'elenco di tutte le regioni supportate, consulta Località.
- Fai clic su AVANTI.
- Regione: seleziona una località dall'elenco a discesa.
- Nella sezione Dettagli connessione, completa quanto segue:
- Connettore: seleziona HDFS dall'elenco a discesa dei connettori disponibili.
- Versione del connettore: seleziona la versione del connettore dall'elenco a discesa delle versioni disponibili.
- Nel campo Nome connessione, inserisci un nome per l'istanza di connessione.
I nomi delle connessioni devono soddisfare i seguenti criteri:
- I nomi delle connessioni possono contenere lettere, numeri o trattini.
- Le lettere devono essere minuscole.
- I nomi delle connessioni devono iniziare con una lettera e terminare con una lettera o un numero.
- I nomi delle connessioni non possono contenere più di 49 caratteri.
- (Facoltativo) Inserisci una Descrizione per l'istanza di connessione.
- (Facoltativo) Abilita Cloud Logging,
quindi seleziona un livello di log. Per impostazione predefinita, il livello di log è impostato su
Error
. - Service Account: seleziona un account di servizio con i ruoli richiesti.
- Percorso: specifica il percorso HDFS da utilizzare come directory di lavoro.
- (Facoltativo) Configura le impostazioni del nodo di connessione:
- Numero minimo di nodi: inserisci il numero minimo di nodi di connessione.
- Numero massimo di nodi: inserisci il numero massimo di nodi di connessione.
Un nodo è un'unità (o una replica) di una connessione che elabora le transazioni. Sono necessari più nodi per elaborare più transazioni per una connessione e, viceversa, sono necessari meno nodi per elaborare meno transazioni. Per capire in che modo i nodi influiscono sui prezzi dei connettori, consulta la sezione Prezzi dei nodi di connessione. Se non inserisci alcun valore, per impostazione predefinita i nodi minimi sono impostati su 2 (per una migliore disponibilità) e i nodi massimi su 50.
- (Facoltativo) Fai clic su + AGGIUNGI ETICHETTA per aggiungere un'etichetta alla connessione sotto forma di coppia chiave/valore.
- Fai clic su AVANTI.
- Nella sezione Destinazioni, inserisci i dettagli dell'host remoto (sistema di backend) a cui vuoi connetterti.
- Tipo di destinazione: seleziona un Tipo di destinazione.
- Per specificare il nome host o l'indirizzo IP di destinazione, seleziona Indirizzo host e inserisci l'indirizzo nel campo Host 1.
- Per stabilire una connessione privata, seleziona Collegamento endpoint e scegli il collegamento richiesto dall'elenco Collegamento endpoint.
Se vuoi stabilire una connessione pubblica ai tuoi sistemi di backend con maggiore sicurezza, puoi valutare la possibilità di configurare indirizzi IP statici in uscita per le tue connessioni e poi configurare le regole del firewall in modo da consentire solo gli indirizzi IP statici specifici.
Per inserire altre destinazioni, fai clic su +AGGIUNGI DESTINAZIONE.
- Fai clic su AVANTI.
- Tipo di destinazione: seleziona un Tipo di destinazione.
-
Nella sezione Autenticazione, inserisci i dettagli di autenticazione.
- Seleziona un Tipo di autenticazione e inserisci i dettagli pertinenti.
La connessione HDFS supporta i seguenti tipi di autenticazione:
- Nome utente e password
Per capire come configurare questi tipi di autenticazione, consulta Configurare l'autenticazione.
- Fai clic su AVANTI.
- Seleziona un Tipo di autenticazione e inserisci i dettagli pertinenti.
- Rivedi: rivedi i dettagli di connessione e autenticazione.
- Fai clic su Crea.
Configura l'autenticazione
Inserisci i dettagli in base all'autenticazione che vuoi utilizzare.
-
Nome utente e password
- Nome utente: inserisci il nome utente da utilizzare per la connessione HDFS.
- Password : inserisci il secret di Secret Manager contenente la password associata al nome utente.
- Versione del secret: seleziona la versione del secret per il secret selezionato sopra.
Esempi di configurazione della connessione
Questa sezione elenca i valori di esempio per i vari campi che configuri durante la creazione della connessione.
Tipo di connessione con nome utente e password
Nome campo | Dettagli |
---|---|
Località | europe-west1 |
Connettore | HDFS |
Versione del connettore | 1 |
Nome collegamento | hdfs-v24-new |
Service account | my-service-account@my-project.iam.gserviceaccount.com |
Numero minimo di nodi | 2 |
Numero massimo di nodi | 2 |
Tipo di destinazione | Indirizzo host |
Host | 10.128.0. |
port1 | 10000 |
Nome utente | utente1 |
Password | PASSWORD |
Versione secret | 1 |
Limitazioni di sistema
Il connettore HDFS può elaborare un massimo di 20 transazioni al secondo, per nodo e limita le transazioni oltre questo limite. Per impostazione predefinita, Integration Connectors alloca due nodi (per una migliore disponibilità) per una connessione.
Per informazioni sui limiti applicabili a Integration Connectors, vedi Limiti.
Utilizzare la connessione HDFS in un'integrazione
Una volta creata la connessione, questa diventa disponibile sia in Apigee Integration che in Application Integration. Puoi utilizzare la connessione in un'integrazione tramite l'attività Connettori.
- Per capire come creare e utilizzare l'attività Connettori in Apigee Integration, consulta Attività Connettori.
- Per capire come creare e utilizzare l'attività Connettori in Application Integration, consulta Attività Connettori.
Azioni
Questa sezione mostra come eseguire alcune delle azioni in questo connettore.
Azione MakeDirectory
Questa azione crea una directory nel percorso specificato.
Parametri di input dell'azione MakeDirectory
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
Autorizzazione | Stringa | Falso | Le autorizzazioni per creare una nuova directory. |
Percorso | Stringa | Vero | Il percorso della nuova directory. |
Per un esempio su come configurare l'azione MakeDirectory
,
vedi Esempi.
Azione ListStatus
Questa azione elenca i contenuti del percorso fornito.
Parametri di input dell'azione ListStatus
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
Percorso | Stringa | Vero | Il percorso del file. |
Per un esempio su come configurare l'azione ListStatus
,
vedi Esempi.
Azione GetHomeDirectory
Questa azione recupera la home directory dell'utente corrente.
Parametri di input dell'azione GetHomeDirectory
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
connectorInputPayload | Json | Vero | Il payload di input del connettore. |
Per un esempio su come configurare l'azione GetHomeDirectory
,
vedi Esempi.
Azione DeleteFile
Questa azione elimina un file o una directory.
Parametri di input dell'azione DeleteFile
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
Percorso | Stringa | Vero | Il percorso del file. |
Ricorsivo | Booleano | Falso | Specifica se eliminare le sottocartelle di una cartella. |
Per un esempio su come configurare l'azione DeleteFile
,
consulta Esempi.
Azione GetContentSummary
Questa azione recupera il riepilogo dei contenuti di un file o di una cartella.
Parametri di input dell'azione GetContentSummary
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
Percorso | Stringa | Vero | Il percorso del file o della cartella. |
Per un esempio su come configurare l'azione GetContentSummary
,
consulta Esempi.
Azione RenameFile
Questa azione rinomina un file o una directory.
Parametri di input dell'azione RenameFile
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
percorso | Stringa | Vero | Il percorso del file. |
destinazione | Stringa | Vero | Specifica il nuovo nome e il nuovo percorso del file. |
Per un esempio su come configurare l'azione RenameFile
,
consulta Esempi.
Azione SetPermission
Questa azione imposta l'autorizzazione di un percorso.
Parametri di input dell'azione SetPermission
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
Percorso | Stringa | Vero | Il percorso del file. |
Autorizzazione | Stringa | Vero | Specifica le autorizzazioni Unix in notazione ottale (base 8). |
Per un esempio su come configurare l'azione SetPermission
,
vedi Esempi.
Azione SetPermission
Questa azione imposta l'autorizzazione di un percorso.
Parametri di input dell'azione SetPermission
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
Percorso | Stringa | Vero | Il percorso del file. |
Autorizzazione | Stringa | Vero | Specifica le autorizzazioni Unix in notazione ottale (base 8). |
Per un esempio su come configurare l'azione SetPermission
,
vedi Esempi.
Azione SetOwner
Questa azione imposta un proprietario e un gruppo di un percorso.
Parametri di input dell'azione SetOwner
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
Percorso | Stringa | Vero | Il percorso del file. |
Proprietario | Stringa | Vero | Il nuovo proprietario del percorso. |
gruppo | Stringa | Falso | Il nome del nuovo gruppo. |
Per un esempio su come configurare l'azione SetOwner
,
vedi Esempi.
Azione UploadFile
Questa azione carica un file.
Parametri di input dell'azione UploadFile
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
percorso | Stringa | Vero | Il percorso del file. |
Contenuti | Stringa | Vero | Il contenuto del file caricato. |
Per un esempio su come configurare l'azione UploadFile
,
vedi Esempi.
Azione DownloadFile
Questa azione scarica un file.
Parametri di input dell'azione DownloadFile
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
percorso | Stringa | Vero | Il percorso del file. |
WriteToFile | Stringa | Falso | La posizione locale del file in cui viene scritto l'output. |
Per un esempio su come configurare l'azione DownloadFile
,
vedi Esempi.
Azione AppendToFile
Questa azione aggiunge un file.
Parametri di input dell'azione AppendToFile
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
percorso | Stringa | Vero | Il percorso del file. |
Contenuti | Stringa | Vero | I contenuti da aggiungere al file. |
Per un esempio su come configurare l'azione AppendToFile
,
vedi Esempi.
Azione GetFileChecksum
Questa azione recupera il checksum di un file.
Parametri di input dell'azione GetFileChecksum
Nome parametro | Tipo di dati | Obbligatorio | Descrizione |
---|---|---|---|
percorso | Stringa | Vero | Il percorso del file. |
Per un esempio su come configurare l'azione GetFileChecksum
,
vedi Esempi.
Esempi di azioni
Questa sezione mostra come eseguire alcuni degli esempi di azioni in questo connettore.
Esempio: creare una directory
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
MakeDirectory
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/hduser" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[{ "Success": true }]
Esempio: recuperare la home directory
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
GetHomeDirectory
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{}
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[{ "Path": "/user/hduser" }]
Esempio: eliminare un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
DeleteFile
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/hduser/testFile" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[{ "Success": true }]
Esempio: elenco dello stato di un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
ListStatus
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "path": "/user/hduser/deletefile" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[{ "fileId": 16471.0, "PathSuffix": "data.txt", "owner": "hduser", "group": "supergroup", "length": 38.0, "permission": "644", "replication": 1.0, "storagePolicy": 0.0, "childrenNum": 0.0, "blockSize": 1.34217728E8, "modificationTime": "2024-08-16 16:12:01.921", "accessTime": "2024-08-16 16:12:01.888", "type": "FILE" }, { "fileId": 16469.0, "PathSuffix": "file2.txt", "owner": "hduser", "group": "supergroup", "length": 53.0, "permission": "644", "replication": 1.0, "storagePolicy": 0.0, "childrenNum": 0.0, "blockSize": 1.34217728E8, "modificationTime": "2024-08-16 16:12:01.762", "accessTime": "2024-08-16 16:12:01.447", "type": "FILE" }]
Esempio: ottenere il riepilogo dei contenuti di un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
GetContentSummary
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/hduser/appendtofile" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[{ "DirectoryCount": "1", "FileCount": "1", "Length": 52.0, "Quota": -1.0, "SpaceConsumed": 52.0, "SpaceQuota": -1.0, "ecpolicy": "", "snapshotdirectorycount": "0", "snapshotfilecount": "0", "snapshotlength": "0", "snapshotspaceconsumed": "0" }]
Esempio: rinominare un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
hdfs_RenameFile_action
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/hduser/renamefile_second/file1.txt", "Destination": "/user/hduser/renamefile_second/file1rename" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[{ "Success": true }]
Esempio: impostare l'autorizzazione di un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
SetPermission
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/hduser/gcpdirectory", "Permission": "777" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[{ "Success": true }]
Esempio: impostare il proprietario di un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
SetOwner
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/hduser/gcpdirectory", "Owner": "newowner" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[{ "Success": true }]
Esempio: carica un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
UploadFile
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/newfile9087.txt", "Content": "string" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[{ "Success": true }]
Esempio: scaricare un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
DownloadFile
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/sampleFile/file1.txt" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[ { "Output": "This is sample File\nfor this testing\ncontent" } ]
Esempio: accodare un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
AppendToFile
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/sampleFile/file1.txt", "Content": "content" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[ { "Success": true } ]
Esempio: ottenere il checksum di un file
- Nella finestra di dialogo
Configure connector task
, fai clic suActions
. - Seleziona l'azione
GetFileChecksum
, quindi fai clic su Fine. - Nella sezione Mappatura dei dati
Open Data Mapping Editor
e poi inserisci un valore simile al seguente nel campoInput
:{ "Path": "/user/sampleFile/file1.txt" }
Se l'azione ha esito positivo, il
parametro di risposta connectorOutputPayload
dell'attività
del connettore avrà un valore simile al seguente:
[ { "Algorithm": "MD5-of-0MD5-of-512CRC32C", "Bytes": "00000200000000000000000080f5b53ae8c165ae56e86109b8bb2a1700000000", "Length": 28 } ]
Esempi di operazioni sulle entità
Questa sezione mostra come eseguire alcune delle operazioni sulle entità in questo connettore.
Esempio: elenca i dati di tutti i file
Questo esempio recupera i dati di tutti i file nell'entità Files
.
- Nella finestra di dialogo
Configure connector task
, fai clic suEntities
. - Seleziona
Object
dall'elencoEntity
. - Seleziona l'operazione
List
, quindi fai clic su Fine.
Esempio: recuperare i dati di un'autorizzazione
Questo esempio recupera i dati dell'autorizzazione con l'ID specificato dall'entità Permission
.
- Nella finestra di dialogo
Configure connector task
, fai clic suEntities
. - Seleziona
Permission
dall'elencoEntity
. - Seleziona l'operazione
Get
, quindi fai clic su Fine. - Nella sezione Input attività dell'attività Connettori, fai clic su EntityId e
poi inserisci
/user/hduser/appendfile
nel campo Valore predefinito.In questo caso,
/user/hduser/appendfile
è un ID univoco nell'entitàPermission
.
Ricevere assistenza dalla community Google Cloud
Puoi pubblicare le tue domande e discutere di questo connettore nella community di Google Cloud nei forum di Cloud.Passaggi successivi
- Scopri come sospendere e ripristinare una connessione.
- Scopri come monitorare l'utilizzo dei connettori.
- Scopri come visualizzare i log dei connettori.