Connettore Bigtable Beam
Il connettore Bigtable Beam (BigtableIO
) è un connettore I/O Apache
Beam open source che può aiutarti a eseguire operazioni batch e di streaming
sui dati Bigtable in una pipeline utilizzando
Dataflow.
Se esegui la migrazione da HBase a Bigtable o se esegui un'applicazione che utilizza l'API HBase anziché le API Bigtable, utilizza il connettore Bigtable HBase Beam (CloudBigtableIO
) anziché il connettore descritto in questa pagina.
Dettagli connettore
Il connettore Bigtable Beam è un componente del repository GitHub di Apache Beam. La documentazione Javadoc è disponibile
all'indirizzo Class
BigtableIO
.
Prima di creare una pipeline Dataflow, controlla il supporto del runtime di Apache Beam per assicurarti di utilizzare una versione di Java supportata per Dataflow. Utilizza la versione supportata più recente di Apache Beam.
Il connettore Bigtable Beam viene utilizzato insieme al client Bigtable per Java, una libreria client che chiama le API Bigtable. Scrivi il codice per eseguire il deployment di una pipeline che utilizza il connettore a Dataflow, che gestisce il provisioning e la gestione delle risorse e contribuisce alla scalabilità e all'affidabilità dell'elaborazione dei dati.
Per ulteriori informazioni sul modello di programmazione Apache Beam, consulta la documentazione di Beam.
Controllo del flusso di scrittura batch
Quando invii scritture batch (incluse le richieste di eliminazione) a una tabella utilizzando il connettore Bigtable Beam, puoi attivare il controllo del flusso di scrittura batch. Quando questa funzionalità è abilitata, Bigtable esegue automaticamente le seguenti operazioni:
- Limita la velocità del traffico per evitare di sovraccaricare il cluster Bigtable
- Assicura che il cluster sia sottoposto a un carico sufficiente per attivare la scalabilità automatica di Bigtable (se abilitata), in modo che vengano aggiunti automaticamente più nodi al cluster quando necessario
Per maggiori informazioni, consulta la sezione Controllo del flusso di scrittura batch. Per un esempio di codice, vedi Attivare il controllo del flusso di scrittura batch.
Passaggi successivi
- Leggi una panoramica delle richieste di scrittura Bigtable.
- Consulta un elenco di modelli Dataflow che funzionano con Bigtable.
- Connettore sink Bigtable Kafka Connect