Bigtable con Dataproc

Bigtable è il servizio di database di big data NoSQL di Google. È lo stesso database su cui si basano molti dei principali servizi di Google, tra cui Ricerca, Analytics, Maps e Gmail. Bigtable è progettato per gestire grandi carichi di lavoro con bassa latenza coerente e velocità effettiva elevata, ed è perciò la scelta giusta per le applicazioni operative e analitiche, tra cui IoT, analisi utente e dei dati finanziari.

Bigtable è un'ottima opzione per qualsiasi utilizzo di Apache Spark o Hadoop che richieda Apache HBase. Bigtable supporta le API Apache HBase 1.0+ e 2.0+ e offre un client Bigtable HBase in Maven per utilizzare Bigtable con Dataproc.

Utilizzare il connettore Bigtable Spark

Il connettore Bigtable Spark consente di leggere e scrivere dati da e in Bigtable. Puoi leggere i dati dall'applicazione Spark utilizzando Spark SQL e DataFrames. Per i job di sola lettura, puoi utilizzare il serverless computing di Data Boost. Data Boost è progettato per i requisiti di prestazioni di job e query con throughput elevato e ti consente di evitare di influire sul traffico del cluster di pubblicazione delle applicazioni quando vengono eseguiti questi job e queste query.

Per saperne di più, consulta Utilizzare il connettore Bigtable Spark.

Passaggi successivi

  • Per ulteriori informazioni sull'utilizzo di Bigtable, consulta la documentazione di Bigtable.