Bigtable con Dataproc

Bigtable è il servizio di database di big data NoSQL di Google. È lo stesso database su cui si basano molti dei principali servizi di Google, tra cui Ricerca, Analytics, Maps e Gmail. Bigtable è progettato per gestire grandi carichi di lavoro con bassa latenza coerente e velocità effettiva elevata, ed è perciò la scelta giusta per le applicazioni operative e analitiche, tra cui IoT, analisi utente e dei dati finanziari.

Bigtable è un'opzione eccellente per qualsiasi utilizzo di Apache Spark o Hadoop che richiede Apache HBase. Bigtable supporta le API Apache HBase 1.0 e successive e 2.0 e successive e offre un client Bigtable HBase in Maven per utilizzare Bigtable con Dataproc.

Utilizzare il connettore Bigtable Spark

Il connettore Bigtable Spark ti consente di leggere e scrivere dati da e in Bigtable. Puoi leggere i dati dall'interno della tua applicazione Spark utilizzando Spark SQL e DataFrames. Per i job di sola lettura, puoi utilizzare il serverless computing di Data Boost (anteprima). Data Boost è progettato per i requisiti di prestazioni di query e job con throughput elevato e ti consente di evitare di influire sul traffico del cluster che gestisce le applicazioni quando vengono eseguiti questi job e query.

Per ulteriori informazioni, consulta Utilizzare il connettore Bigtable Spark.

Passaggi successivi

  • Per ulteriori informazioni sull'utilizzo di Bigtable, consulta la documentazione di Bigtable.