Integrazioni con Bigtable

Questa pagina descrive le integrazioni tra Bigtable e altri prodotti e servizi.

Servizi Google Cloud

Questa sezione descrive i servizi Google Cloud con cui si integra Bigtable.

BigQuery

BigQuery è il data warehouse di analisi di Google completamente gestito, a basso costo e con capacità di petabyte. Puoi utilizzare BigQuery con Bigtable per le seguenti finalità:

  • Puoi creare una tabella esterna BigQuery e utilizzarla per eseguire query sulla tabella Bigtable e unire i dati ad altre tabelle BigQuery. Per ulteriori informazioni, consulta la sezione Eseguire query sui dati Bigtable.

  • Puoi esportare i dati di BigQuery in una tabella Bigtable utilizzando l'ETL inverso (RETL) da BigQuery a Bigtable. Per ulteriori informazioni, consulta Esportare i dati in Bigtable.

Cloud Asset Inventory

Cloud Asset Inventory, che fornisce servizi di inventario basati su un database delle serie temporali, supporta e restituisce tipi di risorse Bigtable. Per un elenco completo, consulta Tipi di risorse supportati.

Data Catalog

Data Catalog è una funzionalità di Dataplex che cataloga automaticamente i metadati delle risorse Bigtable. Le informazioni di Data Catalog sui tuoi dati possono contribuire a semplificare analisi, riutilizzo dei dati, sviluppo di applicazioni e gestione dei dati. Per ulteriori informazioni, consulta Gestire le risorse di dati utilizzando Data Catalog.

Dataflow

Dataflow è un servizio cloud e un modello di programmazione per l'elaborazione dei big data. Dataflow supporta l'elaborazione sia in batch che in streaming. Puoi utilizzare Dataflow per elaborare i dati archiviati in Bigtable o per archiviare l'output della pipeline Dataflow. Puoi anche utilizzare i modelli Dataflow per esportare e import i dati come file Avro, Parquet o SequenceFile.

Per iniziare, consulta Connettore Bigtable Beam.

Puoi anche utilizzare Bigtable come ricerca chiave-valore per arricchire i dati in una pipeline. Per una panoramica, consulta Arricchire i dati streaming. Per un tutorial, consulta Utilizzare Apache Beam e Bigtable per arricchire i dati.

Dataproc

Dataproc fornisce Apache Hadoop e prodotti correlati come servizio gestito nel cloud. Con Dataproc, puoi eseguire job Hadoop che leggono e scrivono in Bigtable.

Per un esempio di job MapReduce Hadoop che utilizza Bigtable, consulta la directory /java/dataproc-wordcount nel repository GitHub GoogleCloudPlatform/cloud-bigtable-examples.

Vertex AI Vector Search è una tecnologia che consente di eseguire ricerche tra miliardi di elementi semanticamente simili o semanticamente correlati. È utile per implementare motori per suggerimenti, chatbot e classificazione del testo.

Puoi utilizzare Bigtable per archiviare gli incorporamenti vettoriali, esportarli in un indice di ricerca vettoriale ed eseguire query sull'indice per trovare elementi simili. Per un tutorial che mostra un flusso di lavoro di esempio, consulta Bigtable to Vertex AI Vector Search Export nel workflows-demos repository GitHub.

Big data

Questa sezione descrive i prodotti Big Data con cui Bigtable è integrato.

Apache Beam

Apache Beam è un modello unificato per definire pipeline di elaborazione parallela dei dati sia in batch sia in flussi. Il connettore Beam Bigtable (BigtableIO) ti consente di eseguire operazioni in batch e in streaming sui dati Bigtable in una pipeline.

Per un tutorial che mostra come utilizzare il connettore Beam Bigtable per eseguire il deployment di una pipeline di dati in Dataflow, consulta Elaborare un stream di modifiche Bigtable.

Apache Hadoop

Apache Hadoop è un framework che consente l'elaborazione distribuita di grandi set di dati su cluster di computer. Puoi utilizzare Dataproc per creare un cluster Hadoop, quindi eseguire job MapReduce che leggono e scrivono in Bigtable.

Per un esempio di job MapReduce Hadoop che utilizza Bigtable, consulta la directory /java/dataproc-wordcount nel repository GitHub GoogleCloudPlatform/cloud-bigtable-examples.

StreamSets Data Collector

StreamSets Data Collector è un'applicazione di streaming di dati che puoi configurare per scrivere dati in Bigtable. StreamSets fornisce una libreria Bigtable nel proprio repository GitHub all'indirizzo streamsets/datacollector.

Database a grafo

Questa sezione descrive i database di grafo con cui Bigtable si integra.

HGraphDB

HGraphDB è un livello client per l'utilizzo di Apache HBase o Bigtable come database grafico. Implementa le interfacce Apache TinkerPop 3.

Per ulteriori informazioni sull'esecuzione di HGraphDB con il supporto di Bigtable, consulta la documentazione di HGraphDB.

JanusGraph

JanusGraph è un database a grafo scalabile. È ottimizzato per memorizzare e eseguire query su grafici contenenti centinaia di miliardi di vertici e spigoli.

Per ulteriori informazioni sull'esecuzione di JanusGraph con il supporto di Bigtable, consulta Eseguire JanusGraph con Bigtable o la documentazione di JanusGraph.

Gestione dell'infrastruttura

Questa sezione descrive gli strumenti di gestione dell'infrastruttura con cui Bigtable è integrato.

Pivotal Cloud Foundry

Pivotal Cloud Foundry è una piattaforma di sviluppo e deployment delle applicazioni che offre la possibilità di legare un'applicazione a Bigtable.

Terraform

Terraform è uno strumento open source che codifica le API in file di configurazione dichiarativi. Questi file possono essere condivisi tra i membri del team, trattati come codice, modificati, rivisti e sottoposti al controllo delle versioni.

Per ulteriori informazioni sull'utilizzo di Bigtable con Terraform, consulta Instance Bigtable e Tabella Bigtable nella documentazione di Terraform.

Database e monitoraggio delle serie temporali

Questa sezione descrive i database delle serie temporali e gli strumenti di monitoraggio con cui si integra Bigtable.

Eroico

Heroic è un sistema di monitoraggio e un database di serie temporali. Heroic può utilizzare Bigtable per archiviare i suoi dati.

Per ulteriori informazioni su Heroic, consulta il repository GitHub spotify/heroic, nonché la documentazione per la configurazione di Bigtable e la configurazione delle metriche.

OpenTSDB

OpenTSDB è un database di serie temporali che può utilizzare Bigtable per l'archiviazione. La documentazione di OpenTSDB fornisce informazioni per aiutarti a iniziare.