Bigap と Dataproc

Bigtable は Google が提供する NoSQL ビッグデータのデータベース サービスです。検索、アナリティクス、マップ、Gmail など、Google の多数のコアサービスを支えているものと同じデータベースを使用しています。Bigtable は、低レイテンシ、高スループットを維持しつつ大量のワークロードを処理できるように設計されているため、IoT、ユーザー分析、金融データ解析など、データ操作用途およびデータ解析用途のどちらにも優れたツールとして機能します。

Bigtable は、Apache HBase を必要とする Apache Spark や Hadoop の用途に最適です。Bigtable は、Apache HBase 1.0 以降と 2.0 以降の API をサポートし、Maven で Bigtable HBase クライアントを提供しており、Dataproc で Bigtable を使用できます。

Bigtable Spark コネクタを使用する

Bigtable Spark コネクタを使用すると、Bigtable との間でデータを読み書きできます。データは、Spark SQL と DataFrames を使用して Spark アプリケーション内から読み取ります。読み取り専用ジョブには、Data Boost サーバーレス コンピューティングを使用できます。Data Boost は、高スループットのジョブとクエリのパフォーマンス要件に合わせて設計されているため、これらのジョブとクエリの実行時に、アプリケーション サービスを提供するクラスタのトラフィックに影響を与えることはありません。

詳細については、Bigtable Spark コネクタを使用するをご覧ください。

次のステップ

  • Bigtable の使用に関する詳細は、Bigtable のドキュメントをご覧ください。