Dataflow ドキュメント

Dataflow は、さまざまなデータ処理パターンの実行に対応したマネージド サービスです。このサイトのドキュメントでは、Dataflow を使用してバッチおよびストリーミングのデータ処理パイプラインをデプロイする方法とサービス機能の使用方法を説明します。

Apache Beam SDK は、バッチとストリーミングの両方のパイプラインの開発に対応したオープンソースのプログラミング モデルです。Apache Beam プログラムでパイプラインを作成し、Dataflow サービスで実行します。Apache Beam のドキュメントには、詳細なコンセプト情報と Apache Beam のプログラミング モデル、SDK、他のランナーのリファレンス情報が記載されています。

Apache Beam の基本コンセプトについては、Beam のツアーBeam Playground をご覧ください。また、Dataflow Cookbook リポジトリには、起動可能な自己完結型のパイプラインと、Dataflow の最も一般的なユースケースが用意されています。

Apache、Apache Beam、Beam、Beam ロゴ、Beam のホタルのマスコットは、米国およびその他の国における Apache Software Foundation の登録商標です。
  • Gemini 2.0 Flash Thinking をご利用いただけます。
  • AI API や BigQuery などの人気プロダクトの毎月の無料使用枠をご利用いただけます。
  • 自動請求は行われず、契約も不要です。

常に無料で利用可能な 20 以上のプロダクトを確認する

AI API、VM、データ ウェアハウスなど、一般的なユースケース向けの 20 以上のプロダクトを無料でご利用いただけます。

セルフペース トレーニング、ユースケース、リファレンス アーキテクチャ、コードサンプル、 Google Cloud サービスの使用方法と接続方法の例をご覧ください。
ユースケース
ユースケース

Dataflow を使用すると、高度に並列化されたワークロードを単一のパイプラインで実行できるため、効率が向上し、ワークフローの管理が容易になります。

ストリーミング

ユースケース
ユースケース

Dataflow ML では、Dataflow を使用して完全な ML パイプラインをデプロイおよび管理できます。ML モデルを使用して、バッチ パイプラインとストリーミング パイプラインでローカルとリモートの推論を行います。データ処理ツールを使用して、モデルのトレーニング用データを準備し、モデルの結果を処理します。

ML ストリーミング

ユースケース
ユースケース

ウェブストアから BigQuery と Bigtable にデータをストリーミングするエンドツーエンドの e コマース サンプル アプリケーションを構築します。このサンプル アプリケーションは、ストリーミング データ分析とリアルタイム AI を実装するための一般的なユースケースとベスト プラクティスを示しています。

e コマース ストリーミング

関連動画