Dataflow 文档

Dataflow 是一种用于执行各种数据处理模式的托管式服务。本网站上提供的文档介绍如何使用 Dataflow 部署批量数据处理流水线和流式数据处理流水线，其中包括各项服务功能的使用说明。

Apache Beam SDK 是一个开源编程模型，既可用于开发批处理流水线，又可用于开发流处理流水线。您可以使用 Apache Beam 程序创建流水线，然后在 Dataflow 服务上运行这些流水线。Apache Beam 文档提供了有关 Apache Beam 编程模型、SDK 和其他运行程序的深入概念性信息和参考资料。

如需了解 Apache Apache 基本概念，请参阅 Beam 导览和 Beam Playground。Dataflow 实战宝典代码库还提供了即时可用且独立的流水线以及最常见的 Dataflow 应用场景。

Apache、Apache Beam、Beam、Beam 徽标和 Beam 萤火虫吉祥物是 Apache Software Foundation 在美国和/或其他国家/地区的注册商标。

免费开始使用

获享 $300 免费赠金开始概念验证

体验 Gemini 2.0 Flash Thinking
免费使用热门产品（包括 AI API 和 BigQuery）的每月用量
不会自动收费，无需承诺

查看免费产品优惠

继续探索 20 多种提供“始终免费”用量的产品

使用适用于常见应用场景（包括 AI API、虚拟机、数据仓库等）的 20 多种免费产品。

文档资源

查找快速入门和指南，查看重要参考文档，并获取有关常见问题的帮助。

指南

参考信息

资源

探索自主培训、应用场景、参考架构和代码示例，并了解有关如何使用和连接 Google Cloud 服务的示例。

使用场景

运行 HPC 高度并行工作负载

使用 Dataflow，您可以在单个流水线中运行高度并行的工作负载，从而提高效率并使工作流更易于管理。

流式

了解详情

使用场景

使用 Dataflow ML 运行推理

借助 Dataflow ML，您可以使用 Dataflow 部署和管理完整的机器学习 (ML) 流水线。使用机器学习模型通过批处理和流处理流水线进行本地和远程推断。使用数据处理工具准备数据以用于模型训练并处理模型的结果。

机器学习流式处理

了解详情

使用场景

创建电子商务流处理流水线

构建一个端到端的电子商务示例应用，该应用可将来自网上商店的数据流式传输到 BigQuery 和 Bigtable。示例应用展示了实现流式数据分析和实时人工智能 (AI) 的常见使用场景和最佳实践。

电子商务流式处理

了解详情

Dataflow 文档

获享 $300 免费赠金开始概念验证

继续探索 20 多种提供“始终免费”用量的产品

指南

参考信息

资源

运行 HPC 高度并行工作负载

使用 Dataflow ML 运行推理

创建电子商务流处理流水线

相关视频