Dataproc 配额

本页面列出了 Dataproc API 配额限制,这些限制在项目和区域层级强制实施。配额每 60 秒(1 分钟)重置一次。

如需了解有助于避免配额和资源可用性问题的集群优化策略,请参阅资源可用性和可用区策略

下表列出了每个项目具体的默认 Dataproc API 配额类型、配额限制,以及限制所适用的方法。

配额类型 限制 适用的 API 方法
AutoscalingOperationRequestsPerMinutePerProjectPerRegion 400 CreateAutoscalingPolicy、GetAutoscalingPolicy、ListAutoscalingPolicies、UpdateAutoscalingPolicy、DeleteAutoscalingPolicy
ClusterOperationRequestsPerMinutePerProjectPerRegion 200 CreateCluster、DeleteCluster、UpdateCluster、StopCluster、StartCluster、DiagnoseCluster、RepairCluster
NodeGroupOperationRequestsPerMinutePerProjectPerRegion 600 CreateNodeGroup、DeleteNodeGroup、ResizeNodeGroup、RepairNodeGroup、UpdateLabelsNodeGroup、StartNodeGroup、StopNodeGroup
GetJobRequestsPerMinutePerProjectPerRegion 7500 GetJob
JobOperationRequestsPerMinutePerProjectPerRegion 400 SubmitJob、UpdateJob、CancelJob、DeleteJob
WorkflowOperationRequestsPerMinutePerProjectPerRegion 400 CreateWorkflowTemplate、InstantiateWorkflowTemplate、InstantiateInlineWorkflowTemplate、UpdateWorkflowTemplate、DeleteWorkflowTemplate
DefaultRequestsPerMinutePerProjectPerRegion 7500 所有其他操作(主要是 Get 操作)

下表列出了项目级和区域级的其他活跃操作及作业总数限制。

配额类型 限制 说明
ActiveOperationsPerProjectPerRegion 5000 单个区域数据库中,单个项目内所有类型并发活跃操作的总数限制
ActiveJobsPerProjectPerRegion 5000 单个区域数据库中单个项目内处于 NON_TERMINAL 状态的活跃作业总数限制

其他 Google Cloud 配额

Dataproc 集群还会使用其他 Google Cloud 产品。这些产品具有项目级层配额,其中包括适用于 Dataproc 用量的配额。使用 Dataproc 时必需用到一些服务,例如 Compute EngineCloud Storage。其他服务(例如 BigQueryBigtable)可以选择使用 Dataproc。

必需的集群服务

创建 Dataproc 集群需要以下强制执行配额限制的服务。

Compute Engine

Dataproc 集群使用 Compute Engine 虚拟机。Compute Engine 配额分为区域限制和全局限制。这些限制适用于您创建的集群。例如,创建具有一个 n1-standard-4 -m 节点和两个 n1-standard-4 -w 节点的集群需要使用 12 个虚拟 CPU (4 * 3)。此集群的用量将计入区域配额限制(24 个虚拟 CPU)。

默认集群资源

使用默认设置创建 Dataproc 集群时,需使用以下 Compute Engine 资源。

资源 用量
虚拟 CPU 12
虚拟机实例 3
Persistent Disk 1500 GB

Cloud Logging

Dataproc 会将驱动程序输出和集群日志保存在 Cloud Logging 中。 Logging 配额适用于 Dataproc 集群。

可选集群服务

您可以选择将以下服务(具有配额限制)与 Dataproc 集群搭配使用。

BigQuery

对 BigQuery 执行数据读写操作时,适用 BigQuery 配额

Bigtable

对 Bigtable 执行数据读写操作时,适用 Bigtable 配额

资源可用性和可用区策略

如需优化集群以提高资源可用性并减少潜在的缺货错误,请考虑以下策略:

  • 自动选择可用区展示位置:创建集群时,请使用自动选择可用区展示位置。这样一来,Dataproc 便可在您指定的区域内选择最佳可用区,从而提高成功创建集群的几率。

  • 区域配额:验证您的区域 Compute Engine 配额是否充足,因为即使启用了自动选择可用区展示位置,如果区域总容量不足以满足您的请求,配额也可能会用尽。

  • 机器类型灵活性:如果您发现特定机器类型持续缺货,请为集群使用其他更易于获得的机器类型。