本页面列出了 Dataproc API 配额限制,这些限制在项目和区域层级强制实施。配额每 60 秒(1 分钟)重置一次。
如需了解有助于避免配额和资源可用性问题的集群优化策略,请参阅资源可用性和可用区策略。
下表列出了每个项目具体的默认 Dataproc API 配额类型、配额限制,以及限制所适用的方法。
配额类型 | 限制 | 适用的 API 方法 |
---|---|---|
AutoscalingOperationRequestsPerMinutePerProjectPerRegion | 400 | CreateAutoscalingPolicy、GetAutoscalingPolicy、ListAutoscalingPolicies、UpdateAutoscalingPolicy、DeleteAutoscalingPolicy |
ClusterOperationRequestsPerMinutePerProjectPerRegion | 200 | CreateCluster、DeleteCluster、UpdateCluster、StopCluster、StartCluster、DiagnoseCluster、RepairCluster |
NodeGroupOperationRequestsPerMinutePerProjectPerRegion | 600 | CreateNodeGroup、DeleteNodeGroup、ResizeNodeGroup、RepairNodeGroup、UpdateLabelsNodeGroup、StartNodeGroup、StopNodeGroup |
GetJobRequestsPerMinutePerProjectPerRegion | 7500 | GetJob |
JobOperationRequestsPerMinutePerProjectPerRegion | 400 | SubmitJob、UpdateJob、CancelJob、DeleteJob |
WorkflowOperationRequestsPerMinutePerProjectPerRegion | 400 | CreateWorkflowTemplate、InstantiateWorkflowTemplate、InstantiateInlineWorkflowTemplate、UpdateWorkflowTemplate、DeleteWorkflowTemplate |
DefaultRequestsPerMinutePerProjectPerRegion | 7500 | 所有其他操作(主要是 Get 操作) |
下表列出了项目级和区域级的其他活跃操作及作业总数限制。
配额类型 | 限制 | 说明 |
---|---|---|
ActiveOperationsPerProjectPerRegion | 5000 | 单个区域数据库中,单个项目内所有类型并发活跃操作的总数限制 |
ActiveJobsPerProjectPerRegion | 5000 | 单个区域数据库中单个项目内处于 NON_TERMINAL 状态的活跃作业总数限制 |
其他 Google Cloud 配额
Dataproc 集群还会使用其他 Google Cloud 产品。这些产品具有项目级层配额,其中包括适用于 Dataproc 用量的配额。使用 Dataproc 时必需用到一些服务,例如 Compute Engine 和 Cloud Storage。其他服务(例如 BigQuery 和 Bigtable)可以选择使用 Dataproc。
必需的集群服务
创建 Dataproc 集群需要以下强制执行配额限制的服务。
Compute Engine
Dataproc 集群使用 Compute Engine 虚拟机。Compute Engine 配额分为区域限制和全局限制。这些限制适用于您创建的集群。例如,创建具有一个 n1-standard-4
-m 节点和两个 n1-standard-4
-w 节点的集群需要使用 12 个虚拟 CPU (4 * 3
)。此集群的用量将计入区域配额限制(24 个虚拟 CPU)。
默认集群资源
使用默认设置创建 Dataproc 集群时,需使用以下 Compute Engine 资源。
资源 | 用量 |
---|---|
虚拟 CPU | 12 |
虚拟机实例 | 3 |
Persistent Disk | 1500 GB |
Cloud Logging
Dataproc 会将驱动程序输出和集群日志保存在 Cloud Logging 中。 Logging 配额适用于 Dataproc 集群。
可选集群服务
您可以选择将以下服务(具有配额限制)与 Dataproc 集群搭配使用。
BigQuery
对 BigQuery 执行数据读写操作时,适用 BigQuery 配额。
Bigtable
对 Bigtable 执行数据读写操作时,适用 Bigtable 配额。
资源可用性和可用区策略
如需优化集群以提高资源可用性并减少潜在的缺货错误,请考虑以下策略:
自动选择可用区展示位置:创建集群时,请使用自动选择可用区展示位置。这样一来,Dataproc 便可在您指定的区域内选择最佳可用区,从而提高成功创建集群的几率。
区域配额:验证您的区域 Compute Engine 配额是否充足,因为即使启用了自动选择可用区展示位置,如果区域总容量不足以满足您的请求,配额也可能会用尽。
机器类型灵活性:如果您发现特定机器类型持续缺货,请为集群使用其他更易于获得的机器类型。