错误代码 429

本指南将介绍如何针对 Vertex AI 中不同的配额框架排查429资源耗尽错误。429 错误表示您的请求数量超出分配用于处理这些请求的容量。

下表显示了每个配额框架的错误消息:

配额框架 消息
随用随付 Resource exhausted, please try again later.
预配的吞吐量 Too many requests. Exceeded the Provisioned Throughput.

排查随用随付错误

在随用随付模式下,您使用的是共享资源池。如果您在发出请求时资源不可用,Vertex AI 会返回 429 错误。此错误不会计入您的错误率,如服务等级协议 (SLA) 中所述。

如需解决 429 错误,请考虑以下选项:

排查预置吞吐量错误

如果您已订阅预配吞吐量,当您的请求超出预留吞吐量,并且您已将端点配置为拒绝超额费用时,您会收到 429 错误。

如需解决 429 错误,您可以执行以下任一操作:

  • 将端点配置为按需处理超额费用,这是默认行为示例。如果采用此设置,超额费用将以随用随付形式结算,而不是被拒绝。
  • 增加预配的吞吐量订阅中的 GSU 数量。

预配吞吐量行为

订阅预配的吞吐量后,Vertex AI 会为您的项目预留所购买的吞吐量。Vertex AI 处理请求的方式因您使用的吞吐量是高于还是低于购买的吞吐量而异:

  • 利用率不足:如果您使用的吞吐量少于购买的吞吐量,则容量相关错误的处理方式取决于预配吞吐量订阅的类型:
    • 标准:本可能以 429 返回的容量相关错误会以 5XX 返回,并计入 SLA 错误率。
    • 单区域:与容量相关的 429 错误会被视为 5XX,但不计入 SLA 错误率。
  • 过度使用:默认情况下,当您超出所购买的吞吐量时,系统会按需处理额外的请求,并按随用随付方式结算。

后续步骤