Diese Seite wurde von der Cloud Translation API übersetzt.

Fehlercode 429

Wenn die Anzahl der an ein Modell gesendeten Anfragen die verfügbare Verarbeitungskapazität überschreitet, gibt Vertex AI den Fehlercode 429 zurück, der angibt, dass die Ressource erschöpft ist. Die spezifische Fehlermeldung und der Lösungspfad hängen davon ab, ob Sie den Pay-as-you-go-Dienst verwenden oder bereitgestellten Durchsatz erworben haben.

Fehler 429

In der folgenden Tabelle wird verglichen, wie der 429-Fehler in den Kontingentframeworks „Pay-as-you-go“ und „Bereitgestellter Durchsatz“ behandelt wird.

	Pay as you go	Bereitgestellter Durchsatz
Fehlermeldung	`Resource exhausted, please try again later.`	`Too many requests. Exceeded the Provisioned Throughput.`
Ursache	Die Anzahl der Anfragen überschreitet die verfügbare Kapazität im gemeinsamen Ressourcenpool.	Die Anzahl der Anfragen überschreitet Ihre reservierte Durchsatzkapazität.
SLA-Auswirkungen	Anfragen, bei denen ein `429`-Fehler auftritt, werden nicht auf Ihre Fehlerrate angerechnet, wie im Service Level Agreement (SLA) beschrieben.	Fehler bei der Nutzung unter dem gekauften Durchsatz werden als `5XX` zurückgegeben. Bei standardmäßig bereitgestelltem Durchsatz werden `5XX`-Fehler auf das SLA angerechnet. Der bereitgestellte Durchsatz für eine einzelne Zone ist nicht durch das SLA abgedeckt. Fehler bei der Nutzung über dem gekauften Durchsatz werden als „Pay-as-you-go“ behandelt und nicht auf das SLA angerechnet.

Mit einem Abo für bereitgestellten Durchsatz reservieren Sie eine bestimmte Menge an Durchsatz für Ihre Modelle. Wenn Sie kein Abo haben und freigegebene Ressourcen nicht verfügbar sind, erhalten Sie den Fehler 429. Obwohl Sie keine reservierte Kapazität haben, können Sie Ihre Anfrage noch einmal senden.

Bei Projekten mit bereitgestelltem Durchsatz reserviert Vertex AI den gekauften Durchsatz für die Nutzung Ihres Projekts. Wenn Sie weniger als die gekaufte Menge verwenden, werden Fehler, die sonst 429 wären, als 5XX zurückgegeben und auf die SLA-Fehlerrate angerechnet. Wenn Sie das gekaufte Volumen überschreiten, werden die zusätzlichen Anfragen On-Demand als „Pay-as-you-go“ verarbeitet.

429‑Fehler beheben

Die Schritte zur Behebung eines 429-Fehlers variieren je nach Ihrem Kontingentrahmen.

Pay as you go

Im Rahmen des Pay-as-you-go-Kontingents haben Sie die folgenden Möglichkeiten, 429-Fehler zu beheben:

Globalen Endpunkt verwenden: Verwenden Sie nach Möglichkeit den globalen Endpunkt anstelle eines regionalen Endpunkts.
Wiederholungsstrategie implementieren: Verwenden Sie den abgeschnittenen exponentiellen Backoff, um Anfragen zu wiederholen.
Kontingenterhöhung anfordern: Wenn für Ihr Modell Kontingente gelten, können Sie eine Anfrage zur Kontingenterhöhung (Quota Increase Request, QIR) einreichen.
Traffic glätten: Wenn Ihr Modell Dynamic Shared Quota (DSQ) verwendet, kann es hilfreich sein, den Traffic zu glätten und große Spitzen zu reduzieren. Weitere Informationen finden Sie unter Dynamisches freigegebenes Kontingent.
Abonnieren Sie Provisioned Throughput: Wenn Sie ein konsistenteres Serviceniveau wünschen, abonnieren Sie Provisioned Throughput. Weitere Informationen finden Sie unter Bereitgestellter Durchsatz.

Bereitgestellter Durchsatz

So beheben Sie einen 429-Fehler, wenn Sie ein Provisioned Throughput-Abo haben:

On-Demand-Verarbeitung zulassen: Verwenden Sie das Standardverhalten, indem Sie in Ihren Vorhersageanfragen keinen Header festlegen. Überschreitungen werden On-Demand verarbeitet und als „Pay-as-you-go“ abgerechnet.
Reservierte Kapazität erhöhen: Erhöhen Sie die Anzahl der GSUs in Ihrem Provisioned Throughput-Abo.

Nächste Schritte

Weitere Informationen zum dynamischen freigegebenen Kontingent finden Sie unter Dynamisches freigegebenes Kontingent.
Weitere Informationen zum bereitgestellten Durchsatz finden Sie unter Bereitgestellter Durchsatz.
Weitere Informationen zu Kontingenten und Limits für Vertex AI finden Sie unter Vertex AI-Kontingente und -Limits.
Weitere Informationen zu Google Cloud-Kontingenten und ‑Limits finden Sie unter Informationen zu Kontingentwerten und Systemlimits.
Weitere Informationen zu API-Fehlern