Wenn die Anzahl der an ein Modell gesendeten Anfragen die verfügbare Verarbeitungskapazität überschreitet, gibt Vertex AI den Fehlercode 429
zurück, der angibt, dass die Ressource erschöpft ist. Die spezifische Fehlermeldung und der Lösungspfad hängen davon ab, ob Sie den Pay-as-you-go-Dienst verwenden oder bereitgestellten Durchsatz erworben haben.
Fehler 429
In der folgenden Tabelle wird verglichen, wie der 429
-Fehler in den Kontingentframeworks „Pay-as-you-go“ und „Bereitgestellter Durchsatz“ behandelt wird.
Pay as you go | Bereitgestellter Durchsatz | |
---|---|---|
Fehlermeldung | Resource exhausted, please try again later. |
Too many requests. Exceeded the Provisioned Throughput. |
Ursache | Die Anzahl der Anfragen überschreitet die verfügbare Kapazität im gemeinsamen Ressourcenpool. | Die Anzahl der Anfragen überschreitet Ihre reservierte Durchsatzkapazität. |
SLA-Auswirkungen | Anfragen, bei denen ein 429 -Fehler auftritt, werden nicht auf Ihre Fehlerrate angerechnet, wie im Service Level Agreement (SLA) beschrieben. |
Fehler bei der Nutzung unter dem gekauften Durchsatz werden als 5XX zurückgegeben. Bei standardmäßig bereitgestelltem Durchsatz werden 5XX -Fehler auf das SLA angerechnet. Der bereitgestellte Durchsatz für eine einzelne Zone ist nicht durch das SLA abgedeckt. Fehler bei der Nutzung über dem gekauften Durchsatz werden als „Pay-as-you-go“ behandelt und nicht auf das SLA angerechnet. |
Mit einem Abo für bereitgestellten Durchsatz reservieren Sie eine bestimmte Menge an Durchsatz für Ihre Modelle. Wenn Sie kein Abo haben und freigegebene Ressourcen nicht verfügbar sind, erhalten Sie den Fehler 429
. Obwohl Sie keine reservierte Kapazität haben, können Sie Ihre Anfrage noch einmal senden.
Bei Projekten mit bereitgestelltem Durchsatz reserviert Vertex AI den gekauften Durchsatz für die Nutzung Ihres Projekts. Wenn Sie weniger als die gekaufte Menge verwenden, werden Fehler, die sonst 429
wären, als 5XX
zurückgegeben und auf die SLA-Fehlerrate angerechnet. Wenn Sie das gekaufte Volumen überschreiten, werden die zusätzlichen Anfragen On-Demand als „Pay-as-you-go“ verarbeitet.
429‑Fehler beheben
Die Schritte zur Behebung eines 429
-Fehlers variieren je nach Ihrem Kontingentrahmen.
Pay as you go
Im Rahmen des Pay-as-you-go-Kontingents haben Sie die folgenden Möglichkeiten, 429
-Fehler zu beheben:
- Globalen Endpunkt verwenden: Verwenden Sie nach Möglichkeit den globalen Endpunkt anstelle eines regionalen Endpunkts.
- Wiederholungsstrategie implementieren: Verwenden Sie den abgeschnittenen exponentiellen Backoff, um Anfragen zu wiederholen.
- Kontingenterhöhung anfordern: Wenn für Ihr Modell Kontingente gelten, können Sie eine Anfrage zur Kontingenterhöhung (Quota Increase Request, QIR) einreichen.
- Traffic glätten: Wenn Ihr Modell Dynamic Shared Quota (DSQ) verwendet, kann es hilfreich sein, den Traffic zu glätten und große Spitzen zu reduzieren. Weitere Informationen finden Sie unter Dynamisches freigegebenes Kontingent.
- Abonnieren Sie Provisioned Throughput: Wenn Sie ein konsistenteres Serviceniveau wünschen, abonnieren Sie Provisioned Throughput. Weitere Informationen finden Sie unter Bereitgestellter Durchsatz.
Bereitgestellter Durchsatz
So beheben Sie einen 429
-Fehler, wenn Sie ein Provisioned Throughput-Abo haben:
- On-Demand-Verarbeitung zulassen: Verwenden Sie das Standardverhalten, indem Sie in Ihren Vorhersageanfragen keinen Header festlegen. Überschreitungen werden On-Demand verarbeitet und als „Pay-as-you-go“ abgerechnet.
- Reservierte Kapazität erhöhen: Erhöhen Sie die Anzahl der GSUs in Ihrem Provisioned Throughput-Abo.
Nächste Schritte
- Weitere Informationen zum dynamischen freigegebenen Kontingent finden Sie unter Dynamisches freigegebenes Kontingent.
- Weitere Informationen zum bereitgestellten Durchsatz finden Sie unter Bereitgestellter Durchsatz.
- Weitere Informationen zu Kontingenten und Limits für Vertex AI finden Sie unter Vertex AI-Kontingente und -Limits.
- Weitere Informationen zu Google Cloud-Kontingenten und ‑Limits finden Sie unter Informationen zu Kontingentwerten und Systemlimits.
- Weitere Informationen zu API-Fehlern