Wenn die Anzahl Ihrer Anfragen die für die Verarbeitung von Anfragen zugewiesene Kapazität überschreitet, wird der Fehlercode 429
zurückgegeben. In der folgenden Tabelle sehen Sie die Fehlermeldung, die von den einzelnen Kontingentframeworks generiert wird:
Kontingentrahmen | Nachricht |
---|---|
Pay as you go | Resource exhausted, please try again later. |
Bereitgestellter Durchsatz | Too many requests. Exceeded the Provisioned Throughput. |
Mit einem Provisioned Throughput-Abo können Sie eine bestimmte Menge an Durchsatz für bestimmte generative KI-Modelle reservieren. Wenn Sie kein Provisioned Throughput-Abo haben und Ihrer Anwendung keine Ressourcen zur Verfügung stehen, wird der Fehlercode 429
zurückgegeben. Obwohl Sie keine reservierte Kapazität haben, können Sie Ihre Anfrage noch einmal versuchen. Die Anfrage wird jedoch nicht auf Ihre Fehlerrate angerechnet, wie in Ihrem Service Level Agreement (SLA) beschrieben.
Bei Projekten, für die bereitgestellter Durchsatz erworben wurde, misst Vertex AI den Durchsatz eines Projekts und reserviert den erworbenen Durchsatz für die tatsächliche Nutzung des Projekts.
Wenn Sie bei standardmäßigem bereitgestellten Durchsatz weniger als die gekaufte Menge verwenden, werden Fehler, die ansonsten 429
wären, als 5XX
zurückgegeben und auf die SLA-Fehlerrate angerechnet. Wenn Sie bei Provisioned Throughput für eine einzelne Zone weniger als die gekaufte Menge verwenden, werden kapazitätsbezogene 429
-Fehler als 5XX
behandelt, werden aber nicht auf die SLA-Fehlerrate angerechnet. Wenn Sie die gekaufte Menge überschreiten, werden die zusätzlichen Anfragen On-Demand als „Pay-as-you-go“ verarbeitet.
Pay as you go
Im Rahmen des Kontingentmodells mit nutzungsabhängiger Bezahlung haben Sie die folgenden Möglichkeiten, 429
-Fehler zu beheben:
- Verwenden Sie nach Möglichkeit den globalen Endpunkt anstelle eines regionalen Endpunkts.
- Implementieren Sie eine Wiederholungsstrategie mit abgeschnittenem exponentiellen Backoff.
- Wenn für Ihr Modell Kontingente gelten, können Sie eine Anfrage zur Kontingenterhöhung einreichen. Wenn Ihr Modell dynamisches gemeinsames Kontingent verwendet, kann es helfen, den Traffic zu glätten und große Spitzen zu reduzieren. Weitere Informationen finden Sie unter Dynamisches gemeinsames Kontingent (DSQ).
- Abonnieren Sie bereitgestellten Durchsatz, um ein konsistenteres Serviceniveau zu erhalten. Weitere Informationen finden Sie unter Bereitgestellter Durchsatz.
Bereitgestellter Durchsatz
So beheben Sie den Fehler 429, der durch Provisioned Throughput generiert wird:
- Verwenden Sie das Beispiel für das Standardverhalten, in dem kein Header in Vorhersageanfragen festgelegt wird. Überschreitungen werden On-Demand verarbeitet und als „Pay-as-you-go“ abgerechnet.
- Erhöhen Sie die Anzahl der GSUs in Ihrem Provisioned Throughput-Abo.
Nächste Schritte
- Weitere Informationen zum dynamischen freigegebenen Kontingent finden Sie unter Dynamisches freigegebenes Kontingent.
- Weitere Informationen zum bereitgestellten Durchsatz finden Sie unter Bereitgestellter Durchsatz.
- Informationen zu Kontingenten und Limits für Vertex AI finden Sie unter Vertex AI-Kontingente und -Limits.
- Weitere Informationen zu Google Cloud Kontingenten und Systemlimits finden Sie in der Dokumentation zu Cloud-Kontingenten.
- Weitere Informationen zu API-Fehlern