Wenn die Anzahl Ihrer Anfragen die Kapazität überschreitet, die für die Verarbeitung von Anfragen zugewiesen ist, wird der Fehlercode 429
zurückgegeben. In der folgenden Tabelle sind die Fehlermeldungen aufgeführt, die von den einzelnen Kontingentsystemen generiert werden:
Kontingentrahmen | Meldung |
---|---|
Pay as you go | Resource exhausted, please try again later. |
Bereitgestellter Durchsatz | Too many requests. Exceeded the Provisioned Throughput. |
Mit einem Abo für bereitgestellten Durchsatz können Sie einen bestimmten Durchsatz für bestimmte Modelle für generative KI reservieren. Wenn Sie kein Abo mit bereitgestelltem Durchsatz haben und für Ihre Anwendung keine Ressourcen verfügbar sind, wird der Fehlercode 429
zurückgegeben. Auch wenn Sie keine reservierte Kapazität haben, können Sie Ihre Anfrage noch einmal senden. Die Anfrage wird jedoch nicht auf Ihre Fehlerrate angerechnet, wie in Ihrem Service Level Agreement (SLA) beschrieben.
Bei Projekten, für die ein bereitgestellter Durchsatz gekauft wurde, misst Vertex AI den Durchsatz eines Projekts und reserviert diesen Durchsatz, damit er verfügbar ist. Wenn Sie weniger als den gekauften Durchsatz nutzen, werden Fehler, die andernfalls als 429
zurückgegeben würden, als 5XX
zurückgegeben und als Teil der im SLA beschriebenen Fehlerrate gezählt.
Pay as you go
Im Rahmen des Pay-per-Use-Kontingents haben Sie folgende Möglichkeiten, 429
-Fehler zu beheben:
- Implementieren Sie eine Wiederholungsstrategie mit abgeschnittenem exponentiellem Backoff.
- Wenn Sie eine Nutzerüberschreibung festgelegt und so konfiguriert haben, dass die Kosten kontrolliert werden, erhöhen Sie das Limit. Weitere Informationen finden Sie unter Dynamisches freigegebenes Kontingent.
- Abonnieren Sie den bereitgestellten Durchsatz, um eine gleichmäßigere Dienstqualität zu erhalten. Weitere Informationen finden Sie unter Bereitgestellter Durchsatz.
Nächste Schritte
- Weitere Informationen zum dynamischen freigegebenen Kontingent finden Sie unter Dynamisches freigegebenes Kontingent.
- Weitere Informationen zu Kontingenten und Limits für Vertex AI finden Sie unter Vertex AI-Kontingente und -Limits.
- Weitere Informationen zu Kontingenten und Limits für Google Cloud finden Sie unter Informationen zu Kontingentwerten und Systemlimits.