Bei Cloud Translation werden Inhaltsgröße und Anzahl von Anfragen, die Sie senden können, durch Kontingente begrenzt. Kontingente sollen unvorhergesehene Nutzungsspitzen verhindern und dadurch die Community der Nutzer vonGoogle Cloud schützen. Sie können Ihre Kontingente auch selbst reduzieren, um übermäßige Nutzung zu verhindern und die Kosten im Griff zu behalten.
Wenn Sie das Kontingent überschreiten, gibt Cloud Translation den Fehler 403
zurück.
Die Fehlermeldung lautet Daily Limit Exceeded
, wenn Sie ein Tageskontingent überschreiten, oder User Rate Limit Exceeded
, wenn Sie ein Minutenkontingent überschreiten.
Tageskontingente werden um Mitternacht (Zeitzone U.S. Pacific) zurückgesetzt. Daher kann es bis zu 24 Stunden dauern, bis neue Kontingente wirksam werden.
Nutzungskontingente festlegen
Standardmäßig ist die Anzahl der Zeichen, die Sie pro Tag senden können, unbegrenzt. Wenn Sie ein festes Budget haben, empfehlen wir, die tägliche Nutzung zu überwachen und die Kontingente entsprechend Ihren geplanten Ausgaben anzupassen.
Sie können Ihre Kontingente über die Seite Kontingente der Google Cloud Console ändern. v2-Kontingente gelten für Cloud Translation Basic, v3-Kontingente für Cloud Translation Advanced.
Inhaltskontingente
Inhaltskontingente gelten für synchrone Anfragen für die Methoden translateText
, detectLanguage
und translateDocument
. Für asynchrone Anfragen, z. B. Batch-Textübersetzungen, gelten nur die Ratenkontingente.
Alle an die Cloud Translation API gesendeten Zeichen werden auf diese Kontingente angerechnet, auch Leerzeichen. Wenn Sie sowohl Cloud Translation Basic als auch Cloud Translation Advanced nutzen, werden die Kontingente addiert.
Bei Textübersetzungen werden Kontingente für benutzerdefinierte Modelle separat gezählt und nicht auf die allgemeinen Modellkontingente angerechnet. Es gibt jedoch ein Limit für die Anzahl der benutzerdefinierten Modelle, die an einem Tag für ein Projekt angefordert werden können. Wenn das translation-llm
-Modell verwendet wird, gibt es außerdem kein Kontingent für Inhalte.
Kontingent | Standard |
---|---|
Zeichen, die an das allgemeine Modell pro Projekt und Tag gesendet werden (v2 und v3) | unbegrenzt |
Zeichen, die an das allgemeine Modell pro Projekt und Minute gesendet werden (v2 und v3) | 6.000.000 |
Zeichen, die an das allgemeine Modell pro Projekt, Minute und Nutzer gesendet werden (v2 und v3) | 6.000.000 |
Zeichen, die für die Transliteration pro Projekt und Minute gesendet werden (v3) | 100.000 (wird auch auf die Zeichen angerechnet, die als Kontingent an das allgemeine Modell pro Projekt und Minute gesendet werden) |
Zeichen, die für die Transkription pro Projekt und Minute gesendet werden (v3) | 100.000 |
Zeichen, die an benutzerdefinierte Modelle pro Projekt und Minute gesendet werden (v3) | 100.000 |
Zeichen, die an benutzerdefinierte Modelle pro Projekt, Minute und Nutzer gesendet werden (v3) | bis zum Projektlimit |
Anzahl der eindeutigen benutzerdefinierten Modelle, die pro Projekt und Tag aufgerufen werden (v3) | 30 |
Für die Übersetzung von Dokumenten gesendete Seiten pro Projekt und Minute (v3) | 2.400 |
Für die Übersetzung von Dokumenten gesendete Seiten pro Projekt, Minute und Nutzer (v3) | 2.400 |
* Kontingente pro Nutzer gelten für die Anzahl der Anfragen, die ein Endnutzer mit einer Clientanwendung pro Minute stellen kann. Wenn Sie ein Dienstkonto verwenden, ist für Kontingentzwecke der Nutzer die Identität des Dienstkontos. Wenn Sie Cloud Translation Basic und einen API-Schlüssel verwenden, erzwingt Cloud Translation dieses Limit anhand der Client-IP-Adresse.
Limit für Inhalte pro Anfrage
Die Cloud Translation API ist für die Übersetzung kleinerer Anfragen optimiert. Die empfohlene Maximallänge einer Anfrage beträgt 5.000 Zeichen (Codepunkte). Generell gilt aber: Je mehr Zeichen die Anfrage enthält, desto höher ist die Antwortlatenz. Bei Cloud Translation Advanced kann eine einzelne Anfrage maximal 30.000 Codepunkte haben. Cloud Translation Basic hat eine maximale Anfragengröße von 100.000 Byte. Alternativ können per Batchübersetzung mehr Inhalte pro Anfrage als lang andauernden Vorgang gesendet werden.
Anfragen, die das Maximum überschreiten, werden von der Cloud Translation API mit der Fehlermeldung 400 INVALID_ARGUMENT
abgelehnt, auch wenn noch ein freies Kontingent verfügbar ist.
Ratenkontingente
Bei Cloud Translation gibt es ein Kontingent für die Anzahl der Anfragen, die Sie an den Dienst senden können. Diese Kontingente gelten für alle Cloud Translation-Methodenaufrufe, mit Ausnahme der Methoden translateDocument
und getSupportedLanguages
, für die eigene Kontingente in Bezug auf Anfragen oder Inhalte gelten.
Kontingente für benutzerdefinierte Modelle und translation-llm
werden separat gezählt und nicht auf die anderen Ratenkontingente für Version 3 angerechnet.
Kontingent | Standard |
---|---|
Anfragen zum Abruf unterstützter Sprachen (v2 und v3 zusammen) pro Projekt und Minute | 600 |
v2-Anfragen pro Projekt und Minute | 300.000 |
v2-Anfragen pro Projekt, Minute und Nutzer | bis zum v2-Projektlimit |
v3-Anfragen pro Projekt und Minute | 6000 |
v3-Transkriptionsanfragen pro Projekt und Minute | 6000 |
v3-Anfragen pro Projekt, Minute und Nutzer | bis zum v3-Projektlimit |
v3-Batch-Übersetzungsanfragen (Text und Dokumente) pro Projekt und Tag | unbegrenzt |
v3-Anfragen zur benutzerdefinierten Modellübersetzung pro Projekt und Tag | unbegrenzt |
v3-Anfragen zur benutzerdefinierten Modellübersetzung pro Projekt und Minute | 600 |
v3-Batch-Anfragen zur benutzerdefinierten Modellübersetzung pro Projekt und Tag | unbegrenzt |
v3-Anfragen zur Modellerstellung pro Projekt und Minute | 10 |
Gleichzeitige v3-Anfragen zur Modellerstellung pro Projekt | 2 |
v3-Anfragen an Translation LLM pro Projekt und Minute | 900 |
v3-Anfragen zur adaptiven Übersetzung pro Projekt und Minute | 900 |
* Kontingente pro Nutzer gelten für die Anzahl der Anfragen, die ein Endnutzer mit einer Clientanwendung pro Minute stellen kann. Wenn Sie ein Dienstkonto verwenden, ist für Kontingentzwecke der Nutzer die Identität des Dienstkontos. Wenn Sie Cloud Translation Basic und einen API-Schlüssel verwenden, erzwingt Cloud Translation dieses Limit anhand der Client-IP-Adresse.
Kontingentanrechnung
Bei Cloud Translation Basic werden Inhalts- und Ratenkontingente dem Projekt angerechnet, das die Anfrage stellt. Dieses Projekt wird anhand des bei der Anfrage verwendeten Schlüssels ermittelt.
Bei Cloud Translation Advanced bezieht sich das Inhaltskontingent auf das Projekt, das mit dem Modell in der Anfrage verknüpft ist. Die Ratenkontingente beziehen sich auf das Projekt, das die Anfrage stellt.
In der folgenden Textübersetzungsanfrage beziehen sich beispielsweise die Ratenkontingente auf project-id-1
, da die Anfrage von project-id-1
stammt. Das Inhaltskontingent bezieht sich auf project-id-2
, da bei der Anfrage ein Modell in diesem Projekt verwendet wird.
POST https://translation.googleapis.com/v3/projects/project-id-1/locations/us-central1:translateText { "Model":"projects/project-id-2/locations/us-central1/models/model-id", "sourceLanguageCode": "en", "targetLanguageCode": "ru", "contents": ["Dr. Watson, please discard your trash."] }
Limits für Cloud Translation Advanced
In der folgenden Tabelle werden die Limits für Cloud Translation Advanced dargestellt. Diese können nicht geändert werden.
Beschreibung | Limit |
---|---|
Höchstzahl der Dateien in einer einzelnen Batch-Anfrage | 100 Dateien |
Höchstzahl der Glossar-Ressourcen eines Projekts | 10.000 |
Translation LLM
Beschreibung | Limit |
---|---|
Maximale Anzahl von Zeichen, die Sie pro Anfrage senden können | 30.000 |
Adaptive Übersetzung
Beschreibung | Limit |
---|---|
Maximale Anzahl von Segmentpaaren, die Sie importieren können | 10.000 (Google Cloud Console) 30.000 (API) |
Maximale Anzahl von Zeichen, die Sie pro Anfrage senden können | 30.000 |
Maximale Anzahl von Ausgabetextzeichen aus der adaptiven Übersetzung pro Anfrage | 30.000 für Sprachen (darüber hinaus gehender Text wird entfernt) |