Kontingente und Limits

Bei Cloud Translation werden Inhaltsgröße und Anzahl von Anfragen, die Sie senden können, durch Kontingente begrenzt. Kontingente sollen unvorhergesehene Nutzungsspitzen verhindern und dadurch die Community der Nutzer vonGoogle Cloud schützen. Sie können Ihre Kontingente auch selbst reduzieren, um übermäßige Nutzung zu verhindern und die Kosten im Griff zu behalten.

Wenn Sie das Kontingent überschreiten, gibt Cloud Translation den Fehler 403 zurück. Die Fehlermeldung lautet Daily Limit Exceeded, wenn Sie ein Tageskontingent überschreiten, oder User Rate Limit Exceeded, wenn Sie ein Minutenkontingent überschreiten.

Tageskontingente werden um Mitternacht (Zeitzone U.S. Pacific) zurückgesetzt. Daher kann es bis zu 24 Stunden dauern, bis neue Kontingente wirksam werden.

Nutzungskontingente festlegen

Standardmäßig ist die Anzahl der Zeichen, die Sie pro Tag senden können, unbegrenzt. Wenn Sie ein festes Budget haben, empfehlen wir, die tägliche Nutzung zu überwachen und die Kontingente entsprechend Ihren geplanten Ausgaben anzupassen.

Sie können Ihre Kontingente über die Seite Kontingente der Google Cloud Console ändern. v2-Kontingente gelten für Cloud Translation Basic, v3-Kontingente für Cloud Translation Advanced.

Inhaltskontingente

Inhaltskontingente gelten für synchrone Anfragen für die Methoden translateText, detectLanguage und translateDocument. Für asynchrone Anfragen, z. B. Batch-Textübersetzungen, gelten nur die Ratenkontingente.

Alle an die Cloud Translation API gesendeten Zeichen werden auf diese Kontingente angerechnet, auch Leerzeichen. Wenn Sie sowohl Cloud Translation Basic als auch Cloud Translation Advanced nutzen, werden die Kontingente addiert.

Bei Textübersetzungen werden Kontingente für benutzerdefinierte Modelle separat gezählt und nicht auf die allgemeinen Modellkontingente angerechnet. Es gibt jedoch ein Limit für die Anzahl der benutzerdefinierten Modelle, die an einem Tag für ein Projekt angefordert werden können. Wenn das translation-llm-Modell verwendet wird, gibt es außerdem kein Kontingent für Inhalte.

Kontingent Standard
Zeichen, die an das allgemeine Modell pro Projekt und Tag gesendet werden (v2 und v3) unbegrenzt
Zeichen, die an das allgemeine Modell pro Projekt und Minute gesendet werden (v2 und v3) 6.000.000
Zeichen, die an das allgemeine Modell pro Projekt, Minute und Nutzer gesendet werden (v2 und v3) 6.000.000
Zeichen, die für die Transliteration pro Projekt und Minute gesendet werden (v3) 100.000 (wird auch auf die Zeichen angerechnet, die als Kontingent an das allgemeine Modell pro Projekt und Minute gesendet werden)
Zeichen, die für die Transkription pro Projekt und Minute gesendet werden (v3) 100.000
Zeichen, die an benutzerdefinierte Modelle pro Projekt und Minute gesendet werden (v3) 100.000
Zeichen, die an benutzerdefinierte Modelle pro Projekt, Minute und Nutzer gesendet werden (v3) bis zum Projektlimit
Anzahl der eindeutigen benutzerdefinierten Modelle, die pro Projekt und Tag aufgerufen werden (v3) 30
Für die Übersetzung von Dokumenten gesendete Seiten pro Projekt und Minute (v3) 2.400
Für die Übersetzung von Dokumenten gesendete Seiten pro Projekt, Minute und Nutzer (v3) 2.400

* Kontingente pro Nutzer gelten für die Anzahl der Anfragen, die ein Endnutzer mit einer Clientanwendung pro Minute stellen kann. Wenn Sie ein Dienstkonto verwenden, ist für Kontingentzwecke der Nutzer die Identität des Dienstkontos. Wenn Sie Cloud Translation Basic und einen API-Schlüssel verwenden, erzwingt Cloud Translation dieses Limit anhand der Client-IP-Adresse.

Limit für Inhalte pro Anfrage

Die Cloud Translation API ist für die Übersetzung kleinerer Anfragen optimiert. Die empfohlene Maximallänge einer Anfrage beträgt 5.000 Zeichen (Codepunkte). Generell gilt aber: Je mehr Zeichen die Anfrage enthält, desto höher ist die Antwortlatenz. Bei Cloud Translation Advanced kann eine einzelne Anfrage maximal 30.000 Codepunkte haben. Cloud Translation Basic hat eine maximale Anfragengröße von 100.000 Byte. Alternativ können per Batchübersetzung mehr Inhalte pro Anfrage als lang andauernden Vorgang gesendet werden.

Anfragen, die das Maximum überschreiten, werden von der Cloud Translation API mit der Fehlermeldung 400 INVALID_ARGUMENT abgelehnt, auch wenn noch ein freies Kontingent verfügbar ist.

Ratenkontingente

Bei Cloud Translation gibt es ein Kontingent für die Anzahl der Anfragen, die Sie an den Dienst senden können. Diese Kontingente gelten für alle Cloud Translation-Methodenaufrufe, mit Ausnahme der Methoden translateDocument und getSupportedLanguages, für die eigene Kontingente in Bezug auf Anfragen oder Inhalte gelten.

Kontingente für benutzerdefinierte Modelle und translation-llm werden separat gezählt und nicht auf die anderen Ratenkontingente für Version 3 angerechnet.

Kontingent Standard
Anfragen zum Abruf unterstützter Sprachen (v2 und v3 zusammen) pro Projekt und Minute 600
v2-Anfragen pro Projekt und Minute 300.000
v2-Anfragen pro Projekt, Minute und Nutzer bis zum v2-Projektlimit
v3-Anfragen pro Projekt und Minute 6000
v3-Transkriptionsanfragen pro Projekt und Minute 6000
v3-Anfragen pro Projekt, Minute und Nutzer bis zum v3-Projektlimit
v3-Batch-Übersetzungsanfragen (Text und Dokumente) pro Projekt und Tag unbegrenzt
v3-Anfragen zur benutzerdefinierten Modellübersetzung pro Projekt und Tag unbegrenzt
v3-Anfragen zur benutzerdefinierten Modellübersetzung pro Projekt und Minute 600
v3-Batch-Anfragen zur benutzerdefinierten Modellübersetzung pro Projekt und Tag unbegrenzt
v3-Anfragen zur Modellerstellung pro Projekt und Minute 10
Gleichzeitige v3-Anfragen zur Modellerstellung pro Projekt 2
v3-Anfragen an Translation LLM pro Projekt und Minute 900
v3-Anfragen zur adaptiven Übersetzung pro Projekt und Minute 900

* Kontingente pro Nutzer gelten für die Anzahl der Anfragen, die ein Endnutzer mit einer Clientanwendung pro Minute stellen kann. Wenn Sie ein Dienstkonto verwenden, ist für Kontingentzwecke der Nutzer die Identität des Dienstkontos. Wenn Sie Cloud Translation Basic und einen API-Schlüssel verwenden, erzwingt Cloud Translation dieses Limit anhand der Client-IP-Adresse.

Kontingentanrechnung

Bei Cloud Translation Basic werden Inhalts- und Ratenkontingente dem Projekt angerechnet, das die Anfrage stellt. Dieses Projekt wird anhand des bei der Anfrage verwendeten Schlüssels ermittelt.

Bei Cloud Translation Advanced bezieht sich das Inhaltskontingent auf das Projekt, das mit dem Modell in der Anfrage verknüpft ist. Die Ratenkontingente beziehen sich auf das Projekt, das die Anfrage stellt.

In der folgenden Textübersetzungsanfrage beziehen sich beispielsweise die Ratenkontingente auf project-id-1, da die Anfrage von project-id-1 stammt. Das Inhaltskontingent bezieht sich auf project-id-2, da bei der Anfrage ein Modell in diesem Projekt verwendet wird.

POST https://translation.googleapis.com/v3/projects/project-id-1/locations/us-central1:translateText
{
  "Model":"projects/project-id-2/locations/us-central1/models/model-id",
  "sourceLanguageCode": "en",
  "targetLanguageCode": "ru",
  "contents": ["Dr. Watson, please discard your trash."]
}

Limits für Cloud Translation Advanced

In der folgenden Tabelle werden die Limits für Cloud Translation Advanced dargestellt. Diese können nicht geändert werden.

Beschreibung Limit
Höchstzahl der Dateien in einer einzelnen Batch-Anfrage 100 Dateien
Höchstzahl der Glossar-Ressourcen eines Projekts 10.000

Translation LLM

Beschreibung Limit
Maximale Anzahl von Zeichen, die Sie pro Anfrage senden können 30.000

Adaptive Übersetzung

Beschreibung Limit
Maximale Anzahl von Segmentpaaren, die Sie importieren können 10.000 (Google Cloud Console)
30.000 (API)
Maximale Anzahl von Zeichen, die Sie pro Anfrage senden können 30.000
Maximale Anzahl von Ausgabetextzeichen aus der adaptiven Übersetzung pro Anfrage 30.000 für Sprachen (darüber hinaus gehender Text wird entfernt)