Kontingente

In diesem Dokument sind die Kontingente und Systemlimits für Document AI aufgeführt.

  • Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
  • Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Ressource vonGoogle Cloud Ihr Projekt von Google Cloud nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Nutzer vonGoogle Cloud schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Ressourcen von Google Cloud .

Das Cloud-Kontingentsystem tut Folgendes:

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf der Ebene des Projekts von Google Cloud . Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Projekts von Google Cloud werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

In diesem Dokument sind die Kontingente für Document AI aufgeführt.

Dienststufen

Document AI unterstützt zwei Service-Stufen und die zugehörigen Kontingente für Online-Verarbeitungsanfragen an auf generativer KI basierende Prozessorversionen: die Stufen „Bereitgestellt“ und „Best Effort“.

Das Kontingent für die bereitgestellte Stufe umfasst 120 Seiten pro Minute für Basisprozessorversionen wie den benutzerdefinierten Extraktor v1.4 und v1.5 sowie 30 Seiten pro Minute für Basisprozessorversionen wie den benutzerdefinierten Extraktor v1.5 Pro.

Das Best-Effort-Kontingent umfasst 120 für Basisprozessorversionen wie den benutzerdefinierten Extraktor v1.4 und v1.5 sowie 60 für Pro-Prozessorversionen wie den benutzerdefinierten Extraktor v1.5 Pro. Es wird erst verwendet, wenn das bereitgestellte Kontingent aufgebraucht ist. Dies gilt für Kontingente BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (Messwert best_effort_online_process_document_pages_us) und BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (Messwert best_effort_online_process_document_pages_eu) in der Console.

Hinweise Benutzerdefinierter Extrahierer v1.4 (basierend auf Gemini 2.0 Flash) Benutzerdefinierter Extraktor v1.5 (basierend auf Gemini 2.5 Flash) Benutzerdefinierter Extraktor v1.5 Pro (basierend auf Gemini 2.5 Pro)
Aktiv 120 120 30
Beste Leistung 120 120 60
Auf Organisationsebene bereitgestellt 240 240 60

Wenn Sie mehr als die in den Best-Effort-Kontingenten aufgeführten Werte benötigen, können Sie eine Anfrage zur Kontingenterhöhung stellen. Wenden Sie sich dazu an Ihren Vertriebsmitarbeiter.

Wenn Sie sich mehr verfügbare Kapazität bei hohem Traffic sichern möchten, lesen Sie den Abschnitt zum Stellen einer Anfrage für eine Kapazitätsreservierung.

Für die Best-Effort-Stufe gibt es kein Service Level Agreement.

Liste der Kontingente

Für Document AI gelten die folgenden Kontingente. Die Kontingente gelten für alle Google Cloud Console-Projekte sowie für alle Anwendungen und IP-Adressen, die dieses Projekt verwenden.

Wenn Sie mehr Anfragen verarbeiten möchten, senden Sie uns in der Google Cloud -Konsole eine Document AI-Kontingentanfrage zu Ihrem Projekt.

Geben Sie in der Anfrage Informationen zu Ihren spezifischen Anforderungen und Ihrem Anwendungsfall an.

Anfragekontingent Standardwert Hinweise
Anfragen pro Minute 1.800 pro Nutzer Kontingent in der Google Cloud Console ansehen
Anfragen für Onlineprozesse pro Minute (nur v1beta2) 600 pro Projekt Kontingent in der Google Cloud Console ansehen
Onlineanfragen pro Minute (USA) 120 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Onlineanfragen pro Minute (EU) 120 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (USA) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.4 mit Gemini 2.0 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (EU) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.4 mit Gemini 2.0 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (USA) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.5 mit Gemini 2.5 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (EU) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.5 mit Gemini 2.5 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Onlineanfragen pro Minute verarbeiten (einzelne Region) 6 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchprozessanfragen pro Projekt und Region (USA) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchprozessanfragen pro Projekt und Region (EU) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchprozessanfragen pro Prozessor (einzelne Region) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten in aktiver Verarbeitung (nur v1beta2) 10.000 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für das Training von Prozessorversionen (USA) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für das Training von Prozessorversionen (EU) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Trainingsanfragen für Prozessorversionen (einzelne Region) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (USA) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (EU) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (einzelne Region) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte generative Prozessorversionen (USA) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Bereitgestellte generative Prozessorversionen (EU) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Bereitgestellte generative Prozessorversionen (Einzelregion) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für Importdokumente (USA) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für Importdokumente (EU) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Importieren von Dokumenten (einzelne Region) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für Exportdokumente (USA) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für den Export von Dokumenten (EU) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für den Export von Dokumenten (einzelne Region) 1 pro Projekt Kontingent in der Google Cloud Console ansehen

* Anfragen zur Kontingentanpassung werden für diese Version noch nicht unterstützt.

 Wird in australia-southeast1 mit einer Anfrage zur Kontingentanpassung unterstützt.

Anfrage für Kapazitätsreservierung stellen

Mit der Kapazitätsreservierung für Document AI wird reservierte Kapazität für die Verarbeitung von Echtzeit-Vorhersage-Traffic mit hohem Volumen für den abonnierten Zeitraum bereitgestellt. So können die Anforderungen des Service Level Agreement (SLA) erfüllt werden. Jede Einheit entspricht einer zusätzlichen Seite pro Minute über das Standardkontingent hinaus.

Die Kapazitätsreservierung wird unterstützt und ist erforderlich, um die Kontingente für die bereitgestellte Stufe von benutzerdefinierten Extraktormodellen v1.4 und v1.5 zu erhöhen, einschließlich der darauf basierenden feinabgestimmten Prozessorversionen.

Der Preis für die Kapazitätsreservierung beträgt 300 $pro zusätzlicher Seite pro Minute und Monat.

So stellen Sie einen Antrag auf Kapazitätsreservierung:

Console

  1. Rufen Sie in der Google Cloud Console die Seite IAM & Verwaltung > Kapazitätsreservierung auf:

    Kapazitätsreservierung

  2. Klicken Sie in der Nähe der Seitenüberschrift auf die Schaltfläche Neue Kapazitätsreservierung erstellen. Sie werden dann zu einem zweiseitigen Antragsformular weitergeleitet.

  3. Füllen Sie die Seite Konfigurieren mit den folgenden Informationen aus:

    1. Geben Sie einen Namen für den Auftrag ein.
    2. Wählen Sie eine Region aus.
    3. Wählen Sie im Drop-down-Menü die Prozessorversion aus.
    4. Geben Sie die Anzahl der zusätzlichen Seiten pro Minute an, die pro Monat benötigt werden.
    5. Wählen Sie den monatlichen Abozeitraum aus.
    6. Wählen Sie das Startdatum und die Startzeit aus.
    7. Wählen Sie im Drop-down-Menü eine Option für die automatische Verlängerung aus.
  4. Klicken Sie auf Weiter.

  5. Auf der zweiten Seite sehen Sie die geschätzten Kosten pro Monat. Sie müssen BESTÄTIGEN eingeben, um den Kauf zu bestätigen.

  6. Klicken Sie auf Bestätigen und senden, um Ihre Bestellung zu bestätigen.

Den Status der Anfrage sehen Sie auf dem Tab Kapazitätsreservierung.

Es gibt drei mögliche Status:

  • Inaktiv: Das Abo hat noch nicht begonnen.
  • Aktiv: Das Abo läuft.
  • Abgeschlossen: Das Abo ist beendet.

Was Sie vor dem Kauf einer Kapazitätsreservierung beachten sollten

Die folgenden Überlegungen können Ihnen bei der Entscheidung helfen, ob Sie eine Kapazitätsreservierung erwerben möchten:

  • Sie können Ihre Bestellung nicht mitten in der Laufzeit stornieren.

    Der Kauf einer Kapazitätsreservierung ist eine Zusicherung. Das bedeutet, dass Sie die Bestellung während der Laufzeit nicht stornieren können. Sie können jedoch die Anzahl der gekauften GSUs erhöhen. Wenn Sie versehentlich eine Zusicherung erworben haben oder ein Problem mit Ihrer Konfiguration vorliegt, wenden Sie sich an Ihren Google Cloud Kundenbetreuer.

  • Sie können Ihr Abo automatisch verlängern.

    Wenn Sie Ihre Bestellung aufgeben, können Sie festlegen, dass Ihr Abo am Ende der Laufzeit automatisch verlängert wird oder ausläuft. Sie können die automatische Verlängerung abbrechen. Wenn Sie Ihr Abo vor der automatischen Verlängerung kündigen möchten, müssen Sie die automatische Verlängerung 30 Tage vor Beginn des nächsten Zeitraums kündigen.

    Sie können monatliche Abos so konfigurieren, dass sie sich jeden Monat automatisch verlängern. Wöchentliche Laufzeiten unterstützen keine automatische Verlängerung.