Best Practices für die Kontingentverwaltung

Auf dieser Seite werden Best Practices für die Verwaltung von Kontingenten für die Cloud Healthcare API beschrieben. Verwenden Sie diese Seite, wenn Ihr Google Cloud Projekt viel Traffic hat oder haben könnte und Sie mehr Kontingent benötigen, als die Cloud Healthcare API standardmäßig bietet.

Cloud Healthcare API-Standardkontingente

Die Standardkontingente für die Cloud Healthcare API sind nicht für alle Anwendungsfälle konzipiert, insbesondere wenn in Ihrem Google Cloud Projekt viel Traffic anfällt. Das Kontingent für die Cloud Healthcare API wird nicht automatisch erhöht. Sie müssen Ihre Kontingentnutzung planen und überwachen.

Best Practices für die Überwachung und Anzeige von Kontingenten

Es gibt mehrere Methoden, um Ihre Kontingentnutzung aufzurufen. Wenn Sie Kontingente für die Cloud Healthcare API schätzen und ansehen, empfehlen wir, das Dienstkontingentmodell zu verwenden. Mit dem Modell können Sie das verfügbare Kontingent anhand der folgenden Kriterien genau einschätzen:

  • Gibt an, ob eine Administratorüberschreibung vorhanden ist. Einem Hauptkonto, dem die Rolle Kontingentadministrator in einer Organisation zugewiesen wurde, kann eine Administratorüberschreibung auf Kontingente inGoogle Cloud -Projekten innerhalb der Organisation anwenden. Eine Überschreibung durch den Administrator ersetzt Standardlimits und Überschreibungen durch den Ersteller.
  • Gibt an, ob eine Überschreibung durch den Hersteller vorhanden ist. Ein Dienstinhaber gewährt einem Nutzer eines Dienstes eine Überschreibung durch den Ersteller. Google Cloud ist der Dienstinhaber des Cloud Healthcare API-Dienstes. Jede Kontingentüberschreibung, die Google Cloud bereitstellt, ist eine Überschreibung durch den Ersteller.

  • Gibt an, ob eine Überschreibung durch Nutzer vorhanden ist. Eine Person, die Anfragen an die Cloud Healthcare API stellt, ist ein Nutzer des Cloud Healthcare API-Dienstes. Sie können Überschreibungen durch den Nutzer in verschiedenen Situationen anwenden, z. B. um Kontingente in IhremGoogle Cloud -Projekt als Kostenkontrollmaßnahme zu begrenzen und so Budgetüberschreitungen zu verhindern.

Wenn Sie eine dieser Überschreibungen verwenden, können Sie Ihr Nutzerkontingentlimit berechnen, um eine genaue Einschätzung Ihres verfügbaren Kontingents zu erhalten.

Best Practices für das Anfordern zusätzlicher Kontingente

Google Cloud hat Verfahren zum Anfordern eines höheren Kontingentwerts. Informationen zur Verarbeitung von Anfragen zur Kontingentanpassung finden Sie unter Kontingentanpassungen.

Bevor Sie zusätzliches Kontingent anfordern, müssen Sie Folgendes implementiert haben:

Diese Implementierungen können die benötigte Kontingentmenge aus folgenden Gründen reduzieren:

  • Bei beiden Implementierungen werden Lastspitzen über mehrere Stunden oder Minuten verteilt, anstatt über Sekunden.
  • Bei beiden Implementierungen wird das Kontingent über einen Zeitraum von 24 Stunden effizient genutzt. Wenn Anfragen, die das Standardkontingent deutlich überschreiten, über einen Zeitraum von 24 Stunden hinweg konsistent sind, können dem Cloud Healthcare API-Dienst größere Ressourcenpools zugewiesen werden. Die zusätzliche Zuweisung von Ressourcen erfolgt nur auf Anfrage und wird von Fall zu Fall entschieden.
  • Durch eine einheitliche Ressourcennutzung kann Google Cloud Ihre Kontingentanforderungen leichter nachvollziehen und Ihnen das benötigte Kontingent zur Verfügung stellen.

Um Ihre Kapazitäten und Ihr Kontingent effektiv verwalten zu können, müssen Sie die Kapazitätsanforderungen Ihrer Organisation kennen. Wenn Sie Ihre Kapazitätsanforderungen planen und davon ausgehen, dass Sie eine große Kontingenterhöhung benötigen, wenn Ihr Google Cloud -Projekt in der Produktion ist, fordern Sie eine Erhöhung beim Google Cloud Kundenservice an. Der Kundenservice kann Ihnen bei der Zuweisung und Erhöhung von Kontingenten während der Test- und Einführungsphasen Ihres Google Cloud -Projekts helfen.

Sie benötigen keinen kostenpflichtigen Kundendienst, um eine Kontingenterhöhung anzufordern. Einige Anfragen zur Kontingenterhöhung werden innerhalb von 2–3 Arbeitstagen bearbeitet. Wir empfehlen jedoch, mehr Zeit einzuplanen. Wenn die Kontingenterhöhung umfangreich ist, kann es 10 Arbeitstage oder länger dauern, bis die Anfrage abgeschlossen ist. Sie müssen Zeit einplanen, um auf den Kundenservice zu reagieren und alle Fragen oder offenen Probleme bezüglich der Anfrage zu klären. Wenn Sie darauf achten, dass Ihr ursprünglicher Antrag auf Kontingenterhöhung ausreichend detailliert ist, können Sie möglicherweise die Wartezeit verkürzen, bis der Antrag bearbeitet wird.

Best Practices für die Vorhersage des Kontingentbedarfs

Bevor Ihr Google Cloud -Projekt in die Produktion geht, sollten Sie den benötigten Kontingentbedarf abschätzen und planen. Wenn Sie Ihre Kontingentanforderungen planen, können Sie unerwartete Einschränkungen bei der Ressourcennutzung vermeiden.

In den folgenden Abschnitten wird erläutert, was Sie bei der Planung des Kontingents beachten sollten.

Gesamtnutzung für alle Datenspeicher und Clients vorhersagen

Gesamtnutzung aller Cloud Healthcare API-Datenspeicher und Gesamtnutzung aller Clients, die Anfragen an IhrGoogle Cloud -Projekt senden.

  • In einigen Google Cloud Projekten werden mehrere Anwendungsfälle der Cloud Healthcare API implementiert. In Ihrem Google Cloud Projekt werden möglicherweise mehrere Cloud Healthcare API-Datasets und Datenspeicher für verschiedene Datentypen verwendet, wodurch sich die Gesamtkontingentnutzung erhöht.
  • Kontingente werden proGoogle Cloud-Projekt und pro Region erzwungen. Achten Sie darauf, dass Sie genaue Messungen Ihres erforderlichen Kontingents in mehreren Regionen haben. Wenn Sie mehrere Google Cloud Projekte haben, benötigen Sie möglicherweise genauere Messungen für die einzelnen Projekte. Weitere Informationen zur Planung von Kontingenten pro Region finden Sie unter Nutzung pro Region prognostizieren.
  • Die Cloud Healthcare API führt keinen Lastausgleich für Kontingente zwischen Clients, Datasets oder Datenspeichern durch. Der Kunde muss entscheiden, ob er ein Priorisierungsschema implementieren möchte, um sicherzustellen, dass beim wichtigsten Traffic keine 429 RESOURCE_EXHAUSTED-Fehler auftreten.

Nutzung pro Region vorhersagen

Kontingente für die Cloud Healthcare API werden proGoogle Cloud-Projekt und pro Region gemessen. Kontingente werden in der Regel pro Minute gemessen. Dadurch können kleine Spitzen von Anfragen pro Sekunde auf einer Minutenskala ausgeglichen werden.

Wenn in Ihrem Google Cloud Projekt mehrere Regionen verwendet werden, können Sie Kontingente für jede Region festlegen.

Wenn sich Ihr Cloud Healthcare API-Dataset am multiregionalen Standort us befindet und Sie ein zusätzliches Kontingent anfordern möchten, geben Sie in Ihrem Kontingentantrag an, dass das Kontingent für die „US-Metaregion“ gilt. Der multiregionale Standort us besteht aus den folgenden Unterregionen:

  • us-central1
  • us-east1
  • us-west1

Wenn Sie bereits Cloud Healthcare API-Traffic haben, für den Kontingente in einer der us--Unterregionen verwendet werden, müssen Sie den vorhandenen Traffic in diesen Unterregionen berücksichtigen, wenn Sie eine Kontingenterhöhung für die us-Multiregion anfordern. Wenn Sie beispielsweise Datasets in us-central1 und us haben und eine Kontingenterhöhung in us anfordern, geben Sie in Ihrem Antrag an, dass Sie Datasets in us-central1 haben.

Transaktionen mit geringem Volumen bevorzugen

Im folgenden Szenario wird die Bedeutung von kleineren Traffic-Mengen, die regelmäßig gesendet werden, im Gegensatz zu Transaktionen mit hohem Volumen und einem längeren Intervall zwischen den Transaktionen erläutert.

Das Traffic-Volumen wird mit der Formel request payload * time = traffic volume berechnet. Eine hochvolumige Transaktion besteht aus einer oder mehreren Anfragen an die Cloud Healthcare API in einem kurzen Intervall, die eine große Nutzlast enthalten. Eine Reihe von Anfragen kann auch als mit hohem Volumen eingestuft werden, wenn unabhängig von der Nutzlastgröße viele Anfragen in einem kurzen Intervall gesendet werden.

Angenommen, ein Client erfasst Transaktionen mit hohem Volumen und sendet sie alle fünf Minuten in einem Burst an die Cloud Healthcare API. Folgendes geschieht:

  1. Bei der ersten Trafficspitze wird das Kontingent in der ersten Minute verbraucht (abhängig von der Minutenüberschreitung), bis das gesamte Kontingent aufgebraucht ist.
  2. Für verbleibenden Burst-Traffic werden 429 RESOURCE_EXHAUSTED-Fehler zurückgegeben. Wenn konfiguriert, wird bei allen betroffenen Anfragen der exponentielle Backoff angewendet.
  3. Ein bestimmter Prozentsatz der Anfragen, bei denen der ursprüngliche exponentielle Backoff aufgetreten ist, wird für einen erneuten Versuch in der nächsten Minute neu geplant. Einige Anfragen werden mehrmals pro Minute versucht und dann in der nächsten Minute noch einmal.
  4. Wenn das Anfragevolumen hoch genug ist, können bei wiederholten Anfragen 429 RESOURCE_EXHAUSTED-Fehler und wieder exponentieller Backoff auftreten. Bei bestimmten Traffic-Spitzen kann es zu unterschiedlichen Zeiten zu einem exponentiellen Backoff kommen. Die Versuche, Traffic noch einmal zu senden, können in Zukunft in derselben Minute zusammenlaufen.
  5. Wenn das Anfragevolumen weiterhin hoch ist, wird ein Teil des Traffics beim nächsten Traffic-Burst noch einmal versucht. Das Problem wird dadurch verschärft, dass dem bestehenden Rückstand an Anfragen mehr Traffic hinzugefügt wird. Ihre Anwendung hat möglicherweise Schwierigkeiten, den Rückstand an Anfragen zu verwalten und sie konsistent an die Cloud Healthcare API zu senden.

Dieses Szenario zeigt, wie wichtig es ist, das Trafficvolumen pro Minute zu kennen. Implementieren Sie Ihr Traffic-Volumen und Backoffs, um Netzwerküberlastung zu vermeiden und dafür zu sorgen, dass bei Ihrer Anwendung nicht viele Fehler auftreten, die Wiederholungen erfordern.

DICOM- und FHIR-Kontingente prüfen

Informationen zu den Cloud Healthcare API-Kontingenten für FHIR- und DICOM-Speicher und ‑Vorgänge finden Sie unter Kontingentlimits.