Betriebsrichtlinien für Spanner

Auf dieser Seite werden einige der nutzerseitig gesteuerten Konfigurationen beschrieben, die dazu führen können, dass ein Ausfall einer Spanner-Instanz vom Spanner-SLA (Service Level Agreement) ausgeschlossen wird. Das SLA schließt Ausfälle aus, die „durch Faktoren verursacht wurden, die außerhalb der Kontrolle von Google liegen“. Außerdem finden Sie dort Richtlinien, wie Sie diese Konfigurationen vermeiden können.

Spanner verwaltet viele Aspekte von Datenbankvorgängen, z. B. das Aufteilen und Neuausgleichen von Daten, die Replikation, das Failover sowie alle Hardware- und Softwareupdates. Viele dieser Verhaltensweisen lassen sich mit integrierten Einstellungen und Administrator-APIs konfigurieren. Ihre Arbeitslasten hängen neben Spanner auch von anderen Komponenten ab, z. B. von Ihren Anwendungen und Ihrem Netzwerk. Diese vom Kunden gesteuerten Konfigurationen können das Risiko von Instanzausfällen in Abhängigkeit von der Datenbanklast und anderen Konfigurationsparametern erhöhen.

Wenn Ihre Instanz fehlerhaft wird und Google feststellt, dass die Instanz die auf dieser Seite beschriebenen Betriebsbeschränkungen nicht einhält, wird eine daraus resultierende Ausfallzeit möglicherweise nicht durch das Spanner-SLA abgedeckt (bzw. nicht darauf angerechnet).

Konfigurationen, die vom Spanner-SLA ausgeschlossen sind

Die folgenden Konfigurationen sind vom Spanner-SLA ausgeschlossen:

  • Wenn Ihre Instanz so konfiguriert und verwendet wird, dass die Arbeitslast die Instanz überlastet, ist sie nicht durch das SLA abgedeckt.
  • Ausfallzeiten von Instanzen, die auf Ihre freiwilligen Handlungen oder Unterlassungen zurückzuführen sind, sind nicht durch die SLA abgedeckt.
  • Wenn Sie die Spanner API oder andere Google Cloud APIs deaktivieren, die zum Erstellen einer Verbindung zu Spanner erforderlich sind, fällt dies nicht unter die SLA.
  • Die Nichtverfügbarkeit der Spanner API aufgrund Ihrer Netzwerkkonfiguration, z. B. Proxy- und Firewallregeln, ist nicht durch die SLA abgedeckt.
  • Die Nichtverfügbarkeit von Anwendungen aufgrund veralteter oder falsch konfigurierter Clients ist nicht durch die SLA abgedeckt. Prüfen Sie insbesondere, ob Sie aktuelle Clientversionen mit unterstützten Abhängigkeiten verwenden. Java-Anwendungen sollten beispielsweise die BOM (Bill of Materials) von Google mit einem Paketmanager wie Gradle oder Maven verwenden.

Wir empfehlen Ihnen, Benachrichtigungen und Monitoring mit Cloud Monitoring einzurichten.

Zu vermeidende Konfigurationen

Damit das Spanner-SLA abgedeckt ist, müssen Sie die folgenden Konfigurationen vermeiden:

  • CPU-Überlastung: Wenn die CPU-Auslastung konstant hoch ist, hat Ihre Instanz nicht die richtige Größe für Ihre Arbeitslast und ist möglicherweise nicht vom SLA abgedeckt. Die Empfehlungen zur CPU-Auslastung von Spanner bieten Spielraum für ein Failover-Ereignis, bei dem die verbleibenden Rechenressourcen dazu beitragen, den Traffic von nicht verfügbaren Teilen der Instanz zu bewältigen. Sie können die CPU-Auslastungsmesswerte von Spanner verwenden, um die CPU-Auslastung zu überwachen.
  • Vollständiger Speicherplatz: In Spanner wird Ihnen nur der von Ihnen genutzte Speicherplatz in Rechnung gestellt. Jeder Knoten oder jede Recheneinheit hat jedoch ein Limit für die Menge an Speicherplatz, die er verwalten kann. Wenn Ihre Instanz nicht die richtige Größe für den adressierbaren Speicher pro Knoten hat, ist sie möglicherweise nicht durch das SLA abgedeckt. Mit den Messwerten zur Speicherauslastung von Spanner können Sie die Speicherauslastung überwachen.
  • Kontingentlimit:Knotenressourcen sind durch Kontingente pro Nutzer begrenzt. Wenn Sie Kontingenterhöhungen nicht im Voraus beantragen, kann es zu einer Überlastung der Computeressourcen kommen, die möglicherweise nicht durch die SLA abgedeckt ist. Anfragen zur Kontingenterhöhung, die eine Genehmigung von Google erfordern, werden in der Regel innerhalb eines Tages bearbeitet.
  • Nicht bereitgestellte Sitzungen: Spanner-Clients verwenden gRPC-Channels für die Kommunikation mit Google Cloud -Endpunkten für Abfragen und Verwaltung. Wenn Ihre Clientumgebungen nicht genügend Kanäle für das Anfragevolumen einer Arbeitslast bieten, kann es bei Ihren Anwendungen zu einer hohen Latenz und einem niedrigen Anfragedurchsatz kommen, die möglicherweise nicht durch die SLA abgedeckt sind.
  • Überlastung der Verbindung:Viele Spanner-APIs können bei einem vorübergehenden Fehler, z. B. einem Transaktions-Deadlock in einer Abfrage, einem Netzwerkproblem oder Ratenbeschränkungen für administrative APIs, sicher wiederholt werden. Zu aggressive Wiederholungsversuche können bestehende Verbindungen überlasten und zu Ressourcenmangel oder zusätzlichem Drosseln führen. Die erhöhte Latenz oder der reduzierte Durchsatz sind möglicherweise nicht durch das SLA abgedeckt. Weitere Informationen finden Sie unter Client-Zeitüberschreitungen und ‑Wiederholungsversuche verwalten.
  • Überlastung von Festplattenlaufwerken (HDD): Mit mehrstufigem Speicher können Sie Ihre Spanner-Daten auf einer Mischung aus Solid-State-Laufwerken (SSDs) und Festplattenlaufwerken (HDDs) speichern. Wenn die Festplattenauslastung auf HDD-Speicher 100 % erreicht, tritt in Ihrer Spanner-Instanz eine deutlich erhöhte Latenz auf. Dies ist möglicherweise nicht durch das SLA abgedeckt. Mit den Messwerten für den mehrstufigen Speicher von Spanner können Sie die Festplattenauslastung überwachen.

Nächste Schritte