Consignes opérationnelles Spanner

Cette page décrit certaines des configurations contrôlées par l'utilisateur qui peuvent entraîner l'exclusion d'une panne d'instance Spanner du contrat de niveau de service (SLA) Spanner, qui exclut les pannes "causées par des facteurs échappant au contrôle raisonnable de Google". Il fournit également des consignes sur la façon d'éviter ces configurations.

Spanner gère de nombreux aspects des opérations de base de données, tels que la division et le rééquilibrage des données, la réplication, le basculement, ainsi que toutes les mises à jour matérielles et logicielles. Vous pouvez configurer la plupart de ces comportements à l'aide de paramètres intégrés et d'API d'administration. Vos charges de travail dépendent également d'autres composants en plus de Spanner, tels que vos applications et votre réseau. Ces configurations contrôlées par le client peuvent augmenter le risque de temps d'arrêt des instances, en fonction de la charge de votre base de données et d'autres paramètres de configuration.

Si votre instance n'est plus opérationnelle et que Google détermine qu'elle ne respecte pas les limites opérationnelles décrites sur cette page, toute indisponibilité qui en résulte peut ne pas être couverte (ou n'est pas comptabilisée) par le contrat de niveau de service Spanner.

Configurations exclues du contrat de niveau de service Spanner

Les configurations suivantes sont exclues du SLA Spanner :

  • Si votre instance est configurée et utilisée de manière à ce que la charge de travail la surcharge, elle n'est pas couverte par le contrat de niveau de service.
  • Les temps d'arrêt des instances résultant de vos actions ou inactions volontaires ne sont pas couverts par le SLA.
  • Si vous désactivez l'API Spanner ou d'autres API Google Cloud requises pour créer une connexion à Spanner, le SLA ne s'applique pas.
  • L'indisponibilité de l'API Spanner résultant de la configuration de votre réseau, comme les règles de proxy et de pare-feu, n'est pas couverte par le SLA.
  • L'indisponibilité de l'application en raison de clients obsolètes ou mal configurés n'est pas couverte par le contrat de niveau de service. En particulier, vérifiez que vous utilisez des versions récentes du client avec des dépendances compatibles. Par exemple, les applications Java doivent utiliser la nomenclature de Google avec un gestionnaire de packages, tel que Gradle ou Maven.

Nous vous recommandons de configurer des alertes et la surveillance à l'aide de Cloud Monitoring.

Configurations à éviter

Pour bénéficier du contrat de niveau de service Spanner, vous devez éviter les configurations suivantes :

  • Surcharge du processeur : si l'utilisation du processeur est systématiquement élevée, l'instance n'est pas correctement dimensionnée par rapport à la charge de travail et peut ne pas être couverte par le contrat de niveau de service. Les recommandations d'utilisation du processeur de Spanner prévoient une surcharge en cas de basculement, où les ressources de calcul restantes permettent de gérer le trafic provenant des parties indisponibles de l'instance. Vous pouvez utiliser les métriques d'utilisation du processeur de Spanner pour surveiller l'utilisation du processeur.
  • Stockage complet : Spanner ne vous facture que l'espace de stockage que vous utilisez. Toutefois, chaque nœud ou unité de calcul est soumis à une limite de stockage qu'il peut gérer. Si votre instance n'est pas correctement dimensionnée pour l'espace de stockage adressable par nœud, elle peut ne pas être couverte par le contrat de niveau de service. Vous pouvez utiliser les métriques d'utilisation du stockage Spanner pour surveiller l'utilisation du stockage.
  • Limite de quota : les ressources de nœud sont limitées par des quotas par utilisateur. Si vous ne demandez pas d'augmentation de quota à l'avance, vous risquez de surcharger les ressources de calcul, ce qui peut ne pas être couvert par le SLA. Les demandes d'augmentation de quota qui nécessitent l'approbation de Google sont généralement traitées sous un jour.
  • Sessions sous-provisionnées : les clients Spanner utilisent des canaux gRPC pour communiquer avec les points de terminaison Google Cloud pour les requêtes et l'administration. Si vos environnements client ne fournissent pas suffisamment de canaux pour prendre en charge le volume de requêtes d'une charge de travail, vos applications peuvent rencontrer une latence élevée et un faible débit de requêtes qui ne sont pas couverts par le SLA.
  • Surcharge de connexion : de nombreuses API Spanner peuvent être réessayées en toute sécurité en cas d'échec temporaire, comme un blocage de transaction dans une requête, un problème de réseau ou des limites de débit pour les API d'administration. Des nouvelles tentatives trop agressives peuvent submerger les connexions existantes, ce qui entraîne un épuisement des ressources ou une limitation supplémentaire. L'augmentation de la latence ou la diminution du débit ne sont pas couvertes par le contrat de niveau de service. Pour en savoir plus, consultez Gérer les délais d'expiration et les nouvelles tentatives des clients.
  • Surcharge du disque dur (HDD) : le stockage hiérarchisé vous permet de stocker vos données Spanner sur un mélange de disques durs SSD et HDD. Si la charge de disque sur le stockage HDD atteint 100 %, la latence de votre instance Spanner augmente considérablement et elle peut ne pas être couverte par le contrat de niveau de service. Vous pouvez utiliser les métriques de stockage hiérarchisé Spanner pour surveiller la charge du disque.

Étapes suivantes