En esta página, se describen algunas de las configuraciones controladas por el usuario que pueden hacer que se excluya la interrupción de una instancia de Spanner del Acuerdo de Nivel de Servicio (ANS) de Spanner, que excluye las interrupciones "causadas por factores externos al control razonable de Google". También proporciona lineamientos para evitar estas configuraciones.
Spanner administra muchos aspectos de las operaciones de la base de datos, como la división y el reequilibrio de los datos, la replicación, la conmutación por error y todas las actualizaciones de hardware y software. Puedes configurar muchos de estos comportamientos con parámetros de configuración integrados y APIs administrativas. Tus cargas de trabajo también dependen de otros componentes además de Spanner, como tus aplicaciones y tu red. Estas configuraciones controladas por el cliente pueden aumentar el riesgo de tiempo de inactividad de la instancia, según la carga de la base de datos y otros parámetros de configuración.
Si tu instancia deja de estar en buen estado y Google determina que no cumple con los límites operativos que se describen en esta página, es posible que el ANS de Spanner no cubra el tiempo de inactividad resultante (o que no se considere en su contra).
Configuraciones excluidas del ANS de Spanner
Las siguientes configuraciones se excluyen del ANS de Spanner:
- Si tu instancia está configurada y se usa de tal manera que la carga de trabajo sobrecarga la instancia, no está cubierta por el ANS.
- El ANS no cubre el tiempo de inactividad de las instancias que se produce como resultado de tus acciones u omisiones voluntarias.
- Si inhabilitas la API de Spanner o cualquier otra API de Google Cloud que se requiera para crear y conectar a Spanner, no se incluirá en el ANS.
- El SLA no cubre la falta de disponibilidad de la API de Spanner que se produce como resultado de la configuración de tu red, como las reglas de proxy y firewall.
- El ANS no cubre la falta de disponibilidad de la aplicación debido a clientes desactualizados o mal configurados. En particular, verifica que estés usando versiones recientes del cliente con dependencias compatibles. Por ejemplo, las aplicaciones de Java deben usar la BOM de Google (lista de materiales) con un administrador de paquetes, como Gradle o Maven.
Te recomendamos que configures alertas y supervisión con Cloud Monitoring.
Configuraciones que se deben evitar
Para mantener la cobertura del ANS de Spanner, debes evitar las siguientes configuraciones:
- Sobrecarga de CPU: Si el uso de CPU se mantiene alto, la instancia no tiene el tamaño adecuado para la carga de trabajo y es posible que el ANS no la cubra. Las recomendaciones de uso de CPU de Spanner proporcionan una sobrecarga para un evento de conmutación por error, en el que los recursos de procesamiento restantes ayudan a adaptarse al tráfico de las partes no disponibles de la instancia. Puedes usar las métricas de uso de CPU de Spanner para supervisar el uso de CPU.
- Almacenamiento completo: Spanner solo te factura por el almacenamiento que usas. Sin embargo, cada nodo, o unidad de procesamiento, tiene un límite para la cantidad de almacenamiento que puede administrar. Si tu instancia no tiene el tamaño adecuado para el almacenamiento direccionable por nodo, es posible que el ANS no la cubra. Puedes usar las métricas de uso del almacenamiento de Spanner para supervisar el uso del almacenamiento.
- Límite de cuota: Los recursos de nodos están limitados por cuotas por usuario. Si no solicitas aumentos de cuota con anticipación, es posible que se produzca una sobrecarga de recursos de procesamiento, lo que podría no estar cubierto por el ANS. Por lo general, las solicitudes de aumento de cuota que requieren la aprobación de Google se completan en un día.
- Sesiones con aprovisionamiento insuficiente: Los clientes de Spanner usan canales de gRPC para comunicarse con los extremos de Google Cloud para las consultas y la administración. Si tus entornos de cliente no proporcionan suficientes canales para admitir el volumen de solicitudes de una carga de trabajo, es posible que tus aplicaciones experimenten una latencia alta y una capacidad de procesamiento de solicitudes baja que no estén cubiertas por el SLA.
- Sobrecarga de conexión: Se puede volver a intentar llamar a muchas APIs de Spanner de forma segura en caso de una falla transitoria, como un bloqueo de transacción en una consulta, un problema de red o límites de frecuencia para las APIs administrativas. Los reintentos demasiado agresivos pueden sobrecargar las conexiones existentes, lo que provoca agotamiento de recursos o limitación adicional. Es posible que el ANS no cubra el aumento de la latencia o la reducción del rendimiento. Para obtener más información, consulta cómo administrar los tiempos de espera y los reintentos del cliente.
- Sobrecarga de la unidad de disco duro (HDD): El almacenamiento en niveles te permite almacenar tus datos de Spanner en una combinación de unidades de estado sólido (SSD) y unidades de disco duro (HDD). Si la carga del disco en el almacenamiento HDD alcanza el 100%, la latencia de tu instancia de Spanner aumentará significativamente y es posible que el ANS no la cubra. Puedes usar las métricas de almacenamiento por niveles de Spanner para supervisar la carga del disco.