Consideraciones sobre la resiliencia de las aplicaciones

En esta página se proporciona información sobre la resiliencia de las aplicaciones de Google Cloud NetApp Volumes.

Consideraciones sobre la resiliencia de las aplicaciones

Aunque NetApp Volumes tiene una alta disponibilidad, los eventos de mantenimiento programados, como las actualizaciones de la plataforma, las actualizaciones del servicio, las actualizaciones de software o los fallos de componentes no planificados en el servicio, pueden provocar breves pausas en las operaciones de entrada y salida (E/S).

Pausas de E/S

El software cliente del sistema de archivos de red (NFS) o del bloque de mensajes del servidor (SMB) de tu sistema operativo gestiona las pausas breves de E/S. El cliente espera y vuelve a intentar las operaciones de E/S sin informar del problema a la aplicación. Estas pausas breves no se consideran disruptivas porque, aunque los usuarios de la aplicación pueden observar tiempos de respuesta más largos, la aplicación no informa de errores de E/S.

En el caso de las pausas de E/S más largas, el comportamiento depende del cliente NFS o SMB de tu sistema operativo y de los posibles tiempos de espera configurados en la aplicación. En las siguientes secciones se describen los detalles específicos del protocolo para las pausas de E/S.

Pausas de E/S de NFS

Todas las llamadas a un recurso compartido NFS no disponible y montado de forma rígida se bloquean en el cliente NFS y esperan indefinidamente hasta que el servidor NFS vuelva a responder. Mientras espera el cliente NFS, aparecen mensajes en los registros del cliente que indican que el servidor NFS no responde.

Desde el punto de vista de la aplicación, las operaciones de E/S, como la lectura o la escritura, se bloquean y permanecen pendientes hasta que el recurso compartido de NFS se devuelve correctamente. Durante las pausas de E/S, no se pierde ninguna operación de E/S y los volúmenes de NetApp aseguran la coherencia de los datos, a menos que detengas por la fuerza las operaciones de E/S pendientes en el lado del cliente.

Usar aplicaciones de software de clústeres para automatizar las conmutaciones por error

Si utilizas aplicaciones de software de clústeres, como Pacemaker, en las VMs cliente para automatizar la conmutación por error de tu aplicación, configura los tiempos de espera de los recursos compartidos de NFS para que puedan resistir los eventos de mantenimiento de NetApp Volumes. Estas conmutaciones por error abortan las operaciones de E/S pendientes en el cliente y pueden provocar la pérdida de transacciones. Te recomendamos que uses los siguientes tiempos de espera:

Tipo de protocolo Tiempo de espera recomendado Notas
Recursos compartidos NFSv3 60 segundos (para los niveles de servicio Estándar, Premium y Extremo)
120 segundos (para el nivel de servicio Flexible)
Te recomendamos que utilices un método de valla, que usa la opción de montaje nolock en lugar de depender de los bloqueos de NFS.
NFSv4.1 105 segundos (en los niveles de servicio Estándar, Premium y Extremo)
165 segundos (en el nivel de servicio Flexible)
El protocolo NFSv4.1 añade automáticamente un bloqueo fiable a través de NFSv3 (sección 9.6.2 de RFC de NFSv4.x), que puedes usar como mecanismo de aislamiento. La recuperación del estado de bloqueo añade 45 segundos más.

Pausas de E/S de recursos compartidos SMB

A diferencia de NFS, las sesiones de SMB usan una conexión que puede agotarse. NetApp Volumes se mantiene por debajo de los tiempos de espera en la mayoría de los casos.

Tiempo de espera de la sesión

El tiempo de espera de la sesión se define en el cliente. El tiempo de espera predeterminado de los clientes de Windows es de 60 segundos. Puedes ejecutar el comando Get-SmbClientConfiguration/Set-SmbClientConfiguration con el parámetro SessionTimeout para leer o cambiar el tiempo de espera de la sesión.

Si se agota el tiempo de espera de una sesión, la sesión SMB se interrumpe y se informa de un error de E/S a la aplicación que realiza la E/S. El Explorador de archivos o las aplicaciones de Microsoft 365 suelen volver a conectarse en cuanto el usuario accede de nuevo al recurso compartido SMB. Cuando se producen errores de E/S, algunas aplicaciones intentan volver a conectarse y reintentar la operación de E/S fallida, mientras que otras no lo hacen. Consulta la documentación del proveedor de tu aplicación para saber cómo gestiona los tiempos de espera de SMB y cómo puede funcionar de forma resiliente en los recursos compartidos de SMB.

Los recursos compartidos de disponibilidad continua (CA) son una función de SMB3.x que mejora la resiliencia de la conmutación por error en aplicaciones similares a bases de datos. NetApp Volumes admite recursos compartidos disponibles de forma continua para Microsoft SQL Server y FSLogix.

La recuperación tras fallos mejora con cada nueva versión de SMB. NetApp Volumes es compatible con SMB 2.1, 3.0 y 3.1.1. Si es posible, usa la última versión compatible de SMB. Windows 10/Server 2016 y versiones posteriores admiten la versión 3.1.1 más reciente de SMB.

Precauciones basadas en aplicaciones para pymes

Algunas aplicaciones basadas en SMB requieren la función de conmutación por error transparente de SMB. La conmutación por error transparente de SMB permite realizar operaciones de mantenimiento en volúmenes de SMB dentro de volúmenes de NetApp sin interrumpir la conectividad con las aplicaciones de servidor que almacenan y acceden a los datos. NetApp Volumes admite la opción de recursos compartidos disponibles de forma continua de SMB para asegurarse de que determinadas aplicaciones admitan la conmutación por error transparente de SMB. El uso de recursos compartidos de SMB con disponibilidad continua solo admite las siguientes cargas de trabajo:

  • Contenedores de perfiles de usuario de FSLogix

  • Microsoft SQL Server (no Linux SQL Server)

Los recursos compartidos de SMB con disponibilidad continua no admiten aplicaciones personalizadas.

En ocasiones, pueden producirse eventos de mantenimiento programados, como actualizaciones de la plataforma y del software de servicio. Los eventos de mantenimiento se consideran no disruptivos desde el punto de vista del protocolo de archivos (NFS o SMB) siempre que la aplicación pueda gestionar las pausas de E/S que puedan producirse durante estos eventos.

En los niveles de servicio Estándar, Premium y Extremo, las pausas de E/S suelen ser breves y duran entre unos segundos y 30 segundos.

En el nivel de servicio Flexible, las pausas de E/S pueden durar hasta 70 segundos.

Siguientes pasos

Consulta las consideraciones de seguridad de Google Cloud NetApp Volumes.