Una infraestructura fiable es un requisito fundamental para las cargas de trabajo en la nube. Como arquitecto de la nube, para diseñar una infraestructura fiable para tus cargas de trabajo, debes conocer bien las funciones de fiabilidad del proveedor de la nube que elijas. En este documento se describen los componentes básicos de la fiabilidad enGoogle Cloud (zonas, regiones y recursos con ámbito de ubicación) y los niveles de disponibilidad que proporcionan. Este documento también proporciona directrices para evaluar los requisitos de fiabilidad de tus cargas de trabajo y presenta recomendaciones de arquitectura para crear y gestionar una infraestructura fiable en Google Cloud.
Este documento se divide en las siguientes partes:
- Información general sobre la fiabilidad (esta parte)
- Elementos de creación de fiabilidad en Google Cloud
- Evalúa los requisitos de fiabilidad de tus cargas de trabajo en la nube
- Diseñar una infraestructura fiable para tus cargas de trabajo en Google Cloud
- Gestionar el tráfico y la carga de las cargas de trabajo en Google Cloud
- Gestionar y monitorizar tu Google Cloud infraestructura
Si ya has leído esta guía y quieres ver qué ha cambiado, consulta las notas de la versión.
Información general sobre la fiabilidad
Una aplicación o una carga de trabajo es fiable cuando cumple tus objetivos actuales de disponibilidad y resistencia a los fallos.
La disponibilidad (o tiempo de actividad) es el porcentaje de tiempo que una aplicación está disponible. Por ejemplo, en una aplicación que tiene un objetivo de disponibilidad del 99,99%, el tiempo de inactividad total no debe superar los 8,64 segundos en un periodo de 24 horas. A veces, la disponibilidad se mide como la proporción de solicitudes que la aplicación sirve correctamente durante un periodo determinado. Por ejemplo, en una aplicación que tiene un objetivo de disponibilidad del 99,99%, no pueden fallar más de diez solicitudes por cada 100.000 solicitudes recibidas. La disponibilidad suele expresarse como el número de nueves del porcentaje. Por ejemplo, una disponibilidad del 99,99 % se expresa como "cuatro nueves".
En función del propósito de la aplicación, puede que tengas diferentes conjuntos de indicadores para determinar su fiabilidad. A continuación, se muestran algunos ejemplos de estos indicadores:
- En el caso de las aplicaciones que sirven contenido, la disponibilidad, la latencia y el rendimiento son indicadores de fiabilidad importantes. Indican si la aplicación puede responder a las solicitudes, cuánto tiempo tarda en hacerlo y cuántas solicitudes puede procesar correctamente en un periodo determinado.
- En el caso de las bases de datos y los sistemas de almacenamiento, la latencia, el rendimiento, la disponibilidad y la durabilidad (el grado de protección de los datos frente a la pérdida o la corrupción) son indicadores de fiabilidad. Indican cuánto tiempo tarda el sistema en leer o escribir datos, y si se puede acceder a los datos bajo demanda.
- En las cargas de trabajo de Big Data y analíticas, como las de las canalizaciones de procesamiento de datos, es fundamental que el rendimiento de las canalizaciones sea coherente (rendimiento y latencia) para asegurar la actualización de los productos de datos, así como un indicador de fiabilidad importante. Indica la cantidad de datos que se pueden procesar y el tiempo que tarda la canalización en pasar de la ingestión al procesamiento de datos.
- La mayoría de las aplicaciones tienen la exactitud de los datos como indicador de fiabilidad esencial.
Para obtener más directrices sobre cómo definir los objetivos de fiabilidad de tus aplicaciones, consulta el artículo Evaluar los requisitos de fiabilidad de las cargas de trabajo en la nube.
Factores que afectan a la fiabilidad de las aplicaciones
La fiabilidad de una aplicación implementada en Google Cloud depende de los siguientes factores:
- El diseño interno de la aplicación.
- Las aplicaciones o los componentes secundarios de los que depende la aplicación.
- Google Cloud recursos de infraestructura, como computación, redes, almacenamiento, bases de datos y seguridad, en los que se ejecuta la aplicación, y cómo utiliza la aplicación la infraestructura.
- La capacidad de infraestructura que aprovisionas y cómo se escala.
- Los procesos y las herramientas de DevOps que usas para crear, desplegar y mantener la aplicación, sus dependencias y la infraestructura de Google Cloud.
Estos factores se resumen en el siguiente diagrama:
Como se muestra en el diagrama anterior, la fiabilidad de una aplicación implementada en Google Cloud depende de varios factores. Esta guía se centra en la fiabilidad de la Google Cloud infraestructura.
Siguientes pasos
- Elementos de creación de fiabilidad en Google Cloud
- Evalúa los requisitos de fiabilidad de tus cargas de trabajo en la nube
- Diseñar una infraestructura fiable para tus cargas de trabajo en Google Cloud
- Gestionar el tráfico y la carga de las cargas de trabajo en Google Cloud
- Gestionar y monitorizar tu Google Cloud infraestructura
Colaboradores
Autores:
- Nir Tarcic | Cloud Lifecycle SRE UTL
- Kumar Dhanagopal | Desarrollador de soluciones entre productos
Otros colaboradores:
- Alok Kumar | Ingeniero distinguido
- Andrew Fikes | Engineering Fellow, Fiabilidad
- Chris Heiser | SRE TL
- David Ferguson | Director de Ingeniería de fiabilidad de sitios
- Joe Tan | Asesor jurídico de producto sénior
- Krzysztof Duleba | Ingeniero principal
- Narayan Desai | SRE principal
- Sailesh Krishnamurthy | Vicepresidente de Ingeniería
- Steve McGhee | Defensor de la fiabilidad
- Sudhanshu Jain | Responsable de producto
- Yaniv Aknin | Ingeniero de software