En esta guía, se explica cómo prepararte para eventos de capacidad máxima y tráfico alto para que puedas ofrecer tus servicios con un tiempo de inactividad mínimo o sin él, y sin degradación del rendimiento ni de la experiencia del usuario.
Cuando administras eventos en la nube, hay tres fases clave:
- Preparación: Completa actividades y tareas para prepararte para tu evento, incluida una revisión de la arquitectura, la planificación de la capacidad y la creación de reservas.
- Ejecución: Cuando comience el evento, obsérvalo de cerca y reacciona según corresponda.
- Análisis: Después de que finalice el evento, analiza lo que salió bien, lo que salió mal y cómo mejorar los eventos futuros.
En esta guía, nos enfocamos en la fase de preparación.
Lista de tareas
Completa las siguientes tareas para aprender a prepararte para un evento de capacidad máxima:
Para seguir la guía paso a paso en esta tarea directamente en la consola de Google Cloud, haz clic en Guiarme:
Antes de comenzar
Según el paquete de asistencia de Atención al cliente que compraste, asegúrate de comprender los servicios de preparación para eventos disponibles:
Asistencia mejorada: Puedes optimizar la preparación de tus eventos, lanzamientos y migraciones con la Asistencia con eventos planificados, que es un servicio de valor agregado que proporciona cobertura para las fases críticas de eventos digitales a corto plazo de alto tráfico, como inauguraciones, lanzamientos de productos nuevos o migraciones de datos.
Asistencia premium: Puedes usar el Servicio de administración de eventos para eventos de tráfico máximo planificados, como lanzamientos de productos o grandes ofertas. Con este servicio, el equipo de Atención al cliente se asocia contigo para crear un plan, brindarte orientación durante el evento y ayudarte con lo siguiente:
- Prepara tus sistemas para momentos clave y cargas de trabajo pesadas
- Ejecutar pruebas de desastres para resolver posibles problemas de forma proactiva
- Desarrollar e implementar una ruta de resolución más rápida para reducir el impacto de cualquier problema que pueda ocurrir
Después del evento, tu administrador técnico de cuentas (TAM) trabajará contigo para revisar los resultados y hacer recomendaciones para eventos futuros. Para comenzar o obtener más información, comunícate con tu TAM.
Comprende las prácticas recomendadas para la administración de eventos
Debes comprender y seguir ciertas prácticas recomendadas para administrar eventos:
Detalla el proceso de planificación del evento: Durante la fase de preparación de un evento de capacidad máxima, comunícate tu equipo de cuentas o TAM para que te ayuden a revisar la arquitectura, crear diagramas, cronogramas y listas de tareas de lanzamiento, verificar las cuotas de servicio según tu perfil de tráfico previsto y determinar el impacto general en tus proyectos.
Supervisa y reacciona durante la ejecución: Cuando comience la temporada alta o el evento de lanzamiento, deberás supervisar de cerca la actividad y reaccionar según sea necesario. Si ocurre algún problema, un proceso de administración y derivación de incidentes bien definido es clave para reducir el esfuerzo y el tiempo que lleva abordar y resolver el problema.
Revisa y documenta tu análisis: Cuando finalice la temporada alta o el evento de lanzamiento, revisa y analiza el evento, y documenta las lecciones aprendidas para poder aplicarlas a tu próximo evento importante.
Si quieres obtener más información, consulta Prácticas recomendadas para la administración de eventos.
Solicita y asegura la capacidad adecuada para tu evento
Un componente fundamental de la fase de preparación es planificar la capacidad, en la que determinas la cantidad de recursos de la nube necesarios para garantizar que tus cargas de trabajo tengan lo que necesitan para funcionar de manera eficaz. Cuando te prepares para el evento de tráfico alto o la temporada alta, asegúrate de que tus cuotas coincidan con tus requisitos de recursos para no encontrar fallas inesperadas. Para obtener más información, consulta Cómo proteger la capacidad de tu evento.
Usa el Planificador de capacidad
El Planificador de capacidad te permite ver el uso histórico y proyectado de tus instancias de máquina virtual (VM), volúmenes de Persistent Disk y GPUs. También puedes ver las reservas, reservar recursos con anticipación, administrar los límites de la cuota de tu proyecto y configurar solicitudes de aumento de cuota automáticas. Para obtener más información, consulta Visualiza datos de uso y pronóstico en el Planificador de capacidad.
En la consola de Google Cloud, ve a la página Planificador de capacidad.
En el selector de recursos de la barra de herramientas de la consola, selecciona un proyecto, una carpeta o una organización.
Selecciona el tipo de recurso de Compute Engine para el que deseas ver los datos de uso:
Para ver los datos de uso de tus VMs, haz clic en la pestaña Máquina virtual si aún no está seleccionada.
Para ver los datos de uso de los volúmenes de Persistent Disk, haz clic en la pestaña Disco.
Para ver los datos de uso de tus GPUs, haz clic en la pestaña GPU.
Puedes filtrar elementos para ver diferentes visualizaciones de datos sobre el uso y los datos de previsión del recurso.
Habilita el ajustador de cuotas
El ajustador de cuotas supervisa tu consumo de recursos y envía de forma proactiva solicitudes de ajuste de cuota en tu nombre para que no tengas que hacer solicitudes manuales. Para obtener más información, consulta Cómo funciona el ajustador de cuotas.
En la consola de Google Cloud, ve a la página IAM y administración > Cuotas y límites del sistema.
Haz clic en la pestaña Configurations.
Para activar el ajustador de cuota, haz clic en el botón de activación Habilitar para llevarlo a la posición activada.
Cuando en la columna Estado se muestra Habilitado, el ajustador de cuotas supervisa el uso y emite solicitudes de ajuste de cuota cuando el uso de recursos se acerca a su valor de cuota.
Solicita un ajuste de cuota
Si tus cuotas no son suficientes para lo que necesitas, puedes solicitar un ajuste de la cuota. Para obtener más información, consulta Visualiza y administra las cuotas.
En la consola de Google Cloud, ve a la página IAM y administración > Cuotas y límites del sistema.
Selecciona la casilla de verificación junto a la cuota que deseas aumentar.
De manera opcional, para buscar una cuota, usa
Filtrar.Haz clic en
Editar y aparecerá el panel Cambios en la cuota.En el campo Valor nuevo, ingresa el valor de cuota que deseas. Algunos valores de cuota tienen una unidad de medida. Si este es el caso, selecciona la unidad que quieras en la lista adyacente.
Si ves un mensaje que indica que se quitará la anulación de cuota si solicitas una cuota superior al valor de anulación, selecciona la casilla de verificación para continuar y, luego, Solicitar una cuota mayor.
En el campo Descripción de la solicitud, ingresa una descripción y, luego, haz clic en Listo.
Haz clic en Siguiente y proporciona tus detalles de contacto.
Haz clic en Enviar solicitud.
Si se rechaza tu solicitud, puedes intentar solicitar el aumento de cuota creando un caso de asistencia o comunicándote con tu equipo de cuentas o tu TAM.
Crea una reserva
Las reservas ayudan a garantizar que tengas los recursos de Compute Engine disponibles para crear VMs con el mismo hardware (memoria y CPU virtuales) y recursos opcionales (GPUs y discos SSD locales) cuando los necesites.
Una reserva on demand se aprovisiona en el momento en que la solicitas, si la capacidad solicitada está disponible. Una reserva futura te permite solicitar la capacidad con anticipación. Te recomendamos que solicites reservas futuras con bastante anticipación al evento. Para obtener más información, consulta Reservas de recursos zonales de Compute Engine.
Crea una reserva a pedido de un solo proyecto
En la consola de Google Cloud, ve a la página Reservas.
En la pestaña Reservas según demanda (predeterminada), haz clic en
Crear reserva.Se abrirá la página Crear una reserva.
Ingresa un Nombre para tu reserva.
Selecciona una región y una zona en las que deseas reservar los recursos.
En Tipo de recurso compartido, selecciona Local si aún no está seleccionado.
Para permitir que una reserva de VMs con GPU sea consumida por los trabajos de entrenamiento personalizados o los trabajos de predicción de Vertex AI, en la sección Servicios de Google Cloud, selecciona Compartir reserva.
Selecciona una opción de Usar con instancia de VM:
Para permitir que las VMs coincidentes consuman de forma automática esta reserva, selecciona Usar reserva de forma automática si aún no está seleccionada.
Para consumir los recursos de esta reserva solo cuando creas VMs coincidentes que se dirigen de forma específica a esta reserva por nombre, elige Seleccionar reserva específica.
Ingresa la cantidad de instancias de VM que deseas reservar.
En la sección Configuración de la máquina, haz lo siguiente:
Para especificar las propiedades de tus VMs de una plantilla de instancias existente, elige Usar plantilla de instancias.
Especifica una plantilla de instancias. Si seleccionas una plantilla regional, solo puedes reservar recursos en esa región.
Para borrar automáticamente la reserva en una hora especificada, selecciona la casilla de verificación Habilitar eliminación automática. La eliminación automática de reservas puede ser útil para evitar cargos innecesarios cuando dejas de consumir la reserva.
Para crear la reserva, haz clic en Crear.
Se abrirá la página Reservas. La creación de la reserva puede tardar hasta un minuto.
Crea una reserva futura de un solo proyecto
En la consola de Google Cloud, ve a la página Reservas.
Haz clic en la pestaña Reservas futuras.
Haz clic en
Crear reserva futura.Se abrirá la página Crear una reserva futura.
En Nombre, ingresa un nombre para tu solicitud de reserva futura.
En Prefijo, ingresa un prefijo de nombre. El nombre de cada reserva creada de forma automática de esta solicitud de reserva futura comienza con este prefijo.
En Región y Zona, selecciona la región y la zona en las que deseas reservar los recursos.
En Hora de inicio, ingresa una hora de inicio para el período de la reserva. La hora de inicio no puede ser posterior a un año a partir de la fecha y hora en que envías una solicitud de reserva futura para su revisión. Para tener tiempo suficiente para modificar, cancelar o borrar la reserva futura de forma opcional antes de que ingrese a la hora de bloqueo, especifica un valor recomendado para la hora de inicio.
En Hora de finalización, ingresa una hora de finalización para el período de reserva de al menos 14 días. En la sección Resumen de la duración, puedes ver la duración del período de reserva. Para aumentar la probabilidad de que Google Cloud apruebe tu solicitud de reserva futura después de enviarla para su revisión, asegúrate de especificar un valor recomendado para el período de reserva.
En la sección Tipo de recurso compartido, selecciona Local si aún no está seleccionada.
En Capacidad total necesaria, ingresa el recuento total de VMs que deseas reservar para el período, la configuración de VM y los proyectos especificados en esta solicitud de reserva futura.
En la sección Configuración de la máquina, haz lo siguiente:
Selecciona Usar plantilla de instancias.
En Plantilla de instancias, selecciona la plantilla que prefieras. Si seleccionas una plantilla de instancias regional, solo puedes reservar recursos dentro de la misma región que la región de la plantilla.
En la sección Eliminación automática de reservas generadas automáticamente, realiza una de las siguientes acciones:
Para permitir que se borren de forma automática las reservas creadas de forma automática en tu solicitud de reserva futura con Compute Engine, haz lo siguiente:
Haz clic en el botón de activación Habilitar eliminación automática para llevarlo a la posición activada si aún no está configurado.
Opcional: En Hora de eliminación automática, ingresa una fecha y hora nuevas para borrar las reservas creadas de forma automática. La fecha y la hora deben ser posteriores a la hora de finalización del período de reserva. Si dejas este campo vacío, las reservas creadas de forma automática se borran en un plazo de dos horas después de la hora de finalización del período de reserva.
De lo contrario, haz clic en el botón de activación Habilitar eliminación automática para llevarlo a la posición desactivada.
Para terminar de crear el borrador de la solicitud de reserva futura, haz clic en Guardar un borrador.
Se abrirá la página Reservas. La creación de la solicitud de reserva futura puede tomar hasta un minuto en completarse.
Prepárate para resolver problemas rápidamente durante el evento
La forma en que respondas, categorices y resuelvas incidentes de gravedad diferente puede afectar de manera significativa tus operaciones durante un evento. Asegúrate de usar un sistema de administración de incidentes centralizado para realizar un seguimiento eficaz durante todo el ciclo de vida del incidente.
Además de revisar tus contactos y habilitar el estado del servicio personalizado, debes hacer lo siguiente:
- Revisar las prácticas recomendadas para trabajar con Atención al cliente
- Crear un plan de comunicación
- Verificar el acceso
Para obtener más información, consulta Prepárate para resolver problemas durante el evento.
Revisa tus contactos
Muchas Google Cloud ofertas envían notificaciones para compartir información importante con los Google Cloud usuarios. De forma predeterminada, estas notificaciones se envían a los miembros con determinados roles de administración de identidades y accesos (IAM). Con los contactos esenciales, puedes proporcionar tu propia lista de contactos para personalizar quién recibe notificaciones. Para obtener más información, consulta Administra contactos para las notificaciones.
En la consola de Google Cloud, ve a la página IAM y administración > Contactos esenciales.
Asegúrate de que el nombre de tu proyecto, organización o carpeta aparezca en el selector de recursos de la barra de herramientas de la consola. El selector de recursos te indica para qué proyecto, organización o carpeta administras los contactos.
Para ver una lista de contactos por categoría, selecciona Categoría. Para enumerar los contactos de forma alfabética, selecciona Contactos.
Habilitar Personalized Service Health
Personalized Service Health te permite identificar Google Cloud interrupciones del servicio pertinentes para tus proyectos para que puedas administrarlas y responder a ellas de manera eficiente. Para obtener más información, consulta la descripción general de Personalized Service Health.
Asegúrate de haber habilitado la API de Service Health antes del evento y de que tu organización pueda acceder al panel y configurar alertas. Para obtener más información, consulta Administra el acceso a Personalized Service Health.
- En la página del selector de proyectos de la consola de Google Cloud, selecciona o
crea un proyecto de Google Cloud.
-
Enable the Service Health API.
Administra y optimiza tus recursos en la nube
Administra y optimiza los recursos que usan tus Google Cloudcargas de trabajo. Esto implica ajustar el tamaño de los recursos según el uso y la demanda reales, usar el ajuste de escala automático para la asignación de recursos dinámica y revisar las recomendaciones de arquitectura y seguridad.
Además de revisar las recomendaciones de Active Assist, debes hacer lo siguiente:
- Consultar las Google Cloud prácticas recomendadas
- Revisar la escalabilidad
- Revisar las versiones de tus productos
- Revisar las alertas y los paneles
Para obtener más información, consulta Optimiza tus recursos de la nube.
Revisa las recomendaciones de Active Assist
Active Assist se refiere a la cartera de herramientas que se usan enGoogle Cloud para generar recomendaciones y estadísticas que te ayudarán a optimizar tus proyectos de Google Cloud . Para obtener más información, consulta Qué es Active Assist.
En la consola de Google Cloud, ve al Centro de recomendaciones.
Con el selector de recursos de la barra de herramientas de la consola, selecciona un Google Cloud proyecto, una carpeta o una organización.
Solo puedes ver las recomendaciones a nivel de la organización o la carpeta si tienes permisos para esa organización o carpeta, independientemente de tus permisos para las carpetas o los proyectos dentro de ella.
En el panel de navegación, haz clic en Todas las recomendaciones.
Se muestran las recomendaciones que puedes filtrar, ordenar y compartir. Puedes explorar las recomendaciones en detalle, ver qué recursos se ven afectados y qué impacto podría tener la implementación de una recomendación.
Para obtener más información sobre una recomendación, haz clic en una, en la columna Recommendation.
Se muestran los datos relevantes que podrían ayudarte a decidir si aplicar o descartar la recommendación.
Si tienes permiso, puedes aplicar o descartar una recomendación haciendo clic en el botón correspondiente.
Ten en cuenta que algunas recomendaciones podrían no aplicarse directamente. Sigue las instrucciones detalladas en la consola para aplicarlas.
Programa y realiza pruebas de carga
Las pruebas de carga pueden determinar si tu sistema se escalará de forma correcta durante el uso de producción y encontrar cuellos de botella que impidan que se escale.
Tres o cinco meses antes del evento, debes realizar pruebas de carga en proyectos y cargas de trabajo críticos para simular el tráfico máximo.
Investiga las implicaciones de cuota y costo de las pruebas de carga y crea alertas de presupuesto de Facturación de Cloud que supervisen el gasto de los servicios que más estresarás.
Después de cada prueba, evalúa los resultados y usa el Planificador de capacidad para visualizar tu uso y tus datos de previsión, y solicitar aumentos de cuota según sea necesario. En este documento, consulta Cómo usar el Planificador de capacidad y Cómo solicitar un ajuste de cuota.
Si necesitas asistencia, comunícate con tu equipo de cuentas o con tu TAM. Pueden ayudarte a detectar y planificar cambios de arquitectura para mejorar la confiabilidad y disponibilidad general de tus servicios.
Programa y realiza pruebas de recuperación ante desastres
Si tienes una estrategia de recuperación ante desastres (DR) sólida y probada, puedes minimizar el impacto de las interrupciones, lograr tiempos de recuperación más rápidos y reanudar las operaciones principales con mayor rapidez cuando algo sale mal.
Tu estrategia de DR debe incluir requisitos detallados de la respuesta ante emergencias, operaciones de copia de seguridad y procedimientos de recuperación.
Uno o tres meses antes del evento, asegúrate de realizar simulaciones de situaciones de desastre para identificar cualquier brecha en tus planes de DR y nivel de preparación.
Después de cada prueba, evalúa los resultados para determinar si se requieren cambios en la arquitectura. Revisa y optimiza los recursos según sea necesario. En este documento, consulta Administra y optimiza tus recursos en la nube.
Tu equipo de cuentas o tu TAM pueden ayudarte con las pruebas de DR, así como a comprender y mejorar tu proceso de respuesta ante incidentes. Para obtener más información, consulta la Guía de planificación para la recuperación ante desastres.
Resumen de recursos
En la siguiente tabla, se enumeran las guías a las que se hace referencia en este documento.
Comprende las prácticas recomendadas para la administración de eventos |
---|
Solicita y asegura la capacidad adecuada para tu evento |
|
Prepárate para resolver problemas rápidamente durante el evento |
Administra y optimiza tus recursos en la nube |
Programa y realiza pruebas de carga |
Programa y realiza pruebas de recuperación ante desastres |