Configura las políticas de expulsión de las VMs en GKE en Bare Metal

Este documento es para los administradores de plataforma que ejecutan máquinas virtuales (VMs) en GKE en Bare Metal. En este documento, se muestra cómo configurar la política de expulsión que controla cómo las VM que usan el entorno de ejecución de VM en Google Distributed Cloud pueden migrar de forma automática a otros hosts durante los eventos de mantenimiento. Estos parámetros de configuración te permiten seguir ejecutando las VM en otros hosts cuando actualizas un clúster o realizas mantenimiento en un host.

Antes de comenzar

Para completar este documento, necesitas acceso a la versión 1.12.0 (anthosBareMetalVersion: 1.12.0) o superior de GKE en Bare Metal. Puedes usar cualquier tipo de clúster capaz de ejecutar cargas de trabajo. Si es necesario, prueba GKE en Bare Metal en Compute Engine o consulta la descripción general de la creación de clústeres.

Configuración de la política de expulsión

GKE en Bare Metal te permite configurar el comportamiento de los nodos cuando actualizas clústeres o colocas nodos en modo de mantenimiento. El entorno de ejecución de VM en Google Distributed Cloud usa una política de expulsión que controla cómo el clúster controla las VM que se ejecutan durante estos eventos.

Cuando se habilita, el entorno de ejecución de VM en Google Distributed Cloud usa la migración en vivo para mover las cargas de trabajo de VM a otro host de forma predeterminada. Con este comportamiento, se minimizan las posibles interrupciones en las cargas de trabajo de la VM. Con la migración en vivo, las VM que se pueden migrar se mueven de un host a otro sin interrumpir el SO invitado.

La siguiente configuración de política de expulsión puede configurarse:

Propiedad Predeterminada Valores válidos
evictionStrategy LiveMigrate LiveMigrate, Restart
maxMigrationAttemptsPerVM 3 Números enteros en el rango [1,5]
migrationTargetInitializationTimeout 30s Cualquier string de duración válida, como 1m, 2h o 1h30m

evictionStrategy

Si este valor se establece como LiveMigrate, el entorno de ejecución de VM en Google Distributed Cloud intenta migrar cualquier VM que se pueda migrar fuera de un nodo para expulsarla. La VM se coloca en otro nodo del clúster y continúa ejecutándose.

Si este valor se establece como Restart, el entorno de ejecución de VM en Google Distributed Cloud no hace ningún intento para migrar las VM. En cambio, las VM se detienen cuando el nodo se pone en modo de mantenimiento, y las VM comienzan de nuevo cuando el nodo sale del modo de mantenimiento. La VM no estará disponible durante el evento de mantenimiento del host.

Cuando eliges la estrategia LiveMigrate, el entorno de ejecución de VM en Google Distributed Cloud recurre a la estrategia Restart para las VM no migrables.

maxMigrationAttemptsPerVM

Esta configuración controla la cantidad máxima de intentos de migración que pueden ocurrir para una VM en particular antes de que se aplique la estrategia de Restart.

Esta configuración se ignora si evictionStrategy se establece en Restart.

migrationTargetInitializationTimeout

Esta configuración controla el tiempo máximo que puede tardar una migración en iniciarse antes de que se considere que falló. Una migración que lleva demasiado tiempo en iniciarse se considera dentro del presupuesto de migración con errores de una carga de trabajo de VM.

Esta configuración se ignora si evictionStrategy se establece en Restart.

Habilita y configura la política de expulsión

Para usar la política de expulsión en el entorno de ejecución de VM en Google Distributed Cloud, la configuración evictionPolicy debe definirse en el objeto VMRuntime del clúster. Esta configuración está habilitada de forma predeterminada en los clústeres de Anthos en la versión 1.12 y posteriores de equipos físicos. Si actualizas desde una versión anterior, debes habilitar esta configuración de forma manual.

Un objeto vacío, como evictionPolicy: {}, habilita la política de expulsión con la configuración predeterminada. Para cambiar el comportamiento predeterminado, agrega opciones de configuración adicionales al objeto evictionPolicy.

Para habilitar y configurar la política de expulsión, completa los siguientes pasos:

  1. Edita el recurso personalizado VMRuntime:

    kubectl edit vmruntime vmruntime
    
  2. Agrega o actualiza la sección evictionPolicy con un objeto vacío para usar la configuración predeterminada de la política de expulsión o agrega la configuración que desees:

    apiVersion: vm.cluster.gke.io/v1
    kind: VMRuntime
    metadata:
      name: vmruntime
    spec:
      disableCDIUploadProxyVIP: false
      enabled: true
      evictionPolicy: {}
      useEmulation: false
    

    Si evictionPolicy no se propaga, como evictionPolicy: null, o no se incluye en el manifiesto, no se realiza ninguna acción especial. Las VMs se expulsan de manera forzosa.

    En los siguientes manifiestos de ejemplo, se muestra cómo habilitar la migración en vivo de VM o reiniciar las VM en el mismo host después de que se complete el mantenimiento:

    Migración en vivo

    En la siguiente política de expulsión de ejemplo, se habilita la migración en vivo de las VM. El clúster puede reintentar la migración en vivo hasta 3 veces y con un tiempo de espera de 30 segundos en el proceso cada vez para iniciarse:

    apiVersion: vm.cluster.gke.io/v1
    kind: VMRuntime
    metadata:
      name: vmruntime
    spec:
      disableCDIUploadProxyVIP: false
      enabled: true
      evictionPolicy:
        evictionStrategy: LiveMigrate
        maxMigrationAttemptsPerVM: 3
        migrationTargetInitializationTimeout: 30s
      useEmulation: false
    

    Reiniciar

    En el siguiente ejemplo de política de expulsión, no se realiza ningún intento de migración de ninguna VM durante la expulsión. Las VM se detienen en su host actual y vuelven a comenzar cuando el host finaliza su evento de mantenimiento:

    apiVersion: vm.cluster.gke.io/v1
    kind: VMRuntime
    metadata:
      name: vmruntime
    spec:
      disableCDIUploadProxyVIP: false
      enabled: true
      evictionPolicy:
        evictionStrategy: Restart
      useEmulation: false
    
  3. Guarda y cierra el recurso personalizado VMRuntime en el editor.

    El entorno de ejecución de VM en Google Distributed Cloud ahora aplica la política de expulsión a las VM de tu clúster.

¿Qué sigue?