Este documento es para los administradores de plataforma que ejecutan máquinas virtuales (VMs) en GKE en Bare Metal. En este documento, se muestra cómo configurar la política de expulsión que controla cómo las VM que usan el entorno de ejecución de VM en Google Distributed Cloud pueden migrar de forma automática a otros hosts durante los eventos de mantenimiento. Estos parámetros de configuración te permiten seguir ejecutando las VM en otros hosts cuando actualizas un clúster o realizas mantenimiento en un host.
Antes de comenzar
Para completar este documento, necesitas acceso a la versión 1.12.0 (anthosBareMetalVersion: 1.12.0
) o superior de GKE en Bare Metal. Puedes usar cualquier tipo de clúster capaz de ejecutar cargas de trabajo. Si es necesario, prueba GKE en Bare Metal en Compute Engine o consulta la descripción general de la creación de clústeres.
Configuración de la política de expulsión
GKE en Bare Metal te permite configurar el comportamiento de los nodos cuando actualizas clústeres o colocas nodos en modo de mantenimiento. El entorno de ejecución de VM en Google Distributed Cloud usa una política de expulsión que controla cómo el clúster controla las VM que se ejecutan durante estos eventos.
Cuando se habilita, el entorno de ejecución de VM en Google Distributed Cloud usa la migración en vivo para mover las cargas de trabajo de VM a otro host de forma predeterminada. Con este comportamiento, se minimizan las posibles interrupciones en las cargas de trabajo de la VM. Con la migración en vivo, las VM que se pueden migrar se mueven de un host a otro sin interrumpir el SO invitado.
La siguiente configuración de política de expulsión puede configurarse:
Propiedad | Predeterminada | Valores válidos |
---|---|---|
evictionStrategy |
LiveMigrate |
LiveMigrate , Restart |
maxMigrationAttemptsPerVM |
3 |
Números enteros en el rango [1 ,5 ] |
migrationTargetInitializationTimeout |
30s |
Cualquier string de duración válida, como 1m , 2h o 1h30m |
evictionStrategy
Si este valor se establece como LiveMigrate
, el entorno de ejecución de VM en Google Distributed Cloud intenta migrar cualquier VM que se pueda migrar fuera de un nodo para expulsarla. La VM se coloca en otro nodo del clúster y continúa ejecutándose.
Si este valor se establece como Restart
, el entorno de ejecución de VM en Google Distributed Cloud no hace ningún intento para migrar las VM. En cambio, las VM se detienen cuando el nodo se pone en modo de mantenimiento, y las VM comienzan de nuevo cuando el nodo sale del modo de mantenimiento.
La VM no estará disponible durante el evento de mantenimiento del host.
Cuando eliges la estrategia LiveMigrate
, el entorno de ejecución de VM en Google Distributed Cloud recurre a la estrategia Restart
para las VM no migrables.
maxMigrationAttemptsPerVM
Esta configuración controla la cantidad máxima de intentos de migración que pueden ocurrir para una VM en particular antes de que se aplique la estrategia de Restart
.
Esta configuración se ignora si evictionStrategy
se establece en Restart
.
migrationTargetInitializationTimeout
Esta configuración controla el tiempo máximo que puede tardar una migración en iniciarse antes de que se considere que falló. Una migración que lleva demasiado tiempo en iniciarse se considera dentro del presupuesto de migración con errores de una carga de trabajo de VM.
Esta configuración se ignora si evictionStrategy
se establece en Restart
.
Habilita y configura la política de expulsión
Para usar la política de expulsión en el entorno de ejecución de VM en Google Distributed Cloud, la configuración evictionPolicy
debe definirse en el objeto VMRuntime
del clúster. Esta configuración está habilitada de forma predeterminada en los clústeres de Anthos en la versión 1.12 y posteriores de equipos físicos. Si actualizas desde una versión anterior, debes habilitar esta configuración de forma manual.
Un objeto vacío, como evictionPolicy: {}
, habilita la política de expulsión con la configuración predeterminada. Para cambiar el comportamiento predeterminado, agrega opciones de configuración adicionales al objeto evictionPolicy
.
Para habilitar y configurar la política de expulsión, completa los siguientes pasos:
Edita el recurso personalizado
VMRuntime
:kubectl edit vmruntime vmruntime
Agrega o actualiza la sección
evictionPolicy
con un objeto vacío para usar la configuración predeterminada de la política de expulsión o agrega la configuración que desees:apiVersion: vm.cluster.gke.io/v1 kind: VMRuntime metadata: name: vmruntime spec: disableCDIUploadProxyVIP: false enabled: true evictionPolicy: {} useEmulation: false
Si
evictionPolicy
no se propaga, comoevictionPolicy: null
, o no se incluye en el manifiesto, no se realiza ninguna acción especial. Las VMs se expulsan de manera forzosa.En los siguientes manifiestos de ejemplo, se muestra cómo habilitar la migración en vivo de VM o reiniciar las VM en el mismo host después de que se complete el mantenimiento:
Migración en vivo
En la siguiente política de expulsión de ejemplo, se habilita la migración en vivo de las VM. El clúster puede reintentar la migración en vivo hasta 3 veces y con un tiempo de espera de 30 segundos en el proceso cada vez para iniciarse:
apiVersion: vm.cluster.gke.io/v1 kind: VMRuntime metadata: name: vmruntime spec: disableCDIUploadProxyVIP: false enabled: true evictionPolicy: evictionStrategy: LiveMigrate maxMigrationAttemptsPerVM: 3 migrationTargetInitializationTimeout: 30s useEmulation: false
Reiniciar
En el siguiente ejemplo de política de expulsión, no se realiza ningún intento de migración de ninguna VM durante la expulsión. Las VM se detienen en su host actual y vuelven a comenzar cuando el host finaliza su evento de mantenimiento:
apiVersion: vm.cluster.gke.io/v1 kind: VMRuntime metadata: name: vmruntime spec: disableCDIUploadProxyVIP: false enabled: true evictionPolicy: evictionStrategy: Restart useEmulation: false
Guarda y cierra el recurso personalizado
VMRuntime
en el editor.El entorno de ejecución de VM en Google Distributed Cloud ahora aplica la política de expulsión a las VM de tu clúster.