Augmenter la vitesse de trafic réseau pour les nœuds GPU


Cette page explique comment augmenter la bande passante réseau pour les nœuds GPU sur les clusters Google Kubernetes Engine (GKE) à l'aide de la carte d'interface réseau virtuelle Google (gVNIC).

Dans les clusters Autopilot, les nœuds exécutant la version 1.30.2-gke.1023000 de GKE ou une version ultérieure ont le gVNIC (Google Virtual NIC) installé automatiquement. Les instructions de cette page ne s'appliquent qu'aux clusters standards.

Pour augmenter la bande passante sur les nœuds de processeur, envisagez d'activer la bande passante de niveau 1.

Avant de commencer

Avant de commencer, effectuez les tâches suivantes :

  • Activez l'API Google Kubernetes Engine.
  • Activer l'API Google Kubernetes Engine
  • Si vous souhaitez utiliser Google Cloud CLI pour cette tâche, installez puis initialisez gcloud CLI. Si vous avez déjà installé gcloud CLI, assurez-vous de disposer de la dernière version en exécutant la commande gcloud components update.

Limites

Conditions requises

  • Les nœuds GKE doivent utiliser une image de nœud Container-Optimized OS.

Activer gVNIC

Vous pouvez créer un cluster dans lequel des pools de nœuds utilisent gVNIC, créer un pool de nœuds avec gVNIC activé, ou mettre à jour un pool de nœuds pour utiliser gVNIC.

Créer un cluster

Créer un cluster avec des pools de nœuds utilisant gVNIC :

gcloud container clusters create CLUSTER_NAME \
    --accelerator type=GPU_TYPE,count=AMOUNT \
    --machine-type=MACHINE_TYPE \
    --enable-gvnic

Remplacez les éléments suivants :

  • CLUSTER_NAME : nom du nouveau cluster
  • GPU_TYPE : type d'accélérateur GPU que vous utilisez. Par exemple, nvidia-tesla-t4.
  • AMOUNT : nombre de GPU à associer aux nœuds du pool de nœuds.
  • MACHINE_TYPE : type de machine que vous souhaitez utiliser. gVNIC n'est pas compatible avec les types de machines à mémoire optimisée.

Créer un pool de nœuds

Créer un pool de nœuds utilisant gVNIC :

gcloud container node-pools create NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Remplacez les éléments suivants :

  • NODEPOOL_NAME : nom du nouveau pool de nœuds.
  • CLUSTER_NAME : nom du cluster existant.

Mettre à jour un pool de nœuds

Mettre à jour un pool de nœuds pour utiliser gVNIC :

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Remplacez les éléments suivants :

  • NODEPOOL_NAME : nom du pool de nœuds que vous souhaitez mettre à jour.
  • CLUSTER_NAME : nom du cluster existant.

Cette modification nécessite de recréer les nœuds, ce qui peut perturber vos charges de travail en cours d'exécution. Pour en savoir plus sur cette modification spécifique, recherchez la ligne correspondante dans le tableau Modifications manuelles qui recréent les nœuds à l'aide d'une stratégie de mise à niveau de nœuds sans respecter les règles de maintenance. Pour en savoir plus sur les mises à jour de nœuds, consultez Planifier les perturbations liées aux mises à jour de nœuds.

Désactiver gVNIC

Mettre à jour le pool de nœuds à l'aide de l'option --no-enable-gvnic :

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --no-enable-gvnic

Cette modification nécessite de recréer les nœuds, ce qui peut perturber vos charges de travail en cours d'exécution. Pour en savoir plus sur cette modification spécifique, recherchez la ligne correspondante dans le tableau Modifications manuelles qui recréent les nœuds à l'aide d'une stratégie de mise à niveau de nœuds sans respecter les règles de maintenance. Pour en savoir plus sur les mises à jour de nœuds, consultez Planifier les perturbations liées aux mises à jour de nœuds.

Dépannage

Pour résoudre les problèmes liés à la gVNIC, consultez la section Dépannage de la carte d'interface réseau virtuelle Google.

Étape suivante