Cette page explique comment augmenter la bande passante réseau pour les nœuds GPU sur les clusters Google Kubernetes Engine (GKE) à l'aide de la carte d'interface réseau virtuelle Google (gVNIC).
Dans les clusters Autopilot, les nœuds exécutant la version 1.30.2-gke.1023000 de GKE ou une version ultérieure ont le gVNIC (Google Virtual NIC) installé automatiquement. Les instructions de cette page ne s'appliquent qu'aux clusters standards.
Pour augmenter la bande passante sur les nœuds de processeur, envisagez d'activer la bande passante de niveau 1.
Avant de commencer
Avant de commencer, effectuez les tâches suivantes :
- Activez l'API Google Kubernetes Engine. Activer l'API Google Kubernetes Engine
- Si vous souhaitez utiliser Google Cloud CLI pour cette tâche, installez puis initialisez gcloud CLI. Si vous avez déjà installé gcloud CLI, assurez-vous de disposer de la dernière version en exécutant la commande
gcloud components update
.
Limites
- Les limites relatives à Compute Engine s'appliquent.
Conditions requises
- Les nœuds GKE doivent utiliser une image de nœud Container-Optimized OS.
Activer gVNIC
Vous pouvez créer un cluster dans lequel des pools de nœuds utilisent gVNIC, créer un pool de nœuds avec gVNIC activé, ou mettre à jour un pool de nœuds pour utiliser gVNIC.
Créer un cluster
Créer un cluster avec des pools de nœuds utilisant gVNIC :
gcloud container clusters create CLUSTER_NAME \
--accelerator type=GPU_TYPE,count=AMOUNT \
--machine-type=MACHINE_TYPE \
--enable-gvnic
Remplacez les éléments suivants :
CLUSTER_NAME
: nom du nouveau clusterGPU_TYPE
: type d'accélérateur GPU que vous utilisez. Par exemple,nvidia-tesla-t4
.AMOUNT
: nombre de GPU à associer aux nœuds du pool de nœuds.MACHINE_TYPE
: type de machine que vous souhaitez utiliser. gVNIC n'est pas compatible avec les types de machines à mémoire optimisée.
Créer un pool de nœuds
Créer un pool de nœuds utilisant gVNIC :
gcloud container node-pools create NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Remplacez les éléments suivants :
NODEPOOL_NAME
: nom du nouveau pool de nœuds.CLUSTER_NAME
: nom du cluster existant.
Mettre à jour un pool de nœuds
Mettre à jour un pool de nœuds pour utiliser gVNIC :
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Remplacez les éléments suivants :
NODEPOOL_NAME
: nom du pool de nœuds que vous souhaitez mettre à jour.CLUSTER_NAME
: nom du cluster existant.
Cette modification nécessite de recréer les nœuds, ce qui peut perturber vos charges de travail en cours d'exécution. Pour en savoir plus sur cette modification spécifique, recherchez la ligne correspondante dans le tableau Modifications manuelles qui recréent les nœuds à l'aide d'une stratégie de mise à niveau de nœuds sans respecter les règles de maintenance. Pour en savoir plus sur les mises à jour de nœuds, consultez Planifier les perturbations liées aux mises à jour de nœuds.
Désactiver gVNIC
Mettre à jour le pool de nœuds à l'aide de l'option --no-enable-gvnic
:
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--no-enable-gvnic
Cette modification nécessite de recréer les nœuds, ce qui peut perturber vos charges de travail en cours d'exécution. Pour en savoir plus sur cette modification spécifique, recherchez la ligne correspondante dans le tableau Modifications manuelles qui recréent les nœuds à l'aide d'une stratégie de mise à niveau de nœuds sans respecter les règles de maintenance. Pour en savoir plus sur les mises à jour de nœuds, consultez Planifier les perturbations liées aux mises à jour de nœuds.
Dépannage
Pour résoudre les problèmes liés à la gVNIC, consultez la section Dépannage de la carte d'interface réseau virtuelle Google.
Étape suivante
- Utilisez la journalisation des règles de réseau pour enregistrer les connexions aux pods autorisées ou refusées par les règles de réseau de votre cluster.