Résoudre les problèmes liés à GKE


Cette page répertorie les pages de dépannage pour les problèmes courants que vous pouvez rencontrer lorsque vous utilisez Google Kubernetes Engine (GKE). Cette page s'adresse aux administrateurs et architectes, aux spécialistes de la sécurité, de la mise en réseau ou du stockage qui dépannent les configurations GKE. Pour en savoir plus sur les rôles GKE, consultez la section Rôles utilisateur et tâches courantes de l'utilisateur dans GKE Enterprise.

Utilisez cette page pour diagnostiquer et résoudre les problèmes que vous rencontrez à différents stades de l'utilisation de votre infrastructure GKE:

Cette page vous permet également d'accéder à des sujets de dépannage plus généraux:

Pour résoudre les problèmes de mise en réseau GKE, consultez la section Résoudre les problèmes de mise en réseau GKE dans la documentation sur la mise en réseau GKE.

Configurer le cluster

Thème Description
Création de clusters Résoudre les problèmes de création de clusters
Clusters Autopilot Diagnostiquer et résoudre les problèmes liés aux clusters GKE Autopilot, y compris la création de clusters, la suppression d'espaces de noms, l'ajustement de la capacité et les problèmes de charge de travail
Outil de ligne de commande Kubectl Résoudre les problèmes liés à l'outil de ligne de commande kubectl dans GKE, y compris les problèmes d'authentification et d'autorisation Cette page inclut également des conseils pour résoudre les problèmes liés au proxy Konnectivity afin de vérifier s'il est à l'origine de l'arrêt de la réponse des commandes kubectl logs, attach, exec ou port-forward.
Pools de nœuds standards Résolvez les problèmes liés aux pools de nœuds GKE Standard, y compris les problèmes de création de pool de nœuds, de provisionnement au mieux, de métadonnées d'instance corrompues et de migration de charges de travail vers de nouveaux pools de nœuds.
Enregistrement des nœuds Résolvez les problèmes qui surviennent lors de l'ajout de nœuds à votre cluster GKE Standard, tels que les échecs d'enregistrement des nœuds et les conditions préalables manquantes pour l'enregistrement réussi des nœuds.
Environnement d'exécution du conteneur Résoudre les problèmes liés aux environnements d'exécution de conteneur dans GKE, y compris les problèmes liés à containerd et dockershim, ainsi qu'aux registres privés.

Stockage

Thème Description
Stockage Résolvez les problèmes de stockage, y compris les problèmes liés aux disques persistants régionaux, aux performances des disques et à l'extension de volume.

Sécurité du cluster

Thème Description
Authentification Résolvez les problèmes d'authentification dans GKE, y compris les problèmes liés au RBAC, à la fédération d'identité de charge de travail pour GKE et au serveur de métadonnées GKE.
Comptes de service Résolvez les problèmes liés aux comptes de service, y compris en rétablissant le compte de service par défaut et en activant le compte de service par défaut Compute Engine.
Secrets au niveau de la couche application Résolvez les problèmes pouvant survenir lors de la configuration du chiffrement des secrets de la couche application, y compris les mises à jour et les erreurs qui échouent si vous ne pouvez pas utiliser une clé Cloud KMS ou si la version de clé Cloud KMS a été détruite.

L'autorité de certification racine du cluster arrive bientôt à expiration

Thème Description
Expiration de l'autorité de certification racine Si l'autorité de certification racine (CA) de votre cluster arrive bientôt à expiration, découvrez comment effectuer une rotation des identifiants pour éviter toute interruption des opérations normales sur le cluster.

Charges de travail

Thème Description
Charges de travail déployées Résolvez les erreurs des charges de travail exécutées dans un cluster GKE, y compris CrashLoopBackOff et PodUnschedulable. Consultez la section "PodUnschedulable" pour obtenir des conseils sur les erreurs telles que MatchNodeSelector et Does not have minimum availability.
Extractions d'images Résoudre les problèmes d'extraction d'images Découvrez les causes des états tels que ImagePullBackOff et ErrImagePull, et comment résoudre ces états en corrigeant les problèmes courants tels que l'authentification et la connectivité réseau.
Charges de travail Arm Résolvez les problèmes liés aux charges de travail Arm, y compris les plantages des pods sur les nœuds Arm.
TPU Résolvez les problèmes liés aux TPU, y compris les problèmes liés aux quotas, au provisionnement automatique des nœuds, à la configuration des charges de travail et à la planification.
GPU Résolvez les problèmes liés aux GPU, y compris les problèmes d'installation des pilotes de GPU, les erreurs de plug-in d'appareil et les images de conteneur.

Gestion des clusters

Thème Description
Licences Résolvez les problèmes liés aux mises à niveau de cluster GKE, tels qu'un kube-apiserver non sain après une mise à niveau du plan de contrôle ou des charges de travail évincées après une mise à niveau.
Webhook Découvrez comment résoudre les problèmes et assurer la stabilité du plan de contrôle de votre cluster lorsque vous utilisez des webhooks d'admission.
Espace de noms bloqué à l'état Terminating Résolvez les problèmes liés aux espaces de noms bloqués à l'état Terminating en identifiant et en supprimant les composants non opérationnels qui bloquent la suppression.

Surveillance

Thème Description
Métriques système Résolvez les problèmes liés aux métriques système qui ne s'affichent pas dans Cloud Monitoring.
Tableaux de bord de surveillance Résolvez les problèmes liés aux tableaux de bord de surveillance, y compris les problèmes d'activation de la surveillance, les ressources Kubernetes manquantes et les autorisations.
Logging Résoudre les problèmes de journalisation, y compris les problèmes d'activation de la journalisation, les journaux manquants et les quotas.

Erreurs 4xx

Thème Description
Erreurs 4xx Résolvez certaines des erreurs 400, 401, 403 et 404 que vous pouvez rencontrer lorsque vous utilisez GKE. Cette page contient également des informations sur la façon de résoudre les erreurs liées à l'absence d'autorisations de modification sur le compte.

Problèmes connus

Thème Description
Problèmes connus Identifiez et corrigez les problèmes connus susceptibles d'affecter votre utilisation de GKE.

Étapes suivantes