Le tableau de bord "Présentation de GKE Enterprise" de la console Google Cloud fournit une vue d'ensemble de votre parc. La présentation vous aide à utiliser les fonctionnalités de GKE Enterprise en vous indiquant le nombre de problèmes de sécurité rencontrés par votre parc, la couverture de Policy Controller à l'échelle de votre parc et l'état de synchronisation de vos packages Config Sync. En outre, le tableau de bord fournit une vue au niveau du parc de l'utilisation des ressources de vos parcs, clusters et équipes. Vous pouvez utiliser ces informations pour optimiser les dépenses, la conception des applications et l'allocation des ressources, y compris l'utilisation du processeur, de la mémoire et du disque.
Avant de lire cette page, assurez-vous de connaître la gestion des ressources Kubernetes, comme décrit dans la documentation Kubernetes Gestion des ressources pour les pods et les conteneurs.
La présentation de GKE Enterprise dans la console Google Cloud n'est disponible que pour les utilisateurs du parc qui ont activé GKE Enterprise.
Consulter la présentation
Pour afficher le tableau de bord "Vue d'ensemble" :
Après avoir sélectionné le projet hôte de votre parc, accédez à la présentation de GKE Enterprise dans la console Google Cloud .
Sélectionner un filtre temporel
Par défaut, la présentation de GKE Enterprise affiche l'utilisation des ressources au cours de la dernière heure. Pour modifier cette période, utilisez l'option de filtre temporel :
- Sélectionnez la période sur laquelle vous souhaitez afficher l'utilisation moyenne des ressources des conteneurs de la flotte. Choisissez l'une des options prédéfinies ou sélectionnez Personnalisée pour spécifier une période personnalisée.
Afficher les clusters, les niveaux d'accès de l'équipe, les coûts et l'utilisation totale des ressources
La première section fournit un aperçu de vos clusters, de votre champ d'application, du coût estimé de votre parc et de l'utilisation totale du processeur/de la mémoire/du disque au cours de la période que vous avez sélectionnée. Les métriques d'utilisation des ressources sont générées à l'aide des données système Cloud Monitoring des clusters de votre parc.
Si la notification Données manquantes de... s'affiche, consultez la section Activer le système Cloud Monitoring pour les clusters de parc pour résoudre le problème.
Afficher l'état du cluster
Dans la section Clusters in this Fleet (Clusters de ce parc), vous pouvez voir le nombre de clusters de votre parc. En cas de problème de connectivité du cluster au parc, des avertissements ou des erreurs s'affichent. C'est le cas, par exemple, si vous avez supprimé un cluster sans annuler son enregistrement au préalable, ou si vous devez vous connecter à un cluster situé en dehors deGoogle Cloud pour en afficher les détails.
- Si une erreur ou un avertissement s'affiche, cliquez sur la notification pour afficher le ou les clusters problématiques, et résoudre le problème.
- Cliquez sur Afficher tous les clusters pour afficher la liste complète des clusters de votre parc.
Afficher les niveaux d'accès d'équipe
Dans la section Niveaux d'accès d'équipe, vous pouvez voir le nombre de niveaux d'accès d'équipe dans ce parc. Les niveaux d'accès d'équipe vous permettent de définir des sous-ensembles de ressources de parc par équipe. Une fois que vous avez défini ces niveaux d'accès, vous pouvez utiliser les fonctionnalités de gestion des équipes afin que chaque équipe puisse agir en tant que "locataire" distinct dans votre flotte.
- Cliquez sur Afficher tous les niveaux d'accès d'équipe pour afficher la liste complète des niveaux d'accès d'équipe de votre parc.
Afficher le coût mensuel estimé
Dans la section Coût mensuel estimé, vous pouvez consulter le coût mensuel estimé de toutes vos ressources de parc.
- Cliquez sur Afficher dans "Optimisation des coûts" pour afficher des métriques d'utilisation liées aux coûts plus détaillées pour votre parc.
Afficher l'utilisation totale des ressources
La section Utilisation totale indique l'utilisation moyenne des ressources de processeur, de mémoire et de disque réelles de tous les conteneurs de votre parc, par rapport aux ressources pouvant être allouées aux nœuds des clusters de ce parc. Les données sont affichées pour la période que vous avez choisie. L'indication Pouvant être alloué sur un nœud Kubernetes correspond à la quantité de ressources pouvant être utilisées par les pods standards de ce nœud.
Cette vue offre un aperçu rapide de l'utilisation des ressources et des ressources disponibles de votre parc. Elle peut indiquer les problèmes potentiels à examiner plus en détail avec des métriques plus détaillées. Par exemple, si l'utilisation totale du processeur est très faible, vous pouvez utiliser les métriques "par cluster" ci-dessous pour identifier les clusters pouvant être redimensionnés.
Afficher la gestion des fonctionnalités
Afficher les problèmes de sécurité
Pour vous aider à identifier les problèmes de sécurité qui affectent les clusters membres de votre parc, tels que les failles actives ou les problèmes de configuration des charges de travail, consultez la section Problèmes de sécurité. Cette section vous présente les informations suivantes:
- Nombre total de problèmes détectés dans votre flotte. Les problèmes sont regroupés par gravité, qui est attribuée en fonction de l'échelle de gravité qualitative CVSS.
- Répartition des problèmes par type. Cela vous permet de déterminer si les problèmes proviennent de problèmes de configuration, d'un bulletin de sécurité ou d'une faille.
Pour obtenir un aperçu de la sécurité de votre cluster GKE et des conseils pratiques pour résoudre les problèmes détectés, cliquez sur Afficher la stratégie de sécurité. Si vous n'avez jamais utilisé le tableau de bord de stratégie de sécurité, cliquez sur Activer la stratégie de sécurité pour activer l'API Container Security et accéder au tableau de bord de stratégie de sécurité.
Pour en savoir plus, consultez À propos du tableau de bord de stratégie de sécurité.
Afficher la couverture de Policy Controller
Policy Controller permet d'appliquer des règles entièrement programmables pour vos clusters. Ces règles servent de "garde-fous" et empêchent toute modification de la configuration de l'API Kubernetes de contrevenir aux contrôles de sécurité, opérationnels ou de conformité de votre organisation.
La section État des règles indique le nombre de clusters sur lesquels Policy Controller est activé.
Cliquez sur Afficher la règle pour afficher le tableau de bord Policy Controller. Si vous n'avez pas installé Policy Controller sur un cluster, cliquez sur Activer la stratégie.
Pour en savoir plus sur Policy Controller, consultez la documentation.
Afficher l'état du package Config Sync
Config Sync est un service GitOps qui permet aux opérateurs de cluster et aux administrateurs de plate-forme de déployer des packages à partir d'une source de vérité. Un package contient toutes les configurations contenues dans chaque source à partir de laquelle vous synchronisez votre cluster. La source peut être un dépôt Git, un répertoire dans un dépôt Git, une image OCI ou un dépôt Helm. Étant donné que vous pouvez synchroniser votre cluster à partir de plusieurs sources, vous pouvez avoir plusieurs packages par cluster.
La section État de la configuration affiche les informations suivantes:
- Nombre total de packages dans votre parc
- État de synchronisation des packages de votre parc
Cliquez sur Afficher la présentation de la configuration pour afficher le tableau de bord Config Sync. Si vous n'avez pas installé Config Sync sur un cluster, cliquez sur Activer Config Sync.
Pour en savoir plus sur Config Sync, consultez la documentation.
Afficher l'efficacité du parc
Cette section fournit une vue détaillée de l'utilisation que fait votre parc de ses ressources cloud ou sur site, y compris l'utilisation des ressources par parc, et l'utilisation principale et faible des ressources par cluster. Cela peut vous aider à identifier, par exemple, les clusters potentiellement sous-utilisés ou surutilisés que vous souhaitez redimensionner. Pour en savoir plus sur le calcul de ces métriques, consultez la section Métriques d'utilisation des ressources de parc.
Afficher l'utilisation des ressources au fil du temps
La ligne Utilisation du processeur/de la mémoire/du disque par parc vous permet d'examiner plus en détail la façon dont votre parc utilise les ressources au fil du temps. Il vous permet également de voir les ressources demandées par vos clusters, les ressources allouables et l'utilisation réelle. Chaque panneau affiche un graphique de votre utilisation agrégée des processeurs, de la mémoire ou du disque au cours de la période que vous avez choisie, avec les informations suivantes affichées sous forme de lignes distinctes:
- Pouvant être alloué : quantité de la ressource pouvant être allouée à vos nœuds de cluster de parc
- Demandé : quantité de ressources demandée par les conteneurs de votre parc
- Utilisé : quantité réelle de la ressource utilisée par vos conteneurs
Pour afficher les détails d'un point donné du graphique, faites défiler le graphique jusqu'à la période qui vous intéresse (par exemple, un pic visible de l'utilisation réelle sur le graphique). Les informations sur l'utilisation des ressources pouvant être allouées, demandées et des ressources réelles pour cette période sont affichées.
Pour activer ou désactiver l'affichage d'une ou de plusieurs des lignes du graphique, cliquez sur la ou les métriques appropriées sous le graphique.
Afficher l'utilisation principale des ressources par cluster
La ligne suivante indique l'utilisation principale du processeur/de la mémoire/du disque par cluster de votre parc, ce qui vous permet de voir rapidement les clusters spécifiques qui utilisent le plus leurs ressources allouables. Chaque panneau répertorie vos cinq clusters principaux par ordre d'utilisation (le plus élevé en premier). Pour chaque cluster, vous pouvez afficher un graphique de son utilisation de la ressource et une moyenne de son utilisation des ressources par rapport aux ressources pouvant être allouées au cours de la période choisie. Cette vue peut vous aider, par exemple, à identifier les clusters surutilisés. Les clusters qui ne disposent pas de suffisamment de ressources disponibles ne pourront peut-être pas planifier de pods.
Cliquez sur le nom du cluster qui vous intéresse pour en savoir plus sur la façon dont il utilise ses ressources. Dans la vue "Utilisation", vous pouvez également afficher le nombre de redémarrages de conteneurs et les journaux d'erreurs de votre cluster.
Cliquez sur Afficher tous les clusters par utilisation du processeur/de la mémoire/du disque pour afficher une liste triée de tous les clusters de votre parc.
Afficher l'utilisation faible des ressources par cluster
La dernière ligne de l'utilisation des ressources indique l'utilisation faible du processeur/de la mémoire/du disque par cluster de votre parc, ce qui vous permet de voir rapidement les clusters sous-utilisés. Les cinq clusters qui utilisent le moins de ressources apparaissent en haut de chaque panneau, avec un graphique de leur utilisation et une moyenne de leur utilisation des ressources par rapport aux ressources pouvant être allouées au cours de la période choisie.
Cliquez sur le nom du cluster qui vous intéresse pour en savoir plus sur la façon dont il utilise ses ressources. Dans la vue "Utilisation", vous pouvez également afficher le nombre de redémarrages de conteneurs et les journaux d'erreurs de votre cluster.
Cliquez sur Afficher tous les clusters par utilisation du processeur/de la mémoire/du disque pour afficher une liste triée de tous les clusters de votre parc.
Afficher l'efficacité de l'équipe
Cette section fournit une vue d'ensemble de l'utilisation que font vos équipes de leurs ressources cloud ou sur site. Il vous aide également à surveiller les équipes qui rencontrent des problèmes.
Cliquez sur l'équipe qui vous intéresse pour approfondir le tableau de bord de l'équipe. Dans le tableau de bord de l'équipe, vous pouvez obtenir plus d'informations sur l'utilisation des ressources et les espaces de noms de l'équipe. Cela peut vous aider à identifier les espaces de noms qui affectent l'utilisation des ressources de l'équipe.
Afficher l'utilisation des ressources la plus élevée par niveau d'accès d'équipe
Utilisation du processeur/de la mémoire/du disque par niveau d'accès vous permet d'identifier rapidement les équipes spécifiques qui utilisent le plus leurs ressources. Chaque panneau répertorie vos équipes principales par ordre d'utilisation (le plus élevé en premier). Pour chaque équipe, vous pouvez afficher un graphique de son utilisation de la ressource et une moyenne de son utilisation des ressources par rapport à la requête.
Pour afficher l'utilisation des ressources de toutes vos équipes pour la période que vous avez choisie, cliquez sur Afficher toutes les équipes par utilisation du processeur/de la mémoire/du disque.
Afficher la distribution des erreurs par champ d'application
Cette fiche indique les équipes qui ont généré le plus de journaux d'erreurs pour la période que vous avez choisie.
Pour afficher la liste des équipes triées par nombre d'erreurs, cliquez sur Afficher tous les niveaux d'accès par nombre d'erreurs.
Afficher le nombre de redémarrages par niveau d'accès
Cette section affiche les équipes ayant enregistré le plus grand nombre de redémarrages de conteneurs pour la période sélectionnée.
Pour afficher la liste des équipes triées par redémarrages, cliquez sur Afficher tous les champs d'application par redémarrages.
Activer le système Cloud Monitoring pour les clusters de parcs
Comme indiqué dans la section Afficher les clusters, les niveaux d'accès de l'équipe et l'utilisation totale des ressources, les métriques du tableau de bord sont générées à l'aide de données Cloud Monitoring pour les composants de cluster (tels que les charges de travail dans les espaces de noms kube-system
et gke-connect
). Par conséquent, Cloud Monitoring doit être activé pour tous les composants système, de plan de contrôle et Kube State Metrics de vos clusters membres de parc.
Cloud Logging et Cloud Monitoring sont activés par défaut pour la plupart des clusters GKE et GKE Enterprise, mais vous devez toujours activer manuellement Cloud Monitoring pour tous les composants du cluster. Pour les clusters associés, vous devez toujours configurer Cloud Monitoring manuellement.
Si l'un des composants de cluster de votre parc n'a pas activé Cloud Monitoring, un panneau s'affiche en haut de la page, indiquant le nombre de clusters dont les données sont manquantes.
Pour activer Cloud Monitoring pour les composants de ces clusters, consultez les guides suivants pour votre type de cluster:
- Configurer la journalisation et la surveillance pour GKE
- Utiliser Cloud Logging et Cloud Monitoring avec Google Distributed Cloud
- Configurer Cloud Logging et Cloud Monitoring pour Google Distributed Cloud
- Surveillance des clusters associés :
- Autoriser la journalisation et la surveillance pour GKE sur AWS.
- Autoriser la journalisation et la surveillance pour GKE sur Azure.
- Journalisation et surveillance pour GKE sur AWS (génération précédente)
Activer la surveillance des clusters enregistrés dans plusieurs projets
Pour collecter et afficher des métriques sur plusieurs Google Cloud projets, Cloud Monitoring vous permet de créer des champs d'application de métriques multiprojets. Lorsque vous enregistrez un cluster GKE depuis un projet différent vers votre projet hôte de parc, un nouveau champ d'application de métriques incluant les deux projets est automatiquement créé (s'il n'existe pas déjà). Vous pouvez ainsi consulter les données d'utilisation du cluster dans la vue d'ensemble.
Étapes suivantes
- Pour en savoir plus sur les métriques d'utilisation des ressources dans le tableau de bord et sur la façon de les utiliser, consultez la section Métriques d'utilisation des ressources de parc.
- Découvrez comment utiliser Cloud Logging et Cloud Monitoring pour observer vos clusters et leurs charges de travail.