L'agent Ops est l'agent principal de la collecte de la télémétrie à partir de vos instances Compute Engine. En combinant la collecte de journaux, de métriques et de traces en un seul processus, l'agent Ops utilise Fluent Bit pour les journaux, qui est compatible avec la journalisation à haut débit, et le collecteur OpenTelemetry pour les métriques et les traces.
Pour en savoir plus sur l'installation de l'agent Ops, consultez les ressources suivantes:
- Pour les instances Compute Engine, consultez la section Installer l'agent Ops.
- Pour les serveurs de solution Bare Metal, consultez la section Configurer l'agent Ops pour la solution Bare Metal.
Fonctionnalités de l'agent Ops
Les fonctionnalités globales sont les suivantes :- Processus de téléchargement et d'installation/mise à niveau unique.
- Configuration simple, unifiée et basée sur YAML.
- Prise en charge des distributions Linux et Windows standards.
- Assistance de proxy.
Fonctionnalités de journalisation
Les fonctionnalités de journalisation sont les suivantes :
Performances améliorées par rapport à l'ancien agent Logging :
- Haut débit permettant de profiter pleinement de l'architecture multicœur.
- Gestion efficace des ressources (mémoire, processeur, etc.).
Collecter des journaux à partir de sources diverses :
- Journaux système standards (
/var/log/syslog
et/var/log/messages
pour Linux, Windows Event Log) collectés sans configuration. - Journaux basés sur des fichiers avec des chemins et un intervalle d'actualisation personnalisables.
- Daemon Journald/journaux systemd.
- Enregistre les journaux via le protocole TCP.
- Journaux via le protocole de transfert (utilisés par Fluent Bit et Fluentd).
- Journaux système standards (
Traitement flexible :
- Analysez les journaux texte dans des journaux structurés : analyse basée sur JSON et basée sur des expressions régulières.
- Modifiez les entrées de journal en supprimant, en renommant ou en définissant des champs.
- Excluez des journaux en fonction des libellés et des expressions régulières
- Détectez et concaténez les journaux d'exceptions de langages multilignes à partir de Java, Python et Golang.
Prise en charge des applications tierces
- Intégration de journaux d'applications tiers sélectionnés qui reconnaissent les chemins d'accès et les formats de fichiers journaux d'application courants.
Fonctionnalités de surveillance
Les fonctionnalités de surveillance incluent :
- Métriques système collectées sans configuration. Les métriques collectées sont les suivantes :
- métriques concernant les processeurs
- métriques concernant le disque
- métriques iis (Windows uniquement)
- métriques concernant l'interface
- Métriques GPU (Linux uniquement)
- métriques concernant la mémoire
- métriques mssql (Windows uniquement)
- métriques pagefile (Windows uniquement)
- métriques concernant la pagination
- métriques concernant le réseau
- métriques concernant les traitements
- Métriques automatiques d'agent :
- Prise en charge des applications tierces
- Des intégrations sélectionnées de métriques d'applications tierces, qui collectent des métriques d'application courantes et offrent des exemples de tableaux de bord et de règles d'alerte.
- Collection de métriques Prometheus à partir d'applications s'exécutant sur Compute Engine.
- Collection de métriques et traces OTLP (OpenTelementry Protocol) à partir d'applications instrumentées à l'aide des SDK OpenTelemetry.
- Collection de métriques du gestionnaire de GPU du centre de données NVIDIA (DCGM).
La page Gestion des métriques de Cloud Monitoring fournit des informations qui peuvent vous aider à contrôler les sommes que vous consacrez aux métriques facturables, sans affecter l'observabilité. La page Gestion des métriques fournit les informations suivantes :
- Les volumes d'ingestion pour la facturation à base d'octets et celle à base d'exemples, englobant les différents domaines de métriques et des métriques individuelles
- Les données sur les libellés et la cardinalité des métriques
- Nombre de lectures pour chaque métrique.
- L'utilisation de métriques dans les règles d'alerte et les tableaux de bord personnalisés
- Les taux d'erreurs d'écriture de métriques
Vous pouvez également utiliser la gestion des métriques pour exclure les métriques inutiles, ce qui élimine le coût de leur ingestion. Pour en savoir plus sur la Gestion des métriques, consultez la section Afficher et gérer l'utilisation des métriques.
Fonctionnalités de Trace
Les fonctionnalités de Trace sont les suivantes :
- Collection de traces OTLP (OpenTelemetry Protocol) provenant d'applications instrumentées à l'aide des SDK OpenTelemetry.
Instances de machines virtuelles
Vous pouvez installer l'agent Ops sur les instances Compute Engine. Pour créer une instance Compute Engine, consultez le guide de démarrage de Compute Engine.
Les types d'instances de VM suivants font partie de services gérés qui mettent en œuvre la compatibilité Monitoring de façon spécifique aux services. N'essayez pas d'installer ou de configurer manuellement l'agent Ops sur ceux-ci :
- L'environnement standard App Engine offre une compatibilité intégrée avec Monitoring. Les agents ne sont pas nécessaires.
- Les instances de l'environnement flexible App Engine comportent des agents préinstallés avec des configurations spécifiques au service.
- Les instances Dataflow comportent des anciens agents Monitoring préinstallés avec des configurations spécifiques au service.
Les instances Dataproc antérieures à la version 2.2 de l'image disposent d'anciens agents Monitoring préinstallés avec des configurations spécifiques au service.
Vous pouvez installer l' agent Ops sur les clusters Dataproc qui utilisent une version d'image 2.2 ou ultérieure pour collecter les journaux syslog et les métriques d'hôte. Pour en savoir plus, consultez la page Versions Dataproc 2.2.x.
- Instances de nœud Google Kubernetes Engine.
- Les clusters GKE sur Google Cloud sont configurés pour collecter les journaux et les métriques avec Logging et Monitoring par défaut. Vous pouvez également configurer la collecte de métriques et de journaux pour les clusters de conteneurs existants. Pour plus d'informations, consultez la page Configurer la journalisation et la surveillance pour GKE.
- Les instances de Google Distributed Cloud disposent d'une solution intégrée de journalisation et de surveillance qui collecte l'état des composants du système. Pour plus d'informations, consultez la page Journalisation et surveillance.
Systèmes d'exploitation
L'agent Ops accepte les systèmes d'exploitation suivants sur des instances de VM compatibles. Pour en savoir plus sur les instances de VM Arm, consultez la page Compatibilité avec les VM Arm Compute Engine.
Systèmes d'exploitation Linux
L'agent prend en charge les systèmes d'exploitation Linux suivants :
- Rocky Linux 8
- Rocky Linux 9
- RHEL 7 : rhel-7, rhel-7-9-sap-ha
- RHEL 8 : rhel-8, rhel-8-4-sap-ha, rhel-8-6-sap-ha, rhel-8-8-sap-ha
- RHEL 9 : rhel-9
- Debian 11 (BullsEye)
- Debian 12 (Bookworm)
- Deep Learning VM Images basées sur Debian 11 (Bullseye)
- Ubuntu 20.04 LTS (Focal Fossa) : ubuntu-2004-lts, ubuntu-minimal-2004-lts
- Ubuntu 22.04 LTS (Jammy Jellyfish) : ubuntu-2204-lts, ubuntu-minimal-2204-lts
- Ubuntu 23.10 (Mantic Minotaur) : ubuntu-2310-amd64, ubuntu-minimal-2310-amd64
- Ubuntu 24.04 LTS (Noble Numbat) : ubuntu-2404-lts-amd64, ubuntu-minimal-2404-lts-amd64
- Ubuntu 24.10 (Oracular Oriole): ubuntu-2410-amd64, ubuntu-minimal-2410-amd64
- SLES 12 : sles-12, sles-12-sp5-sap
- SLES 15 : sles-15, sles-15-sp2-sap, sles-15-sp3-sap, sles-15-sp4-sap, sles-15-sp5-sap, sles-15-sp6-sap
- OpenSUSE Leap 15 : opensuse-leap (opensuse-leap-15-3-*, opensuse-leap-15-4-*)
Compatibilité avec les VM Arm Compute Engine
L'Agent Ops est compatible avec les instances de VM C4A et Tau T2A Arm de Compute Engine. L'agent Ops est compatible avec les VM Arm sur les images d'OS suivantes :
- Debian 12 (Bookworm) : Agent Ops version 2.44.0
- Ubuntu 20.04 LTS (Focal Fossa) : Agent Ops version 2.39.0
- Ubuntu 22.04 LTS (Jammy Jellyfish) : version de l'agent Ops 2.42.0
- Ubuntu 23.10 (Mantic Minotaur) : version de l'agent Ops 2.44.0
- Ubuntu 24.04 LTS (Noble Numbat) : version de l'agent Ops 2.47.0
- Ubuntu 24.10 (Oracular Oriole): version de l'agent Ops 2.52.0
- RHEL 9 : agent Ops version 2.40.0
- Rocky Linux 8: agent Ops version 2.51.0
- Rocky Linux 9: agent Ops version 2.40.0
- SLES 15 : Agent Ops version 2.43.0
- OpenSUSE Leap 15 : Agent Ops version 2.43.0
L'agent Ops est compatible avec un sous-ensemble des images compatibles avec Compute Engine. Pour en savoir plus sur les VM Arm Compute Engine Arm, consultez la section Créer et démarrer une instance de VM Arm.
Systèmes d'exploitation Windows
L'agent prend en charge les systèmes d'exploitation Windows suivants :
- Windows Server : windows-2016, windows-2019, windows-2022
- Windows Server Core : windows-2016-core, windows-2019-core, windows-20h2-core, windows-2022-core
Accès requis par l'agent
L'installation de l'agent requiert l'accès aux noms de DNS suivants :
Dépôt de packages Google Cloud :
packages.cloud.google.com
Google télécharge le sous-domaine :
dl.google.com
L'exécution de l'agent requiert l'accès aux noms de DNS suivants :
Serveur de jetons OAuth2 :
oauth2.googleapis.com
Les versions antérieures de l'agent peuvent nécessiter l'accès à
www.googleapis.com
(URL complète :https://www.googleapis.com/oauth2/v3/token
).Si vous utilisez une ancienne version de l'agent, il est recommandé de mettre à niveau votre agent vers la version la plus récente.
API Monitoring :
monitoring.googleapis.com
API Logging :
logging.googleapis.com
L'agent utilise les ports TCP de la VM pour la communication entre processus. Les ports suivants, qui n'ont pas besoin d'être ouverts en externe, doivent être disponibles pour l'agent sur votre VM :
20201
20202
Règlement d'obsolescence
L'agent Ops est soumis au Règlement d'obsolescence des agents.
Pour obtenir des informations sur l'abandon des anciennes fonctionnalités et versions, consultez la page sur les abandons liés à Google Cloud Observability.
Tarifs
Si vous installez l'agent Ops, les métriques, les journaux ou les traces envoyés par l'agent à votre projet Google Cloud peuvent vous être facturés. Pour en savoir plus sur les tarifs, consultez les documents suivants :Pour collecter des traces OTLP (OpenTelemetry Protocol), vous devez configurer l'agent pour collecter les traces d'une application instrumentée. Pour en savoir plus, consultez la page Collecter des traces (OTLP) avec l'agent Ops.
Étapes suivantes
- Installez l'agent Ops en suivant les instructions de la section Installer l'agent Ops.