Ops Agent 是用于从 Compute Engine 实例收集遥测数据的主要代理。Ops Agent 将日志、指标和跟踪的收集合并到一个进程中,使用支持高吞吐量日志记录的 Fluent Bit 来记录日志,并使用 OpenTelemetry Collector 来记录指标和跟踪。
如需了解如何安装 Ops Agent,请参阅以下内容:
- 对于 Compute Engine 实例,请参阅安装 Ops Agent。
- 对于裸金属解决方案服务器,请参阅为裸金属解决方案设置 Ops Agent。
Ops Agent 功能
整体功能包括:- 单一的下载和安装/升级过程。
- 基于 YAML 的简单、统一配置。
- 支持标准 Linux 和 Windows 发行版。
- 代理支持。
日志记录功能
日志记录功能包括:
与旧版 Logging 代理相比,性能有所提升:
- 高吞吐量能力,充分利用多核架构。
- 高效的资源(例如内存、CPU)管理。
从各种来源收集日志:
- 无需任何配置即可收集的标准系统日志(用于 Linux 的
/var/log/syslog和/var/log/messages,以及 Windows 事件日志)。 - 基于文件的日志,可自定义路径和刷新间隔。
- journald 守护程序/systemd 日志。
- 基于 TCP 协议的日志。
- 基于转发协议(由 Fluent Bit 和 Fluentd 使用)的日志。
- 无需任何配置即可收集的标准系统日志(用于 Linux 的
灵活处理:
第三方应用支持
- 精心设计的第三方应用日志集成,可识别常见的应用日志文件路径和格式。
监控功能
监控功能包括:
- 无需任何配置即可收集的系统指标。收集的指标包括:
- 第三方应用支持
- 精心设计的第三方应用指标集成,可收集常见的应用指标并提供示例信息中心和提醒政策。
- 从 Compute Engine 上运行的应用收集 Prometheus 指标。
- 从使用 OpenTelemetry SDK 插桩的应用收集 OpenTelemetry 协议 (OTLP) 指标和跟踪记录。
- 收集 NVIDIA 数据中心 GPU 管理器 (DCGM) 指标。
Cloud Monitoring 指标管理页面提供的信息可帮助您控制在收费指标上支出的金额,而不会影响可观测性。指标管理页面报告以下信息:
- 针对指标网域中基于字节和基于样本的结算以及各个指标的注入量。
- 有关标签和指标基数的数据。
- 每个指标的读取次数。
- 指标在提醒政策和自定义信息中心内的使用。
- 指标写入错误率。
您还可以使用指标管理来排除不需要的指标,从而免除注入这些指标的费用。 如需详细了解指标管理页面,请参阅查看和管理指标使用情况。
跟踪记录功能
跟踪记录功能包括:
- 从使用 OpenTelemetry SDK 插桩的应用收集 OpenTelemetry 协议 (OTLP) 跟踪记录。
虚拟机实例
您可以在 Compute Engine 实例上安装 Ops Agent。 如需创建 Compute Engine 实例,请参阅 Compute Engine 入门指南。
以下类型的虚拟机实例属于实现服务专用 Monitoring 支持的代管式服务。请勿尝试在这些实例上手动安装或配置 Ops Agent:
- App Engine 标准版具有内置的 Monitoring 支持。不需要代理。
- App Engine 柔性环境实例预安装了具有服务专用配置的代理。
- Dataflow 实例预安装了具有服务专用配置的旧版 Monitoring 代理。
映像版本 2.2 之前的 Dataproc 实例已预安装了具有服务特定配置的旧版 Monitoring 代理。
您可以在使用映像版本 2.2 及更高版本的 Dataproc 集群上安装 Ops Agent 来收集 syslog 日志和主机指标。如需了解详情,请参阅 Dataproc 2.2.x 发布版本。
- Google Kubernetes Engine 节点实例:
- GKE on Google Cloud 集群默认配置为使用 Logging 和 Monitoring 收集日志和指标。您还可以为现有容器集群配置指标和日志收集。如需了解相关信息,请参阅为 GKE 配置日志记录和监控。
- Google Distributed Cloud 实例提供了集成式日志记录和监控解决方案,可收集有关系统组件的状态。如需了解相关信息,请参阅日志记录和监控。
操作系统
Ops Agent 在兼容的虚拟机实例上支持以下操作系统。 如需了解 Arm 虚拟机实例,请参阅对 Compute Engine Arm 虚拟机的支持。
Linux 操作系统
该代理支持以下 Linux 操作系统:
- Rocky Linux 8
- Rocky Linux 9
- RHEL 8:rhel-8、rhel-8-6-sap-ha、rhel-8-8-sap-ha、rhel-8-10-sap-ha
- RHEL 9:rhel-9
- Debian 11 (Bullseye)
- Debian 12 (Bookworm)
- 基于 Debian 11 (Bullseye) 的 Deep Learning VM Image
- Ubuntu 22.04 LTS (Jammy Jellyfish):ubuntu-2204-lts、ubuntu-minimal-2204-lts
- Ubuntu 24.04 LTS (Noble Numbat):ubuntu-2404-lts-amd64、ubuntu-minimal-2404-lts-amd64
- SLES 12:sles-12、sles-12-sp5-sap
- SLES 15:sles-15、sles-15-sp3-sap、sles-15-sp4-sap、sles-15-sp5-sap、sles-15-sp6-sap
- OpenSUSE Leap 15:opensuse-leap (opensuse-leap-15-6-*)
对 Compute Engine Arm 虚拟机的支持
Ops Agent 支持 Compute Engine C4A 和 Tau T2A Arm 虚拟机实例。以下操作系统映像上的 Arm 虚拟机支持 Ops Agent:
- Debian 12 (Bookworm):Ops Agent 2.44.0 版
- Ubuntu 22.04 LTS (Jammy Jellyfish):Ops Agent 2.42.0 版
- Ubuntu 24.04 LTS (Noble Numbat):Ops Agent 2.47.0 版
- RHEL 9:Ops Agent 2.40.0 版
- Rocky Linux 8:Ops Agent 2.51.0 版
- Rocky Linux 9:Ops Agent 2.40.0 版
- SLES 15:Ops Agent 2.43.0 版
- OpenSUSE Leap 15:Ops Agent 2.43.0 版
受 Compute Engine 支持的部分映像支持 Ops Agent。如需详细了解 Compute Engine Arm 虚拟机,请参阅创建和启动 Arm 虚拟机实例。
Windows 操作系统
该代理支持以下 Windows 操作系统:
- Windows Server:windows-2016、windows-2019、windows-2022、windows-2025
- Windows Server Core:windows-2016-core、windows-2019-core、windows-20h2-core、windows-2022-core、windows-2025-core
代理访问要求
安装代理需要访问以下 DNS 名称:
Google Cloud package repository:
packages.cloud.google.comGoogle 下载子网域:
dl.google.com
运行代理需要访问以下 DNS 名称:
OAuth2 令牌服务器:
oauth2.googleapis.com旧版代理可能需要访问
www.googleapis.com(完整网址:https://www.googleapis.com/oauth2/v3/token)。如果您使用的是旧版代理,建议您升级代理到最新版本。
Monitoring API:
monitoring.googleapis.comLogging API:
logging.googleapis.com
代理会将虚拟机中的 TCP 端口用于进程间通信。以下端口(无需在外部打开)必须可供虚拟机上的代理使用:
20201
20202
弃用政策
Ops Agent 需遵循代理弃用政策。
如需了解旧版功能和版本的弃用信息,请参阅 Google Cloud Observability 弃用。
价格
如果您安装 Ops Agent,则可能需要为代理发送到您的 Google Cloud 项目的指标、日志或跟踪记录付费。如需了解价格信息,请参阅 Google Cloud Observability 价格。如需收集 OpenTelemetry 协议 (OTLP) 跟踪记录,您必须配置代理以从插桩应用收集跟踪记录。如需了解详情,请参阅使用 Ops Agent 收集 (OTLP) 跟踪记录。
后续步骤
- 如需安装 Ops Agent,请参阅安装 Ops Agent。