Ops Agent 是用于从 Compute Engine 实例收集遥测数据的主要代理。Ops Agent 将日志、指标和跟踪的收集合并到一个进程中,使用支持高吞吐量日志记录的 Fluent Bit 来记录日志,并使用 OpenTelemetry Collector 来记录指标和跟踪。
如需了解如何安装 Ops Agent,请参阅以下内容:
- 对于 Compute Engine 实例,请参阅安装 Ops Agent。
- 对于裸金属解决方案服务器,请参阅为裸金属解决方案设置 Ops Agent。
Ops Agent 功能
整体功能包括:- 单一的下载和安装/升级过程。
- 基于 YAML 的简单、统一配置。
- 支持标准 Linux 和 Windows 发行版。
- 代理支持。
日志记录功能
日志记录功能包括:
与旧版 Logging 代理相比,性能有所提升:
- 高吞吐量能力,充分利用多核架构。
- 高效的资源(例如内存、CPU)管理。
从各种来源收集日志:
- 无需任何配置即可收集的标准系统日志(用于 Linux 的
/var/log/syslog
和/var/log/messages
,以及 Windows 事件日志)。 - 基于文件的日志,可自定义路径和刷新间隔。
- journald 守护程序/systemd 日志。
- 基于 TCP 协议的日志。
- 基于转发协议(由 Fluent Bit 和 Fluentd 使用)的日志。
- 无需任何配置即可收集的标准系统日志(用于 Linux 的
灵活处理:
第三方应用支持
- 精心设计的第三方应用日志集成,可识别常见的应用日志文件路径和格式。
监控功能
监控功能包括:
- 无需任何配置即可收集的系统指标。收集的指标包括:
- 第三方应用支持
- 精心设计的第三方应用指标集成,可收集常见的应用指标并提供示例信息中心和提醒政策。
- 从 Compute Engine 上运行的应用收集 Prometheus 指标。
- 从使用 OpenTelemetry SDK 插桩的应用收集 OpenTelemetry 协议 (OTLP) 指标和跟踪记录。
- 收集 NVIDIA 数据中心 GPU 管理器 (DCGM) 指标。
Cloud Monitoring 指标管理页面提供的信息可帮助您控制在收费指标上支出的金额,而不会影响可观测性。指标管理页面报告以下信息:
- 针对指标网域中基于字节和基于样本的结算以及各个指标的注入量。
- 有关标签和指标基数的数据。
- 每个指标的读取次数。
- 指标在提醒政策和自定义信息中心内的使用。
- 指标写入错误率。
您还可以使用指标管理来排除不需要的指标,从而降低提取这些指标的费用。 如需详细了解指标管理页面,请参阅查看和管理指标使用情况。
跟踪记录功能
跟踪记录功能包括:
- 从使用 OpenTelemetry SDK 插桩的应用收集 OpenTelemetry 协议 (OTLP) 跟踪记录。
虚拟机实例
您可以在 Compute Engine 实例上安装 Ops Agent。 如需创建 Compute Engine 实例,请参阅 Compute Engine 入门指南。
以下类型的虚拟机实例属于实现服务专用 Monitoring 支持的代管式服务。请勿尝试在这些实例上手动安装或配置 Ops Agent:
- App Engine 标准版具有内置的 Monitoring 支持。不需要代理。
- App Engine 柔性环境实例预安装了具有服务专用配置的代理。
- Dataflow 实例预安装了具有服务专用配置的旧版 Monitoring 代理。
映像版本 2.2 之前的 Dataproc 实例已预安装了具有服务特定配置的旧版 Monitoring 代理。
您可以在使用映像版本 2.2 及更高版本的 Dataproc 集群上安装 Ops Agent 来收集 syslog 日志和主机指标。如需了解详情,请参阅 Dataproc 2.2.x 发布版本。
- Google Kubernetes Engine 节点实例:
- GKE on Google Cloud 集群默认配置为使用 Logging 和 Monitoring 收集日志和指标。您还可以为现有容器集群配置指标和日志收集。如需了解相关信息,请参阅为 GKE 配置日志记录和监控。
- Google Distributed Cloud 实例提供了集成式日志记录和监控解决方案,可收集有关系统组件的状态。如需了解相关信息,请参阅日志记录和监控。
操作系统
Ops Agent 在兼容的虚拟机实例上支持以下操作系统。 如需了解 Arm 虚拟机实例,请参阅对 Compute Engine Arm 虚拟机的支持。
Linux 操作系统
该代理支持以下 Linux 操作系统:
- Rocky Linux 8
- Rocky Linux 9
- RHEL 7:rhel-7、rhel-7-9-sap-ha
- RHEL 8:rhel-8、rhel-8-4-sap-ha、rhel-8-6-sap-ha、rhel-8-8-sap-ha
- RHEL 9:rhel-9
- Debian 11 (Bullseye)
- Debian 12 (Bookworm)
- 基于 Debian 11 (Bullseye) 的 Deep Learning VM Image
- Ubuntu 20.04 LTS (Focal Fossa):ubuntu-2004-lts、ubuntu-minimal-2004-lts
- Ubuntu 22.04 LTS (Jammy Jellyfish):ubuntu-2204-lts、ubuntu-minimal-2204-lts
- Ubuntu 23.10 (Mantic Minotaur):ubuntu-2310-amd64、ubuntu-minimal-2310-amd64
- Ubuntu 24.04 LTS (Noble Numbat):ubuntu-2404-lts-amd64、ubuntu-minimal-2404-lts-amd64
- Ubuntu 24.10 (Oracular Oriole):ubuntu-2410-amd64、ubuntu-minimal-2410-amd64
- SLES 12:sles-12、sles-12-sp5-sap
- SLES 15:sles-15、sles-15-sp2-sap、sles-15-sp3-sap、sles-15-sp4-sap、sles-15-sp5-sap、sles-15-sp6-sap
- OpenSUSE Leap 15:opensuse-leap(opensuse-leap-15-3-*、opensuse-leap-15-4-*)
对 Compute Engine Arm 虚拟机的支持
Ops Agent 支持 Compute Engine C4A 和 Tau T2A Arm 虚拟机实例。以下操作系统映像上的 Arm 虚拟机支持 Ops Agent:
- Debian 12 (Bookworm):Ops Agent 2.44.0 版
- Ubuntu 20.04 LTS (Focal Fossa):Ops Agent 2.39.0 版
- Ubuntu 22.04 LTS (Jammy Jellyfish):Ops Agent 2.42.0 版
- Ubuntu 23.10 (Mantic Minotaur):Ops Agent 2.44.0 版
- Ubuntu 24.04 LTS (Noble Numbat):Ops Agent 2.47.0 版
- Ubuntu 24.10 (Oracular Oriole):Ops Agent 2.52.0 版
- RHEL 9:Ops Agent 2.40.0 版
- Rocky Linux 8:Ops Agent 2.51.0 版
- Rocky Linux 9:Ops Agent 2.40.0 版
- SLES 15:Ops Agent 2.43.0 版
- OpenSUSE Leap 15:Ops Agent 2.43.0 版
受 Compute Engine 支持的部分映像支持 Ops Agent。如需详细了解 Compute Engine Arm 虚拟机,请参阅创建和启动 Arm 虚拟机实例。
Windows 操作系统
该代理支持以下 Windows 操作系统:
- Windows Server:windows-2016、windows-2019、windows-2022
- Windows Server Core:windows-2016-core、windows-2019-core、windows-20h2-core、windows-2022-core
代理访问要求
安装代理需要访问以下 DNS 名称:
Google Cloud package repository:
packages.cloud.google.com
Google 下载子网域:
dl.google.com
运行代理需要访问以下 DNS 名称:
OAuth2 令牌服务器:
oauth2.googleapis.com
旧版代理可能需要访问
www.googleapis.com
(完整网址:https://www.googleapis.com/oauth2/v3/token
)。如果您使用的是旧版代理,建议您升级代理到最新版本。
Monitoring API:
monitoring.googleapis.com
Logging API:
logging.googleapis.com
代理会将虚拟机中的 TCP 端口用于进程间通信。以下端口(无需在外部打开)必须可供虚拟机上的代理使用:
20201
20202
弃用政策
Ops Agent 需遵循代理弃用政策。
如需了解旧版功能和版本的弃用信息,请参阅 Google Cloud Observability 弃用。
价格
如果您安装 Ops Agent,则可能需要为代理发送到 Google Cloud 项目的指标、日志或跟踪记录付费。如需了解价格信息,请参阅以下文档:如需收集 OpenTelemetry 协议 (OTLP) 跟踪记录,您必须配置代理以从插桩应用收集跟踪记录。如需了解详情,请参阅使用 Ops Agent 收集 (OTLP) 跟踪记录。
后续步骤
- 如需安装 Ops Agent,请参阅安装 Ops Agent。