在应用停止响应时收到通知
完成以下任务,了解如何在应用停止响应 HTTP 请求时收到通知:
- 创建电子邮件通知渠道。
- 创建拨测和提醒政策。
- 查看拨测信息中心。
- 强制拨测失败。
- 查看电子邮件通知和突发事件。
- 清理。
如需在 Google Cloud 控制台中直接遵循有关此任务的分步指导,请点击操作演示:
准备工作
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Monitoring API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Cloud Monitoring API.
创建电子邮件通知渠道
在创建提醒政策之前,请先配置要用于提醒政策的通知渠道。Cloud Monitoring 支持多种不同类型的通知渠道,包括电子邮件、Slack、PagerDuty 和 Pub/Sub。如需了解详情,请参阅创建和管理通知渠道。 如需通过电子邮件接收通知,请执行以下操作:-
在 Google Cloud 控制台中,转到 notifications 提醒页面:
如果您使用搜索栏查找此页面,请选择子标题为监控的结果。
- 在工具栏中,点击编辑通知渠道。
- 在通知渠道页面中,滚动到
电子邮件 ,然后点击新增。 - 输入您的电子邮件地址和显示名称(如
My email
),然后点击保存。
创建拨测和提醒政策
如需在应用未能响应请求时收到通知,请配置正常运行时间检查以向应用发送请求,然后配置提醒政策以监控对正常运行时间检查的响应:
-
在 Google Cloud 控制台中,前往 拨测页面:
如果您使用搜索栏查找此页面,请选择子标题为监控的结果。
- 在工具栏中,点击创建拨测。
- 对于资源类型,请选择网址。
- 对于主机名,请输入公司的有效网址,或输入
cloud.google.com
。 - 如果您输入了公司的网址,请将路径字段留空。否则,请输入
/monitoring/docs
。您可以将该正常运行情况检查配置为向贵公司网址或
cloud.google.com/monitoring/docs
发送请求。 - 点击继续以进入响应验证部分。
如需了解这些设置,请参阅验证响应数据。
- 点击继续以进入提醒和通知部分。
- 展开通知渠道菜单,然后选择所需的通知渠道。
- 点击继续以进入审核部分。
- 为拨测输入一个标题,例如
My check
。 如需验证您的拨测配置,请点击
测试 。如果收到错误,请参阅验证拨测。
- 点击创建。
此时将创建拨测和提醒政策,并且新的拨测会列在拨测页面上。
查看拨测信息中心
拨测页面会显示您的拨测列表以及每项检查的状态。如需查看您创建的正常运行时间检查的详细状态,请执行以下操作:
-
在 Google Cloud 控制台中,前往 拨测页面:
如果您使用搜索栏查找此页面,请选择子标题为监控的结果。
点击拨测的名称以打开拨测的信息中心。
由于拨测未执行,因此图表为空,并且拨测状态为未运行检查。
在工具栏中,点击
启用自动刷新,为图表启用自动刷新功能。等待图表上显示一些数据点,然后刷新页面。
当每个位置的状态为
通过时,请继续执行下一步。否则,请等待一分钟,然后刷新页面以更新状态窗格。
强制拨测失败
如需强制拨测失败,请修改路径,使拨测测试的网址无效:
- 点击工具栏中的修改。
- 在路径字段中,附加或输入 HelloWorld。
- 点击保存。
- 在工具栏中,点击 启用自动刷新,为图表启用自动刷新功能。
等待通过的检查数图表上的数据点变为零,然后刷新页面。
当每个位置的状态为
失败时,请继续执行下一步。否则,请等待一分钟,然后刷新页面以更新状态窗格。
查看通知和突发事件
当提醒政策确定正常运行时间检查连续两次失败后,Cloud Monitoring 会创建突发事件并发送通知。突发事件是提醒政策触发的记录,其中包含有助于排查失败问题的信息。如需查看通知和突发事件,请执行以下操作:
- 打开您的电子邮件账号,然后查看标题以
[ALERT] Failure of uptime check_id
开头的邮件。 如需获取有关失败的详细信息,请在通知中点击查看突发事件。
突发事件详细信息页面会在 Cloud 控制台的新页面中打开。
您已成功创建拨测和提醒政策,并强制拨测失败,并且您已收到一条通知。您现在可以关闭显示突发事件详细信息页面的浏览器页面,
清理
为避免因本页中使用的资源导致您的 Google Cloud 账号产生费用,请按照以下步骤操作。
如果您创建了一个新项目,但不再需要该项目,请删除该项目。
如果您使用的是现有项目,请执行以下操作:
删除您创建的拨测:
-
在 Google Cloud 控制台中,前往 拨测页面:
如果您使用搜索栏查找此页面,请选择子标题为监控的结果。
- 选择您创建的拨测,然后点击
删除 。删除拨测时,监控该拨测的提醒政策也会一并删除。
-
后续步骤
如需了解如何查看和自定义虚拟机的信息中心,请参阅快速入门查看和自定义虚拟机实例信息中心。
如需了解如何测试应用,请参阅合成监控概览。
如需了解如何安装 Ops Agent 并从 Apache 服务器收集指标,请参阅快速入门 使用 Ops Agent 收集 Apache 指标。
如需了解 Ops Agent,请参阅 Ops Agent 概览。
如需了解如何创建自定义信息中心,请参阅管理自定义信息中心。