Cloud Assist 调查

Gemini Cloud Assist 调查是一款用于在复杂的分布式云环境中排查基础设施和应用问题的根本原因分析 (RCA) 工具。调查可帮助您了解、诊断和解决 Google Cloud中的问题。借助调查,您可以通过缩短问题解决时间和提高整体可用性来简化突发事件响应,而无需耗费太多精力。

如果您有兴趣使用此非公开预览版功能,请加入 Gemini Cloud Assist 可信测试员计划

Gemini Cloud Assist 调查的优势

  • 在上下文中排查问题

    Gemini Cloud Assist 调查已集成到您的当前工作流中,包括以下位置:

    • Logs Explorer:您可以根据日志消息触发调查。
    • 产品内错误:您可以在 Google Kubernetes Engine 或 Dataproc 等产品页面中触发调查。
    • Cloud Hub:您可以从 Cloud Hub 的运行状况和问题排查页面中触发调查。
    • Chat:您可以在聊天中与调查互动并询问相关问题。
    • “调查”页面:您可以点击创建按钮,从“调查”主页面触发调查。
  • 了解问题

    问题是您向调查提供的信息,其中可能包含错误、说明、时间表或受影响的资源。观察结果是与问题最相关的环境状态分析洞见。观察结果有助于您快速了解环境中发生的情况。调查会使用您的 Google Cloud 环境的上下文来分析日志、配置和指标等数据源。跨数据源的分析可能来自程序 runbook、广泛的信号分析或工具。然后,系统会对观察结果进行排序和过滤,以帮助您专注于与您的问题最相关的信息。

  • 诊断问题。

    调查会综合观察结果,并利用特定于该领域的知识来找出可能的根本原因。公开知识和私有知识用于解释根本原因的背景信息,使其更易于理解。在存在不确定性时,可以提供多个根本原因作为假设。您可以迭代调查并创建新的修订版本,以便深入了解某些领域。

  • 解决问题。

    调查结果会建议后续问题排查步骤或解决方法,以帮助您解决问题。通过引用特定资源或时间段,您可以获得相关信息,而无需自行花费大量时间收集信息,从而更快、更轻松地解决问题。

  • 获取更多支持。

    如果您需要其他支持,可以将调查无缝转换为 Google Cloud 支持请求。支持工程师可以使用调查的详细信息,以便了解您在问题排查过程中的背景信息,从而帮助您更快地解决问题,减少来回沟通的次数。

使用调查的示例

假设您在 Logs Explorer 中看到错误日志。如果您已启用调查功能,则可以点击与日志关联的“调查”按钮,开始对错误进行调查。

错误日志的屏幕截图。

  • 点击调查按钮后,系统会打开一个面板,其中包含调查创建表单。错误预填充表单的详细信息,例如日志的时间、消息内容和资源。

    您可以添加更多信息或修改现有详细信息,然后点击创建以开始调查。

  • 调查首先会发现可能与您的问题相关的资源。

    调查会分析数据源,例如这些资源生成的日志、事件和配置。

  • 然后,调查会根据此分析生成一系列相关观察结果,以便了解问题。

    调查观察结果的屏幕截图。

    观察结果中包含指向每个观察结果所依据的来源数据的链接,以便您进一步调查和核实观察结果。

  • 调查还会产生一个或多个关于错误原因的假设。

    “调查”假设的屏幕截图。

    假设会考虑所有观察结果,并使用这些观察结果来证明每个假设原因。每个假设都包含有关假设依据的更多信息,并且每个假设都建议了调查错误原因的后续步骤或解决问题的建议修复方法,以便您对问题进行问题排查,直到找到解决方案。

支持的 Google Cloud 产品

支持的产品是指调查支持对其进行问题排查的产品。Gemini Cloud Assist 调查支持以下Google Cloud 产品:

后续步骤