对话式分析:借助 Gemini 的协助,使用自然语言查询数据

对话式分析是一款依托 AI 技术的数据查询工具,可帮助您用自然语言编写问题,让没有商务智能专业知识的用户也能从数据中获取价值。对话分析使用 Gemini in Looker,这款产品属于 Gemini for Google Cloud 产品组合,可提供依托生成式 AI 技术的辅助功能,帮助您分析数据并从中获得富有价值的分析洞见。为了尽可能提供最可靠的回答,对话式分析会使用您的 LookML 模型来了解应如何查询您的数据。对话式分析是一项 Gemini in Looker 功能,可在 Looker (Google Cloud Core) 和 Looker(原始版本)实例以及 Looker Studio 中作为 Looker Studio Pro 订阅的一部分使用。

了解 Gemini for Google Cloud 如何以及何时使用您的数据。作为一项尚处于发展早期的技术,Gemini for Google Cloud 产品可能会生成看似合理但实际上不正确的输出。我们建议您先验证 Gemini for Google Cloud 产品的所有输出,然后再使用。如需了解详情,请参阅 Gemini for Google Cloud 和 Responsible AI

对话分析可在 Looker Studio、Looker(原始版本)实例和 Looker (Google Cloud Core) 实例中使用。

准备工作

如需在 Looker Studio 中使用对话式分析,您必须满足以下要求。

  1. 您必须是 Looker Studio Pro 订阅的用户。Looker Studio Pro 许可免费提供给 Looker 用户。
  2. 管理员必须为 Looker Studio 启用 Gemini in Looker

如需在 Looker 实例中使用对话分析,您和您的 Looker 实例必须满足以下要求:

  1. Looker 管理员必须为 Looker 实例启用 Gemini in Looker。
  2. Looker 管理员必须在 Looker 实例中向您授予 Gemini 角色。您还必须拥有包含所查询模型的 access_data 权限的角色。

支持的数据源

您必须先连接到数据源,然后才能对数据提出问题。对话式分析可与 Looker、Google BigQuery、Google 表格和 CSV 数据连接器搭配使用。

您要分析的数据集必须位于 Looker、Google BigQuery、Google 表格或 CSV 文件中。

请按照以下页面中的说明设置与这些数据源的连接:

您可以前往 Looker 数据洞察中的“数据源”页面,查看已添加到 Looker 数据洞察的特定数据源。此页面不会显示来自探索广告系列等来源的数据。

您可以在 Looker Studio、Looker(原始版本)实例和 Looker (Google Cloud Core) 实例中前往对话式分析页面。

您可以通过以下方式从 Looker Studio 访问对话分析:

  • 直接前往对话分析
  • 从 Looker Studio 的导航面板中选择 对话分析
  • 如果您位于 Sandbox 工作区,请从 Looker Studio 的创建菜单中选择 对话

如果您的管理员为您的 Looker 实例启用了 Gemini in Looker,那么作为 Looker 用户,您可以在 Looker 实例中通过以下方式访问对话分析功能:

对话分析适用于搭载 Looker 25.0 或更高版本的 Looker (Google Cloud Core) 和 Looker(原始版本)实例。

发起对话

您对数据集提出的问题集会按对话进行整理。将工作拆分为多个对话对整理问题线索很有帮助。之前的对话会列在对话分析的时间表 近期面板中。点击任何现有对话即可返回对话并提出其他问题。

如需创建新对话,请按以下步骤操作:

  1. 前往对话式分析
  2. 在对话分析中,点击 + 创建对话。问题和结果会保存在您选择的项目的“沙盒”位置,以供日后查看。
  3. 选择您要调查的数据源或您要用于对话的数据代理:

    • 数据源:如需根据现有数据源发起对话,请选择数据源面板,然后选择一个数据源。如需创建新的数据源,请选择连接到数据

    • 数据代理:如需与现有数据代理发起对话,请选择代理,然后选择一个数据代理。如需创建新的数据代理,请选择 + 创建代理

  4. 如需开始对话,请输入您的问题,然后按 Return 键(Mac)或 Enter 键(PC)。

您可以通过 近期对话部分返回对话。

积极提问

您可以提出问题,从数据中获取数据洞见。您可以使用建议的问题作为探索数据和熟悉对话分析的起点。

询问数据源相关问题

创建对话后,您可以在屏幕底部的 提问字段中询问数据相关问题。

问题无需采用特定格式或使用特定语法。不过,它们需要与您选择的数据源相关。在您输入查询后,对话分析功能可能会改写您的问题,改写后的问题会在对话窗口中显示在原始问题后面。例如,对话式分析可能会将“用户年龄的平均值是多少?”重述为“用户平均年龄是多少?”

在您继续对话时,对话分析功能会将之前的问题和答案纳入考量。您可以利用之前的回答,通过进一步优化结果或更改可视化图表类型来进一步完善回答。

如需有关创建题目的更多指导,请参阅最佳做法

建议的问题

如果您不熟悉数据或不确定如何着手,可以先从建议的问题开始对话。当您开始新对话时,对话分析会在我可以询问哪些问题?标题下提供建议的开场问题。点击建议的问题以生成答案。

对话开始后,您还可以在可收起的存储 数据面板中,在尝试询问标题下找到建议的问题。点击建议的问题以生成答案。

管理对话中的询问

与数据对话时,您可以通过在正在运行时停止有效的查询响应删除最近的问题及其响应来管理对话。

停止查询响应

如需在发送消息后停止运行查询,请点击 Stop response(停止响应)。对话分析会停止运行查询,并显示以下消息:The query was cancelled.

删除最近的问题

如需删除最新的问题及其回答,请按以下步骤操作:

  1. 将光标悬停在最新的问题上,然后点击 删除消息
  2. 要永久删除消息吗?对话框中,点击删除以永久删除相应问题及其回答。

了解查询结果和计算

当您在对话分析中询问数据相关问题时,系统的回答可能包括可视化图表、数据表格或其他详细信息,具体取决于您的具体查询和关联的数据。

除了此查询响应之外,对话式分析还提供了以下选项来帮助您了解查询结果和计算方式:

确定答案的计算方式

如需了解对话式分析如何得出回答或创建可视化图表,请点击查询结果中的 这是如何计算的?

点击这是如何计算出来的?后,对话式分析会显示文本部分。文本部分以纯文本形式说明了对话分析功能为得出给定答案而采取的步骤。此说明包含所用原始字段名称、所执行的计算、应用的过滤条件、排序顺序和其他详细信息。

获取更多数据洞见

当对话式分析能够提供有关某个回答的更多数据洞见时,该回答下方会显示数据洞见 keyboard_arrow_down 按钮。点击数据分析 keyboard_arrow_down,查看与您的查询相关的更多信息。数据分析仅分析您的问题返回的数据,不会运行其他查询来提取其他数据。数据分析可以提供有用的提示,帮助您构思后续问题以继续对话。

以下示例展示了“每个状态有多少用户?”这一问题可能返回的一些数据洞见:

  • 高数据量区域和低数据量区域的概要说明。例如:
    • “根据所提供的数据,加利福尼亚州、德克萨斯州和俄亥俄州是开展业务的关键州。”
    • “英格兰和中国特定地区(即安徽和广东)的业务活动非常活跃。”
    • “根据数据,有些州(包括三重县、秋田县和岩手县)的存在感很低。”
  • 对数据集的变异性的评估。例如,“数据表明不同地理位置的运营规模各不相同。”

使用代码解释器启用高级分析

对话式分析中的代码解析器会将您的自然语言问题转换为 Python 代码,并执行该代码。与基于标准 SQL 的查询相比,代码解析器使用 Python 可以执行更复杂的分析和可视化操作。如需详细了解如何启用代码解析器,请参阅对话分析代码解析器

已知限制

对话式分析功能存在以下已知限制。

可视化图表的限制

对话分析利用 Vega-lite 生成对话图表。完全支持以下 Vega 图表类型:

  • 折线图(一个或多个系列)
  • 面积图
  • 条形图(水平、垂直、堆叠)
  • 散点图(一个或多个组)
  • 饼图

系统支持以下 Vega 图表类型,但您在渲染这些图表时可能会遇到意外行为:

  • 地图
  • 热图
  • 带有提示的图表

不支持 Vega 目录之外的图表类型。本部分未指定的任何图表都被视为不受支持。

数据源限制

对话式分析功能存在以下数据源限制:

  • 对于 Looker 数据,对话式分析功能每个查询最多可返回 5,000 行。
  • 对话式分析不支持 BigQuery 的灵活列名称功能。
  • 对停用了报告中的字段修改功能的数据源,对话式分析功能的效果不佳,因为此设置会阻止对话式分析功能创建计算字段。
  • 当数据源为 Looker 时,对话式分析无法设置使用 LookML parameter 参数定义的仅限过滤条件的值。

问题限制

对话式分析支持可通过单个可视化图表回答的问题,例如:

  • 指标随时间的变化趋势
  • 指标按维度细分或分布的情况
  • 一个或多个维度的非重复值
  • 单个指标值
  • 维度值排行榜(按指标排序)

对话式分析目前不支持仅可通过以下类型的复杂可视化图表回答的问题:

  • 指标随时间的变化百分比,包括对比分析
  • 预测和预报
  • 高级统计分析,包括相关性和异常检测

管理会话

您可以更改对话的名称、删除对话,或从回收站文件夹中恢复对话。

为对话命名

对话分析会根据您的第一个问题和回答自动生成对话标题。如需更改生成的名称,请按以下步骤操作:

  1. 近期对话面板中,打开对话。
  2. 点击页面顶部的标题。
  3. 输入新的对话名称。
  4. 如需保存更改,请点击页面上的其他位置,或按 Return 键(Mac)或 Enter 键(PC)。

对话名称已更改为“我的营销报告”。

删除对话

您可以将对话移至回收站、从回收站中恢复对话,或永久删除对话。

将对话移至回收站

如需将对话移至回收站,请按以下步骤操作:

  1. 前往对话式分析
  2. 近期对话面板中,打开要移至回收站的对话。
  3. 在所选对话中,点击 移至回收站

恢复或永久删除对话

如需从回收站中恢复或永久删除对话,请按以下步骤操作:

  1. 在对话分析中,选择左侧导航面板中的回收站 ,查看已移至回收站的对话列表。
  2. 回收站部分中,点击要恢复或永久删除的对话的名称。
  3. 确定吗?对话框中,选择以下选项之一:
    • 取消:取消操作。
    • 恢复:恢复对话。您可以通过对话分析工具左侧导航菜单的 Recent(近期)部分访问对话。
    • 永久删除:永久删除对话。

搜索对话

如需按标题搜索特定对话,请按以下步骤操作:

  1. 前往对话式分析
  2. 搜索对话分析搜索栏中,输入您的搜索查询。在您输入时,系统会显示与您的搜索查询匹配的标题对话列表。
  3. 从搜索结果中选择一个对话,以打开该对话。

最佳做法

请查看以下最佳实践,帮助对话分析提供最实用的回答。

设置数据源

以理想的方式设置数据源有助于对话分析提供最实用的答案。创建数据源时,请考虑遵循以下最佳实践:

  • 仅在数据源中添加应供最终用户用于分析的字段。
  • 为每个字段指定一个清晰简洁的名称。
  • 为每个字段提供清晰的说明,并在适当情况下提供示例值。这些字段说明包含在发送到对话式分析的提示中,有助于提供背景信息。示例值对于字符串字段尤其有用。

如果您使用的是 Looker Studio 数据源,请考虑以下其他最佳实践:

  • 您可以完全排除不应用于分析的字段,也可以在数据源中隐藏这些字段
  • 您可以添加或修改字段说明,为对话分析提供背景信息。
  • 如果您看到意外结果,请检查数据源,并确认字段类型和默认汇总设置是否正确。

提示

为对话分析撰写问题时,请考虑遵循以下最佳实践:

  • 请尽可能使用数据源中包含的确切字段名称。这有助于对话式分析对名称相似的列进行区分。

  • 如需通过纳入或排除特定数据来缩小结果范围,请尽可能直接说明字段和过滤条件值。例如,请改为查询“国家/地区为德国的销售额”或“区域为德国的销售额”,而不是“德国销售额”。

如需考虑类似名称的列等情况,或者允许用户将“德语”“德国”和“DE”等字词互换使用,不妨考虑创建可处理这些变体的自定义数据代理

数据服务智能体

数据代理基于对话分析的强大功能,进一步优化了没有商业智能专业知识的用户的体验,帮助他们从数据中获取价值。借助数据代理,您可以使用特定于您数据的情境和指令来自定义依托 AI 技术的数据查询代理。

例如,您可以将“忠实”客户定义为在特定时间范围内完成了 5 笔以上购买交易的客户。或者,您希望节省用户的时间,因此数据代理的所有回答都应以 20 个字或更少的字数进行总结。此外,您还希望数字的格式符合公司标准。您可以使用这些类型的说明等来构建数据代理,让其了解用户希望如何与您的数据互动。如需了解详情,请访问数据代理文档页面。

提供反馈

您可以通过以下任一方式向 Google 提供有关对话分析的反馈:

  • 选择以下选项之一,为各个回答评分:
    • thumb_up 好评:表示回复很有用。
    • thumb_down 答得不好:表示回答没有帮助。
  • 如需发送详细反馈,请点击对话式分析左侧导航面板底部的发送反馈

如果您要分享负面反馈,可以选择添加更多详细信息,包括对话内容的副本。