将 CSV 文件上传到 Looker 中的 Studio

您可以将数据从提供 CSV(逗号分隔值)文件的任何来源导入到 Looker 中的 Studio。您可以直接从计算机上传 CSV 文件。

创建 CSV 文件数据源

Looker 中的 Studio 会将上传的 CSV 文件存储在数据集中。一个数据集可以包含一个或多个具有相同列标题的 CSV 文件。CSV 文件数据源可以包含一个或多个数据集。

如需创建新的 CSV 文件数据源,请按以下步骤操作:

  1. 在 Looker 中登录 Studio。
  2. 点击创建按钮,然后选择数据源
  3. 选择 CSV 文件上传 Google 连接器。
  4. 点击添加数据集按钮,创建新数据集。
    • 您还可以将一个或多个 CSV 文件拖动到可用数据集部分,Looker 中的 Studio 将创建一个包含上传文件的新数据集。
  5. 上传完文件后,点击关联按钮。

您上传的数据会存储在 Cloud Storage 中。这种存储设置有很多优势,包括能够从云端访问和下载数据,以及能够将数据用于其他 Google Cloud 服务。

详细了解 Cloud Storage

将 CSV 文件添加到数据集

您可以将多个文件上传到一个数据集,前提是列标题一致。当您添加新文件时,系统会将这些数据附加到数据集中。这样,您就可以随着时间的推移更新数据。

如需向数据集添加 CSV 文件,请按以下步骤操作:

  1. 在 Looker 中登录 Studio。
  2. 点击数据源标签页。
  3. 选择包含 CSV 文件的数据源。
  4. 点击修改连接
  5. 可用数据集部分,选择要从中添加文件的数据集。
  6. 点击添加文件按钮。
    • 您还可以将一个或多个 CSV 文件拖动到数据集中的文件部分。
  7. 上传文件后,点击重新连接按钮。

共享数据集

您创建的数据集归您所有,不可共享。不过,创建基于数据集的数据源后,您可以与其他用户共享该数据源。这意味着,您的数据集可在共享的数据源和报告中使用,但只有您可以访问数据集本身。

上传文件格式

请确保您上传的文件格式正确无误。否则,上传过程中可能会出现错误,或者您的数据在报告中可能看起来不正确。

内容错误的常见原因是上传的数据中分隔符、引号和换行符的使用不当。了解 CSV 文件上传功能如何处理这些问题,有助于您日后避免麻烦。

UTF-8 编码

上传的文件应采用 UTF-8 编码。这是 Web 上大多数应用的标准编码。

不过,如果您要从某些桌面产品(例如 Microsoft Excel™)导出数据,则可能需要先将文件转换为 UTF-8,然后才能使用 Looker 中的 Studio 将其上传。否则,Looker 中的 Studio 可能会返回 File is Invalid. 等错误消息

仅限表格数据

CSV 文件上传功能只能导入表格数据文件。这意味着,您的文件必须采用行和列的常规结构。每行必须有相同的列数,即使表格中的某个单元格缺少数据也是如此。如果尝试上传包含合并的单元格或结构不一致的文件,上传将会失败并出现上传错误。

分隔符

数据中的所有字段都必须以英文逗号分隔。

如果您要上传的字段中的实际数据中包含英文逗号,则必须用英文引号括住该字段。如果您的数据包含双引号,您可以使用单引号字符将字段括起来。

标题行

文件中的第一行必须是标题行。此行会告知 Looker 中的 Studio 如何为字段命名。字段名称必须是唯一的,因此标题行中不能有重复的值。

列名称必须:

  • 只能包含字母、数字或下划线。不允许使用其他标点符号或特殊字符。
  • 以字母或下划线开头
  • 长度不得超过 128 个字符

标题行还必须遵循分隔符规则

换行符

文件中的每一行都必须以换行符结尾。CSV 文件上传功能不支持数据中包含换行符,即使这些换行符已用引号转义也是如此。

问题排查

以下部分介绍了您在上传 CSV 文件时可能会遇到的常见错误。

错误:文件无效

如果 Looker 中的 Studio 在尝试上传 CSV 文件后显示错误 File is Invalid,请检查以下可能的原因:

  • 文件包含无效的 UTF-8 字符
  • 该文件实际上不是 CSV 文件。例如,如果您将 PDF 文件重命名为使用“.csv”扩展名,Looker 中的 Studio 将无法正确解析该文件。

CSV 文件上传限制

CSV 文件上传受以下限制的约束:

  • 每位用户 1,000 个数据集
  • 每位用户总计 2 GB 存储空间
  • 每个数据集每天 100 次上传
  • 每个数据集的文件大小上限为 100MB

数据源简介