您可以将数据从提供 CSV(逗号分隔值)文件的任何来源导入到 Looker 中的 Studio。您可以直接从计算机上传 CSV 文件。
创建 CSV 文件数据源
Looker 中的 Studio 会将上传的 CSV 文件存储在数据集中。一个数据集可以包含一个或多个具有相同列标题的 CSV 文件。CSV 文件数据源可以包含一个或多个数据集。
如需创建新的 CSV 文件数据源,请按以下步骤操作:
- 在 Looker 中登录 Studio。
- 点击创建按钮,然后选择数据源。
- 选择 CSV 文件上传 Google 连接器。
- 点击添加数据集按钮,创建新数据集。
- 您还可以将一个或多个 CSV 文件拖动到可用数据集部分,Looker 中的 Studio 将创建一个包含上传文件的新数据集。
- 上传完文件后,点击关联按钮。
您上传的数据会存储在 Cloud Storage 中。这种存储设置有很多优势,包括能够从云端访问和下载数据,以及能够将数据用于其他 Google Cloud 服务。
将 CSV 文件添加到数据集
您可以将多个文件上传到一个数据集,前提是列标题一致。当您添加新文件时,系统会将这些数据附加到数据集中。这样,您就可以随着时间的推移更新数据。
如需向数据集添加 CSV 文件,请按以下步骤操作:
- 在 Looker 中登录 Studio。
- 点击数据源标签页。
- 选择包含 CSV 文件的数据源。
- 点击修改连接。
- 在可用数据集部分,选择要从中添加文件的数据集。
- 点击添加文件按钮。
- 您还可以将一个或多个 CSV 文件拖动到数据集中的文件部分。
- 上传文件后,点击重新连接按钮。
共享数据集
您创建的数据集归您所有,不可共享。不过,创建基于数据集的数据源后,您可以与其他用户共享该数据源。这意味着,您的数据集可在共享的数据源和报告中使用,但只有您可以访问数据集本身。
上传文件格式
请确保您上传的文件格式正确无误。否则,上传过程中可能会出现错误,或者您的数据在报告中可能看起来不正确。
内容错误的常见原因是上传的数据中分隔符、引号和换行符的使用不当。了解 CSV 文件上传功能如何处理这些问题,有助于您日后避免麻烦。
UTF-8 编码
上传的文件应采用 UTF-8 编码。这是 Web 上大多数应用的标准编码。
不过,如果您要从某些桌面产品(例如 Microsoft Excel™)导出数据,则可能需要先将文件转换为 UTF-8,然后才能使用 Looker 中的 Studio 将其上传。否则,Looker 中的 Studio 可能会返回 File is Invalid.
等错误消息
仅限表格数据
CSV 文件上传功能只能导入表格数据文件。这意味着,您的文件必须采用行和列的常规结构。每行必须有相同的列数,即使表格中的某个单元格缺少数据也是如此。如果尝试上传包含合并的单元格或结构不一致的文件,上传将会失败并出现上传错误。
分隔符
数据中的所有字段都必须以英文逗号分隔。
如果您要上传的字段中的实际数据中包含英文逗号,则必须用英文引号括住该字段。如果您的数据包含双引号,您可以使用单引号字符将字段括起来。
标题行
文件中的第一行必须是标题行。此行会告知 Looker 中的 Studio 如何为字段命名。字段名称必须是唯一的,因此标题行中不能有重复的值。
列名称必须:
- 只能包含字母、数字或下划线。不允许使用其他标点符号或特殊字符。
- 以字母或下划线开头
- 长度不得超过 128 个字符
标题行还必须遵循分隔符规则。
换行符
文件中的每一行都必须以换行符结尾。CSV 文件上传功能不支持数据中包含换行符,即使这些换行符已用引号转义也是如此。
问题排查
以下部分介绍了您在上传 CSV 文件时可能会遇到的常见错误。
错误:文件无效
如果 Looker 中的 Studio 在尝试上传 CSV 文件后显示错误 File is Invalid
,请检查以下可能的原因:
- 文件包含无效的 UTF-8 字符。
- 该文件实际上不是 CSV 文件。例如,如果您将 PDF 文件重命名为使用“.csv”扩展名,Looker 中的 Studio 将无法正确解析该文件。
CSV 文件上传限制
CSV 文件上传受以下限制的约束:
- 每位用户 1,000 个数据集
- 每位用户总计 2 GB 存储空间
- 每个数据集每天 100 次上传
- 每个数据集的文件大小上限为 100MB