从 Looker(原始版本)到 Looker (Google Cloud Core) 的自助迁移

本文档概述了将现有 Looker 实例从 Looker(原始版本)环境迁移到 Looker (Google Cloud Core) 的技术步骤。

Looker (Google Cloud Core) 是一种与 Google Cloud 平台深度集成的部署环境。Looker (Google Cloud Core) 托管在 Google Cloud 基础架构上;您可以直接通过 Google Cloud 控制台进行管理;并且它与 Google Cloud的许多其他产品、服务和功能深度集成。

准备工作

  1. 查看以下文档,熟悉 Google Cloud 原则和工具:
  2. 请与您的客户代表联系,了解迁移事宜以及您的 Looker(原始版本)实例是否符合迁移条件。如果您的实例符合条件,并且您已升级现有 Looker(原始版本)合同以涵盖 Looker (Google Cloud Core),则可以按照本文档中的步骤迁移实例。
  3. 如需获得准备迁移所需的权限,请让管理员向您授予 Google Cloud Looker Looker (Google Cloud Core) 实例将驻留的项目的以下 IAM 角色:

    • 创建 Looker (Google Cloud Core) 实例: Looker 管理员 (roles/looker.admin)。
    • 在您的 Google Cloud 项目中分配 IAM 角色: Project IAM Admin (roles/resourcemanager.projectIamAdmin)。
    • 创建 Cloud Storage 存储桶: Storage Admin (roles/storage.admin)。

    如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限

    您也可以通过自定义角色或其他预定义角色来获取所需的权限。

  4. 如需管理 Looker(原始版本)实例以准备迁移,您必须拥有该实例中的 Admin Looker 角色。
  5. 创建新的“空”Looker (Google Cloud Core) 实例。

    请务必为新的 Looker (Google Cloud Core) 实例选择合适的版本、网络连接类型(公共 IP 或专用 IP)和其他配置属性(CMEK、VPC-SC),以确保该实例具备必要的功能。Looker (Google Cloud Core) 中的某些功能取决于所选版本所选网络类型

    使实例保持“空”状态;不要向其中填充任何数据,例如模型文件、用户、连接、探索、信息中心或文件夹。在导入步骤中,所有设置或内容都将被清除,并替换为迁移的数据。

    不过,通过 Google Cloud 控制台指定的 Looker (Google Cloud Core) 配置属性,或只能在创建实例期间指定的配置属性,在迁移过程中不会被覆盖。

概览

概括来讲,迁移过程包括以下步骤。

  1. 确保 Looker(原始版本)实例已做好迁移准备。
  2. 从 Looker(原始版本)实例导出数据。
  3. 将数据导入新的“空”Looker (Google Cloud Core) 实例。
  4. 完成 Looker (Google Cloud Core) 实例的设置。
  5. 停用 Looker(原始版本)实例。

以下各部分详细介绍了这些步骤。

确保 Looker(原版)实例已做好迁移准备

您的 Looker(原始)实例必须满足以下前提条件,才能进行迁移:

  • 您的 Looker(原始版本)实例必须由 Google 管理(即不是客户托管),并且托管在 Google Cloud 或 Amazon Web Services 上。
  • 您的 Looker(原始版本)实例必须使用当前 Looker (Google Cloud Core)版本一个月内的版本。如需查找当前的 Looker (Google Cloud Core)版本,请参阅 Looker 版本说明,并找到最新的部署公告。

此外,在迁移之前,请执行以下活动:

  • Looker(原始版本)与 Looker (Google Cloud Core) 之间存在少量功能差异。请查看这些差异,确保 Looker (Google Cloud Core) 中的功能能够满足您的持续需求。

  • 迁移会复制所有生产模式项目及其包含的模型文件,但不会复制属于个人用户的开发模式项目。为确保开发模式文件通过迁移进行转移,您必须在启动迁移之前将所有开发模式项目中的所有文件提交到 Git 代码库

  • Looker (Google Cloud Core) 仅支持 Google OAuthSAMLOpenID Connect 身份验证方法。

  • 在迁移期间,两个 Looker 实例(一个 Looker [原始版本] 实例和一个 Looker (Google Cloud Core) 实例)将并行运行一段时间。发生的任何自动活动(例如提醒和预定数据传送,以及访问后端数据库的后台活动)都可能会重复。为避免重复活动,请在 Looker(原始版本)或 Looker (Google Cloud Core)实例中删除自动提醒和安排。

从 Looker(原始)实例导出数据

从 Looker(原始版本)实例导出数据需要执行两个步骤:

  1. 创建用于存储迁移数据的位置
  2. 启动导出

创建用于存储迁移数据的位置

在创建 Looker (Google Cloud Core) 实例的同一 Google Cloud 项目中执行以下所有操作。

  1. 创建一个新的 Cloud Storage 存储桶(例如 <bucket-name>)。
    • 此存储桶将用于存储迁移数据。
    • 请按照创建存储分区文档页面上的说明操作。
    • 请注意,<bucket-name> 在所有 Google Cloud中必须是唯一的。我们建议在存储桶名称前添加唯一标识符(例如您的项目 ID)。
  2. 确定 Cloud Storage 存储桶区内文件夹的名称(例如 <folder-name>)。现在不要创建该文件夹。在导出请求期间指定文件夹名称。系统会在导出过程中自动创建该文件。
  3. 在 Cloud KMS 中创建密钥环和密钥(例如 <kms_keyring_id><kms-key-id>)。
  4. 专门为迁移创建新的服务账号(例如 <export-service-account>)。
  5. <export-service-account> 授予以下两个特定 IAM 角色:

  6. 创建与 <export-service-account> 关联的服务账号密钥,并下载 JSON 密钥文件。

请求导出

确保实例已准备好进行迁移、创建“空”Looker (Google Cloud Core) 实例并创建用于存储迁移数据的位置后,在 Looker(原始)实例的管理面板中,于导出页面中输入以下信息:

  • 您创建的 Cloud Storage 存储桶的名称。
  • Cloud Storage 文件夹名称 - 在导出期间,系统会自动创建具有此名称的文件夹。导出完成后,导出文件将显示在您创建的 Cloud Storage 存储桶中相应文件夹内的一个带有时间戳的子文件夹中。
  • KMS 密钥名称
  • 包含服务账号密钥的 JSON 文本。

导出页面上输入信息后,点击请求导出以开始导出。

导出过程需要几分钟到几小时。导出完成后,您会在 Cloud Storage 存储桶和文件夹中看到多个导出文件(采用非人类可读格式)。这些文件是后续导入步骤的输入。

将数据导入新的“空”Looker (Google Cloud Core) 实例

导出实例数据后,您可以将其导入 Looker (Google Cloud Core) 实例。

按照将数据从 Cloud Storage 导入 Looker (Google Cloud Core) 实例页面上的说明操作,并将命令指向放置导出文件的存储桶和文件夹。

简而言之,这需要执行以下操作:

  1. Looker 服务账号(而非 <export-service-account>)授予以下角色,以获取对存储桶和 KMS 密钥的访问权限:
  2. 通过 Google Cloud 控制台或 gcloud CLI 触发导入

导入操作需要几分钟到几小时的时间。完成后,Looker (Google Cloud Core) 实例将重启,并包含所有迁移的数据。

完成 Looker (Google Cloud Core) 实例的设置

此时,Looker 管理员可以前往实例网址登录实例以完成设置。

迁移过程会尽可能多地复制 Looker(原始)实例配置。不过,有些项无法迁移,或者在 Looker (Google Cloud Core) 中的运作方式略有不同,必须进行调整。

以下是一些已知需要特别注意的商品:

常规设置(位于 Looker 的管理面板中)

常规设置(以及管理面板中的其他设置)的大部分选项不会自动复制,因为它们往往不同,或者在 Looker (Google Cloud Core)中不存在相同形式的选项。您应根据所选的 Looker (Google Cloud Core) 配置仔细查看并配置所有设置。如需详细了解 Looker (Google Cloud Core) 中的设置,请参阅通过 Looker 管理 Looker (Google Cloud Core) 实例通过 Google Cloud 控制台管理 Looker (Google Cloud Core) 实例文档页面。

用户

Looker (Google Cloud Core) 仅支持 Google OAuthSAMLOpenID Connect 身份验证方法。

如果 Looker(原始)实例也配置了 Google OAuth,则系统会复制用户记录及其属性(前提是这些记录和属性在两个实例中都与同一 Google ID 和电子邮件地址相关联)。项目 IAM 管理员必须向每位用户授予 Google Cloud 项目(实例所在的项目)的 Looker 管理员或 Looker 实例用户 IAM 角色

如果 Looker(原始)实例已配置为使用 SAML 或 OpenID Connect,请确保相应身份验证方法的合并用户时使用字段仅指示 LookerLooker (Google Cloud Core)支持的身份验证方法

如果 Looker(原始版本)实例的某些用户是通过 Looker (Google Cloud Core) 不支持的机制(例如 LDAP 或电子邮件地址/密码)进行身份验证的,则需要重新创建这些用户账号,并将其转换为受支持的身份验证方法。

数据库连接数

Looker(原始版本)相比,Looker (Google Cloud Core) 支持的数据库方言略有不同。系统会复制数据库连接的所有配置属性(包括连接字符串和密码,如果适用)。不过,Looker (Google Cloud Core)中不同的网络拓扑可能会导致数据库连接无法立即正常运行。例如,如果通过特定于 Looker(原始)实例的防火墙或隧道访问数据库,您可能需要重新配置防火墙或隧道。您应测试每个连接,并在必要时重新建立连接。

使用 OAuth 的数据库连接

从 Looker(原始)迁移到 Looker (Google Cloud Core)不会保留各个用户与 BigQuerySnowflake 之间的数据库连接的 OAuth 访问令牌或刷新令牌。迁移后,当 Looker (Google Cloud Core) 用户查看引用 OAuth 数据库连接的探索或信息中心时,系统会提示他们重新进行 OAuth 身份验证。用户还可以前往账号页面,然后在 OAuth 连接凭据标题下为每个数据库选择登录,以重新向数据库进行身份验证。任何由单个用户拥有并引用 OAuth 连接的自动化安排或提醒都会中断,直到该用户使用其 OAuth 凭据登录为止。

Git 代码库连接

如果实例使用的是裸 Git 代码库,则这些代码库应无需修改即可正常运行(已复制,但未共享)。但如果实例连接到远程代码库,则可能需要验证并重新启用这些连接,这与数据库连接类似。

其他网络配置

Looker 实例可能具有其他类型的入站和出站网络连接(例如,在专用 IPAction HubMarketplace电子邮件等上下文中)。这些网络连接也必须经过验证。

用于访问 Looker (Google Cloud Core) 实例的网址

Looker (Google Cloud Core) 实例附带随机分配的主网址。如果需要通过特定网址访问实例,您可以配置自定义网域

日程和提醒

如果 Looker(原始版本)实例和 Looker (Google Cloud Core) 实例同时处于活跃状态,它们可能会生成重复的预定操作和提醒,并执行访问已连接数据库的重复后台操作。应尽快在其中一个实例中停用这些活动。

任何由单个用户拥有并引用该用户个人 OAuth 连接的自动化安排或提醒都将失效,直到该用户使用其 OAuth 凭据登录为止。

维护窗口

与 Looker(原始版本)不同,Looker (Google Cloud Core) 可以指定维护政策

Elite 系统活动

在迁移过程中,系统不会复制精英系统活动数据。Looker (Google Cloud Core) 实例将以全新的历史记录启动。

自定义网域

您可以为 Looker (Google Cloud Core) 实例创建自定义网域。您必须设置 DNS 记录,以确保 SSL 证书部署成功。此外,请务必在启用自定义网域并设置身份验证方法后,将身份验证客户端中的回调网址更新为自定义网域。无法使用 looker.com 网域为 Looker (Google Cloud Core) 创建自定义网域。

如果您想使用 Looker (原始) 实例的自定义网址为 Looker (Google Cloud Core) 实例创建自定义网域,则应在迁移完成后,并确认 Looker (Google Cloud Core) 实例已准备就绪后,再设置自定义网域。启用自定义网域后,用户访问实例网址时将看到 Looker (Google Cloud Core) 实例,而不是 Looker(原始版本)实例。

在 Looker (Google Cloud Core) 实例准备就绪、DNS 记录已更新且自定义网域已启用之前,请勿为该实例设置 SAML 或 OpenID Connect。

书签

如果您在 Looker(原始版本)实例中使用自定义网址(不使用 looker.com 网域),那么如果您为 Looker (Google Cloud Core)实例创建自定义网域,并使用与 Looker(原始版本)实例相同的网址,此迁移过程应会保留用户的书签。

启用自定义网域后,指向 Looker(原始版本)内容的书签(例如 https://www.yourcustomdomain.com/dashboard/123)将指向 Looker (Google Cloud Core) 实例中的相应内容。(注意:Looker (Google Cloud Core) 的企业版嵌入版在其网址中使用的是字母数字内容 slug,而不是数字内容 ID,但带有内容 ID 的书签仍会正确重定向到相同的内容。)

此流程无法用于使用网域 looker.com 的 Looker(原始)网址。

该列表并不详尽。在考虑迁移是否完成之前,请测试实例中对您而言最重要的所有方面。

迁移完成后,如果您确定不需要再次导出,可以删除之前创建的 <export-service-account>,这样一来,为此共享的 JSON 密钥就会失效。

停用 Looker(原始版本)实例

迁移后的 Looker (Google Cloud Core) 实例正常运行后,您可以向用户发送该实例的网址,并指示他们开始访问该实例,停止访问 Looker(原始版本)实例。

问题排查

以下部分可帮助您解决导入或导出期间的问题。

导出期间出现的问题

如果 Looker(原始)数据导出存在问题,管理面板的导出页面上会显示错误状态。点击错误状态会显示一条错误消息。

以下是常见的错误来源:

  • Cloud Storage 存储桶、KMS 密钥或 <export-service-account> 无效。
  • <export-service-account> 缺少必要的权限。

在提交导出请求之前,最好先确认这些对象的状态。

导入期间出现的问题

如果导入操作在 4 小时后(如果源实例非常大,则可能需要更长时间)仍未完成,或者因错误而退出,您可能需要向 Cloud Customer Care 提交支持请求来解决此问题。对于此操作,直接面向客户的诊断信息相对较少。

后续步骤