连接第三方数据源

本页介绍了如何将第三方数据源连接到 Vertex AI Search。

当您连接第三方数据源时,Vertex AI Search 会创建一个数据连接器,并为您指定的实体将数据存储区(称为实体数据存储区)与该连接器相关联。实体类型因您要连接的数据源而异。例如,Jira Cloud 实体包括问题、附件、评论和工作日志。

第三方数据源仅适用于通用搜索应用。Chat、推荐和客服应用无法使用第三方数据源。

第三方连接器与 CMEK 不兼容。

如需改为从 Google 数据源导入数据,请参阅创建搜索数据存储空间

准备工作

  1. 请与您的 Google 客户支持团队联系,要求将您添加到第三方数据源连接器的许可名单中。

  2. 前往您计划使用的来源对应的部分:

关联 Confluence Cloud

请按照以下步骤将数据从 Confluence Cloud 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需了解如何设置访问权限控制,请参阅使用数据源访问权限控制

  • 请准备好以下身份验证信息:

    • 实例网址。采用 https://EXAMPLE.atlassian.net 格式,例如 https://google.atlassian.net

    • 实例 ID。这是 cloudid,您可以通过前往 https://EXAMPLE.atlassian.net/_edge/tenant_info 并复制 cloudId 的值来找到它。

  • 启用 OAuth 2.0 并获取客户端 ID 和客户端密钥。

    使用 https://vertexaisearch.cloud.google.com/console/oauth/confluence_oauth.html 作为回调网址。如需了解如何为 Confluence Cloud 启用 OAuth 2.0 并获取客户端 ID 和客户端密钥,请参阅 Atlassian Developer 文档中的 OAuth 2.0 (3LO) 应用

  • 设置 OAuth 2.0 权限范围时,请配置以下范围:

  • 为了正确应用用户权限,每个 Confluence Cloud 用户都必须向所有用户公开其电子邮件地址。为此,请在 Confluence Cloud 中更改电子邮件公开范围设置,并将公开范围设置为 Anyone。如需了解详情,请参阅 Atlassian 文档中的设置电子邮件公开范围

控制台

如需使用 Google Cloud 控制台将数据从 Confluence Cloud 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储区

  3. 点击新建数据存储区

  4. 选择数据源页面上,前往第三方来源部分,然后选择 Confluence

  5. 输入您的身份验证信息,然后点击身份验证

  6. 系统随即会打开一个新窗口。输入实例用户名和密码。 请先检查身份验证是否成功,然后再返回为数据存储区指定 Confluence 来源页面。

  7. 选择要同步的实体,然后点击继续

  8. 为数据连接器选择一个区域。

  9. 为数据连接器输入名称。

  10. 选择同步频率。

  11. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  12. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看相关详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    提取过程可能需要几分钟或几小时,具体取决于数据的大小。

后续步骤

关联 Jira Cloud

请按照以下步骤将数据从 Jira Cloud 同步到 Vertex AI Search。

首次设置数据源并导入数据后,您可以选择数据存储区与该数据源同步的频率。

准备工作

在设置连接之前,请执行以下操作:

  • 设置访问权限控制。确保为您的数据源正确配置了访问权限控制。此步骤可确保只有获得授权的用户才能访问和管理数据。如需了解详情,请参阅使用数据源访问权限控制文档。
  • 为了正确应用用户权限,Jira Cloud 用户必须提供共享同意声明。
  • 确保您拥有 Atlassian 账号、Jira 实例和项目。
  • 验证您是否对 Jira 实例和项目拥有管理员访问权限。

在 Jira 中设置身份验证和权限

按照以下部分中的说明操作,确保您拥有必要的身份验证详细信息以及对 Jira 实例的管理员访问权限。通过 Atlassian 开发者控制台创建客户端 ID 和客户端密钥,配置所需的 OAuth 2.0 范围,并为用户设置权限。最后,检索实例网址和 ID、配置角色并进行身份验证,以便在 Jira Cloud 和 Vertex AI Search 之间同步数据。

创建客户端 ID 和客户端密钥

  1. 登录 developer.atlassian.com
  2. 点击右上角的个人资料图标,然后选择 Developer Console(开发者控制台)。
  3. 点击创建,然后选择 OAuth 2.0 集成
  4. 输入应用的名称。
    • 勾选条款及条件复选框。
    • 点击创建
  5. 您会看到五个选项:概览分发权限授权设置。从授权开始:

    a. 点击授权

    b. 在授权类型表格中,针对 OAuth 2.0 (3LO) 选择添加

  6. 回调网址字段中,输入 https://vertexaisearch.cloud.google.com/console/oauth/jira_oauth.html,然后点击保存更改

    注意:如果您看到以下警告:您的应用没有任何 API。向应用添加 API。,我们将在下一部分中介绍这一点。

  7. 选择权限

    a. 前往 Jira API,点击添加,然后点击配置

    注意:点击添加后,该按钮会变为配置

    b. 前往传统镜重标签页,然后点击修改镜重。选择以下范围:

    确认已选择 7 个镜重,然后保存更改。

  8. 点击分发,选择修改,然后执行以下操作:

    • 请先选择共享单选按钮,以便修改其他字段。
    • 填写其余字段。
    • 当系统提示时,选择Does your app store personal data?
  9. 选择设置以复制您的客户端 ID客户端密钥

检索实例网址和实例 ID

如需获取实例网址,请执行以下操作:

  1. 前往 atlassian.net,然后使用您的管理员账号登录。
  2. 选择要同步的应用。例如,同步第一个应用。
  3. 找到实例网址,即地址栏中的子网域。代码应如下所示:Assign appropriate permissions

如需获取实例 ID,请执行以下操作:

  1. 打开一个新标签页,复制实例网址,然后将 /_edge/tenant_info 附加到实例网址。例如 https://YOUR-INSTANCE.atlassian.net/_edge/tenant_info
  2. 前往该链接,找到 cloudId 值。cloudId 是您的实例 ID。

设置权限和角色

  1. 使用您的管理员账号登录 atlassian.com
  2. 点击左上角的菜单图标,或前往 admin.atlassian.com
  3. 管理页面上,点击管理用户,然后前往群组页面。

  4. 点击创建群组。输入群组名称并创建群组。

  5. 在新建群组的页面中,点击“群组商品访问权限”部分中的向群组添加商品

  6. 对于 Jira,请选择 User access admin 作为产品角色。

  7. 对于 Jira Admin,请选择 Product admin 作为产品角色,然后保存更改。

  8. 群组页面上,点击添加群组成员,然后添加接口将以哪些用户或账号进行身份验证。

创建 Jira Cloud 连接器

控制台

如需使用 Google Cloud 控制台将数据从 Jira Cloud 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储区

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源部分,然后选择 Jira

  5. 输入您的身份验证信息,然后点击身份验证

  6. 系统随即会打开一个新窗口。输入实例用户名和密码。 请先检查身份验证是否成功,然后再返回为数据存储区指定 Jira 来源页面。

  7. 选择要同步的实体,然后点击继续

  8. 为您的数据存储区选择一个区域。

  9. 为数据存储区输入名称。

  10. 选择同步频率。

  11. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  12. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看相关详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    提取过程可能需要几分钟或几小时,具体取决于数据的大小。

后续步骤

关联 Salesforce

请按照以下步骤将数据从 Salesforce 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

准备工作

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需了解如何设置访问权限控制,请参阅使用数据源访问权限控制

  • 请准备好以下身份验证信息。如需了解如何在 Salesforce 中设置客户端 ID 和客户端密钥,请参阅 Salesforce 文档中的为 OAuth 2.0 客户端凭据流程配置关联的应用

    • 实例网址:您的 Salesforce 实例的域名。搜索我的网域,复制以 my.salesforce.com 结尾的域名,然后在开头添加 https://
    • 客户端 ID:点击管理客户详情,从关联的应用复制客户端 ID。如果启用了刷新令牌,请验证令牌是否已刷新,并在创建数据存储区时提供最新的令牌。
    • 客户端密钥:点击管理客户详情,从关联的应用复制客户端密钥。如果启用了刷新令牌,请验证令牌是否已刷新,并在创建数据存储区时提供最新的令牌。
  • 为了正确应用用户权限,Salesforce 用户必须提供分享同意。

  • 使用企业版或开发者版方案。不支持试用账号。

  • 确保您使用的是 Sales Cloud。不支持 Service Cloud。

  • 将 Google Cloud 添加到 Salesforce CORS 许可名单。如果您已完成此任务,请前往“创建应用”部分。

    • 按照 Salesforce 文档中的说明配置 CORS 许可名单
    • 输入 https://console.cloud.google.com/ 作为源网址,然后保存配置。

创建应用

Salesforce 支持以下应用:

  1. 关联的应用
  2. 外部客户端应用

创建关联的应用

如需在 Salesforce 中设置关联的应用以与 Google Cloud 集成,请执行以下操作:

  1. 登录 Salesforce。
  2. 点击齿轮图标,然后前往设置
  3. Setup 菜单下,前往 App Manager
  4. 点击 New connected app
  5. 如需配置关联的应用,请执行以下操作:

    a. 在关联的应用创建页面中,执行以下操作:

    • 选中启用 OAuth 设置
    • 将回调网址设置为:https://vertexaisearch.cloud.google.com/console/oauth/salesforce_oauth.html
    • 选择以下 OAuth 范围:
      • 完全访问权限 (full)
      • 随时执行请求 (refresh_token, offline_access)

    b. 启用以下流程:

    • 客户端凭据流程
    • 授权代码和凭据流程
    • 授权代码和凭据流程的 POST 正文中的用户凭据
    • 对于客户端凭据流程,请在以此身份运行字段中指定您的用户名。您必须对连接器可以提取的所有实体拥有读取权限。

创建关联的应用后,请执行以下操作:

  1. 修改应用政策:

    • 前往 App Manager(应用管理器),然后修改新创建的应用。
    • IP Relaxation(IP 放宽)设置为 Relax IP restrictions
    • 根据需要将刷新令牌政策配置为 Valid until revoked 或更严格的设置。
    • 确保允许的用户已设为 All users may self-authorize
  2. 配置 IP 限制:

    • 如果启用了组织级 IP 地址范围强制执行,请依次前往安全 > 网络访问,然后设置受信任的 IP 地址范围。如需了解详情,请参阅关联的应用 IP 放宽和持续 IP 违规处置文档。
    • 如果不需要 IP 地址限制,请停用对每项请求强制执行登录 IP 地址范围限制
  3. 配置 OAuth 关联的应用:

  4. 保存关联的应用:

    • 保存并退出关联的应用。
    • 在搜索栏中,搜索 OAuth and OpenId connect settings(OAuth 和 OpenId Connect 设置)。
    • 启用允许使用授权代码和凭据流程以及 OAuth 用户名-密码流程

创建外部客户端应用

如需在 Salesforce 中创建和配置外部客户端应用,以便为集成启用基于 OAuth 的身份验证,请执行以下操作:

  1. 获取客户端 ID 和客户端密钥:

    • 登录 Salesforce。
    • 点击齿轮图标,然后前往设置
    • 依次前往设置 > 应用 > 外部客户端应用
    • 点击新建外部客户端应用
  2. 提供所需信息:

    • 输入应用名称和您的电子邮件地址。默认情况下,系统会自动填充 API 名称。
    • 分发状态保留为 Local
  3. 启用 OAuth 设置:

    • 展开 API(启用 OAuth 设置),然后选择 Enable OAuth(启用 OAuth)。
    • 配置:
      • 回调网址https://login.salesforce.com/services/oauth2/callback
      • OAuth 范围:通过 API 管理用户数据 (api)。
      • 流程启用中,选择启用客户端凭据流程
      • 点击创建以创建外部客户端应用。前往外部客户端应用管理器查看您添加到列表中的应用。
  4. 修改应用政策:

    • 打开创建的应用。
    • 前往政策,然后点击修改
    • OAuth 流程和外部客户端应用增强功能中,选中启用客户端凭据流程
    • Run as(以此身份运行)字段中输入您的 Salesforce 用户名。
  5. 访问 OAuth 凭据:

    • 点击设置
    • 点击 OAuth 设置
    • 点击使用方密钥和使用方密码以访问凭据。验证码会发送到您的电子邮件地址。
    • 输入验证码,然后点击验证
    • 复制使用方密钥,并将其用作客户端 ID。
    • 复制使用方密码,并将其用作客户端密钥。

创建 Salesforce 连接器

控制台

如需使用 Google Cloud 控制台将数据从 Salesforce 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储空间

  3. 点击创建数据存储区

  4. 选择数据源页面上,滚动或搜索 Salesforce 以连接第三方来源。

  5. 输入您的 Salesforce 身份验证信息。

  6. 选择要同步的实体,然后点击继续

  7. 为您的数据存储区选择一个区域。

  8. 为数据存储区输入名称。

  9. 选择同步频率。

  10. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  11. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看相关详细信息。连接器开始同步数据时,连接器状态会从“正在创建”更改为“正在运行”。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    提取过程可能需要几分钟或几小时,具体取决于数据的大小。

后续步骤

连接 ServiceNow

请按照以下步骤将数据从 ServiceNow 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需了解如何设置访问权限控制,请参阅使用数据源访问权限控制

  • 请准备好以下身份验证信息:

    • 实例网址,格式为 https://<domain-name>.service-now.com/
    • 客户端 ID 和客户端密钥。如需了解如何设置端点以及如何获取客户端 ID 和客户端密钥,请参阅 ServiceNow 文档中的创建端点以供客户端访问实例
    • 以下某种 ServiceNow 角色类型的用户名和密码:

      • “管理员”角色。请参阅 ServiceNow 文档中的基本系统角色
      • 自定义 ServiceNow 角色。这是一种替代使用管理员角色的方法。如需使用自定义 ServiceNow 角色,请使用以下字段创建访问权限控制规则:

        如需了解详情,请参阅 ServiceNow 文档中的创建角色创建 ACL 规则

控制台

如需使用 Google Cloud 控制台将数据从 ServiceNow 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储区

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源部分,然后选择 ServiceNow

  5. 输入您的 ServiceNow 身份验证信息。

  6. 选择要同步的实体,然后点击继续

  7. 为数据连接器选择一个区域。

  8. 为数据连接器输入名称。

  9. 选择同步频率。

  10. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  11. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据连接器名称,在其数据页面上查看相关详细信息。连接器开始同步数据时,连接器状态会从“正在创建”更改为“正在运行”。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    提取过程可能需要几分钟或几小时,具体取决于数据的大小。

后续步骤

连接 SharePoint Online

请按照以下步骤将数据从 Sharepoint Online 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需了解如何设置访问权限控制,请参阅使用数据源访问权限控制

  • 授予管理员同意书。如需了解如何授予意见征求,请参阅 Microsoft 文档中的向应用授予租户级管理员意见征求

  • 准备以下 Sharepoint Online 身份验证信息,以便在设置过程中使用:

    • 实例网址。采用 http://DOMAIN_OR_SERVER/[sites/]WEBSITE 的形式。如需详细了解网址,请参阅 SharePoint 文档中的 SharePoint 中的网址和令牌
    • 租户 ID、客户端 ID 和客户端密钥。如需注册应用,请为登录受众群体选择仅此组织目录中的账号,然后找到此身份验证信息。如需了解详情,请参阅 Microsoft 文档中的快速入门:向 Microsoft Identity Platform 注册应用

    • 注册应用时,请使用 https://vertexaisearch.cloud.google.com/console/oauth/confluence_oauth.html 作为 Web 回调网址。

    • 配置应用权限时,请为 Graph API 添加以下应用权限:

    • 配置应用权限时,请为 Sharepoint REST API 添加以下委托权限:

  • 下表介绍了建议配置的角色及其限制。

控制台

如需使用 Google Cloud 控制台将数据从 Sharepoint Online 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储区

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源部分,然后选择 Sharepoint Online

  5. 输入您的 Sharepoint Online 身份验证信息,然后点击验证

  6. 系统随即会打开一个新窗口。输入实例用户名和密码。 请先检查身份验证是否成功,然后再返回为数据存储区指定 Sharepoint Online 来源页面。

  7. 选择要同步的实体,然后点击继续

  8. 为您的数据存储区选择一个区域。

  9. 为数据存储区输入名称。

  10. 为数据存储区选择同步频率。

  11. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  12. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看相关详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    提取过程可能需要几分钟或几小时,具体取决于数据的大小。

后续步骤

关联 Slack

请按照以下步骤将数据从 Slack 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

准备工作

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需了解如何设置访问权限控制,请参阅使用数据源访问权限控制

  • 请与 Workspace 所有者联系,获取在工作区中安装新应用的权限。

  • 准备以下 Slack 身份验证信息:

    • 工作区 ID:请按照 Slack 文档中为数据存储区指定 Slack 来源中的说明获取工作区 ID。
    • 访问令牌:创建客户端应用并定义所需的范围。如需了解详情,请参阅 Slack 文档中的快速入门如何快速获取和使用 Slack API 令牌
    • 设置 OAuth 2.0 权限范围时,请配置以下范围:
  • 默认情况下,Slack 会限制抓取和同步私人频道、群组消息和私信中的内容。

配置 Slack 应用

获取访问令牌,以允许 Vertex AI Search 从您的 Slack 工作区注入文档。

生成聊天机器人令牌

生成聊天机器人令牌,以安全地访问私密频道、即时消息 (IM) 和多方即时消息 (MPIM)。聊天机器人令牌无法抓取其不属于的公开频道,并且加入公开频道会生成加入消息。

  1. 登录 Slack API 应用
  2. 点击创建新应用
  3. 选择从头开始
  4. 输入应用的名称,然后选择要集成到的工作区。
  5. 点击创建应用
  6. 点击 OAuth & Permissions(OAuth 和权限)。
  7. Bot 令牌范围下,添加以下必需的范围:

    默认情况下,聊天机器人会从 #general#random 通道读取数据。如需启用抓取功能,请执行以下操作:

    • 对于公开频道,请授予 channels:join 范围,以允许聊天机器人自动加入。
    • 对于私人渠道,请手动邀请聊天机器人。
  8. 点击安装到您的用户名工作区

  9. 按照屏幕上的说明安装应用并检索聊天机器人令牌。

生成用户令牌

生成用户令牌,以便访问所有公开频道,而无需先加入这些频道。除非用户拥有访问权限,否则用户令牌无法抓取私享频道、即时通讯或 MPIM。

  1. 登录 Slack API 应用
  2. 点击创建新应用
  3. 选择从头开始
  4. 输入应用的名称,然后选择要集成到的工作区。
  5. 点击创建应用
  6. 点击 OAuth & Permissions(OAuth 和权限)。
  7. 用户令牌范围下,添加以下必需的范围:

  8. 点击安装到您的用户名工作区

  9. 按照屏幕上的说明安装应用并检索用户令牌。

创建 Slack Cloud 连接器

控制台

如需使用 Google Cloud 控制台将数据从 Slack 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储空间

  3. 点击创建数据存储区

  4. 选择数据源页面上,滚动或搜索 Slack 以关联第三方来源。

  5. 输入您的 Slack 身份验证信息。

    • 实例 ID(工作区 ID):通过浏览器登录您的 Slack 工作区即可获取此 ID。工作区 ID 是网址中 /client 后面的路径段。
    • 身份验证令牌:使用上一部分中获取的令牌。
  6. 选择要同步的实体,然后点击继续

  7. 为您的数据存储区选择一个区域。

  8. 为数据存储区输入名称。

  9. 为数据存储区选择同步频率。

  10. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  11. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看其详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    提取过程可能需要几分钟或几小时,具体取决于数据的大小。

后续步骤

关联 Dropbox

请按照以下步骤将数据从 Dropbox 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

准备工作

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需了解详情,请参阅使用数据源访问权限控制

  • 请准备好以下 Dropbox 身份验证信息。如需了解如何设置这些参数,请参阅 Dropbox 文档中的 OAuth 指南

    • 客户端 ID
    • 客户端密钥

控制台

如需使用 Google Cloud 控制台将数据从 Dropbox 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储区

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源部分,然后选择 Dropbox

  5. 输入您的 Dropbox 身份验证信息,然后点击身份验证。系统随即会显示一个新窗口。

  6. 请先对您的账号进行身份验证并确认验证成功,然后返回为数据存储区指定 Dropbox 来源页面。

  7. 选择要同步的实体,然后点击继续

  8. 为数据存储区选择位置。

  9. 为数据存储区输入名称。

  10. 为数据存储区选择同步频率。

  11. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  12. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看其详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。查看文档标签页,确保实体已正确提取。

    提取过程可能需要几分钟或几小时,具体取决于数据的大小。

后续步骤

Connect Box

请按照以下步骤将数据从 Box 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

准备工作

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需了解如何设置访问权限控制,请参阅使用数据源访问权限控制

  • 请准备好以下 Box 身份验证信息。如需了解如何设置这些参数,请参阅 Box 开发者文档中的 JWT Auth

    • 企业 ID
    • 客户端 ID
    • 客户端密钥
    • 公钥 ID
    • 私钥
    • 口令
  • 创建 JWT 端点时,请配置以下范围:

评论的增量更改的同步时间可能会超过配置的频率间隔。如果复制或移动包含实体的文件夹,增量更改的同步时间可能会超过配置的频率间隔时间。

创建 Box 应用

  1. 使用您的管理员账号登录 Box 开发者控制台
  2. 点击创建新应用
  3. 选择自定义应用类型。
  4. 输入应用名称
  5. 设置应用的用途:集成、AI 或 Google Cloud Agent Builder。
  6. 选择 Server authentication with JWT(使用 JWT 进行服务器身份验证)。

配置 Box 应用

配置 Box 应用的设置。

创建公钥/私钥

  1. 前往 Box 开发者控制台
  2. 配置标签页中,点击生成公钥/私钥对

    • 系统会自动将公钥及其 ID 上传到控制台。在创建连接时会使用此 ID。
    • 您可以将包含私钥和密码的配置文件下载到本地。请务必保留此配置文件以备日后使用。
    • 如需自行生成密钥,请参阅 Box 密钥对设置指南

配置所需权限

  1. 应用范围部分,选择以下权限:
    • 读取存储在 Box 中的所有文件和文件夹

授权应用

  1. 授权标签页中,点击查看并提交,然后等待管理员批准。
  2. 管理员可以在管理控制台中批准应用。

授权后,Box 会完成应用的完整设置。

创建 Box 连接器

控制台

如需使用 Google Cloud 控制台将数据从 Box 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储空间

  3. 点击创建数据存储区

  4. 选择数据源页面上,滚动或搜索 Box 以关联第三方来源。

  5. 输入您的身份验证信息。

  6. 选择要同步的实体,然后点击继续

  7. 为您的数据存储区选择一个区域。

  8. 为数据存储区输入名称。

  9. 为数据存储区选择同步频率。

  10. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  11. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看其详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    提取过程可能需要几分钟或几小时,具体取决于数据的大小。

后续步骤

关联 OneDrive

请按照以下步骤将数据从 OneDrive 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

准备工作

在设置连接之前,请执行以下操作:

控制台

如需使用 Google Cloud 控制台将数据从 OneDrive 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储空间

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源部分,然后选择 OneDrive

  5. 输入您的 OneDrive 身份验证信息。

  6. 选择要同步的实体,然后点击继续

  7. 为您的数据存储区选择一个区域。

  8. 为数据存储区输入名称。

  9. 为数据存储区选择同步频率。

  10. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  11. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看其详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    提取过程可能需要几分钟或几小时,具体取决于数据的大小。

后续步骤