借助 Amazon Kinesis Data Streams 导入主题,您可以将 Amazon Kinesis Data Streams 作为外部来源,将数据持续注入到 Pub/Sub。然后,您可以将数据流式传输到 Pub/Sub 支持的任何目的地。
本文档介绍了如何创建和管理 Amazon Kinesis Data Streams 导入主题。如需创建标准主题,请参阅创建标准主题。
准备工作
详细了解 Pub/Sub 发布流程。
设置工作负载身份联合,以便 Google Cloud 可以访问外部在线播放服务。
管理导入主题所需的角色和权限
如需获得创建和管理 Amazon Kinesis Data Streams 导入主题所需的权限,请让管理员为您授予主题或项目的 Pub/Sub Editor(roles/pubsub.editor
) IAM 角色。
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
此预定义角色包含创建和管理 Amazon Kinesis Data Streams 导入主题所需的权限。如需查看所需的确切权限,请展开所需权限部分:
所需权限
如需创建和管理 Amazon Kinesis Data Streams 导入主题,需要具备以下权限:
-
创建导入主题:
pubsub.topics.create
-
删除导入主题:
pubsub.topics.delete
-
获取导入主题:
pubsub.topics.get
-
列出导入主题:
pubsub.topics.list
-
发布到导入主题:
pubsub.topics.publish
-
更新导入主题:
pubsub.topics.update
-
获取导入主题的 IAM 政策:
pubsub.topics.getIamPolicy
-
为导入主题配置 IAM 政策:
pubsub.topics.setIamPolicy
您可以在项目级别和个别资源级别配置访问权限控制。
设置联合身份以访问 Kinesis Data Streams
借助工作负载身份联合,Google Cloud 服务可以访问在 Google Cloud 外部运行的工作负载。借助身份联合,您无需维护凭据或将凭据传递给 Google Cloud,即可访问其他云中的资源。相反,您可以使用工作负载本身的身份对 Google Cloud 进行身份验证并访问资源。
在 Google Cloud 中创建服务账号
这是一个可选步骤。 如果您已有服务账号,则可以在本过程中使用该账号,而无需创建新的服务账号。如果您使用的是现有服务账号,请参阅记录服务账号唯一 ID 以了解后续步骤。
对于 Amazon Kinesis Data Streams 导入主题,Pub/Sub 会使用该服务账号作为身份来访问 AWS 中的资源。
如需详细了解如何创建服务账号(包括前提条件、所需角色和权限以及命名准则),请参阅创建服务账号。创建服务账号后,您可能需要等待 60 秒或更长时间才能使用该服务账号。出现这种行为的原因是读取操作是最终一致的;新服务账号可能需要一段时间才能显示。
记录服务账号唯一 ID
您需要服务账号唯一 ID 才能在 AWS 控制台中设置角色。
在 Google Cloud 控制台中,前往服务账号详情页面。
点击您刚刚创建的服务账号或您打算使用的服务账号。
在服务账号详情页面中,记下唯一 ID 编号。
您需要在使用自定义信任政策在 AWS 中创建角色部分中使用该 ID。
向 Pub/Sub 服务账号添加服务账号 Token Creator 角色
Service Account Token Creator 角色 (roles/iam.serviceAccountTokenCreator
) 可让主账号为服务账号创建短期有效凭据。这些令牌或凭据用于模拟服务账号。
如需详细了解服务账号模拟,请参阅服务账号模拟。
您还可以在此过程中添加 Pub/Sub Publisher 角色 (roles/pubsub.publisher
)。如需详细了解该角色以及添加该角色的原因,请参阅向 Pub/Sub 服务账号添加 Pub/Sub 发布商角色。
在 Google Cloud 控制台中,转到 IAM 页面。
启用包括 Google 提供的角色授权选项。
查找格式为
service-{PROJECT_NUMBER}@gcp-sa-pubsub.iam.gserviceaccount.com
的服务账号。对于此服务账号,点击修改主账号按钮。
根据需要,点击添加其他角色。
搜索并选择 Service Account Token Creator 角色 (
roles/iam.serviceAccountTokenCreator
)。点击保存。
在 AWS 中创建政策
您需要在 AWS 中创建一项政策,以便 Pub/Sub 能够向 AWS 进行身份验证,从而从 AWS Kinesis 数据流中注入数据。在创建 AWS 政策之前,请先创建 Kinesis 数据流并在其上注册使用方。我们建议您采用这种做法,以便限制对特定数据流的权限。
如需详细了解如何创建 AWS Kinesis 数据流,请参阅 Kinesis 数据流。
如需详细了解用于注册使用方的 AWS Kinesis Data Streams API,请参阅 RegisterStreamConsumer。
如需了解更多方法以及如何在 AWS 中创建政策,请参阅创建 IAM 政策。
如需在 AWS 中创建政策,请执行以下步骤:
登录 AWS 管理控制台,然后打开 IAM 控制台。
在 IAM 控制台的导航窗格中,依次点击访问权限管理 > 政策。
点击创建政策。
在选择服务中,选择 Kinesis。
对于允许的操作,请选择以下选项:
列表 > ListShards。
此操作会授予列出数据流中分片的权限,并提供有关每个分片的信息。
读取 > SubscribeToShard。
此操作会授予监听具有增强型扇出功能的特定分片的权限。
读取 > DescribeStreamConsumer。
此操作会授予获取已注册的串流使用方的说明的权限。
这些权限涵盖从数据流中读取数据。Pub/Sub 仅支持使用流式 SubscribeToShard API 从启用了增强型扇出的 Kinesis 流中读取数据。
点击添加更多权限。
在选择服务部分,输入并选择 STS。
对于允许的操作,依次选择写入 > AssumeRoleWithWebIdentity。
此操作会授予权限,以便 Pub/Sub 获取一组临时安全凭据,以便使用身份联合向 Kinesis 数据流进行身份验证。
点击下一步。
输入政策名称和说明。
点击创建政策。
使用自定义信任政策在 AWS 中创建角色
您必须在 AWS 中创建一个角色,以便 Pub/Sub 能够向 AWS 进行身份验证,从 Kinesis Data Streams 注入数据。
如需使用自定义信任政策创建角色,请执行以下步骤:
登录 AWS 管理控制台,然后打开 IAM 控制台。
在 IAM 控制台的导航窗格中,点击 Roles(角色)。
点击 Create role。
对于 Select trusted entity(选择可信实体),选择 Custom trust policy(自定义信任政策)。
在自定义信任政策部分中,输入或粘贴以下内容:
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Federated": "accounts.google.com" }, "Action": "sts:AssumeRoleWithWebIdentity", "Condition": { "StringEquals": { "accounts.google.com:sub": "<SERVICE_ACCOUNT_UNIQUE_ID>" } } } ] }
将
<SERVICE_ACCOUNT_UNIQUE_ID>
替换为您在记录服务账号唯一 ID 中记录的服务账号的唯一 ID。点击下一步。
对于添加权限,请搜索并选择您刚刚创建的自定义政策。
点击下一步。
输入角色名称和说明。
点击 Create role。
向 Pub/Sub 服务账号添加 Pub/Sub 发布商角色
您必须向 Pub/Sub 服务账号分配发布商角色,以便 Pub/Sub 能够从 AWS Kinesis Data Streams 发布到导入主题。
如需启用从项目中所有主题发布内容的功能,请参阅启用从所有主题发布内容的功能。如果您尚未创建任何 AWS Kinesis Data Streams 导入主题,请使用此方法。
如需启用从特定主题发布内容(推荐),请参阅启用从单个主题发布内容。仅当 AWS Kinesis Data Streams 导入主题已存在时,才应使用此方法。
启用从所有主题发布内容
如果您尚未创建任何 AWS Kinesis Data Streams 导入主题,请使用此方法。
在 Google Cloud 控制台中,转到 IAM 页面。
启用包括 Google 提供的角色授权选项。
查找格式为
service-{PROJECT_NUMBER}@gcp-sa-pubsub.iam.gserviceaccount.com
的服务账号。对于此服务账号,点击修改主账号按钮。
根据需要,点击添加其他角色。
搜索并选择 Pub/Sub 发布者角色 (
roles/pubsub.publisher
)。点击保存。
启用从单个主题发布
仅当 AWS Kinesis Data Streams 导入主题已存在时,才应使用此方法。
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
运行
gcloud pubsub topics add-iam-policy-binding
命令:gcloud pubsub topics add-iam-policy-binding TOPIC_ID\ --member="serviceAccount:service-PROJECT_NUMBER@gcp-sa-pubsub.iam.gserviceaccount.com"\ --role="roles/pubsub.publisher"
替换以下内容:
TOPIC_ID 是 Amazon Kinesis Data Streams 导入主题的主题 ID。
PROJECT_NUMBER 是项目编号。如需查看项目编号,请参阅标识项目。
向服务账号添加 Service Account User 角色
Service Account User 角色 (roles/iam.serviceAccountUser
) 包含 iam.serviceAccounts.actAs
权限,可让主账号将服务账号附加到 Amazon Kinesis Data Streams 导入主题的提取设置,并使用该服务账号进行联合身份验证。
执行以下步骤:
在 Google Cloud 控制台中,转到 IAM 页面。
对于发出创建或更新主题调用的主账号,请点击修改主账号按钮。
根据需要,点击添加其他角色。
搜索并选择 Service account user 角色 (
roles/iam.serviceAccountUser
)。点击保存。
创建 Amazon Kinesis Data Streams 导入主题
如需详细了解与主题关联的属性,请参阅主题的属性。
确保您已完成以下步骤:
分别创建主题和订阅(即使是快速连续创建)可能会导致数据丢失。在订阅之前,主题会存在一小段时间。如果在此期间向主题发送了任何数据,这些数据都会丢失。通过先创建主题、创建订阅,然后将主题转换为导入主题,您可以确保在导入过程中不会遗漏任何消息。
如需创建 Amazon Kinesis Data Streams 导入主题,请按以下步骤操作:
控制台
-
在 Google Cloud 控制台中,前往主题页面。
-
点击创建主题。
-
在主题 ID 字段中,输入 Amazon Kinesis Data Streams 导入主题的 ID。
如需详细了解如何命名主题,请参阅命名准则。
-
选择添加默认订阅。
-
选择启用提取。
-
对于提取来源,请选择 Amazon Kinesis Data Streams。
-
输入以下详细信息:
-
Kinesis 数据流 ARN:您计划注入到 Pub/Sub 的 Kinesis Data Streams 的 ARN。ARN 格式如下:
arn:${Partition}:kinesis:${Region}:${Account}:stream/${StreamName}
。 -
Kinesis 使用方 ARN:已注册到 AWS Kinesis Data Streams 的使用方资源的 ARN。ARN 格式如下:
arn:${Partition}:kinesis:${Region}:${Account}:${StreamType}/${StreamName}/consumer/${ConsumerName}:${ConsumerCreationTimpstamp}
。 -
AWS 角色 ARN:AWS 角色的 ARN。角色的 ARN 格式如下:
arn:aws:iam:${Account}:role/${RoleName}
。 -
服务账号:您在在 Google Cloud 中创建服务账号中创建的服务账号。
-
-
点击创建主题。
gcloud
-
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
-
运行
gcloud pubsub topics create
命令:gcloud pubsub topics create TOPIC_ID \ --kinesis-ingestion-stream-arn KINESIS_STREAM_ARN\ --kinesis-ingestion-consumer-arn KINESIS_CONSUMER_ARN\ --kinesis-ingestion-role-arn KINESIS_ROLE_ARN\ --kinesis-ingestion-service-account PUBSUB_SERVICE_ACCOUNT
替换以下内容:
-
TOPIC_ID 是主题 ID。
-
KINESIS_STREAM_ARN 是您计划注入到 Pub/Sub 的 Kinesis Data Streams 的 ARN。ARN 格式如下:
arn:${Partition}:kinesis:${Region}:${Account}:stream/${StreamName}
。 -
KINESIS_CONSUMER_ARN 是已注册到 AWS Kinesis Data Streams 的使用方资源的 ARN。ARN 格式如下:
arn:${Partition}:kinesis:${Region}:${Account}:${StreamType}/${StreamName}/consumer/${ConsumerName}:${ConsumerCreationTimpstamp}
。 -
KINESIS_ROLE_ARN 是 AWS 角色的 ARN。该角色的 ARN 格式如下:
arn:aws:iam:${Account}:role/${RoleName}
。 -
PUBSUB_SERVICE_ACCOUNT 是您在在 Google Cloud 中创建服务账号中创建的服务账号。
-
Go
在尝试此示例之前,请按照 Pub/Sub 快速入门:使用客户端库中的 Go 设置说明进行操作。 如需了解详情,请参阅 Pub/Sub Go API 参考文档。
如需向 Pub/Sub 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Java
在尝试此示例之前,请按照 Pub/Sub 快速入门:使用客户端库中的 Java 设置说明进行操作。 如需了解详情,请参阅 Pub/Sub Java API 参考文档。
如需向 Pub/Sub 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Node.js
在尝试此示例之前,请按照 Pub/Sub 快速入门:使用客户端库中的 Node.js 设置说明进行操作。 如需了解详情,请参阅 Pub/Sub Node.js API 参考文档。
如需向 Pub/Sub 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Python
在尝试此示例之前,请按照 Pub/Sub 快速入门:使用客户端库中的 Python 设置说明进行操作。 如需了解详情,请参阅 Pub/Sub Python API 参考文档。
如需向 Pub/Sub 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
C++
在尝试此示例之前,请按照 Pub/Sub 快速入门:使用客户端库中的 C++ 设置说明进行操作。 如需了解详情,请参阅 Pub/Sub C++ API 参考文档。
如需向 Pub/Sub 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
Node.js (TypeScript)
在尝试此示例之前,请按照《Pub/Sub 快速入门:使用客户端库》中的 Node.js 设置说明执行操作。 如需了解详情,请参阅 Pub/Sub Node.js API 参考文档。
如需向 Pub/Sub 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为本地开发环境设置身份验证。
如需详细了解 ARN,请参阅 Amazon 资源名称 (ARN) 和 IAM 标识符。
如果您遇到问题,请参阅“Amazon Kinesis Data Streams 导入问题排查”主题。
修改 Amazon Kinesis Data Streams 导入主题
您可以修改 Amazon Kinesis Data Streams 导入主题的提取数据源设置。执行以下步骤:
控制台
-
在 Google Cloud 控制台中,前往主题页面。
-
点击“Amazon Kinesis Data Streams 导入”主题。
-
在主题详情页面中,点击修改。
-
更新您要更改的字段。
-
点击更新。
gcloud
-
In the Google Cloud console, activate Cloud Shell.
At the bottom of the Google Cloud console, a Cloud Shell session starts and displays a command-line prompt. Cloud Shell is a shell environment with the Google Cloud CLI already installed and with values already set for your current project. It can take a few seconds for the session to initialize.
为避免丢失导入主题的设置,请务必在每次更新主题时添加所有设置。如果您省略了某些内容,Pub/Sub 会将设置重置为原始默认值。
使用以下示例中提及的所有标志运行
gcloud pubsub topics update
命令:gcloud pubsub topics update TOPIC_ID \ --kinesis-ingestion-stream-arn KINESIS_STREAM_ARN\ --kinesis-ingestion-consumer-arn KINESIS_CONSUMER_ARN\ --kinesis-ingestion-role-arn KINESIS_ROLE_ARN\ --kinesis-ingestion-service-account PUBSUB_SERVICE_ACCOUNT
替换以下内容:
-
TOPIC_ID 是主题 ID。此字段无法更新。
-
KINESIS_STREAM_ARN 是您计划注入到 Pub/Sub 的 Kinesis Data Streams 的 ARN。ARN 格式如下:
arn:${Partition}:kinesis:${Region}:${Account}:stream/${StreamName}
。 -
KINESIS_CONSUMER_ARN 是已注册到 AWS Kinesis Data Streams 的使用方资源的 ARN。ARN 格式如下:
arn:${Partition}:kinesis:${Region}:${Account}:${StreamType}/${StreamName}/consumer/${ConsumerName}:${ConsumerCreationTimpstamp}
。 -
KINESIS_ROLE_ARN 是 AWS 角色的 ARN。该角色的 ARN 格式如下:
arn:aws:iam:${Account}:role/${RoleName}
。 -
PUBSUB_SERVICE_ACCOUNT 是您在在 Google Cloud 中创建服务账号中创建的服务账号。
-
Amazon Kinesis Data Streams 导入主题的配额和限制
导入主题的发布者吞吐量受主题的发布配额的约束。如需了解详情,请参阅 Pub/Sub 配额和限制。
后续步骤
为您的主题选择订阅类型。
了解如何向主题发布消息。
使用 gcloud CLI、REST API 或客户端库创建或修改主题。