源 MongoDB 文档数据库

Datastream 支持从 MongoDB 源复制更改事件。MongoDB 是一种使用类似 JSON 的文档的开源 NoSQL 数据库。一个文档可以嵌入其他文档。文档会汇集到集合中,而 MongoDB 数据库会存储一个或多个文档集合。

与关系型 SQL 数据库将数据存储在行列表格中不同,MongoDB 数据库中的每条记录都是以二进制 JSON (BSON)(一种二进制数据表示形式)描述的文档。然后,应用可以检索 JSON 格式的这些数据。

本页面包含有关以下方面的信息:

  • 从 MongoDB 数据库复制时需要了解的关键术语
  • Datastream 如何处理从来源 MongoDB 数据库中拉取的数据的行为
  • Datastream 支持的 MongoDB 版本和版次
  • 将 MongoDB 用作来源的已知限制

关键词

以下是您在使用 MongoDB 来源时需要了解的关键术语:

  • SRV 连接:包含与域名服务 (DNS) 服务记录 (SRV) 对应的主机名的连接字符串。该字符串采用以下格式:

    mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]

    如需了解详情,请参阅 MongoDB 文档

  • 标准连接字符串:MongoDB 连接 URI 的标准格式,用于连接到自托管的 MongoDB 独立部署、副本集或分片集群。字符串采用以下格式:

    mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]

    如需了解详情,请参阅 MongoDB 文档

  • 副本集:实现复制和自动故障切换的 MongoDB 服务器集群。复制集可提供冗余和高可用性,是所有生产部署的基础。

  • 分片集群:MongoDB 分片集群由分片、mongos 和配置服务器组成。MongoDB 会在集合级对数据进行分片,并将集合数据分配到集群中的各个分片。

  • mongos:客户端应用与分片集群之间的接口。mongos 充当查询路由器,并将写入操作路由到分片。

  • 集合:MongoDB 以分层结构整理数据。MongoDB 部署包含一个或多个数据库,每个数据库包含一个或多个集合。在每个集合中,MongoDB 都将数据存储为包含字段和值对的文档。集合类似于关系型数据库中的表。

行为

源 MongoDB 数据库依靠变更数据流将变更复制到目标位置。变更数据流可让您访问实时数据,并且受副本集和分片集群的支持。

  • 如果已配置,则会复制所含对象的所有历史数据。
  • 复制指定对象中的所有更改,例如插入、更新和删除。

版本

Datastream 支持 5.0 版之后的 MongoDB 版本。

已知限制

将 MongoDB 用作来源的已知限制包括:

  • 使用 Datastream API 时,您只能指定要从数据流中排除哪些字段。不支持为字段指定包含列表。
  • 不支持流恢复。

后续步骤