源 MongoDB 文档数据库

Datastream 支持复制来自 MongoDB 源的更改事件。MongoDB 是一个使用类似 JSON 的文档的开源 NoSQL 数据库。一个文档可以嵌入其他文档。文档会收集到集合中,MongoDB 数据库会存储一个或多个文档集合。

与关系型 SQL 数据库不同,MongoDB 数据库中的每个记录都是以二进制 JSON (BSON) 描述的文档,BSON 是数据的二进制表示法。然后,应用可以以 JSON 格式检索这些数据。

本页面包含以下信息:

  • 从 MongoDB 数据库复制时需要了解的关键术语
  • Datastream 如何处理从来源 MongoDB 数据库中拉取的数据的行为
  • Datastream 支持的 MongoDB 版本和版本
  • 将 MongoDB 用作来源的已知限制

关键词

在使用 MongoDB 来源时,您需要了解以下关键术语:

  • SRV 连接:连接字符串,其主机名与域名服务 (DNS) 服务记录 (SRV) 相对应。该字符串采用以下格式:

    mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]

    如需了解详情,请参阅 MongoDB 文档

  • 标准连接字符串:MongoDB 连接 URI 的标准格式,用于连接到自托管的 MongoDB 独立部署、副本集或分片集群。该字符串采用以下格式:

    mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]

    如需了解详情,请参阅 MongoDB 文档

  • 副本集:一组 MongoDB 服务器,用于实现复制和自动故障切换。副本集可提供冗余和高可用性,是所有生产部署的基础。

  • 分片集群:MongoDB 分片集群由分片、mongo 和配置服务器组成。MongoDB 会在集合级别分片数据,并将集合数据分布到集群中的分片中。

  • mongos:客户端应用与分片集群之间的接口。mongos 充当查询路由器,并将写入操作写入分片。

  • 集合:MongoDB 以分层结构整理数据。MongoDB 部署包含一个或多个数据库,每个数据库包含一个或多个集合。在每个集合中,MongoDB 都会将数据存储为包含字段和值对的文档。集合类似于关系型数据库中的表。

行为

源 MongoDB 数据库依赖于变更数据流将更改复制到目标位置。借助变更数据流,您可以访问实时数据,并且复制集和分片集群都支持变更数据流。

  • 如果已配置,系统会为包含的对象复制所有历史数据。
  • 复制所有更改,例如对指定对象执行的插入、更新和删除。

版本

Datastream 支持 5.0 之后的 MongoDB 版本。

已知限制

将 MongoDB 用作来源的已知限制包括:

  • 使用 Datastream API 时,您只能指定要从数据流中排除哪些字段。不支持为字段指定包含列表。
  • 不支持流式恢复。

后续步骤