Datastream 支持复制来自 MongoDB 源的更改事件。MongoDB 是一个使用类似 JSON 的文档的开源 NoSQL 数据库。一个文档可以嵌入其他文档。文档会收集到集合中,MongoDB 数据库会存储一个或多个文档集合。
与关系型 SQL 数据库不同,MongoDB 数据库中的每个记录都是以二进制 JSON (BSON) 描述的文档,BSON 是数据的二进制表示法。然后,应用可以以 JSON 格式检索这些数据。
本页面包含以下信息:
- 从 MongoDB 数据库复制时需要了解的关键术语
- Datastream 如何处理从来源 MongoDB 数据库中拉取的数据的行为
- Datastream 支持的 MongoDB 版本和版本
- 将 MongoDB 用作来源的已知限制
关键词
在使用 MongoDB 来源时,您需要了解以下关键术语:
SRV 连接:连接字符串,其主机名与域名服务 (DNS) 服务记录 (SRV) 相对应。该字符串采用以下格式:
mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]
如需了解详情,请参阅 MongoDB 文档。
标准连接字符串:MongoDB 连接 URI 的标准格式,用于连接到自托管的 MongoDB 独立部署、副本集或分片集群。该字符串采用以下格式:
mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]
如需了解详情,请参阅 MongoDB 文档。
副本集:一组 MongoDB 服务器,用于实现复制和自动故障切换。副本集可提供冗余和高可用性,是所有生产部署的基础。
分片集群:MongoDB 分片集群由分片、mongo 和配置服务器组成。MongoDB 会在集合级别分片数据,并将集合数据分布到集群中的分片中。
mongos:客户端应用与分片集群之间的接口。
mongos
充当查询路由器,并将写入操作写入分片。集合:MongoDB 以分层结构整理数据。MongoDB 部署包含一个或多个数据库,每个数据库包含一个或多个集合。在每个集合中,MongoDB 都会将数据存储为包含字段和值对的文档。集合类似于关系型数据库中的表。
行为
源 MongoDB 数据库依赖于变更数据流将更改复制到目标位置。借助变更数据流,您可以访问实时数据,并且复制集和分片集群都支持变更数据流。
- 如果已配置,系统会为包含的对象复制所有历史数据。
- 复制所有更改,例如对指定对象执行的插入、更新和删除。
版本
Datastream 支持 5.0 之后的 MongoDB 版本。
已知限制
将 MongoDB 用作来源的已知限制包括:
- 使用 Datastream API 时,您只能指定要从数据流中排除哪些字段。不支持为字段指定包含列表。
- 不支持流式恢复。
后续步骤
- 了解如何配置 MongoDB 源以便与 Datastream 搭配使用。