Datastream 支持从 MongoDB 源复制更改事件。MongoDB 是一种使用类似 JSON 的文档的开源 NoSQL 数据库。一个文档可以嵌入其他文档。文档会汇集到集合中,而 MongoDB 数据库会存储一个或多个文档集合。
与关系型 SQL 数据库将数据存储在行列表格中不同,MongoDB 数据库中的每条记录都是以二进制 JSON (BSON)(一种二进制数据表示形式)描述的文档。然后,应用可以检索 JSON 格式的这些数据。
本页面包含有关以下方面的信息:
- 从 MongoDB 数据库复制时需要了解的关键术语
- Datastream 如何处理从来源 MongoDB 数据库中拉取的数据的行为
- Datastream 支持的 MongoDB 版本和版次
- 将 MongoDB 用作来源的已知限制
关键词
以下是您在使用 MongoDB 来源时需要了解的关键术语:
SRV 连接:包含与域名服务 (DNS) 服务记录 (SRV) 对应的主机名的连接字符串。该字符串采用以下格式:
mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]
如需了解详情,请参阅 MongoDB 文档。
标准连接字符串:MongoDB 连接 URI 的标准格式,用于连接到自托管的 MongoDB 独立部署、副本集或分片集群。字符串采用以下格式:
mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]
如需了解详情,请参阅 MongoDB 文档。
副本集:实现复制和自动故障切换的 MongoDB 服务器集群。复制集可提供冗余和高可用性,是所有生产部署的基础。
分片集群:MongoDB 分片集群由分片、mongos 和配置服务器组成。MongoDB 会在集合级对数据进行分片,并将集合数据分配到集群中的各个分片。
mongos:客户端应用与分片集群之间的接口。
mongos
充当查询路由器,并将写入操作路由到分片。集合:MongoDB 以分层结构整理数据。MongoDB 部署包含一个或多个数据库,每个数据库包含一个或多个集合。在每个集合中,MongoDB 都将数据存储为包含字段和值对的文档。集合类似于关系型数据库中的表。
行为
源 MongoDB 数据库依靠变更数据流将变更复制到目标位置。变更数据流可让您访问实时数据,并且受副本集和分片集群的支持。
- 如果已配置,则会复制所含对象的所有历史数据。
- 复制指定对象中的所有更改,例如插入、更新和删除。
版本
Datastream 支持 5.0 版之后的 MongoDB 版本。
已知限制
将 MongoDB 用作来源的已知限制包括:
- 使用 Datastream API 时,您只能指定要从数据流中排除哪些字段。不支持为字段指定包含列表。
- 不支持流恢复。
后续步骤
- 了解如何配置 MongoDB 源以与 Datastream 搭配使用。