Datastream admite la replicación de eventos de cambio desde una fuente de MongoDB. MongoDB es una base de datos NoSQL de código abierto que usa documentos similares a JSON. Un documento puede tener otros documentos incorporados. Los documentos se agrupan en colecciones, y una base de datos de MongoDB almacena una o más colecciones de documentos.
En lugar de almacenar datos en tablas de filas y columnas como las bases de datos relacionales de SQL, cada registro en una base de datos de MongoDB es un documento descrito en JSON binario (BSON), una representación binaria de los datos. Luego, las aplicaciones pueden recuperar estos datos en formato JSON.
Esta página incluye información sobre lo siguiente:
- Los términos clave que debes comprender cuando realizas la replicación desde una base de datos de MongoDB
- El comportamiento de cómo Datastream controla los datos que se extraen de una base de datos de MongoDB de origen
- Las versiones y ediciones de MongoDB que admite Datastream
- Limitaciones conocidas para usar MongoDB como fuente
Términos clave
A continuación, se incluyen los términos clave que debes comprender cuando trabajes con fuentes de MongoDB:
Conexión SRV: Es una cadena de conexión con un nombre de host que corresponde a un registro de servicio (SRV) del servicio de nombres de dominio (DNS). La cadena tiene el siguiente formato:
mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]
Para obtener más información, consulta la documentación de MongoDB.
Cadena de conexión estándar: Es el formato estándar del URI de conexión de MongoDB que se usa para conectarse a una implementación independiente, un conjunto de réplicas o un clúster fragmentado de MongoDB autoalojado. La cadena tiene el siguiente formato:
mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]
Para obtener más información, consulta la documentación de MongoDB.
Conjunto de réplicas: Es un clúster de servidores de MongoDB que implementa la replicación y la conmutación por error automatizada. Los conjuntos de réplicas proporcionan redundancia y alta disponibilidad, y son la base de todas las implementaciones de producción.
Clúster fragmentado: Un clúster fragmentado de MongoDB consta de fragmentos, mongos y servidores de configuración. MongoDB fragmenta los datos a nivel de la colección y los distribuye entre los fragmentos del clúster.
mongos: Es la interfaz entre las aplicaciones cliente y el clúster fragmentado.
mongos
actúa como un router de consultas y escribe operaciones en fragmentos.Colección: MongoDB organiza los datos en una estructura jerárquica. Una implementación de MongoDB contiene una o más bases de datos, y cada base de datos contiene una o más colecciones. En cada colección, MongoDB almacena datos como documentos que contienen pares de campo y valor. Las colecciones son similares a las tablas en las bases de datos relacionales.
Comportamiento
La base de datos de MongoDB de origen se basa en flujos de cambios para replicar los cambios en el destino. Los flujos de cambios te permiten acceder a datos en tiempo real y son compatibles con conjuntos de réplicas y clústeres fragmentados.
- Si se configura, todos los datos históricos se replican para los objetos incluidos.
- Se replican todos los cambios, como las inserciones, las actualizaciones y las eliminaciones de los objetos especificados.
Versiones
Datastream es compatible con versiones de MongoDB posteriores a la 5.0.
Limitaciones conocidas
Estas son algunas de las limitaciones conocidas para usar MongoDB como fuente:
- Cuando usas la API de Datastream, solo puedes especificar los campos que deseas excluir en tu flujo. No se admite la especificación de una lista de inclusión para los campos.
- No se admite la recuperación de transmisiones.
¿Qué sigue?
- Aprende a configurar una fuente de MongoDB para usarla con Datastream.