Base de données de documents MongoDB source

Datastream permet de répliquer les événements de modification à partir d'une source MongoDB. MongoDB est une base de données NoSQL Open Source qui utilise des documents semblables à JSON. Un document peut contenir d'autres documents intégrés. Les documents sont regroupés dans des collections, et une base de données MongoDB stocke une ou plusieurs collections de documents.

Au lieu de stocker des données dans des tables de lignes et de colonnes comme les bases de données SQL relationnelles, chaque enregistrement d'une base de données MongoDB est un document décrit en JSON binaire (BSON), une représentation binaire des données. Les applications peuvent ensuite récupérer ces données au format JSON.

Cette page contient des informations sur les éléments suivants:

  • Termes clés que vous devez comprendre lorsque vous effectuez une réplication à partir d'une base de données MongoDB
  • Comportement de Datastream concernant les données extraites d'une base de données MongoDB source
  • Versions et éditions de MongoDB compatibles avec Datastream
  • Limites connues de l'utilisation de MongoDB comme source

Termes clés

Voici les termes clés que vous devez connaître lorsque vous travaillez avec des sources MongoDB:

  • Connexion SRV: chaîne de connexion avec un nom d'hôte correspondant à un enregistrement de service (SRV) du service de noms de domaine (DNS). La chaîne a le format suivant:

    mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]

    Pour en savoir plus, consultez la documentation MongoDB.

  • Chaîne de connexion standard: format standard de l'URI de connexion MongoDB utilisé pour se connecter à un déploiement autonome, un ensemble d'instances répliquées ou un cluster segmenté MongoDB autogéré. La chaîne a le format suivant:

    mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]

    Pour en savoir plus, consultez la documentation MongoDB.

  • Ensemble d'instances dupliquées: cluster de serveurs MongoDB qui implémente la réplication et le basculement automatique. Les ensembles de réplicas offrent une redondance et une haute disponibilité, et constituent la base de tous les déploiements de production.

  • Cluster segmenté: un cluster segmenté MongoDB se compose de segments, de mongos et de serveurs de configuration. MongoDB partitionne les données au niveau de la collection, en les distribuant sur les partitions du cluster.

  • mongos: interface entre les applications clientes et le cluster partitionné. mongos agit en tant que routeur de requêtes et effectue des opérations d'écriture sur les fragments.

  • Collection: MongoDB organise les données dans une structure hiérarchique. Un déploiement MongoDB contient une ou plusieurs bases de données, et chaque base de données contient une ou plusieurs collections. Dans chaque collection, MongoDB stocke les données sous forme de documents contenant des paires de champs et de valeurs. Les collections sont analogues aux tables dans les bases de données relationnelles.

Comportement

La base de données MongoDB source s'appuie sur des flux de modifications pour répliquer les modifications sur la destination. Les flux de modifications vous permettent d'accéder aux données en temps réel et sont compatibles avec les ensembles de réplicas et les clusters partitionnés.

  • Si elle est configurée, toutes les données historiques sont répliquées pour les objets inclus.
  • Toutes les modifications, telles que les insertions, les mises à jour et les suppressions des objets spécifiés, sont répliquées.

Versions

Datastream est compatible avec les versions MongoDB ultérieures à 5.0.

Limitations connues

Les limites connues d'utilisation de MongoDB en tant que source incluent les suivantes:

  • Lorsque vous utilisez l'API Datastream, vous ne pouvez spécifier que les champs que vous souhaitez exclure de votre flux. Il n'est pas possible de spécifier une liste d'inclusion pour les champs.
  • La récupération de flux n'est pas prise en charge.

Étape suivante