Quell-MongoDB-Dokumentdatenbank

Datastream unterstützt die Replikation von Änderungsereignissen aus einer MongoDB-Quelle. MongoDB ist eine Open-Source-NoSQL-Datenbank, die JSON-ähnliche Dokumente verwendet. In einem Dokument können andere Dokumente eingebettet sein. Die Dokumente werden in Sammlungen zusammengefasst und eine MongoDB-Datenbank enthält eine oder mehrere Sammlungen von Dokumenten.

Anstatt Daten wie in relationalen SQL-Datenbanken in Tabellen mit Zeilen und Spalten zu speichern, ist jeder Datensatz in einer MongoDB-Datenbank ein Dokument, das in binärem JSON (BSON) beschrieben wird, einer binären Datendarstellung. Anwendungen können diese Daten dann im JSON-Format abrufen.

Diese Seite enthält Informationen zu:

  • Wichtige Begriffe, die Sie bei der Replikation aus einer MongoDB-Datenbank kennen sollten
  • Das Verhalten von Datastream bei der Verarbeitung von Daten, die aus einer MongoDB-Quelldatenbank abgerufen werden
  • Von Datastream unterstützte MongoDB-Versionen und ‑Editionen
  • Bekannte Einschränkungen bei Verwendung von MongoDB als Quelle

Wichtige Begriffe

Im Folgenden finden Sie die wichtigsten Begriffe, die Sie bei der Arbeit mit MongoDB-Quellen kennen sollten:

  • SRV-Verbindung: Ein Verbindungsstring mit einem Hostnamen, der einem SRV-Eintrag (Service Record) des Domain Name Service (DNS) entspricht. Der String hat folgendes Format:

    mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]

    Weitere Informationen finden Sie in der MongoDB-Dokumentation.

  • Standard-Verbindungsstring: Das Standardformat des MongoDB-Verbindungs-URIs, das für die Verbindung zu einer selbst gehosteten MongoDB-Standalone-Bereitstellung, einem Replikatset oder einem fragmentierten Cluster verwendet wird. Der String hat folgendes Format:

    mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]

    Weitere Informationen finden Sie in der MongoDB-Dokumentation.

  • Replikatset: Ein Cluster von MongoDB-Servern, der Replikation und automatisierten Failover implementiert. Replikatensätze bieten Redundanz und Hochverfügbarkeit und sind die Grundlage für alle Produktions-Deployments.

  • Sharded Cluster: Ein MongoDB-Sharded Cluster besteht aus Shards, Mongos und Konfigurationsservern. MongoDB sShardet Daten auf Sammlungsebene und verteilt die Sammlungsdaten auf die Shards im Cluster.

  • mongos: die Schnittstelle zwischen den Clientanwendungen und dem Sharded Cluster. mongos fungiert als Abfrage-Router und führt Schreibvorgänge auf Shards aus.

  • Sammlung: In MongoDB werden Daten in einer hierarchischen Struktur organisiert. Eine MongoDB-Bereitstellung enthält eine oder mehrere Datenbanken und jede Datenbank enthält eine oder mehrere Sammlungen. In jeder Sammlung speichert MongoDB Daten als Dokumente, die Feld- und Wertpaare enthalten. Sammlungen sind analog zu Tabellen in relationalen Datenbanken.

Verhalten

Die Quell-MongoDB-Datenbank verwendet Änderungsstreams, um Änderungen an das Ziel zu replizieren. Mit Änderungsstreams können Sie auf Echtzeitdaten zugreifen. Sie werden für Replikationssätze und Shard-Cluster unterstützt.

  • Wenn konfiguriert, werden alle Verlaufsdaten für die eingeschlossenen Objekte repliziert.
  • Alle Änderungen wie Einfügungen, Aktualisierungen und Löschungen aus den angegebenen Objekten werden repliziert.

Versionen

Datastream unterstützt MongoDB-Versionen ab 5.0.

Bekannte Einschränkungen

Bekannte Einschränkungen bei Verwendung von MongoDB als Quelle:

  • Wenn Sie die Datastream API verwenden, können Sie nur angeben, welche Felder in Ihrem Stream ausgeschlossen werden sollen. Die Angabe einer Einschlussliste für Felder wird nicht unterstützt.
  • Die Streamwiederherstellung wird nicht unterstützt.

Nächste Schritte