Datastream unterstützt die Replikation von Änderungsereignissen aus einer MongoDB-Quelle. MongoDB ist eine Open-Source-NoSQL-Datenbank, die JSON-ähnliche Dokumente verwendet. In einem Dokument können andere Dokumente eingebettet sein. Die Dokumente werden in Sammlungen zusammengefasst und eine MongoDB-Datenbank enthält eine oder mehrere Sammlungen von Dokumenten.
Anstatt Daten wie in relationalen SQL-Datenbanken in Tabellen mit Zeilen und Spalten zu speichern, ist jeder Datensatz in einer MongoDB-Datenbank ein Dokument, das in binärem JSON (BSON) beschrieben wird, einer binären Datendarstellung. Anwendungen können diese Daten dann im JSON-Format abrufen.
Diese Seite enthält Informationen zu:
- Wichtige Begriffe, die Sie bei der Replikation aus einer MongoDB-Datenbank kennen sollten
- Das Verhalten von Datastream bei der Verarbeitung von Daten, die aus einer MongoDB-Quelldatenbank abgerufen werden
- Von Datastream unterstützte MongoDB-Versionen und ‑Editionen
- Bekannte Einschränkungen bei Verwendung von MongoDB als Quelle
Wichtige Begriffe
Im Folgenden finden Sie die wichtigsten Begriffe, die Sie bei der Arbeit mit MongoDB-Quellen kennen sollten:
SRV-Verbindung: Ein Verbindungsstring mit einem Hostnamen, der einem SRV-Eintrag (Service Record) des Domain Name Service (DNS) entspricht. Der String hat folgendes Format:
mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]
Weitere Informationen finden Sie in der MongoDB-Dokumentation.
Standard-Verbindungsstring: Das Standardformat des MongoDB-Verbindungs-URIs, das für die Verbindung zu einer selbst gehosteten MongoDB-Standalone-Bereitstellung, einem Replikatset oder einem fragmentierten Cluster verwendet wird. Der String hat folgendes Format:
mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]
Weitere Informationen finden Sie in der MongoDB-Dokumentation.
Replikatset: Ein Cluster von MongoDB-Servern, der Replikation und automatisierten Failover implementiert. Replikatensätze bieten Redundanz und Hochverfügbarkeit und sind die Grundlage für alle Produktions-Deployments.
Sharded Cluster: Ein MongoDB-Sharded Cluster besteht aus Shards, Mongos und Konfigurationsservern. MongoDB sShardet Daten auf Sammlungsebene und verteilt die Sammlungsdaten auf die Shards im Cluster.
mongos: die Schnittstelle zwischen den Clientanwendungen und dem Sharded Cluster.
mongos
fungiert als Abfrage-Router und führt Schreibvorgänge auf Shards aus.Sammlung: In MongoDB werden Daten in einer hierarchischen Struktur organisiert. Eine MongoDB-Bereitstellung enthält eine oder mehrere Datenbanken und jede Datenbank enthält eine oder mehrere Sammlungen. In jeder Sammlung speichert MongoDB Daten als Dokumente, die Feld- und Wertpaare enthalten. Sammlungen sind analog zu Tabellen in relationalen Datenbanken.
Verhalten
Die Quell-MongoDB-Datenbank verwendet Änderungsstreams, um Änderungen an das Ziel zu replizieren. Mit Änderungsstreams können Sie auf Echtzeitdaten zugreifen. Sie werden für Replikationssätze und Shard-Cluster unterstützt.
- Wenn konfiguriert, werden alle Verlaufsdaten für die eingeschlossenen Objekte repliziert.
- Alle Änderungen wie Einfügungen, Aktualisierungen und Löschungen aus den angegebenen Objekten werden repliziert.
Versionen
Datastream unterstützt MongoDB-Versionen ab 5.0.
Bekannte Einschränkungen
Bekannte Einschränkungen bei Verwendung von MongoDB als Quelle:
- Wenn Sie die Datastream API verwenden, können Sie nur angeben, welche Felder in Ihrem Stream ausgeschlossen werden sollen. Die Angabe einer Einschlussliste für Felder wird nicht unterstützt.
- Die Streamwiederherstellung wird nicht unterstützt.