Datastream supporta la replica degli eventi di modifica da un'origine MongoDB. MongoDB è un database NoSQL open source che utilizza documenti simili a JSON. Un documento può contenere altri documenti incorporati. I documenti vengono raccolti in raccolte e un database MongoDB archivia una o più raccolte di documenti.
Anziché archiviare i dati in tabelle di righe e colonne come i database SQL relazionali, ogni record in un database MongoDB è un documento descritto in JSON binario (BSON), una rappresentazione binaria dei dati. Le applicazioni possono quindi recuperare questi dati in formato JSON.
Questa pagina contiene informazioni su:
- I termini chiave che devi conoscere quando esegui la replica da un database MongoDB
- Il comportamento di Datastream per la gestione dei dati estratti da un database MongoDB di origine
- Le versioni ed edizioni di MongoDB supportate da Datastream
- Limitazioni note per l'utilizzo di MongoDB come origine
Termini chiave
Di seguito sono riportati i termini chiave che devi conoscere quando lavori con le origini MongoDB:
Connessione SRV: una stringa di connessione con un nome host che corrisponde a un record SRV (Service) del servizio DNS (Domain Name System). La stringa ha il seguente formato:
mongodb+srv://[username:password@]host[/[defaultauthdb][?options]]
Per ulteriori informazioni, consulta la documentazione di MongoDB.
Stringa di connessione standard: il formato standard dell'URI di connessione MongoDB utilizzato per connettersi a un deployment autonomo, a un set di repliche o a un cluster partizionato di MongoDB self-hosted. La stringa ha il seguente formato:
mongodb://[username:password@]host1[:port1][,...hostN[:portN]][/[defaultauthdb][?options]]
Per ulteriori informazioni, consulta la documentazione di MongoDB.
Set di replica: un cluster di server MongoDB che implementa la replica e il failover automatico. I set di repliche forniscono ridondanza e alta disponibilità e sono la base per tutti gli implementazioni di produzione.
Cluster con partizioni: un cluster con partizioni MongoDB è costituito da shard, mongos e server di configurazione. MongoDB esegue il partitioning dei dati a livello di raccolta, distribuendoli tra i vari shard del cluster.
mongos: l'interfaccia tra le applicazioni client e il cluster suddiviso in parti.
mongos
agisce come router delle query e delle operazioni di scrittura nei frammenti.Raccolta: MongoDB organizza i dati in una struttura gerarchica. Un deployment di MongoDB contiene uno o più database e ogni database contiene una o più raccolte. In ogni raccolta, MongoDB archivia i dati come documenti che contengono coppie di campi e valori. Le raccolte sono analoghe alle tabelle nei database relazionali.
Comportamento
Il database MongoDB di origine si basa sui modifiche in tempo reale per replicare le modifiche nella destinazione. I flussi di modifiche ti consentono di accedere ai dati in tempo reale e sono supportati per gli set di repliche e i cluster con partizioni.
- Se configurato, tutti i dati storici vengono replicati per gli oggetti inclusi.
- Tutte le modifiche, come inserimenti, aggiornamenti ed eliminazioni dagli oggetti specificati, vengono replicate.
Versioni
Datastream supporta le versioni di MongoDB successive alla 5.0.
Limitazioni note
Le limitazioni note per l'utilizzo di MongoDB come origine includono:
- Quando utilizzi l'API Datastream, puoi specificare solo i campi da escludere nello stream. La specifica di un elenco di inclusione per i campi non è supportata.
- Il recupero dello stream non è supportato.
Passaggi successivi
- Scopri come configurare un'origine MongoDB per l'utilizzo con Datastream.