Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
O Datastream é um serviço de replicação de dados e captura de dados alterados (CDC) sem servidor e fácil de usar, que permite sincronizar dados de maneira confiável e com latência mínima.
O Datastream oferece replicação contínua de dados de bancos de dados operacionais para o BigQuery. Além disso, o Datastream suporta a gravação do fluxo de eventos de alteração no Cloud Storage e oferece integração simplificada com modelos do Dataflow para criar fluxos de trabalho personalizados e carregar dados em uma ampla variedade de destinos, como Cloud SQL e Spanner. Você também pode usar o Datastream para aproveitar o fluxo de eventos diretamente do Cloud Storage e implementar arquiteturas orientadas a eventos. O Datastream oferece suporte a fontes Oracle, MySQL, SQL Server, PostgreSQL (incluindo AlloyDB para PostgreSQL), MongoDB (prévia) e Salesforce (prévia).
Veja os benefícios do Datastream:
Configuração integrada de pipelines ELT (extrair, carregar e transformar) para replicação de dados de baixa latência, permitindo insights quase em tempo real no BigQuery.
Ser sem servidor, para que não haja recursos para provisionar ou gerenciar, e o
serviço seja escalonado verticalmente e reduzido automaticamente, conforme necessário, com tempo de inatividade mínimo.
Configuração fácil de usar e experiências de monitoramento que aceleram o retorno do investimento.
Integração com o melhor do portfólio de serviços de dados do Google Cloud para integração de dados no Datastream, Dataflow, Pub/Sub, BigQuery e muito mais.
Sincronização e unificação de fluxos de dados em bancos de dados e aplicativos heterogêneos.
Segurança, com opções de conectividade privada e a segurança que você espera do
Google Cloud.
É preciso e confiável, com relatórios de status transparentes e flexibilidade de processamento robusta diante de mudanças de dados e esquemas.
Compatibilidade com vários casos de uso, incluindo análise, replicação de banco de dados e sincronização para migrações e configurações de nuvem híbrida, e para a criação de arquiteturas orientadas a eventos.
Casos de uso
Os recursos de streaming do Datastream permitem vários casos de uso:
Replicação e sincronização de dados em toda a organização com latência mínima
É possível sincronizar dados em bancos de dados e aplicativos heterogêneos
de maneira confiável, com baixa latência e um impacto mínimo no desempenho da
sua origem. Aproveite o poder dos fluxos de dados para análises, replicação de bancos de dados, migração para a nuvem e arquiteturas orientadas a eventos em ambientes híbridos.
Aumente ou reduza a escala com uma arquitetura sem servidor
Comece a trabalhar rapidamente com um serviço sem servidor e fácil de usar que
faz o escalonamento sem interrupções conforme os volumes de dados mudam. Concentrar-se em gerar insights atualizados com base nos seus dados e responder a problemas de alta prioridade, em vez de gerenciar a infraestrutura, o ajuste de desempenho ou o provisionamento de recursos.
Integração com o Google Cloud pacote de integração de dados
Conecte dados em toda a organização com o pacote de produtos de integração de dados. Google Cloud Integre o Datastream aos modelos de jobs do Dataflow para ler dados de um bucket do Cloud Storage e carregá-los em vários destinos, como BigQuery, Spanner e Cloud SQL.
Elementos de experiência
Há três elementos principais no Datastream:
As configurações de conectividade privada permitem que o Datastream se comunique com uma fonte de dados em uma rede privada (internamente noGoogle Cloudou com fontes externas conectadas por VPN ou Interconnect). Essa comunicação acontece por meio de uma conexão de peering de nuvem privada virtual (VPC).
Os perfis de conexão representam as informações de conectividade para uma origem e um destino. Essas informações serão usadas por um stream.
Os streams usam as informações nos perfis de conexão para transferir dados de CDC e de preenchimento da origem para o destino.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-12 UTC."],[[["\u003cp\u003eDatastream is a serverless change data capture (CDC) and replication service that synchronizes data from various operational databases, including Oracle, MySQL, SQL Server, PostgreSQL, and Salesforce, into BigQuery, Cloud Storage, and other destinations.\u003c/p\u003e\n"],["\u003cp\u003eThis service offers low-latency data replication, enabling near real-time insights, seamless scaling, and easy setup and monitoring without the need for manual resource management.\u003c/p\u003e\n"],["\u003cp\u003eDatastream integrates with Google Cloud's data services like Dataflow, Pub/Sub, and BigQuery to build ELT pipelines and is designed to unify data streams across heterogeneous databases and applications.\u003c/p\u003e\n"],["\u003cp\u003eThe platform supports a variety of use cases, such as analytics, database replication, migration and synchronization across hybrid-cloud environments, and building event-driven architectures with minimal latency.\u003c/p\u003e\n"]]],[],null,["# Datastream overview\n\nDatastream is a serverless and easy-to-use change data capture (CDC) and replication service that lets you synchronize data reliably, and with minimal latency.\n\nDatastream provides seamless replication of data from operational databases into BigQuery. In addition, Datastream supports writing the change event stream into Cloud Storage, and offers streamlined integration with Dataflow templates to build custom workflows for loading data into a wide range of destinations, such as Cloud SQL and Spanner. You can also use Datastream to take advantage of the event stream directly from Cloud Storage to realize event-driven architectures. Datastream supports Oracle, MySQL, SQL Server, PostgreSQL (including AlloyDB for PostgreSQL), MongoDB ([Preview](/products#product-launch-stages)) and Salesforce ([Preview](/products#product-launch-stages)) sources.\n\nBenefits of Datastream include:\n\n- Seamless setup of ELT (Extract, Load, Transform) pipelines for low-latency data replication to enable near real-time insights in BigQuery.\n- Being serverless so there are no resources to provision or manage, and the service scales up and down automatically, as needed, with minimal downtime.\n- Easy-to-use setup and monitoring experiences that achieve super-fast time-to-value.\n- Integration across the best of Google Cloud data services' portfolio for data integration across Datastream, Dataflow, Pub/Sub, BigQuery, and more.\n- Synchronizing and unifying data streams across heterogeneous databases and applications.\n- Security, with private connectivity options and the security you expect from Google Cloud.\n- Being accurate and reliable, with transparent status reporting and robust processing flexibility in the face of data and schema changes.\n- Supporting multiple use cases, including analytics, database replication, and synchronization for migrations and hybrid-cloud configurations, and for building event-driven architectures.\n\nUse cases\n---------\n\nThe streaming capabilities of Datastream enable a variety of use cases:\n\n- **Replicating and synchronizing data across your organization with minimal\n latency**\n\n You can synchronize data across heterogeneous databases and applications\n reliably, with low latency, and with minimal impact to the performance of\n your source. Unlock the power of data streams for analytics, database\n replication, cloud migration, and event-driven architectures across hybrid\n environments.\n- **Scale up or down with a serverless architecture seamlessly**\n\n Get up and running fast with a serverless and easy-to-use service that\n scales seamlessly as your data volumes shift. Focus on deriving up-to-date\n insights from your data and responding to high-priority issues, instead of\n managing infrastructure, performance tuning, or resource provisioning.\n- **Integrate with the Google Cloud data integration suite**\n\n Connect data across your organization with the Google Cloud data\n integration suite of products. Integrate Datastream with\n Dataflow job templates to read data from a Cloud Storage bucket\n and load it into a variety of destinations, such as BigQuery,\n Spanner, and Cloud SQL.\n\nExperience elements\n-------------------\n\nThere are three main elements in Datastream:\n\n- **Private connectivity configurations** enable Datastream to communicate with a data source over a private network (internally within Google Cloud, or with external sources connected over VPN or Interconnect). This communication happens through a Virtual Private Cloud (VPC) peering connection.\n- **Connection profiles** represent connectivity information to both a source and a destination. This information will be used by a stream.\n- **Streams** use the information in the connection profiles to transfer CDC and backfill data from the source to the destination.\n\nWhat's next\n-----------\n\n- Start replicating your data [from a source database to BigQuery datasets](/datastream/docs/quickstart-replication-to-bigquery).\n- Learn more about [key concepts and features](/datastream/docs/behavior-overview) of Datastream.\n- Find out how to create [private connectivity configurations](/datastream/docs/create-a-private-connectivity-configuration), [connection profiles](/datastream/docs/create-connection-profiles) and [streams](/datastream/docs/create-a-stream)."]]