O Dataplex é uma malha de dados inteligente que unifica dados distribuídos e automatiza o gerenciamento e a governança de dados. Com o Dataplex, é possível usar a IA para facilitar consultas de dados, garantia de qualidade e insights de negócios.
O Dataplex realiza a governança em grande escala. Considere, por exemplo, uma empresa de varejo global que gera grandes quantidades de dados de vendas, inventário e clientes armazenados no Cloud Storage, no Spanner e no Pub/Sub. Com os dados distribuídos entre os sistemas, gerenciar a governança, garantir a qualidade e manter a conformidade é complexo e demorado. O Dataplex simplifica esse processo fornecendo uma visualização central para descobrir, criar perfis, validar, rastrear a linhagem e controlar o acesso aos recursos de dados organizacionais.
Por que usar o Dataplex?
O Dataplex governa os dados com os seguintes recursos:
- Catalogação de metadados. Extraia metadados de recursos Google Cloud (no BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Metastore do Dataproc) e de terceiros que você importa para o Dataplex e tenha um instantâneo dos seus recursos de dados.
- Descoberta de dados. Procure dados estruturados e não estruturados em buckets do Cloud Storage para extrair e catalogar os metadados.
- Insights de dados. Use a IA para gerar perguntas em linguagem natural sobre seus dados, descobrir padrões, avaliar a qualidade dos dados e realizar análises estatísticas.
- Criação de perfil de dados. Identifique características comuns dos dados de coluna nas tabelas do BigQuery, como valores de dados típicos, distribuição de dados e contagens nulas, que podem informar a classificação de dados e a garantia de qualidade.
- Qualidade dos dados. Defina e avalie a qualidade dos dados nas tabelas do BigQuery, validando-os com base nas políticas organizacionais e registrando alertas se os dados não atenderem aos critérios de qualidade.
- Glossário de negócios. Gerencie terminologias e definições relacionadas a negócios em toda a organização e vincule termos às colunas da tabela para promover um entendimento consistente do uso de dados.
- Linhagem de dados. Acompanhe como os dados se movimentam nos sistemas: de onde vêm, para onde são transmitidos e quais transformações são aplicadas a eles.
O Dataplex oferece suporte a um ciclo de vida de dados completo, desde a descoberta distribuída até os insights de negócios. Os recursos de governança também estão disponíveis no BigQuery.
A seguir
- Saiba mais sobre a governança do BigQuery.
- Saiba mais sobre o catálogo universal do BigQuery.
- Saiba como pesquisar recursos de dados no catálogo universal do BigQuery.
- Saiba como gerenciar entradas e importar fontes personalizadas.
- Saiba como importar metadados para o Dataplex.