Preços do Dataplex Universal Catalog

Os preços do catálogo universal do Dataplex são baseados no uso de pagamento por uso. Atualmente, o Dataplex Universal Catalog cobra com base nas seguintes SKUs:

  • Processamento do Dataplex Universal Catalog (padrão e premium)
  • Armazenamento de reordenação do Dataplex Universal Catalog
  • Armazenamento de metadados
  • Chamadas da API Data Catalog

Confira abaixo uma visão geral de como cada recurso principal do Dataplex Universal Catalog é cobrado:

Capacidade Processamento do catálogo universal do Dataplex Armazenamento do embaralhamento do Dataplex Universal Catalog Armazenamento de metadados
Colheita de metadados do Cloud Storage Padrão N/A N/A
Bancada de trabalho de análise de dados Premium Sim N/A
Linhagem de dados Premium N/A Sim
Qualidade dos dados Premium N/A Sim, se publicado no Data Catalog
Criação de perfil de dados Premium N/A Sim, se publicado no Data Catalog
Enriquecer metadados no catálogo universal do BigQuery N/A N/A Sim
Enriquecer metadados no Data Catalog N/A N/A Sim

Além disso, as chamadas da API Data Catalog são faturadas com base nas taxas da API Data Catalog.

Outro uso

Os recursos de organização de dados no Dataplex Universal Catalog (configuração de lago, zona ou recursos) e a aplicação e propagação da política de segurança são fornecidos sem custo financeiro.

Além disso, algumas funcionalidades do Dataplex Universal Catalog (incluindo tarefas de qualidade e ingestão de dados agendadas e conectores gerenciados do Dataplex Universal Catalog para ingerir metadados do Cloud SQL e do Looker) acionam a execução de jobs usando o Dataproc Serverless, o BigQuery, o Dataflow e o Cloud Scheduler. Essas utilizações são cobradas de acordo com os modelos de preços do Dataproc, BigQuery, Dataflow e Cloud Scheduler, e as cobranças vão aparecer em Dataproc, BigQuery e Dataflow, em vez de Dataplex Universal Catalog.

Preços do processamento do Dataplex Universal Catalog

O processamento padrão e premium do Dataplex Universal Catalog é medido pela Unidade de Computação de Dados (DCU). A DCU-hora é uma unidade de faturamento abstrata do Dataplex Universal Catalog, e a medição real depende dos recursos individuais que você usa.

Preços do processamento padrão do Dataplex Universal Catalog

O nível padrão do Dataplex Universal Catalog abrange a funcionalidade de descoberta de dados que descobre metadados nos dados gerenciados pelo Dataplex Universal Catalog. Confira abaixo os preços de acordo com a região escolhida.

Nível gratuito do Dataplex Universal Catalog

Como parte do Nível gratuito do Google Cloud, o Dataplex Universal Catalog oferece alguns recursos gratuitos até um limite específico. Esses limites de uso gratuito estão disponíveis durante e após o período de teste gratuito. Se você ultrapassar esses limites de uso e não estiver mais no período de teste, a cobrança será feita de acordo com os preços apresentados nas seções acima.

Recurso Limites mensais de uso gratuito
Processamento do Dataplex Universal Catalog 100 DCU/hora

Preços do processamento premium do Dataplex Universal Catalog

O nível de processamento premium do Dataplex abrange a linhagem, a qualidade, o perfil e o workbench de exploração de dados.

As cobranças de CUP para cada atributo são calculadas da seguinte forma:

  • Verificações automáticas de qualidade de dados:
    • O consumo de horas de DCU é proporcional ao processamento envolvido na criação de perfil dos dados e no cálculo das métricas de qualidade de dados. A cobrança é feita por segundo, com um mínimo de um minuto.
    • A cobrança depende do número de linhas, do número de colunas, da quantidade de dados que você digitalizou, da configuração da regra de qualidade de dados, das configurações de particionamento e agrupamento na tabela e da frequência da digitalização.
    • Há várias opções para reduzir o custo das verificações automáticas de qualidade de dados:
    • Para separar as cobranças de qualidade de dados das outras cobranças na SKU de processamento premium do Dataplex, no relatório de faturamento do Cloud, use o rótulo goog-dataplex-workload-type com o valor DATA_QUALITY.
    • Para filtrar cobranças agregadas, use os seguintes rótulos disponíveis na exportação de faturamento no BigQuery:
      • goog-dataplex-datascan-data-source-dataplex-entity
      • goog-dataplex-data-lake-dataplex-data-lake-data-source
      • goog-dataplex-datascan-data-source-dataplex-zone
      • goog-dataplex-datascan-data-source-project
      • goog-dataplex-datascan-data-source-region
      • goog-dataplex-datascan-id
      • goog-dataplex-datascan-job-id
  • Verificações de criação de perfil de dados:
    • O consumo de horas de DCU é proporcional ao processamento envolvido na criação de perfil dos dados e no cálculo das métricas de qualidade de dados. A cobrança é feita por segundo, com um mínimo de um minuto.
    • A cobrança depende do número de linhas, colunas, dados verificados, configurações de particionamento e de cluster na tabela e da frequência da verificação.
    • Há várias opções para reduzir o custo das verificações de perfil de dados:
      • Amostragem
      • Verificações incrementais
      • Filtragem de colunas
      • Filtragem de linhas
    • Para separar as cobranças de criação de perfil de dados das outras cobranças na SKU de processamento premium do Dataplex, no relatório de faturamento do Cloud, use o rótulo goog-dataplex-workload-type com o valor DATA_PROFILE.
    • Para filtrar cobranças agregadas, use os seguintes rótulos disponíveis na exportação de faturamento no BigQuery:
      • goog-dataplex-datascan-data-source-dataplex-entity
      • goog-dataplex-data-lake-dataplex-data-lake-data-source
      • goog-dataplex-datascan-data-source-dataplex-zone
      • goog-dataplex-datascan-data-source-project
      • goog-dataplex-datascan-data-source-region
      • goog-dataplex-datascan-id
      • goog-dataplex-datascan-job-id
  • Linhagem de dados:
    • O consumo de horas de CUP é proporcional ao processamento envolvido para analisar a linhagem automaticamente.
    • Para separar as cobranças de linhagem de dados de outras cobranças na SKU de processamento premium do Dataplex, no relatório de Cobranças do Cloud, use o rótulo goog-dataplex-workload-type com o valor LINEAGE.
    • Se você chamar a API Data Lineage Origin sourceType com um valor diferente de CUSTOM, isso vai gerar custos adicionais.
  • Bancada de trabalho de análise de dados:
    • O DCU-hora é calculado com base no consumo de computação da sessão.

Exemplo de preços de linhagem de dados

O usuário A ativa a linhagem de dados para acompanhar a linhagem do BigQuery no projeto. O projeto está no local us-central1. Em um mês, a linhagem de dados consome 100 horas de DCU de processamento do Dataplex Premium e gera 1 GiB de metadados de linhagem de dados. O custo é:


100 * $0.089           // 100 DCU-hours of Dataplex Premium processing billed at $0.089 per DCU-hr

+ (1GiB - 1MiB) * $2   // cost of storing 1GiB data lineage metadata excluding 1MiB of free storage per month
  ---
  = $10.9

Preços do armazenamento do embaralhamento do Dataplex Universal Catalog

Os preços do armazenamento de embaralhamento abrangem qualquer armazenamento em disco especificado nos ambientes configurados para o workbench de exploração de dados.

Preços do catálogo

Nesta seção, descrevemos os preços do catálogo universal e do Data Catalog. Para mais informações sobre as diferenças entre o catálogo universal e o Data Catalog, consulte Catálogo universal versus Data Catalog.

As cobranças do catálogo universal se aplicam ao armazenamento de metadados do catálogo universal, incluindo metadados armazenados para a linhagem de dados. Essas cobranças entram em vigor em 1º de agosto de 2024.

As cobranças do Data Catalog se aplicam ao armazenamento de metadados do Data Catalog e às chamadas de API feitas para a API Data Catalog.

As cobranças de armazenamento de metadados e chamadas de API são acumuladas diariamente. Confira o uso não faturado no Google Cloud console.

Preços de armazenamento de metadados

O Dataplex Universal Catalog usa a SKU de armazenamento de metadados para cobrar pelo armazenamento de metadados. O armazenamento de metadados é medido em gibibytes (GiB), sendo que 1 GiB é igual a 1.073.741.824 bytes. O Universal Catalog e o Data Catalog medem a quantidade média de metadados armazenados durante um curto intervalo de tempo. Para fins de faturamento, essas medidas são combinadas em uma média durante o período de um mês. Essa média é multiplicada pela taxa mensal.

Se você não paga em dólar americano, são aplicados os preços na sua moeda local listados na página SKUs do Cloud Platform.

Preços do armazenamento do catálogo universal

As cobranças pelo armazenamento de metadados, incluindo as de entradas e aspectos, são faturadas no projeto em que o respectivo recurso foi criado.

Armazenamento médio mensal Preço (USD)
Qualquer US$ 2 por GiB por mês

Quando um recurso no Data Catalog é disponibilizado simultaneamente no catálogo universal, você paga apenas por uma instância ativa desse recurso.

Preços de armazenamento do Data Catalog

Armazenamento médio mensal Preço (USD)
Até 1 MiB Sem custo
Mais de 1 MiB US$ 2 por GiB por mês

Preços de API

Esta seção descreve os preços das APIs Data Catalog e Catalog universal.

Cobranças da API Universal Catalog

Quando os usuários interagem com o catálogo universal, as chamadas de API para o seguinte são gratuitas:

  • Como criar e gerenciar recursos do catálogo universal
  • Criar e gerenciar recursos de linhagem, exceto linhagens coletadas automaticamente
  • Pesquisa no catálogo

Cobranças da API Data Catalog

As chamadas da API Data Catalog são faturadas conforme descrito na tabela a seguir:

Chamadas de API Preço (USD)
1 milhão por mês Sem custo
Mais de 1 milhão por mês US$ 10 por 100.000 chamadas de API

Se você não paga em dólar americano, são aplicados os preços na sua moeda local listados na página SKUs do Cloud Platform.

Exemplos de preços do catálogo universal

Esta seção mostra exemplos de como calcular o custo do catálogo universal.

Aspectos pequenos

  • O usuário A cria e aplica aspectos pequenos (1024 bytes cada). Por US $10 por mês, o usuário pode armazenar 5 GiB de metadados, o que corresponde aproximadamente a 5 milhões de aspectos. Considerando um aspecto por tabela, isso equivale a um total de 5 milhões de tabelas com aspectos.

  • O usuário B cria 5 milhões de atributos de 1 KB cada no dia 10 do mês e os exclui no dia 20. O custo é de US $3,33, calculado como 5 GiB de dados divididos por um terço do mês:

5 GiB * $2
* 1/3
= $3.33

Aspectos grandes

  • O usuário C cria e aplica aspectos grandes (10 KB cada). Por US $10 por mês, o usuário pode armazenar 5 GiB de metadados, o que corresponde a aproximadamente 500 mil aspectos. Considerando um aspecto por tabela, isso resulta em um total de 500 mil tabelas com aspectos.

  • O usuário D cria 10 mil tipos de aspectos (por exemplo, ETL, governança de dados, qualidade de dados) e aplica aspectos grandes (10 KB cada) usando cada um dos 10 tipos de aspectos. Por US $10 por mês, o usuário pode armazenar 5 GiB de metadados, o que corresponde aproximadamente a 500 mil aspectos. Considerando 10 aspectos por tabela, isso equivale a um total de 50 mil tabelas com aspectos.

A seguir

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Entre em contato com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato