Precios del Catálogo Universal Dataplex
El precio del Catálogo Universal de Dataplex se basa en el pago por uso. El Catálogo Universal de Dataplex actualmente cobra según los siguientes SKU:
- Procesamiento del catálogo universal Dataplex (estándar y premium)
- Almacenamiento aleatorio del catálogo universal de Dataplex
- Almacenamiento de metadatos
- Llamadas a la API del catálogo de datos
A continuación, se presenta una descripción general de alto nivel de cómo se factura cada capacidad clave del Catálogo Universal de Dataplex:
Capacidad | Procesamiento del catálogo universal Dataplex | Almacenamiento aleatorio del catálogo universal de Dataplex | Almacenamiento de metadatos |
---|---|---|---|
Recopilación de metadatos de almacenamiento en la nube | Estándar | N / A | N / A |
Banco de trabajo de exploración de datos | De primera calidad | Sí | N / A |
Linaje de datos | De primera calidad | N / A | Sí |
Calidad de los datos | De primera calidad | N / A | Sí, si se publica en el Catálogo de datos |
Perfilado de datos | De primera calidad | N / A | Sí, si se publica en el Catálogo de datos |
Enriquecer metadatos en el catálogo universal de BigQuery | N / A | N / A | Sí |
Enriquecer metadatos en el Catálogo de datos | N / A | N / A | Sí |
Además de esta facturación, las llamadas a la API de Data Catalog se facturan en función de los cargos de la API de Data Catalog .
Otros usos
Las funciones de organización de datos en el Catálogo Universal de Dataplex (configuración de lago, zona o activo) y la aplicación y propagación de políticas de seguridad se proporcionan de forma gratuita.
Además, algunas funcionalidades del Catálogo Universal de Dataplex (incluidas las tareas programadas de calidad e ingesta de datos, y los conectores administrados del Catálogo Universal de Dataplex para la ingesta de metadatos de CloudSQL y Looker) activan la ejecución de trabajos mediante Dataproc Serverless, BigQuery, Dataflow y Cloud Scheduler. Estos usos se facturan según los modelos de precios de Dataproc , BigQuery , Dataflow y Cloud Scheduler , respectivamente, y los cargos se mostrarán en Dataproc, BigQuery y Dataflow en lugar de en el Catálogo Universal de Dataplex.
Precios de procesamiento del Catálogo Universal Dataplex
El procesamiento estándar y premium del Catálogo Universal de Dataplex se contabiliza mediante la Unidad de Cómputo de Datos (DCU). La DCU-hora es una unidad de facturación abstracta para el Catálogo Universal de Dataplex y la contabilización real depende de las funciones individuales que utilice.
Precios de procesamiento estándar del Catálogo Universal Dataplex
El nivel estándar de Dataplex Universal Catalog incluye la funcionalidad de descubrimiento de datos que permite descubrir metadatos en los datos administrados por Dataplex Universal Catalog. A continuación, se muestran los precios según la región de su elección.
Catálogo universal de Dataplex, versión gratuita
Como parte del plan gratuito de Google Cloud , el Catálogo Universal de Dataplex ofrece algunos recursos gratuitos hasta un límite específico. Estos límites de uso están disponibles durante y después del periodo de prueba. Si supera estos límites de uso y ya no está en el periodo de prueba, se le cobrará según los precios descritos en las secciones anteriores.
Recurso | Límites de uso gratuito mensuales |
---|---|
Procesamiento del catálogo universal Dataplex | 100 DCU-hora |
Precios de procesamiento premium del Catálogo Universal de Dataplex
El nivel de procesamiento premium de Dataplex cubre el linaje de datos, la calidad de los datos, la creación de perfiles de datos y el banco de trabajo de exploración de datos.
Los cargos de DCU para cada característica se calculan de la siguiente manera:
- Escaneos automáticos de calidad de datos :
- El consumo de DCU-hora es proporcional al procesamiento necesario para perfilar los datos y calcular las métricas de calidad de los mismos. Se factura por segundo, con un mínimo de un minuto.
- El cargo depende de la cantidad de filas, la cantidad de columnas, la cantidad de datos que haya escaneado, la configuración de las reglas de calidad de datos, las configuraciones de partición y agrupamiento en la tabla, y la frecuencia del escaneo.
- Existen varias opciones para reducir el costo de los escaneos automáticos de calidad de datos:
- Para separar los cargos por calidad de datos de otros cargos en el SKU de procesamiento premium de Dataplex, en el informe de facturación de la nube , use la etiqueta goog-dataplex-workload-type con el valor DATA_QUALITY.
- Para filtrar cargos agregados, utilice las siguientes etiquetas disponibles en la exportación de facturación en BigQuery:
- goog-dataplex-datascan-origen-de-datos-entidad-dataplex
- goog-dataplex-datascan-fuente-de-datos-dataplex-lago
- goog-dataplex-datascan-fuente-de-datos-zona-dataplex
- Proyecto de origen de datos de goog-dataplex-datascan
- goog-dataplex-datascan-región-de-fuente-de-datos
- ID de escaneo de datos de Google Dataplex
- ID de trabajo de escaneo de datos de goog-dataplex
- Escaneos de perfiles de datos :
- El consumo de DCU-hora es proporcional al procesamiento necesario para perfilar los datos y calcular las métricas de calidad de los mismos. Se factura por segundo, con un mínimo de un minuto.
- El cargo depende de la cantidad de filas, la cantidad de columnas, la cantidad de datos escaneados, las configuraciones de partición y agrupamiento en la tabla y la frecuencia del escaneo.
- Existen varias opciones para reducir el coste de los análisis de perfiles de datos:
- Muestreo
- Escaneos incrementales
- Filtrado de columnas
- Filtrado de filas
- Para separar los cargos de creación de perfiles de datos de otros cargos en el SKU de procesamiento premium de Dataplex, en el informe de facturación en la nube , use la etiqueta goog-dataplex-workload-type con el valor DATA_PROFILE.
- Para filtrar cargos agregados, utilice las siguientes etiquetas disponibles en la exportación de facturación en BigQuery:
- goog-dataplex-datascan-origen-de-datos-entidad-dataplex
- goog-dataplex-datascan-fuente-de-datos-dataplex-lago
- goog-dataplex-datascan-fuente-de-datos-zona-dataplex
- Proyecto de origen de datos de goog-dataplex-datascan
- goog-dataplex-datascan-región-de-fuente-de-datos
- ID de escaneo de datos de Google Dataplex
- ID de trabajo de escaneo de datos de goog-dataplex
- Linaje de datos :
- El consumo de horas de DCU es proporcional al procesamiento involucrado para analizar automáticamente el linaje.
- Para separar los cargos por linaje de datos de otros cargos en el SKU de procesamiento premium de Dataplex, en el informe de facturación de la nube , use la etiqueta goog-dataplex-workload-type con el valor LINEAGE.
- Si llama a la API de linaje de datos Origin
sourceType
con un valor distinto deCUSTOM
, se generan costos adicionales.
- Banco de trabajo de exploración de datos :
- La hora DCU se calcula en función del consumo de cómputo de la sesión.
Ejemplo de precios de linaje de datos
El usuario A habilita el linaje de datos para rastrear el linaje de BigQuery en su proyecto. El proyecto se encuentra en la ubicación us-central1. Durante un mes, el linaje de datos consume 100 horas DCU de procesamiento de Dataplex Premium y genera 1 GiB de metadatos de linaje de datos. El costo es:
100 * $0.089 // 100 DCU-hours of Dataplex Premium processing billed at $0.089 per DCU-hr
+ (1GiB - 1MiB) * $2 // cost of storing 1GiB data lineage metadata excluding 1MiB of free storage per month
---
= $10.9
Precios de almacenamiento aleatorio del Catálogo Universal Dataplex
Los precios de almacenamiento aleatorio cubren cualquier almacenamiento en disco especificado en los entornos configurados para el banco de trabajo de exploración de datos .
Precios del catálogo
Esta sección describe los precios del catálogo universal y del catálogo de datos. Para obtener más información sobre las diferencias entre ambos, consulte Catálogo universal frente a Catálogo de datos .
Se aplican cargos al almacenamiento de metadatos del catálogo universal, incluidos los metadatos almacenados para el linaje de datos. Estos cargos entran en vigor el 1 de agosto de 2024.
Los cargos del Catálogo de datos se aplican al almacenamiento de metadatos para el Catálogo de datos y las llamadas API realizadas a la API del Catálogo de datos.
Los cargos por almacenamiento de metadatos y llamadas a la API se acumulan diariamente. Puede consultar el uso no facturado enGoogle Cloud console.
Precios del almacenamiento de metadatos
El Catálogo Universal de Dataplex utiliza el SKU de almacenamiento de metadatos para facturar el almacenamiento. El almacenamiento de metadatos se mide en gibibytes (GiB), donde 1 GiB equivale a 1 073 741 824 bytes. El Catálogo Universal y el Catálogo de Datos miden la cantidad promedio de metadatos almacenados durante un breve periodo de tiempo. Para la facturación, estas mediciones se combinan en un promedio mensual, que se multiplica por la tarifa mensual.
Si paga en una moneda distinta a USD, se aplicarán los precios que figuran en su moneda en los SKU de Cloud Platform .
Precios de almacenamiento de catálogos universales
Los cargos por almacenamiento de metadatos (incluidos los de entradas y aspectos) se facturan al proyecto en el que se creó el recurso respectivo.
Almacenamiento promedio mensual | Precio (USD) |
---|---|
Cualquier | $2 por GiB por mes |
Cuando un recurso del Catálogo de datos se pone a disposición simultáneamente en el catálogo universal, se le cobrará solo por una instancia activa de dicho recurso.
Precios de almacenamiento del catálogo de datos
Almacenamiento promedio mensual | Precio (USD) |
---|---|
Hasta 1 MiB | Sin cargo |
Más de 1 MiB | $2 por GiB por mes |
Precios de la API
En esta sección se describen los precios de las API del catálogo universal y del catálogo de datos.
Tarifas de la API del catálogo universal
A medida que los usuarios interactúan con el catálogo universal , las llamadas API para lo siguiente son gratuitas:
- Creación y gestión de recursos de catálogo universal
- Creación y gestión de recursos de linaje, excepto el linaje que se recolecta automáticamente
- Búsqueda en el catálogo
Cargos de la API del catálogo de datos
Las llamadas a la API del catálogo de datos se facturan como se describe en la siguiente tabla:
Llamadas API | Precio (USD) |
---|---|
1 millón en un mes | Sin cargo |
Más de 1 millón en un mes | $10 por cada 100,000 llamadas API |
Si paga en una moneda distinta a USD, se aplicarán los precios que figuran en su moneda en los SKU de Cloud Platform .
Ejemplos de precios de catálogo universal
En esta sección se proporcionan ejemplos de cómo calcular el coste del catálogo universal.
Pequeños aspectos
El usuario A crea y aplica aspectos pequeños (1024 bytes cada uno). Por $10 al mes, puede almacenar 5 GiB de metadatos, lo que equivale aproximadamente a 5 millones de aspectos. Suponiendo un aspecto por tabla, esto suma un total de 5 millones de tablas con aspectos.
El usuario B crea 5 millones de aspectos de 1 KB cada uno el día 10 del mes y los elimina el día 20. El costo es de $3.33, calculado como 5 GiB de datos divididos entre un tercio del mes:
5 GiB * $2
* 1/3
= $3.33
Grandes aspectos
El usuario C crea y aplica aspectos grandes (10 KB cada uno). Por $10 al mes, puede almacenar 5 GiB de metadatos, lo que equivale aproximadamente a 500 000 aspectos. Suponiendo un aspecto por tabla, el total asciende a 500 000 tablas con aspectos.
El usuario D crea 10 000 tipos de aspecto (por ejemplo, ETL, gobernanza de datos, calidad de datos) y aplica aspectos grandes (de 10 KB cada uno) utilizando cada uno de los 10 tipos de aspecto. Por 10 $ al mes, el usuario puede almacenar 5 GiB de metadatos, lo que equivale aproximadamente a 500 000 aspectos. Suponiendo 10 aspectos por tabla, el total asciende a 50 000 tablas con aspectos.
¿Qué sigue?
- Lea la documentación del producto: Catálogo universal Dataplex , Catálogo de datos .
- Comience a utilizar el Catálogo Universal Dataplex .
- Obtenga información sobre las soluciones y los casos de uso del Catálogo Universal Dataplex .