Las entradas y los grupos de entrada son conceptos clave en Data Catalog.
La siguiente ilustración muestra cómo las entradas y los grupos de entradas encajan en el Modelo de datos de Data Catalog.
Entradas
Las entradas de Data Catalog representan recursos de datos:
- Recursos de Google Cloud, como un conjunto de datos o una tabla de BigQuery, un tema de Pub/Sub, por ejemplo
- Recursos personalizados con tipos de datos personalizados.
Puedes crear, buscar y administrar tus entradas. Para obtener más información, consulta Crea entradas personalizadas de Data Catalog para tus fuentes de datos.
Grupos de entrada
Las entradas se encuentran en un grupo de entrada. Un grupo de entrada es un conjunto junto con las políticas de Identity and Access Management que especificar los usuarios que pueden crear, editar y ver entradas dentro de un grupo de entradas.
Data Catalog crea automáticamente grupos de entradas para Google Cloud
recursos, como BigQuery (@bigquery
) y Pub/Sub
temas (@pubsub
).
Los grupos de entrada de BigQuery y Pub/Sub son únicos porque no puedes ejecutar funciones de API que suelen funcionar en grupos de entrada personalizados. Algunos ejemplos de esas funciones son recuperar la lista de grupos de entrada en un proyecto, recuperar información básica sobre un grupo de entrada y crear o borrar un etiqueta.
Creas tu propio grupo de entrada para contener tus entradas de conjunto de archivos de Cloud Storage y las políticas de IAM asociadas con esas entradas. Si deseas obtener más información, consulta Archivos de superficie de Cloud Storage con entradas de conjuntos de archivos.
Los grupos de entrada, similares a las entradas, se pueden buscar.
Asigna recursos de datos a entradas y grupos de entradas
Consulta las siguientes tablas para ver cómo Data Catalog asigna recursos de datos de diferentes productos de Google Cloud.
Recurso de Dataproc Metastore | Recurso de Data Catalog |
---|---|
Servicio | Entrada y grupo de entrada |
Base de datos | Entrada |
Tabla | Entrada |
Recurso de Dataplex | Recurso de Data Catalog |
---|---|
Lake | Entrada y grupo de entrada |
Zona | Entrada |
Tabla | Entrada |
Conjunto de archivos | Entrada |
Recurso de Pub/Sub | Recurso de Data Catalog |
---|---|
Tema | Entrada dentro de un grupo de entradas de Pub/Sub |
Recurso de Bigtable | Recurso de Data Catalog |
---|---|
Instancia | Entrada y grupo de entrada |
Clúster | Atributo dentro de una entrada de instancia |
Tabla | Entrada dentro del grupo de entrada de instancia |
Familias de columnas | Atributo dentro de una entrada de tabla |
Recurso de BigQuery | Recurso de Data Catalog |
---|---|
Conjunto de datos | Entrada dentro de un grupo de entrada de BigQuery |
Conjunto de datos vinculado | Entrada dentro de un grupo de entrada de BigQuery |
Tabla | Entrada dentro de un grupo de entrada de BigQuery |
Ver | Entrada dentro de un grupo de entrada de BigQuery |
Modelo | Entrada dentro de un grupo de entrada de BigQuery |
Rutina | Entrada dentro de un grupo de entrada de BigQuery |
Conexión | Entrada dentro de un grupo de entrada de BigQuery |
Recurso de Vertex AI | Recurso de Data Catalog |
---|---|
Modelo | Entrada dentro de un grupo de entradas de Vertex AI |
Conjunto de datos | Entrada dentro de un grupo de entradas de Vertex AI |
FeatureGroup | Entrada dentro de un grupo de entradas de Vertex AI |
FeatureOnlineStore | Entrada dentro de un grupo de entradas de Vertex AI |
FeatureView | Entrada dentro de un grupo de entradas de Vertex AI |