Vista JOBS_BY_FOLDER

La vista INFORMATION_SCHEMA.JOBS_BY_FOLDER contiene metadatos casi en tiempo real sobre todos los trabajos enviados en la carpeta principal del proyecto actual, incluidos los trabajos de las subcarpetas.

Rol necesario

Para obtener el permiso que necesitas para consultar la vista INFORMATION_SCHEMA.JOBS_BY_FOLDER, pide a tu administrador que te asigne el rol de gestión de identidades y accesos Lector de recursos de BigQuery (roles/bigquery.resourceViewer) en tu carpeta principal. Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene el permiso bigquery.jobs.listAll INFORMATION_SCHEMA.JOBS_BY_FOLDER, que es necesario para consultar la vista bigquery.jobs.listAll INFORMATION_SCHEMA.JOBS_BY_FOLDER.

También puedes obtener este permiso con roles personalizados u otros roles predefinidos.

Para obtener más información sobre los permisos de BigQuery, consulta Control de acceso con gestión de identidades y accesos.

Esquema

Los datos subyacentes se particionan por la columna creation_time y se agrupan en clústeres por project_id y user_email. La columna query_info contiene información adicional sobre los trabajos de consulta.

La vista INFORMATION_SCHEMA.JOBS_BY_FOLDER tiene el siguiente esquema:

Nombre de la columna Data type (Dato) Valor
bi_engine_statistics RECORD Si el proyecto está configurado para usar BI Engine, este campo contiene BiEngineStatistics. De lo contrario, NULL.
cache_hit BOOLEAN Indica si los resultados de la consulta de este trabajo procedían de una caché. Si tienes un trabajo de instrucción de varias consultas, cache_hit de tu consulta principal es NULL.
creation_time TIMESTAMP (Columna de partición) Hora de creación de este trabajo. La partición se basa en la hora UTC de esta marca de tiempo.
destination_table RECORD Tabla de destino de los resultados (si corresponde).
end_time TIMESTAMP Hora de finalización de este trabajo, en milisegundos desde el inicio del registro de tiempo. Este campo representa la hora en la que el trabajo pasa al estado DONE.
error_result RECORD Detalles de los errores como objetos ErrorProto.
folder_numbers REPEATED INTEGER IDs numéricos de las carpetas que contienen el proyecto, empezando por la carpeta que contiene directamente el proyecto, seguida de la carpeta que contiene la carpeta secundaria, y así sucesivamente. Por ejemplo, si folder_numbers es [1, 2, 3], la carpeta 1 contiene inmediatamente el proyecto, la carpeta 2 contiene 1 y la carpeta 3 contiene 2. Esta columna solo se rellena en JOBS_BY_FOLDER.
job_creation_reason.code STRING Especifica el motivo de alto nivel por el que se ha creado un trabajo.
Los valores posibles son:
  • REQUESTED: se ha solicitado la creación de un trabajo.
  • LONG_RUNNING: la solicitud de consulta se ha ejecutado más allá del tiempo de espera definido por el sistema especificado por el campo timeoutMs en QueryRequest. Por lo tanto, se consideró una operación de larga duración para la que se creó un trabajo.
  • LARGE_RESULTS: los resultados de la consulta no caben en la respuesta insertada.
  • OTHER: el sistema ha determinado que la consulta debe ejecutarse como un trabajo.
job_id STRING El ID del trabajo si se ha creado uno. De lo contrario, el ID de consulta de una consulta que usa el modo de creación de tareas opcional. Por ejemplo, bquxjob_1234.
job_stages RECORD Fases de la consulta de la tarea.

Nota: Los valores de esta columna están vacíos en las consultas que leen datos de tablas con políticas de acceso a nivel de fila. Para obtener más información, consulta las prácticas recomendadas para la seguridad a nivel de fila en BigQuery.

job_type STRING El tipo de trabajo. Puede ser QUERY, LOAD, EXTRACT, COPY o NULL. Un valor NULL indica un trabajo en segundo plano.
labels RECORD Matriz de etiquetas aplicadas al trabajo como pares clave-valor.
parent_job_id STRING ID del trabajo principal (si lo hay).
priority STRING La prioridad de este trabajo. Los valores válidos son INTERACTIVE y BATCH.
project_id STRING Columna de clustering: el ID del proyecto.
project_number INTEGER El número del proyecto.
query STRING Texto de la consulta de SQL. Solo la vista JOBS_BY_PROJECT tiene la columna de consulta.
referenced_tables RECORD Matriz de tablas a las que hace referencia la tarea. Solo se rellena en el caso de las consultas que no se han encontrado en la caché.
reservation_id STRING Nombre de la reserva principal asignada a este trabajo, con el formato RESERVATION_ADMIN_PROJECT:RESERVATION_LOCATION.RESERVATION_NAME.
En este resultado:
  • RESERVATION_ADMIN_PROJECT: el nombre del proyecto de Google Cloud que administra la reserva
  • RESERVATION_LOCATION: la ubicación de la reserva
  • RESERVATION_NAME: el nombre de la reserva
edition STRING Edición asociada a la reserva asignada a este trabajo. Para obtener más información sobre las ediciones, consulta Introducción a las ediciones de BigQuery.
session_info RECORD Detalles sobre la sesión en la que se ejecutó este trabajo, si la hubiera.
start_time TIMESTAMP Hora de inicio de este trabajo, en milisegundos desde la época. Este campo representa la hora en la que la tarea pasa del estado PENDING a RUNNING o DONE.
state STRING Estado de ejecución del trabajo. Los estados válidos son PENDING, RUNNING y DONE.
statement_type STRING El tipo de instrucción de consulta. Por ejemplo, DELETE, INSERT, SCRIPT, SELECT o UPDATE. Consulta QueryStatementType para ver una lista de valores válidos.
timeline RECORD Cronología de la consulta de la tarea. Contiene instantáneas de la ejecución de consultas.
total_bytes_billed INTEGER Si el proyecto está configurado para usar los precios bajo demanda, este campo contiene el total de bytes facturados por la tarea. Si el proyecto está configurado para usar precios de tarifa plana, no se te cobrarán los bytes y este campo solo tiene carácter informativo.

Nota: Los valores de esta columna están vacíos en las consultas que leen datos de tablas con políticas de acceso a nivel de fila. Para obtener más información, consulta las prácticas recomendadas para la seguridad a nivel de fila en BigQuery.

total_bytes_processed INTEGER

Total de bytes procesados por el trabajo.

Nota: Los valores de esta columna están vacíos en las consultas que leen datos de tablas con políticas de acceso a nivel de fila. Para obtener más información, consulta las prácticas recomendadas para la seguridad a nivel de fila en BigQuery.

total_modified_partitions INTEGER Número total de particiones que ha modificado la tarea. Este campo se rellena en los trabajos LOAD y QUERY.
total_slot_ms INTEGER Milisegundos de ranura de la tarea durante toda su duración en el estado RUNNING, incluidas las reintentos.
transaction_id STRING ID de la transacción en la que se ha ejecutado este trabajo (si la hay). Vista previa
user_email STRING Columna de clustering: dirección de correo o cuenta de servicio del usuario que ha ejecutado el trabajo.
query_info.resource_warning STRING El mensaje de advertencia que aparece si el uso de recursos durante el procesamiento de la consulta supera el umbral interno del sistema.
Si una tarea de consulta se completa correctamente, se rellena el campo resource_warning. Con resource_warning, obtienes puntos de datos adicionales para optimizar tus consultas y configurar la monitorización de las tendencias de rendimiento de un conjunto de consultas equivalente mediante query_hashes.
query_info.query_hashes.normalized_literals STRING Contiene el valor hash de la consulta. normalized_literals es un hash hexadecimal STRING que ignora los comentarios, los valores de los parámetros, las funciones definidas por el usuario y los literales. El valor hash será diferente si cambian las vistas subyacentes o si la consulta hace referencia implícitamente a columnas, como SELECT *, y el esquema de la tabla cambia.
Este campo aparece en las consultas de GoogleSQL que se han realizado correctamente y que no son aciertos de caché.
query_info.performance_insights RECORD Estadísticas de rendimiento de la tarea.
query_info.optimization_details STRUCT Las optimizaciones basadas en el historial del trabajo.
transferred_bytes INTEGER Total de bytes transferidos en consultas entre nubes, como las tareas de transferencia entre nubes de BigQuery Omni.
materialized_view_statistics RECORD Estadísticas de las vistas materializadas que se han tenido en cuenta en un trabajo de consulta. Vista previa
metadata_cache_statistics RECORD Estadísticas sobre el uso del índice de columnas de metadatos de las tablas a las que se hace referencia en un trabajo de consulta.
search_statistics RECORD Estadísticas de una consulta de búsqueda.
query_dialect STRING Este campo estará disponible en algún momento de mayo del 2025. El dialecto de consulta que se ha usado en la tarea. Los valores válidos son los siguientes:
  • GOOGLE_SQL: se ha solicitado que el trabajo use GoogleSQL.
  • LEGACY_SQL: se ha solicitado que el trabajo use Legacy SQL.
  • DEFAULT_LEGACY_SQL: no se ha especificado ningún dialecto de consulta en la solicitud de trabajo. BigQuery ha usado el valor predeterminado de LegacySQL.
  • DEFAULT_GOOGLE_SQL: no se ha especificado ningún dialecto de consulta en la solicitud de trabajo. BigQuery ha usado el valor predeterminado de GoogleSQL.

Este campo solo se rellena en las tareas de consulta. La selección predeterminada del dialecto de consulta se puede controlar mediante los ajustes de configuración.
continuous BOOLEAN Si el trabajo es una consulta continua.
continuous_query_info.output_watermark TIMESTAMP Representa el punto hasta el que la consulta continua ha procesado los datos correctamente.
vector_search_statistics RECORD Estadísticas de una consulta de búsqueda de vectores.

Conservación de datos

Esta vista contiene los trabajos que se están ejecutando y el historial de los últimos 180 días.

Ámbito y sintaxis

Las consultas en esta vista deben incluir un calificador de región. En la siguiente tabla se explica el ámbito de la región de esta vista:

Nombre de la vista Ámbito de los recursos Ámbito de la región
[PROJECT_ID.]`region-REGION`.INFORMATION_SCHEMA.JOBS_BY_FOLDER Carpeta que contiene el proyecto especificado REGION
Sustituye lo siguiente:
  • Opcional: PROJECT_ID: el ID de tu Google Cloud proyecto. Si no se especifica, se usa el proyecto predeterminado.
  • REGION: cualquier nombre de región del conjunto de datos. Por ejemplo, `region-us`.