Prepara datos con Gemini

En este documento, se describe cómo generar y administrar sugerencias de código SQL para tus preparaciones de datos en BigQuery.

Para obtener más información, consulta Introducción a la preparación de datos de BigQuery.

Antes de comenzar

Abre el editor de preparación de datos en BigQuery

Para abrir el editor de preparación de datos en BigQuery, crea una preparación de datos nueva, una a partir de una tabla existente o abre una preparación de datos existente. Para obtener más información sobre lo que sucede cuando creas una preparación de datos, consulta Puntos de entrada de la preparación de datos.

En la página BigQuery Studio, puedes ir al editor de preparación de datos de las siguientes maneras:

Crear nuevo

Para crear una nueva preparación de datos en BigQuery, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página de BigQuery Studio.
    Ir a BigQuery
  2. Ve a la lista Crear y haz clic en Preparación de datos. El editor de preparación de datos se muestra en una nueva pestaña de preparación de datos sin título.
  3. En la barra de búsqueda del editor, ingresa el nombre de la tabla o las palabras clave y selecciona una tabla. Se abrirá el editor de preparación de datos de la tabla, que mostrará una vista previa de tus datos en la pestaña Datos y un conjunto inicial de sugerencias de preparación de datos de Gemini.

    Aparecerá un recurso de Preparación de datos en el panel Explorador, en el que podrás acceder a esta preparación en el futuro.
  4. Opcional: Para simplificar la vista, activa el modo de pantalla completa haciendo clic en pantalla completa Pantalla completa.

Crear nuevo desde la tabla

Para crear una nueva preparación de datos a partir de una tabla existente, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página de BigQuery Studio.
    Ir a BigQuery
  2. En el panel Explorador, mantén el puntero sobre una tabla.
  3. Haz clic en more_vert Menú > Consultar en > Preparación de datos. Se abre el editor de preparación de datos de la tabla, que muestra una vista previa de tus datos en la pestaña Datos y un conjunto inicial de sugerencias de preparación de datos de Gemini.

    Aparecerá un recurso de Preparación de datos en el panel Explorador, en el que podrás acceder a esta preparación en el futuro.
  4. Opcional: Para simplificar la vista, activa el modo de pantalla completa haciendo clic en pantalla completa Pantalla completa.

Abrir existente

Para abrir el editor de una preparación de datos existente, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página de BigQuery Studio.
    Ir a BigQuery
  2. En el panel Explorador, haz clic en el nombre de tu proyecto y en Preparación de datos.
  3. Selecciona la preparación de datos existente. Se muestra la vista de gráfico de la canalización de preparación de datos.
  4. Selecciona uno de los nodos del gráfico. Se abrirá el editor de preparación de datos de la tabla, que mostrará una vista previa de tus datos en la pestaña Datos y un conjunto inicial de sugerencias de preparación de datos de Gemini.
  5. Opcional: Para simplificar la vista, activa el modo de pantalla completa haciendo clic en pantalla completa Pantalla completa.

Crea pasos de preparación de datos

Los datos se preparan en pasos. Puedes obtener una vista previa de los pasos sugeridos por Gemini o aplicarlos. También puedes ajustar las sugerencias o aplicar tus propios pasos. Para obtener más información sobre los pasos de preparación de datos compatibles, consulta Pasos compatibles.

Consulta y aplica las sugerencias de Gemini

Cuando abres el editor de preparación de datos de tu tabla en los pasos anteriores, Gemini inspecciona los datos y el esquema de la tabla que cargaste y genera sugerencias.

Cuando veas los datos en la vista de datos, haz clic en el nombre de una columna o en una celda en particular. Gemini genera sugerencias de filtros y transformaciones específicas para esa columna o celda.

Aplicar una sugerencia de Gemini como paso de preparación de datos:

  1. En la vista de datos, ve a la lista Pasos y revisa las sugerencias.
  2. Opcional: Para editar la descripción o la expresión en SQL de una tarjeta de sugerencia, haz clic en Vista previa.
  3. Haz clic en Aplicar.
  4. Opcional: Para obtener mejores sugerencias de Gemini, proporciona ejemplos y repite estos pasos.

Puedes realizar las siguientes acciones en la vista de datos cuando haces clic en Pasos aplicados y examinas la lista de pasos:

  • Para editar o quitar un paso, haz clic en more_vert Menú y realiza el cambio.
  • Selecciona cualquier paso de la lista para ver la muestra de datos y el esquema a partir de este paso en particular.
  • Selecciona un paso de la lista para insertar pasos nuevos después de él.

Mejora las sugerencias con un ejemplo

Para ajustar las sugerencias de Gemini, muéstrale un ejemplo de cómo deberían verse los datos en la celda:

  1. En la vista de datos, edita los valores de una a tres celdas para demostrar cómo deberían verse los valores de esa columna. Por ejemplo, ingresa una fecha como quieras dar formato a todas las fechas. Gemini genera sugerencias nuevas según tus cambios.

  2. Para modificar una tarjeta de sugerencia, haz clic en Vista previa.

  3. Haz clic en Aplicar.

Cómo agregar pasos de forma manual

Si ninguna de las sugerencias satisface tus necesidades, agrega la tuya propia. Para ello, haz clic en Agregar paso, selecciona un tipo de paso y, luego, ingresa una descripción y una expresión SQL.

Agrega una transformación

  1. En la vista de datos, selecciona una columna y haz clic en Agregar paso > transformación.
  2. Ingresa una descripción para el paso.
  3. Ingresa una expresión SQL.
  4. En el campo Columna de destino, selecciona una columna o crea una nueva.
  5. Opcional: Haz clic en Vista previa y revisa el paso.
  6. Haz clic en Aplicar.

Filtra filas

Para agregar un filtro que quite filas, sigue estos pasos:

  1. En la vista de datos, haz clic en Agregar paso > Filtrar.
  2. Ingresa una descripción para el paso.
  3. Ingresa una expresión SQL.
  4. Opcional: Haz clic en Vista previa y revisa el paso.
  5. Haz clic en Aplicar.

Formato de la expresión de filtro

Las expresiones SQL para los filtros retienen las filas que coinciden con la condición especificada. Esto equivale a una sentencia SELECT … WHERE SQL_EXPRESSION.

Por ejemplo, para retener registros en los que la columna year es mayor o igual que 2000, la condición es year >= 2000.

Las expresiones deben seguir la sintaxis de SQL de BigQuery para la cláusula WHERE.

Configura la tabla de errores y agrega una regla de validación

Puedes agregar un filtro que cree una regla de validación, que envíe errores a una tabla de errores o que haga que falle la ejecución de la preparación de datos.

Configura la tabla de errores

Para configurar tu tabla de errores, sigue estos pasos:

  1. En la vista de datos, ve a la barra de herramientas y haz clic en Más > Tabla de errores.
  2. Haz clic en Habilitar tabla de errores.
  3. Define la ubicación de la tabla.
  4. Opcional: Define una duración máxima para mantener los errores.
  5. Haz clic en Guardar.

Agrega una regla de validación

Para agregar una regla de validación, sigue estos pasos:

  1. En la vista de datos, haz clic en Agregar paso > Filtrar.
  2. Ingresa una descripción para el paso.
  3. Ingresa una expresión SQL, en forma de una cláusula WHERE.
  4. Opcional: Si deseas que la expresión SQL actúe como una regla de validación, selecciona la casilla de verificación Las filas de validación con errores se envían a la tabla de errores. También puedes cambiar un filtro por una validación en la barra de herramientas de preparación de datos. Para ello, haz clic en Más > Tabla de errores.
  5. Opcional: Haz clic en Vista previa y revisa el paso.
  6. Haz clic en Aplicar.

Borra una columna

Para borrar una columna de una preparación de datos, sigue estos pasos:

  1. En la vista de esquema, haz clic en more_vert Menú junto a la columna que quieres borrar.
  2. Haz clic en Borrar. Se agrega un nuevo paso aplicado para la columna borrada.

Agrega una operación de unión

Para agregar un paso de operación de unión entre dos fuentes en la preparación de datos, sigue estos pasos:

  1. En la vista de datos de un nodo en la preparación de datos, ve a la lista Pasos y haz clic en Agregar paso > Unión.
  2. En el cuadro de diálogo Configurar unión, selecciona la otra tabla involucrada en la operación de unión (denominada lado derecho de la unión).
  3. Opcional: Selecciona las claves de unión para cada tabla. Las claves de unión deben tener el mismo tipo de datos.
  4. Opcional: Selecciona el tipo de operación de combinación que deseas realizar, como Inner join.
  5. Opcional: Para preparar la tabla del lado derecho antes de especificar una clave de unión, por ejemplo, cuando los tipos de datos de las dos columnas de la unión difieren, sigue estos pasos:

    1. Guardar una unión sin seleccionar una clave de unión
    2. Ve a la vista de gráfico y selecciona la tabla de origen del lado derecho.
    3. Prepara la tabla del lado derecho, como transformar el tipo de datos de una columna.
    4. Para editar la unión que guardaste en el paso anterior, establece una clave.
  6. Haz clic en Crear.

Se conservan todas las filas de la tabla, incluso si no hay un valor correspondiente en una de las tablas.

Después de guardar el paso, la tabla de origen que seleccionaste (el lado derecho de la combinación) y la operación de combinación se reflejan en la lista de pasos aplicados y en los nodos de la vista de gráfico de tu preparación de datos.

Cómo agregar o cambiar una tabla de destino

Para agregar o cambiar una tabla de destino para el resultado de la preparación de datos, sigue estos pasos:

  1. En la vista de datos, haz clic en Agregar > Destino.
  2. Selecciona el proyecto en el que se almacena la tabla de destino.
  3. Selecciona uno de los conjuntos de datos o carga uno nuevo.
  4. Ingresa una tabla de destino. Si la tabla no existe, la preparación de datos creará una tabla nueva en la primera ejecución. Para obtener más información, consulta Modo de escritura.
  5. Selecciona tu conjunto de datos como el conjunto de datos de destino.
  6. Haz clic en Guardar.

Ejecuta la preparación de datos

Para ejecutar los pasos de preparación de datos y cargar los datos preparados en la tabla de destino, programa una ejecución de preparación de datos única o recurrente:

  1. Guarda los cambios pendientes en la preparación de los datos.
  2. En la barra de herramientas de preparación de datos, haz clic en Programar.
  3. Ingresa un nombre para la programación.
  4. Ingresa el nombre de la cuenta de servicio asociada con la ejecución.
  5. Establece una frecuencia.
  6. Haz clic en Crear programación.

Para obtener más información, consulta Programa la preparación de datos.

Actualiza los ejemplos de preparación de datos

Los datos de la muestra no se actualizan automáticamente. Si los datos de las tablas de origen para la preparación de datos cambiaron, pero los cambios no se reflejan en la muestra de datos de la preparación, haz clic en Más > Actualizar muestra.

¿Qué sigue?