Este documento te muestra cómo hacer lo siguiente:
- Instala un paquete de JavaScript en un repositorio de Dataform.
- Autentica un paquete privado de NPM para habilitar su instalación en un repositorio.
- Crea un paquete de JavaScript personalizado que puedas usar para desarrollar flujos de trabajo.
Antes de comenzar
En la consola de Google Cloud , ve a la página Dataform.
Realiza una o ambas de las siguientes acciones:
- Para instalar un paquete en un repositorio o autenticar un paquete privado de NPM para habilitar su instalación, sigue estos pasos:
- Selecciona o crea un repositorio.
- Selecciona o crea un lugar de trabajo de desarrollo.
- Opcional: Para instalar un paquete privado, autentica el paquete privado.
- Si tu repositorio no contiene un archivo
package.json
, creapackage.json
y mueve el paquete principal de Dataform.
- Para crear un paquete, sigue estos pasos:
- Crea un repositorio de Dataform dedicado a tu paquete. Haz que el nombre del repositorio coincida con el nombre de tu paquete.
- Conecta el repositorio a un repositorio de Git de terceros que alojará tu paquete.
- Crea e inicializa un espacio de trabajo en el repositorio de Dataform.
- Para instalar un paquete en un repositorio o autenticar un paquete privado de NPM para habilitar su instalación, sigue estos pasos:
Asegúrate de tener los permisos necesarios para completar las tareas de este documento.
Roles obligatorios
Para obtener los permisos que necesitas para completar las tareas de este documento, pídele a tu administrador que te otorgue los siguientes roles de IAM:
-
Editor de Dataform (
roles/dataform.editor
) en espacios de trabajo y repositorios -
Administrador de Dataform (
roles/dataform.admin
) en repositorios
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Instala un paquete
En esta sección, se muestra cómo instalar un paquete de JavaScript y cómo importarlo a un archivo de JavaScript y a un archivo SQLX para que puedas usar el paquete y desarrollar flujos de trabajo en Dataform.
Para usar un paquete en Dataform, debes instalarlo en tu repositorio.
Puedes instalar los siguientes tipos de paquetes en Dataform:
- Paquetes públicos de NPM publicados
- Paquetes públicos de NPM no publicados
- Paquetes privados de NPM autenticados
Luego, para usar el paquete en un archivo JavaScript o SQLX, debes importar el contenido seleccionado del paquete al archivo. También puedes importar un paquete completo a un archivo JavaScript o SQLX en lugar de su contenido seleccionado.
Para evitar problemas con la instalación de paquetes en tu entorno de producción, te recomendamos que hagas lo siguiente:
Especifica explícitamente la versión del paquete en
package.json
, por ejemplo,3.0.0
. No uses otras opciones dedependencies
depackage.json
, por ejemplo,>version
.Prueba las versiones nuevas de los paquetes en un entorno que no sea de producción. Para obtener más información sobre cómo configurar diferentes entornos del ciclo de vida del flujo de trabajo, consulta Prácticas recomendadas para el ciclo de vida del flujo de trabajo.
Cómo agregar un paquete como dependencia
Para instalar un paquete dentro de un repositorio de Dataform, debes agregarlo como una dependencia en el archivo package.json
:
- En tu espacio de trabajo, en el panel Archivos, selecciona
package.json
. Agrega el paquete al bloque
dependencies
:Agrega un paquete público de NPM publicado con el siguiente formato:
"PACKAGE-NAME": "PACKAGE-VERSION"
Reemplaza lo siguiente:
- PACKAGE-NAME con el nombre del paquete.
- PACKAGE-VERSION con la versión más reciente del paquete público de NPM publicado. Para evitar problemas con la instalación del paquete, especifica la versión de forma explícita, por ejemplo,
3.0.0
.
Agrega un paquete público de NPM no publicado con el siguiente formato:
"PACKAGE-NAME": "PACKAGE-URL"
Reemplaza lo siguiente:
- PACKAGE-NAME con el nombre del paquete.
- PACKAGE-URL con la URL
tar.gz
del repositorio de paquetes de terceros, por ejemplo,https://github.com/user/sample-package-repository/archive/master.tar.gz
.
Agrega un paquete privado de NPM autenticado con el siguiente formato:
"REGISTRY-SCOPE/PACKAGE-NAME": "PACKAGE-URL"
Reemplaza lo siguiente:
- REGISTRY-SCOPE con el nombre del paquete.
REGISTRY-SCOPE debe coincidir con el alcance del registro definido en el archivo
.nmprc
de tu repositorio. - PACKAGE-NAME con el nombre del paquete.
- PACKAGE-URL con la URL
tar.gz
del repositorio de paquetes, por ejemplo,https://github.com/user/sample-package-repository/archive/master.tar.gz
.
- REGISTRY-SCOPE con el nombre del paquete.
REGISTRY-SCOPE debe coincidir con el alcance del registro definido en el archivo
Haz clic en Instalar paquetes.
En el siguiente muestra de código, se muestra el paquete de dimensiones que cambian lentamente de código abierto público agregado al archivo .package.json
:
```json
{
"name": "repository-name",
"dependencies": {
"@dataform/core": "2.0.3",
"dataform-scd": "https://github.com/dataform-co/dataform-scd/archive/0.3.tar.gz"
}
}
```
Importa una función o constante de un paquete a un archivo JavaScript en Dataform
Para usar una función o una constante de un paquete dentro de un archivo JavaScript en Dataform, primero debes importarla al archivo.
Para importar una función o una constante de un paquete a un archivo JavaScript, sigue estos pasos:
- En tu espacio de trabajo, en el panel Archivos, selecciona un archivo
.js
en el que quieras usar el paquete. En el archivo, importa una función o una constante con el siguiente formato:
const { EXPORT-NAME } = require("PACKAGE-NAME");
- Reemplaza EXPORT-NAME por el nombre de la función o la constante que deseas usar, declarada en
module.exports
en el archivo del paqueteindex.js
. - Reemplaza PACKAGE-NAME por el nombre del paquete que deseas usar.
- Reemplaza EXPORT-NAME por el nombre de la función o la constante que deseas usar, declarada en
En el siguiente muestra de código, se muestra la función getDomain
del paquete postoffice
importada y utilizada en un archivo JavaScript:
/*
* Contents of postoffice index.js:
* module.exports = { getDomain };
*/
const { getDomain } = require("postoffice");
getDomain();
Importa un paquete completo a un archivo JavaScript en Dataform
Para importar todo el paquete a un archivo JavaScript en lugar de importar funciones o constantes seleccionadas a un archivo JavaScript, sigue estos pasos:
- En tu espacio de trabajo, en el panel Archivos, selecciona un archivo
.js
en el que quieras usar el paquete. En el archivo, importa el paquete con el siguiente formato:
const CONSTANT-NAME = require("PACKAGE-NAME");
- Reemplaza CONSTANT-NAME por un nombre para la constante.
- Reemplaza PACKAGE-NAME por el nombre del paquete que deseas usar.
En el siguiente muestra de código, se muestra la función getDomain
del paquete postoffice
importado que se usa en un archivo JavaScript:
/*
* Contents of postoffice index.js:
* module.exports = { getDomain };
*/
const postoffice = require("postoffice");
postoffice.getDomain();
Importa una función o constante de paquete a un archivo SQLX en Dataform
Para usar una función o una constante de un paquete dentro de un archivo SQLX, primero debes importarla al archivo.
Para importar una función o una constante de un paquete a un archivo SQLX, sigue estos pasos:
- En tu espacio de trabajo, en el panel Archivos, selecciona un archivo
.sqlx
en el que quieras usar el paquete. En el archivo, ingresa el siguiente bloque
js
:js { const { EXPORT-NAME } = require("PACKAGE-NAME"); }
- Reemplaza EXPORT-NAME por el nombre de la función o la constante que deseas usar, declarada en
module.exports
en el archivo del paqueteindex.js
. - Reemplaza PACKAGE-NAME por el nombre del paquete que deseas usar.
- Reemplaza EXPORT-NAME por el nombre de la función o la constante que deseas usar, declarada en
En la siguiente muestra de código, se muestra la función getDomain
del paquete postoffice
importada en un bloque js
y utilizada en una instrucción SELECT
en un archivo SQLX:
/*
* Contents of postoffice index.js:
* module.exports = { getDomain };
*/
config {
type: "table",
}
js {
const { getDomain } = require("postoffice");
}
SELECT ${getDomain("email")} as test
Importa un paquete completo a un archivo SQLX en Dataform
Para importar todo el paquete a un archivo SQLX en lugar de importar funciones o constantes seleccionadas a un archivo JavaScript, sigue estos pasos:
- En tu espacio de trabajo, en el panel Archivos, selecciona un archivo
.sqlx
en el que quieras usar el paquete. En el archivo, importa el paquete con el siguiente formato:
js { const CONSTANT-NAME = require("PACKAGE-NAME"); }
- Reemplaza CONSTANT-NAME por un nombre para la constante.
- Reemplaza PACKAGE-NAME por el nombre del paquete que deseas usar.
En la siguiente muestra de código, se muestra el paquete postoffice
importado en un bloque js
y su función getDomain
utilizada en una instrucción SELECT
en un archivo SQLX:
/*
* Contents of postoffice index.js:
* module.exports = { getDomain };
*/
config {
type: "table",
}
js {
const postoffice = require("postoffice");
}
SELECT ${postoffice.getDomain("email")} as test
Autentica un paquete privado
En esta sección, se muestra cómo autenticar un paquete de npm privado en Dataform para habilitar su instalación en un repositorio de Dataform.
Para instalar un paquete privado de npm en un repositorio de Dataform y usarlo para desarrollar tu flujo de trabajo, primero debes autenticar el paquete en Dataform. El proceso de autenticación es diferente para el primer paquete privado en un repositorio y para un paquete privado posterior en un repositorio.
Autentica el primer paquete privado en un repositorio de Dataform
Para autenticar paquetes privados de NPM en Dataform, debes hacer lo siguiente antes de instalar el primer paquete privado de NPM en un repositorio de Dataform:
Crea un secreto de Secret Manager dedicado a almacenar tokens de autenticación de paquetes privados de npm en el repositorio de Dataform.
- Agrega el token de autenticación del paquete, que obtuviste de tu registro de npm, al secreto.
Debes almacenar todos los tokens de autenticación de los paquetes privados de npm en tu repositorio en un solo secreto. Debes crear un secreto dedicado por cada repositorio de Dataform. El secreto debe estar en formato JSON.
Sube el secreto al repositorio de Dataform.
Crea un archivo
.npmrc
y agrega el token de autenticación del paquete al archivo.El token de autenticación en el archivo
.npmrc
debe coincidir con el token de autenticación en el secreto subido.
Después de autenticar el paquete privado de NPM, puedes instalar el paquete en el repositorio de Dataform.
Crea un secreto para la autenticación de paquetes privados
Para autenticar paquetes privados de NPM en un repositorio de Dataform, debes crear un secreto de Secret Manager y definir tokens de autenticación para todos los paquetes privados que quieras instalar en el repositorio de Dataform dentro del secreto. Define un token de autenticación para cada paquete privado de NPM y almacena todos los tokens de autenticación en un solo secreto para cada repositorio. El secreto debe estar en formato JSON.
Para crear un secreto con tokens de autenticación para paquetes privados de NPM, sigue estos pasos:
En Secret Manager, crea un secreto.
- En el campo Valor del secreto, ingresa uno o varios tokens de autenticación con el siguiente formato:
{ "AUTHENTICATION_TOKEN_NAME": "TOKEN_VALUE" }
Reemplaza lo siguiente:
- AUTHENTICATION_TOKEN_NAME: Es un nombre único para el token que identifica el paquete que autentica.
- TOKEN_VALUE: Es el valor del token de autenticación que obtuviste de tu registro de npm.
Otorga acceso al secreto a tu cuenta de servicio de Dataform.
Tu cuenta de servicio de Dataform tiene el siguiente formato:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
- Cuando otorgues acceso, asegúrate de otorgar el rol
roles/secretmanager.secretAccessor
a tu cuenta de servicio de Dataform.
- Cuando otorgues acceso, asegúrate de otorgar el rol
Sube el secreto para la autenticación de paquetes privados a un repositorio de Dataform
Antes de instalar un paquete privado de NPM en un repositorio de Dataform por primera vez, sube tu secreto que contiene el token de autenticación del paquete al repositorio.
Para subir el secreto con los tokens de autenticación de paquetes privados de NPM a un repositorio de Dataform, sigue estos pasos:
En la consola de Google Cloud , ve a la página Dataform.
Selecciona el repositorio en el que deseas instalar paquetes privados de npm.
En la página del repositorio, haz clic en Configuración > Configurar paquetes privados de NPM.
En el panel Agregar token para secreto del paquete de npm, en el menú Secreto, selecciona el secreto que contiene los tokens de autenticación para los paquetes privados de npm.
Haz clic en Guardar.
Crea un archivo .npmrc
para la autenticación de paquetes privados
Para autenticar paquetes privados de NPM en un repositorio de Dataform, debes crear un archivo .npmrc
de nivel superior en el repositorio. Debes almacenar tokens de autenticación para todos los paquetes privados de NPM que se instalarán en el repositorio dentro del archivo .npmrc
. Los tokens de autenticación del archivo .npmrc
deben coincidir con los tokens de autenticación del secreto subido al repositorio. Para obtener más información sobre los archivos .npmrc
, consulta la documentación de npmrc.
Para crear un archivo .npmrc
de nivel superior en tu repositorio, sigue estos pasos:
En la consola de Google Cloud , ve a la página Dataform.
Selecciona el repositorio en el que deseas instalar paquetes privados de NPM y, luego, selecciona un espacio de trabajo.
En el panel Archivos, haz clic en
Más y, luego, en Crear archivo.En el panel Crear un archivo nuevo, haz lo siguiente:
En el campo Agregar una ruta de acceso al archivo, ingresa
.npmrc
.Haz clic en Crear archivo.
Agrega un token de autenticación al archivo .npmrc
en un repositorio de Dataform
Para autenticar un paquete privado de NPM en un repositorio de Dataform que ya contiene un secreto con tokens de autenticación de paquetes y un archivo .npmrc
, debes agregar el token de autenticación del paquete privado al archivo .npmrc
del repositorio.
En el archivo .npmrc
, debes definir el alcance de tu registro de NPM y agregar el token de autenticación para el paquete privado al que se accede en ese alcance. Para obtener más información sobre los archivos .npmrc
, consulta la documentación de npmrc.
El token de autenticación en el archivo .npmrc
debe coincidir con el token de autenticación en el secreto subido al repositorio.
Para agregar un token de autenticación al archivo .npmrc
en un repositorio de Dataform, sigue estos pasos:
En la consola de Google Cloud , ve a la página Dataform.
Selecciona el repositorio en el que deseas instalar paquetes privados de NPM y, luego, selecciona un espacio de trabajo.
En el panel Archivos, selecciona el archivo
.npmrc
.En el archivo
.npmrc
, define el alcance del registro de NPM y el token de autenticación para el paquete privado con el siguiente formato:@REGISTRY-SCOPE:registry=NPM-REGISTRY-URL NPM-REGISTRY-URL:_authToken=$AUTHENTICATION-TOKEN
Reemplaza lo siguiente:
- REGISTRY-SCOPE: Es el alcance del registro de NPM al que deseas aplicar el token de autenticación.
- NPM-REGISTRY-URL: Es la URL de tu registro de NPM, por ejemplo,
https://npm.pkg.github.com
. - AUTHENTICATION-TOKEN: Es el token de autenticación para el paquete privado de NPM. El token de autenticación en el archivo
.npmrc
debe coincidir con el token de autenticación en el secreto subido. El token de autenticación se proporciona como una variable de entorno en el archivo.npmrc
, así que asegúrate de agregar los corchetes de apertura${
y de cierre}
.
Puedes ingresar varios tokens de autenticación.
En el siguiente muestra de código, se muestra un token de autenticación para un paquete privado de npm agregado al archivo .npmrc
en un repositorio de Dataform:
@company:registry=https://npm.pkg.github.com
//npm.pkg.github.com/:_authToken=${AUTHENTICATION_TOKEN}
Autentica un paquete privado posterior en un repositorio de Dataform
Para autenticar un paquete privado de NPM en un repositorio de Dataform que ya contiene un secreto con tokens de autenticación de paquetes y un archivo .npmrc
, sigue estos pasos:
En Secret Manager, enumera los secretos y selecciona el secreto que almacena los tokens de autenticación de los paquetes privados de NPM de tu repositorio.
Agrega una versión nueva al secreto.
De forma predeterminada, Dataform usa la versión más reciente del secreto.
- Agrega el token de autenticación para el paquete privado al valor secreto en el siguiente formato:
{ "AUTHENTICATION_TOKEN_NAME": "TOKEN_VALUE" }
Reemplaza lo siguiente:
- AUTHENTICATION_TOKEN_NAME: Es un nombre único para el token que identifica el paquete que autentica.
- TOKEN_VALUE: Es el valor del token de autenticación que obtuviste de tu registro de npm.
Puedes agregar varios tokens de autenticación a la vez.
En Dataform, agrega el token de autenticación al archivo
.npmrc
de tu repositorio.
Después de autenticar el paquete privado de npm, puedes instalar el paquete en el repositorio de Dataform.
Crea un paquete
En esta sección, se muestra cómo crear un paquete de JavaScript personalizado que puedes usar para desarrollar flujos de trabajo en Dataform.
Para crear un paquete que puedas reutilizar en varios repositorios de Dataform, debes crear un repositorio de Dataform dedicado al paquete y conectarlo a un repositorio de Git de terceros para que esté disponible para otros repositorios de Dataform.
Luego, debes crear un archivo index.js
de nivel superior y agregar el contenido del paquete exportable, como funciones y constantes, al archivo. Para ver un ejemplo de un paquete creado en Dataform, consulta dataform-package-base
en GitHub.
Después de crear el paquete, puedes instalarlo en otro repositorio de Dataform y usar el contenido exportable del paquete, como constantes y funciones, para desarrollar flujos de trabajo.
Como alternativa a la creación de un paquete, puedes reutilizar funciones y constantes de JavaScript en un solo repositorio de Dataform con la opción de incluir. Para obtener más información, consulta Cómo reutilizar variables y funciones con includes en Dataform.
Para crear tu propio paquete con código JavaScript que puedas reutilizar en Dataform, sigue estos pasos en tu espacio de trabajo:
En el panel Archivos, haz clic en
Más.Haz clic en Crear archivo.
En el panel Crear un archivo nuevo, haz lo siguiente:
En el campo Agregar una ruta de acceso al archivo, ingresa
index.js
.Haz clic en Crear archivo.
En el archivo
index.js
, ingresa el código JavaScript que deseas que exporte tu paquete.Crea constantes con el siguiente formato:
const CONSTANT_NAME = CONSTANT_VALUE; module.exports = { CONSTANT_NAME };
Reemplaza lo siguiente:
CONSTANT_NAME
: El nombre de tu constanteCONSTANT_VALUE
: Es el valor de tu constante.
Crea funciones con el siguiente formato:
function FUNCTION_NAME(PARAMETERS) { FUNCTION_BODY } module.exports = { FUNCTION_NAME }
Reemplaza lo siguiente:
FUNCTION_NAME
: El nombre de tu función.PARAMETERS
: Son los parámetros de tu función.FUNCTION_BODY
: Es el código que deseas que ejecute la función.
Opcional: Haz clic en Formato.
Opcional: En el directorio
definitions
, agrega el código de tu paquete que no se exportará.
En el siguiente muestra de código del paquete, se muestra el archivo index.js
del paquete postoffice
que exporta la función getDomain
:
// filename index.js
// package name postoffice
const GENERIC_DOMAINS = "('samplemail.com','samplemail.co.uk','examplemailbox.com'";
function getDomain(email) {
let cleanEmail = `trim(${email})`
const domain = `substr(${cleanEmail}, strpos(${cleanEmail}, '@') + 1)`;
return `case
when ${domain} in ${common.GENERIC_DOMAINS} then ${cleanEmail}
when ${domain} = "othermailbox.com" then "other.com"
when ${domain} = "mailbox.com" then "mailbox.global"
when ${domain} = "support.postman.com" then "postman.com"
else ${domain}
end`;
}
module.exports = { getDomain }
¿Qué sigue?
- Para obtener información sobre cómo administrar el paquete principal de Dataform requerido, consulta Administra el paquete principal de Dataform.
- Para obtener más información sobre los paquetes en Dataform, consulta Cómo reutilizar código en varios repositorios con paquetes.
- Para aprender a escribir variables y funciones de JavaScript que puedes reutilizar en Dataform, consulta Cómo reutilizar variables y funciones con includes en Dataform.