Los pasos paralelos pueden reducir el tiempo total de ejecución de un flujo de trabajo, ya que realizan varias llamadas de bloqueo al mismo tiempo.
Las llamadas de bloqueo, como sleep, las llamadas HTTP y las devoluciones de llamada, pueden tardar desde milisegundos hasta días. Los pasos paralelos están diseñados para ayudar con este tipo de operaciones simultáneas de larga duración. Si un flujo de trabajo debe realizar varias llamadas de bloqueo que son independientes entre sí, el uso de ramas paralelas puede reducir el tiempo total de ejecución, ya que las llamadas se inician al mismo tiempo y se espera a que todas se completen.
Por ejemplo, si tu flujo de trabajo debe recuperar datos del cliente de varios sistemas independientes antes de continuar, las ramas paralelas permiten solicitudes de API simultáneas. Si hay cinco sistemas y cada uno tarda dos segundos en responder, realizar los pasos de forma secuencial en un flujo de trabajo podría tardar al menos 10 segundos, mientras que realizarlos en paralelo podría tardar solo dos.
Crea un paso paralelo
Crea un paso parallel
para definir una parte de tu flujo de trabajo en la que se puedan ejecutar dos o más pasos de forma simultánea.
YAML
- PARALLEL_STEP_NAME: parallel: exception_policy: POLICY shared: [VARIABLE_A, VARIABLE_B, ...] concurrency_limit: CONCURRENCY_LIMIT BRANCHES_OR_FOR: ...
JSON
[ { "PARALLEL_STEP_NAME": { "parallel": { "exception_policy": "POLICY", "shared": [ "VARIABLE_A", "VARIABLE_B", ... ], "concurrency_limit": "CONCURRENCY_LIMIT", "BRANCHES_OR_FOR": ... } } } ]
Reemplaza lo siguiente:
PARALLEL_STEP_NAME
: Es el nombre del paso paralelo.POLICY
(opcional): Determina la acción que tomarán otras ramas cuando se produzca una excepción no controlada. La política predeterminada,continueAll
, no genera ninguna acción adicional y se intentarán ejecutar todas las demás ramas. Ten en cuenta quecontinueAll
es la única política compatible actualmente.VARIABLE_A
,VARIABLE_B
, etcétera: Es una lista de variables grabables con alcance superior que permiten asignaciones dentro del paso paralelo. Para obtener más información, consulta Variables compartidas.CONCURRENCY_LIMIT
(opcional): Es la cantidad máxima de ramas e iteraciones que se pueden ejecutar de forma simultánea en una sola ejecución de flujo de trabajo antes de que se pongan en cola más ramas e iteraciones para esperar. Esto se aplica solo a un paso deparallel
y no se propaga. Debe ser un número entero positivo y puede ser un valor literal o una expresión. Para obtener más información, consulta Límites de simultaneidad.BRANCHES_OR_FOR
: Usabranches
ofor
para indicar una de las siguientes opciones:- Son las ramas que se pueden ejecutar de forma simultánea.
- Es un bucle en el que las iteraciones se pueden ejecutar de forma simultánea.
Ten en cuenta lo siguiente:
- Las ramas y las iteraciones paralelas pueden ejecutarse en cualquier orden y es posible que se ejecuten en un orden diferente con cada ejecución.
- Los pasos paralelos pueden incluir otros pasos paralelos anidados hasta el límite de profundidad. Consulta Cuotas y límites.
- Para obtener más detalles, consulta la página de referencia de sintaxis para pasos paralelos.
Reemplaza la función experimental por un paso paralelo
Si usas experimental.executions.map
para admitir el trabajo paralelo, puedes migrar tu flujo de trabajo para que use pasos paralelos y ejecute bucles for
comunes en paralelo. Para ver ejemplos, consulta Reemplaza la función experimental por un paso paralelo.
Muestras
En estos ejemplos, se muestra la sintaxis.
Realiza operaciones en paralelo (con ramas)
Si tu flujo de trabajo tiene varios conjuntos de pasos diferentes que se pueden ejecutar al mismo tiempo, colocarlos en ramas paralelas puede reducir el tiempo total necesario para completar esos pasos.
En el siguiente ejemplo, se pasa un ID de usuario como argumento al flujo de trabajo y se recuperan datos en paralelo de dos servicios diferentes. Las variables compartidas permiten escribir valores en las ramas y leerlos después de que se completan:
YAML
JSON
Procesa elementos en paralelo (con un bucle paralelo)
Si necesitas realizar la misma acción para cada elemento de una lista, puedes completar la ejecución más rápido con un bucle paralelo. Un bucle paralelo permite que se realicen varias iteraciones del bucle en paralelo. Ten en cuenta que, a diferencia de los bucles for normales, las iteraciones se pueden realizar en cualquier orden.
En el siguiente ejemplo, se procesa un conjunto de notificaciones del usuario en un bucle for
paralelo:
YAML
JSON
Agrega datos (con un bucle paralelo)
Puedes procesar un conjunto de elementos mientras recopilas datos de las operaciones realizadas en cada uno de ellos. Por ejemplo, es posible que desees hacer un seguimiento de los IDs de los elementos creados o mantener una lista de los elementos con errores.
En el siguiente ejemplo, 10 consultas separadas a un conjunto de datos públicos de BigQuery devuelven la cantidad de palabras en un documento o un conjunto de documentos. Una variable compartida permite que el recuento de palabras se acumule y se lea después de que se completen todas las iteraciones. Después de calcular la cantidad de palabras en todos los documentos, el flujo de trabajo devuelve el total.
YAML
JSON
¿Qué sigue?
- Referencia de sintaxis: Pasos paralelos
- Instructivo: Ejecuta un flujo de trabajo que ejecute otros flujos de trabajo en paralelo
- Instructivo: Ejecuta varios trabajos de BigQuery en paralelo