Eseguire la migrazione a Batch da Cloud Life Sciences

Questa pagina descrive come eseguire la migrazione a Batch da Cloud Life Sciences.

Google Cloud ha annunciato che Cloud Life Sciences è stato ritirato il 17 luglio 2023 e verrà disattivato l'8 luglio 2025. Tuttavia, Batch è disponibile a livello generale ed è un successore completo che supporta tutti i casi d'uso per Cloud Life Sciences.

Scopri di più su Batch, Cloud Life Sciences e sulle fasi di lancio del prodotto.

Cloud Life Sciences e Batch

La migrazione da Cloud Life Sciences a Batch implica principalmente la comprensione di come utilizzare Batch per i carichi di lavoro che attualmente esegui eseguendo pipeline Cloud Life Sciences.

Per capire come eseguire i carichi di lavoro di Cloud Life Sciences su Batch, consulta tutte le sezioni seguenti:

Panoramica

Una pipeline Cloud Life Sciences descrive una sequenza di azioni (container) da eseguire e l'ambiente in cui eseguire i container.

Un job batch descrive un array di una o più attività e l'ambiente in cui eseguirle. Definisci il workload per un job come una sequenza di uno o più elementi eseguibili (container e/o script) da eseguire. Ogni attività per un job rappresenta una esecuzione della sua sequenza di elementi eseguibili.

Le pipeline Cloud Life Sciences possono essere espresse come job Batch a singola attività.

Ad esempio, i seguenti esempi descrivono una semplice pipeline Cloud Life Sciences e il relativo job Batch equivalente:

Pipeline Cloud Life Sciences Job batch
  {
    "actions": [
      {
        "imageUri": "bash",
        "commands": [
          "-c",
          "echo Hello, world!"
        ]
      }
    ]
  }
  
    {
      "taskGroups" : [{
        "taskSpec" : {
          "runnables" : [{
            "container":{
              "imageUri": "bash",
              "commands": [
                "-c",
                "echo Hello, world!"
              ]
            }
          }]
        }
      }]
    }
    

I job Batch multi-task sono simili alle pipeline Cloud Life Sciences copiate.

A differenza di Cloud Life Sciences, Batch ti consente di pianificare automaticamente più esecuzioni del carico di lavoro. Indichi il numero di volte in cui vuoi eseguire la sequenza di runnable per un job definendo il numero di attività. Quando un job ha più attività, specifica in che modo vuoi che ogni esecuzione vari facendo riferimento all'indice dell'attività negli elementi eseguibili. Inoltre, puoi configurare le pianificazioni relative per le attività di un job, ad esempio, se consentire l'esecuzione parallela di più attività o richiedere che le attività vengano eseguite in ordine sequenziale e una alla volta. Batch gestisce la pianificazione delle attività del job: quando un'attività termina, il job avvia automaticamente l'attività successiva, se presente.

Ad esempio, vedi il seguente job Batch. Questo esempio job ha 100 attività che vengono eseguite su 10 istanze di macchine virtuali (VM) Compute Engine, quindi in qualsiasi momento vengono eseguite in parallelo circa 10 attività. Ogni attività in questo job di esempio esegue un solo eseguibile: un copione che stampa un messaggio e l'indice dell'attività, definito dalla variabile di ambiente predefinita BATCH_TASK_INDEX.

{
  "taskGroups" : [{
    "taskSpec" : {
      "runnables" : [{
        "script":{
          "text": "echo Hello world! This is task ${BATCH_TASK_INDEX}."
        }
      }]
    },
    "taskCount": 100,
    "parallelism": 10
  }]
}

Workflows che prevedono la creazione e il monitoraggio di più pipeline Cloud Life Sciences simili possono talvolta essere semplificati sfruttando la pianificazione integrata di Batch.

Operazioni di base

Questa sezione descrive le operazioni di base in Cloud Life Sciences rispetto a Batch.

La seguente tabella riassume le opzioni di operazioni di base per Cloud Life Sciences e Batch.

Funzionamento di base Opzioni di Cloud Life Sciences Opzioni batch
Esegui un workload.
  • Esegui una pipeline.
  • Crea ed esegui un job.
Visualizza tutti i tuoi workload.
  • Elenca le operazioni a lunga esecuzione.
  • Visualizza un elenco dei tuoi job.
Visualizza i dettagli e lo stato di un workload.
  • Visualizza i dettagli di un'operazione a lunga esecuzione.
  • Esegui il polling di un'operazione a lunga esecuzione.
  • Visualizza i dettagli di un job.
  • Visualizza un elenco delle attività di un job.
  • Visualizza i dettagli di un'attività.
Interrompi e rimuovi un carico di lavoro.
  • Annulla un'operazione a lunga esecuzione.
  • Eliminare (e annullare) un job.
  • Controllare lo stato di una richiesta di eliminazione del job.

Le operazioni di base per Cloud Life Sciences e Batch presentano alcune differenze fondamentali.

Innanzitutto, le risorse operazione a lunga esecuzione non svolgono lo stesso ruolo in Batch che in Cloud Life Sciences. Le risorse di operazioni di lunga durata (LRO) in Cloud Life Sciences sono la risorsa principale utilizzata per elencare e visualizzare le pipeline. Tuttavia, le risorse di operazioni di lunga durata in Batch e altre API vengono utilizzate solo per monitorare lo stato di una richiesta che richiede molto tempo per essere completata. Google Cloud Nello specifico, in Batch l'unica richiesta che restituisce una risorsaoperazione a lunga esecuzionea è l'eliminazione di un job. Per saperne di più sulle risorse operazione a lunga esecuzione per Batch, consulta la documentazione di riferimento dell'API Batch per la risorsa REST projects.locations.operations. Anziché utilizzare risorse di operazione a lunga esecuzione, Batch dispone di risorse di job che puoi visualizzare ed eliminare per i tuoi workload.

In secondo luogo, la visualizzazione dei dettagli di un carico di lavoro in Batch comporta operazioni diverse rispetto a Cloud Life Sciences. Puoi visualizzare un job per vederne i dettagli e lo stato. Tuttavia, anche ogni attività di un job ha i propri dettagli e il proprio stato, che puoi visualizzare consultando un elenco delle attività di un job e visualizzando i dettagli di un'attività.

Per aiutarti a comprendere meglio le operazioni di base per Cloud Life Sciences e Batch, le sezioni seguenti forniscono esempi di comandi Google Cloud CLI e percorsi di richieste API per alcune di queste operazioni di base.

Esempi di comandi gcloud CLI

Per gcloud CLI, i comandi di Cloud Life Sciences iniziano con gcloud beta lifesciences e i comandi Batch iniziano con gcloud batch. Ad esempio, vedi i seguenti comandi gcloud CLI.

  • Esempi di comandi gcloud CLI di Cloud Life Sciences:

    • Esegui una pipeline:

      gcloud beta lifesciences pipelines run \
        --project=PROJECT_ID \
        --regions=LOCATION \
        --pipeline-file=JSON_CONFIGURATION_FILE
      
    • Per visualizzare i dettagli di un'operazione a lunga esecuzione:

      gcloud beta lifesciences operations describe OPERATION_ID
      

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto del tuo progetto.
    • LOCATION: la posizione della pipeline.
    • JSON_CONFIGURATION_FILE: il file di configurazione JSON per la pipeline.
    • OPERATION_ID: l'identificatore dell'operazione a lunga esecuzione, restituito dalla richiesta di esecuzione della pipeline.
  • Esempio di comandi dell'interfaccia a riga di comando gcloud CLI batch:

    • Crea ed esegui un job:

      gcloud batch jobs submit JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
        --config=JSON_CONFIGURATION_FILE
      
    • Visualizza i dettagli di un job:

      gcloud batch jobs describe JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
      
    • Visualizzare l'elenco delle attività di un job:

      ​​gcloud batch tasks list \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME
      
    • Visualizza i dettagli di un'attività:

      gcloud batch tasks describe TASK_INDEX \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME \
        --task_group=TASK_GROUP
      
    • Eliminare (e annullare) un job:

      gcloud batch jobs delete JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION
      

    Sostituisci quanto segue:

    • JOB_NAME: il nome del job.
    • PROJECT_ID: l'ID progetto del tuo progetto.
    • LOCATION: la sede del lavoro.
    • JSON_CONFIGURATION_FILE: il percorso di un file JSON con i dettagli di configurazione del job.
    • TASK_INDEX: l'indice dell'attività di cui vuoi visualizzare i dettagli. In un gruppo di attività, l'indice dell'attività inizia da 0 per la prima attività e aumenta di 1 per ogni attività aggiuntiva. Ad esempio, un gruppo di attività che contiene quattro attività ha gli indici 0, 1, 2 e 3.
    • TASK_GROUP_NAME: il nome del gruppo di attività di cui vuoi visualizzare i dettagli. Il valore deve essere impostato su group0.

Esempi di percorsi delle richieste API

Per le API, Cloud Life Sciences utilizza i percorsi delle richieste lifesciences.googleapis.com e Batch utilizza i percorsi delle richieste batch.googleapis.com. Ad esempio, vedi i seguenti percorsi di richiesta API. A differenza di Cloud Life Sciences, Batch non ha un'API RPC, ma solo un'API REST.

  • Percorsi di richiesta API di esempio di Cloud Life Sciences:

    • Esegui una pipeline:

      POST https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/pipelines:run
      
    • Per visualizzare i dettagli di un'operazione a lunga esecuzione:

      GET https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto del tuo progetto.
    • LOCATION: la posizione della pipeline.
    • OPERATION_ID: l'identificatore dell'operazione a lunga esecuzione, restituito dalla richiesta di esecuzione della pipeline.
  • Percorsi delle richieste API batch di esempio:

    • Crea ed esegui un job:

      POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
      
    • Visualizza i dettagli di un job:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • Visualizzare l'elenco delle attività di un job:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME/taskGroups/TASK_GROUP/tasks
      
    • Elimina un job

      DELETE https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • Controlla lo stato della richiesta di eliminazione del job:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto del tuo progetto.
    • LOCATION: la sede del lavoro.
    • JOB_NAME: il nome del job.
    • TASK_GROUP_NAME: il nome del gruppo di attività di cui vuoi visualizzare i dettagli. Il valore deve essere impostato su group0.
    • OPERATION_ID: l'identificatore dell'operazione a lunga esecuzione, restituito dalla richiesta di eliminazione del job.

Ruoli e autorizzazioni IAM

Questa sezione riassume le differenze tra i ruoli e le autorizzazioni di Identity and Access Management per Cloud Life Sciences e Batch. Per saperne di più sui ruoli e sulle relative autorizzazioni, consulta i riferimenti per i ruoli di base e predefiniti di IAM.

La seguente tabella descrive i ruoli predefiniti e le relative autorizzazioni necessarie per gli utenti di Cloud Life Sciences.

Ruoli Cloud Life Sciences Autorizzazioni

Uno dei seguenti:

  • Cloud Life Sciences Admin (roles/lifesciences.admin) sul progetto
  • Editor Cloud Life Sciences (roles/lifesciences.editor) del progetto
  • Cloud Life Sciences Workflows Runner (roles/lifesciences.workflowsRunner) sul progetto
  • lifesciences.workflows.run
  • lifesciences.operations.cancel
  • lifesciences.operations.get
  • lifesciences.operations.list
Cloud Life Sciences Viewer (roles/lifesciences.viewer) sul progetto
  • lifesciences.operations.get
  • lifesciences.operations.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list

La tabella seguente descrive alcuni dei ruoli predefiniti e le relative autorizzazioni per Batch. A differenza di Cloud Life Sciences, Batch richiede di concedere le autorizzazioni agli utenti e aaccount di serviziont per un job. Per ulteriori informazioni sui requisiti IAM, consulta la sezione Prerequisiti per Batch.

Ruoli batch per gli utenti Autorizzazioni
Batch Job Editor (roles/batch.jobsEditor) sul progetto
  • batch.jobs.create
  • batch.jobs.delete
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Batch Job Viewer (roles/batch.jobsViewer) sul progetto
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Utente service account (roles/iam.serviceAccountUser) nel account di servizio del job
  • iam.serviceAccounts.actAs
  • iam.serviceAccounts.get
  • iam.serviceAccounts.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Ruoli batch per i service account Autorizzazioni
Batch Agent Reporter (roles/batch.agentReporter) sul progetto
  • batch.states.report

Funzionalità corrispondenti

La tabella seguente descrive le funzionalità di Cloud Life Sciences, le funzionalità equivalenti di Batch e i dettagli sulle differenze tra loro.

Ogni funzionalità è rappresentata da una descrizione e dalla relativa sintassi JSON. Puoi utilizzare la sintassi JSON quando accedi a Batch tramite l'API o quando specifichi un file di configurazione JSON tramite Google Cloud CLI. Tuttavia, tieni presente che puoi utilizzare le funzionalità di Batch anche tramite altri metodi, ad esempio tramite i campi della console Google Cloud , i flag gcloud CLI e le librerie client, descritti nella documentazione di Batch.

Per ulteriori informazioni su ogni funzionalità e sulla relativa sintassi JSON, consulta quanto segue:

Funzionalità di Cloud Life Sciences Funzionalità batch Dettagli
pipeline (pipeline) job (job) e le relative attività (taskGroups[])

Un job batch è costituito da un array di una o più attività che eseguono tutte gli stessi eseguibili. Una pipeline Cloud Life Sciences è simile a un job Batch con un'attività. Tuttavia, Cloud Life Sciences non ha un concetto equivalente per le attività (con più) job, che sono un po' come le ripetizioni di una pipeline.

Per ulteriori informazioni su job e attività, consulta la panoramica di Batch.

azioni (actions[]) per una pipeline elementi eseguibili (runnables[]) per le attività di un job

Un'azione Cloud Life Sciences descrive un container, ma un elemento eseguibile Batch può contenere un container o uno script.

credenziali (credentials) per un'azione

per un eseguibile del container:

In Cloud Life Sciences, le credenziali di un'azione devono essere un dizionario criptato Cloud Key Management Service con coppie chiave-valore di nome utente e password.

In Batch, il nome utente e la password per un eseguibile del container si trovano in campi separati. Puoi specificare il campo con testo normale o con il nome di un secret di Secret Manager.

per un'azione:

per un ambiente:

ambienti possibili:

Cloud Life Sciences consente di specificare le variabili di ambiente per un'azione formattate come testo normale o come dizionario criptato. In Batch, è come se l'ambiente per un eseguibile (campo environment in runnables[]) includesse variabili formattate come testo normale (variables) o un dizionario criptato (encryptedVariables).

Tuttavia, Batch offre anche più opzioni per specificare le variabili di ambiente:

  • In alternativa a specificare le variabili come testo normale o un dizionario criptato, puoi specificare le variabili utilizzando i segreti di Secret Manager utilizzando una variabile segreta (secretVariables).
  • In alternativa a specificare una variabile di ambiente per un eseguibile, puoi specificare una variabile di ambiente per tutti gli eseguibili utilizzando il campo environment in taskSpec.
  • In alternativa alla specifica di una variabile di ambiente con lo stesso valore per ogni attività, puoi specificare una variabile di ambiente con un valore diverso per ogni attività utilizzando il campo taskEnvironments[] in taskGroups[].

Per ulteriori informazioni, vedi Utilizzare le variabili di ambiente.

etichette per una richiesta di esecuzione di una pipeline (labels nel corpo della richiesta) etichette per un job (labels nella risorsa job)

A differenza di Cloud Life Sciences, Batch non include un campo etichette nella richiesta di creazione di un nuovo job. L'opzione più simile per Batch è utilizzare etichette associate solo al job.

Batch ha più tipi di etichette (campi labels) che puoi utilizzare quando crei un job. Per saperne di più, vedi Organizzare le risorse utilizzando le etichette.

regioni (regions[]) e zone (zones[]) per le risorse di una pipeline (resources) località consentite (allowedLocations) per il criterio di località delle risorse di un job (locationPolicy)

In Cloud Life Sciences, una pipeline viene eseguita su una singola VM, per la quale puoi specificare le regioni e/o le zone desiderate.

In Batch, l'opzione equivalente sono le località consentite per un job, che puoi definire come una o più regioni o zone e specifica dove possono essere create le VM per un job. Tutte le VM per un singolo job Batch appartengono a un unico gruppo di istanze gestite (MIG), che esiste in una determinata regione; tuttavia, le singole VM potrebbero trovarsi in zone diverse di quella regione.

In particolare, la specifica del campo delle località consentite per un job è facoltativa perché è separata dalla località del job. A differenza della località del job, la località consentita non influisce sulla località utilizzata per creare un job Batch e archiviare i metadati del job. Per ulteriori informazioni, consulta la sezione Località batch.

per le risorse di una pipeline (resources):

per la policy delle risorse di un job (allocationPolicy):

In Cloud Life Sciences, puoi configurare la VM (una) su cui viene eseguita una pipeline.

In Batch, le stesse opzioni per le VM sono disponibili nei campi di una norma di allocazione delle risorse di un job (allocationPolicy):

  • Il account di servizio, le etichette e la configurazione di rete per le VM sono definiti nei rispettivi campi dedicati.
  • Il campo VM (instances), che puoi definire direttamente o utilizzando un modello di istanza, include le opzioni di configurazione per il tipo di macchina, la piattaforma CPU minima consentita, il disco di avvio e qualsiasi altro disco collegato, nonché eventuali GPU e driver GPU.

per un'azione:

per un elemento eseguibile:

Questi vari flag di convenienza di Cloud Life Sciences sono equivalenti in Batch tranne per il fatto che vengono specificati per ogni elemento eseguibile (che può contenere uno script o un container) anziché per ogni azione (container).

per un'azione:

  • Opzione per pubblicare le porte esposte (publishExposedPorts)
  • opzione per specificare lo spazio dei nomi dell'ID processo (PID) (pidNamespace)
  • e l'opzione per specificare i mapping delle porte da container a host (portMappings).
opzioni (options) per un container eseguibile

Queste opzioni di Cloud Life Sciences (e altre) sono supportate in Batch tramite il campo delle opzioni (options) per un eseguibile del contenitore. Imposta il campo delle opzioni su qualsiasi flag che vuoi che Batch aggiunga al comando docker run, ad esempio -P --pid mynamespace -p 22:22.

per un'azione:

nessun equivalente

Il batch precarica le immagini ed elabora gli output di tutti gli elementi eseguibili in modo identico in conformità con le norme sui log del job (logsPolicy).

Opzione per bloccare le reti esterne (blockExternalNetwork) per un'azione opzione per bloccare le reti esterne (blockExternalNetwork) per un container eseguibile

L'opzione Cloud Life Sciences per bloccare le reti esterne per un'azione è simile all'opzione Batch per bloccare le reti esterne per un container.

Batch offre anche molte altre opzioni di networking, ad esempio per bloccare le reti esterne per tutte le VM di un job. Per ulteriori informazioni, consulta la panoramica del networking batch.

montaggi (mounts[]) per un'azione volumi per tutti gli eseguibili (volumes[] in taskSpec) e opzioni di volume per un container (volumes[] in container)

In Batch, puoi utilizzare il campo volumes[] in taskSpec per definire i volumi di un job e i relativi percorsi di montaggio. Batch monta i volumi di archiviazione sulle VM del job e i volumi di archiviazione sono accessibili a tutti i runnable del job (script o container). Il montaggio viene eseguito prima che la VM esegua attività o eseguibili.

Inoltre, Batch supporta opzioni di volume esplicite sui container eseguibili utilizzando il campo volumes[] in container. Queste opzioni di montaggio vengono passate al container come opzioni per il flag --volume del comando docker run, ad esempio il valore [ "/etc:/etc", "/foo:/bar" ] viene tradotto nel comando docker run --volume /etc:/etc --volume /foo:/bar sul container.

Per saperne di più sull'utilizzo dei volumi di archiviazione con Batch, consulta Creare ed eseguire un job che utilizza volumi di archiviazione.

Opzione per abilitare Cloud Storage FUSE (enableFuse) per un'azione nessun equivalente

Batch gestisce il montaggio di tutti i volumi di archiviazione, ad esempio un bucket Cloud Storage, specificati per un job. Di conseguenza, non attivi strumenti di montaggio come Cloud Storage FUSE per Batch; tuttavia, puoi specificare facoltativamente le opzioni di montaggio per i volumi di archiviazione utilizzando il campo mountOptions[].

Per saperne di più sull'utilizzo dei bucket Cloud Storage con Batch, consulta Creare ed eseguire un job che utilizza volumi di archiviazione.

Argomento Pub/Sub (pubSubTopic) per una richiesta di esecuzione di una pipeline

per le configurazioni delle notifiche di un job (notifications[]):

Batch consente una maggiore personalizzazione degli aggiornamenti di stato rispetto a Cloud Life Sciences. Ad esempio, gli utenti batch possono ricevere una notifica su un argomento Pub/Sub quando le singole attività cambiano stato o solo quando cambia lo stato del job complessivo.

Servizi di workflow

Se utilizzi un servizio di workflow con Cloud Life Sciences, la procedura di migrazione prevede anche la configurazione di un servizio di workflow per funzionare con Batch. Questa sezione riepiloga i servizi di workflow che puoi utilizzare con Batch.

Batch supporta Workflows, un servizio di workflow di Google Cloud. Se vuoi utilizzare Workflows con Batch, consulta Esegui un job Batch utilizzando Workflows. In caso contrario, la tabella seguente descrive altri servizi di workflow che potresti utilizzare per Cloud Life Sciences e che puoi utilizzare anche con Batch. Questa tabella elenca le principali differenze per l'utilizzo di ciascun servizio di workflow con Batch anziché Cloud Life Sciences e fornisce dettagli su dove scoprire di più sull'utilizzo di ciascun servizio con Batch.

Servizio Workflow Differenze principali Dettagli
Cromwell

Per utilizzare un file di configurazione Cromwell per l'API Cloud Life Sciences v2beta con l'API Batch, apporta le seguenti modifiche:

  1. Per il campo actor-factory, sostituisci cromwell.backend.google.pipelines.v2beta.PipelinesApiLifecycleActorFactory con cromwell.backend.google.batch.GcpBatchLifecycleActorFactory.
  2. Rimuovi il campo genomics.endpoint-url.
  3. Genera un nuovo file di configurazione.
Per saperne di più su come utilizzare Batch con Cromwell, consulta la documentazione di Cromwell per Batch e il tutorial di Cromwell per Batch.
dsub

Per utilizzare una pipeline dsub per Cloud Life Sciences con Batch, apporta le seguenti modifiche:

  • Per il campo provider, sostituisci google-cls-v2 con google-batch.
Per scoprire di più su come utilizzare Batch con dsub, consulta la documentazione di dsub per Batch.
Nextflow

Per utilizzare un file di configurazione Nextflow per Cloud Life Sciences con Batch, invece, apporta le seguenti modifiche:

  1. Per il campo executor, sostituisci google-lifesciences con google-batch.
  2. Per tutti i prefissi config, sostituisci google.lifeScience con google.batch.
Per scoprire di più su come utilizzare Batch con Nextflow, consulta un tutorial su Batch o un tutorial su Nextflow. Per ulteriori informazioni sulle opzioni di configurazione, consulta la documentazione di Nextflow.
Snakemake

Per utilizzare una pipeline Snakemake per l'API Cloud Life Sciences v2beta con l'API Batch, apporta le seguenti modifiche:

  1. Assicurati di utilizzare Snakemake versione 8 o successive. Per maggiori informazioni, vedi Migrazione tra le versioni di Snakemake.
  2. Apporta le seguenti modifiche al comando snakemake:

    • Sostituisci il flag --google-lifesciences con il flag --executor googlebatch.
    • Sostituisci tutti i flag aggiuntivi che hanno il prefisso --google-lifesciences- con il prefisso --googlebatch-.
Per scoprire di più su come utilizzare Batch con Snakemake, consulta la documentazione di Snakemake per Batch.

Passaggi successivi

  • Per configurare Batch per nuovi utenti e progetti, consulta Inizia.
  • Per scoprire come eseguire i carichi di lavoro utilizzando Batch, consulta Creare un job.