Crea il cluster di previsione

Devi eseguire il deployment delle risorse personalizzate di previsione nel cluster di previsione che l'operatore dell'infrastruttura (IO) crea per te. L'operatore crea carichi di lavoro di previsione nello stesso cluster.

Per creare il cluster di previsione, collabora con l'IO per associare il tuo progetto di previsione e allocare i pool di nodi necessari per le previsioni online in Google Distributed Cloud (GDC) air-gapped.

Per creare un cluster di previsione:

  1. Identifica il progetto della tua organizzazione che vuoi associare al nuovo cluster per le previsioni online.

    Per creare un progetto, consulta Configurare un progetto per Vertex AI. L'ID progetto è necessario per effettuare chiamate API.

  2. Dall'elenco dei tipi di macchina disponibili in Distributed Cloud, scegli il tipo di macchina per i nodi di cui i tuoi carichi di lavoro hanno bisogno nel cluster.

    Il tipo di macchina che scegli dipende dalle dimensioni e dalla complessità del modello di previsione e determina le risorse di calcolo e dell'unità di elaborazione grafica (GPU) che il nodo di input/output fornisce al cluster. Segui i suggerimenti per la selezione dei nodi quando selezioni il tipo di macchina per i nodi.

  3. Invia un'email all'IO utilizzando il modello di richiesta di cluster di previsione per aprire una richiesta e rivolgere la tua richiesta di creazione del cluster.

  4. Se necessario, comunica con l'IO finché non termina la creazione del cluster di previsione associato al tuo progetto e l'assegnazione dei pool di nodi appropriati all'interno del cluster.

Al termine del provisioning del cluster, il cluster di previsione è pronto per le previsioni online.

Consigli per la selezione dei nodi

Quando l'IO crea node pool in un cluster, assegna uno dei tipi di macchine disponibili in Distributed Cloud per fornire un insieme predefinito di risorse per i nodi worker. A seconda delle dimensioni e della complessità del modello, sono necessarie prestazioni di calcolo diverse e, di conseguenza, una quantità specifica di CPU, memoria e GPU. Devi fornire questi dettagli nella comunicazione con l'IO quando vuoi creare un cluster di previsione.

Quando determini con l'IO il tipo di macchina per i pool di nodi che ti servono nel cluster di previsione, devi rispettare le seguenti pratiche:

  • Distributed Cloud aggiunge l'overhead di calcolo ai nodi per i componenti di sistema obbligatori. Pertanto, devi scegliere un tipo di macchina più grande per i tuoi pool di nodi rispetto a quello che intendi utilizzare nel pool di risorse per i tuoi modelli.
  • Scegli la soluzione che fornisce le risorse di memoria e di calcolo minime necessarie per i tuoi requisiti. Ad esempio, se il tuo modello richiede otto vCPU, scegli il tipo di macchina n2-highcpu-8-gdc, la soluzione più piccola con otto vCPU e 8 GB di memoria in Distributed Cloud.
  • Man mano che avanzi, prendi in considerazione soluzioni con prestazioni più elevate solo se quelle più piccole non sono adeguate alle tue esigenze e alle dimensioni e alla complessità del modello. È fondamentale rispettare il principio del privilegio minimo, utilizzando solo le risorse necessarie per eseguire il flusso di lavoro specifico. Questo approccio responsabile garantisce un utilizzo ponderato delle risorse nell'ambiente Distributed Cloud.
  • Scegli solo soluzioni con GPU se sono necessarie per il tuo modello.
  • Se il modello richiede GPU, prendi in considerazione il tipo di macchina a2-highgpu-1g-gdc, la soluzione più piccola che fornisce GPU.

Modello di caso del cluster di previsione

Utilizza il seguente modello per inviare un'email al tuo IO. L'email apre una richiesta per creare il cluster di previsione necessario per le previsioni online.

Good day,

I need to create a prediction cluster and associate it with a project in my organization to use online predictions.

Please use the following information for the creation of the cluster:

- **Cluster name:** vtx-ai-prediction
- **Name of the organization:** [Specify your organization's name.]
- **Project name:** [Specify the name of your project to associate with the prediction cluster.]
- **Machine type for the node pool:** [Specify the machine type you chose from the list of available machine types for the cluster nodes based on node selection recommendations. Please note that the IO can respond with a different suggestion based on your needs.]
- **Compute resources:** [Optionally, if you know how many compute resources your workloads need, describe them in this field.]
- **Memory resources:** [Optionally, if you know how many memory resources your workloads need, describe them in this field.]
- **GPU resources:** [Optionally, if you know how many GPU resources your workloads need, describe them in this field.]

**Note for IO:** Review the instructions to create the prediction cluster in the following section of the documentation: Operator > Configure the deployment > Create the Prediction cluster

Thank you,
[Your name]