Prognosecluster erstellen

Sie müssen Ihre benutzerdefinierten Vorhersageressourcen in dem Vorhersagecluster bereitstellen, den der Infrastruktur-Operator (IO) für Sie erstellt. Der Operator erstellt Vorhersagearbeitslasten in demselben Cluster.

Um den Vorhersagecluster zu erstellen, arbeiten Sie mit dem IO zusammen, um Ihr Vorhersageprojekt zu verknüpfen und die für Onlinevorhersagen erforderlichen Knotenpools in Google Distributed Cloud (GDC) Air-Gapped zuzuweisen.

So erstellen Sie einen Vorhersagecluster:

  1. Wählen Sie das Projekt in Ihrer Organisation aus, das Sie dem neuen Cluster für Onlinevorhersagen zuordnen möchten.

    Informationen zum Erstellen eines Projekts finden Sie unter Projekt für Vertex AI einrichten. Sie benötigen Ihre Projekt-ID für API-Aufrufe.

  2. Wählen Sie in Distributed Cloud aus der Liste der verfügbaren Maschinentypen den Maschinentyp für die Knoten aus, die für Ihre Arbeitslasten im Cluster erforderlich sind.

    Der von Ihnen ausgewählte Maschinentyp hängt von der Größe und Komplexität Ihres Vorhersagemodells ab und bestimmt die Rechen- und GPU-Ressourcen (Graphics Processing Unit), die Ihr IO für den Cluster bereitstellt. Beachten Sie die Empfehlungen zur Knotenauswahl, wenn Sie den Maschinentyp für Ihre Knoten auswählen.

  3. Senden Sie eine E-Mail an das IO mit der Fallvorlage für Vorhersagecluster, um einen Fall zu eröffnen und Ihren Antrag auf Erstellung des Clusters zu stellen.

  4. Kommunizieren Sie bei Bedarf mit dem IO, bis er den Ihrem Projekt zugeordneten Vorhersagecluster erstellt und die entsprechenden Knotenpools im Cluster zugewiesen hat.

Nach Abschluss der Clusterbereitstellung ist der Vorhersagecluster für Onlinevorhersagen bereit.

Empfehlungen zur Knotenauswahl

Wenn der IO Knotenpools in einem Cluster erstellt, weist er einen der verfügbaren Maschinentypen in Distributed Cloud zu, um einen vordefinierten Satz von Ressourcen für die Worker-Knoten bereitzustellen. Je nach Größe und Komplexität des Modells benötigen Sie unterschiedliche Rechenleistungen und folglich eine bestimmte Menge an CPU, Arbeitsspeicher und GPU. Sie müssen diese Details in Ihrer Kommunikation mit dem IO angeben, wenn Sie einen Vorhersagecluster erstellen möchten.

Wenn Sie mit dem IO den Maschinentyp für Knotenpools bestimmen, die Sie im Vorhersagecluster benötigen, müssen Sie die folgenden Empfehlungen beachten:

  • Distributed Cloud fügt den Knoten Rechenaufwand für obligatorische Systemkomponenten hinzu. Daher müssen Sie für Ihre Knotenpools einen größeren Maschinentyp auswählen als den, den Sie im Ressourcenpool für Ihre Modelle verwenden möchten.
  • Wählen Sie die Lösung aus, die den für Ihre Anforderungen erforderlichen Mindestspeicher und die erforderlichen Mindest-Computing-Ressourcen bietet. Wenn für Ihr Modell beispielsweise acht vCPUs erforderlich sind, wählen Sie den Maschinentyp n2-highcpu-8-gdc aus, die kleinste Lösung mit acht vCPUs und 8 GB Arbeitsspeicher in Distributed Cloud.
  • Wenn Sie Fortschritte machen, sollten Sie leistungsstärkere Lösungen nur in Betracht ziehen, wenn kleinere Lösungen für Ihre Anforderungen und die Größe und Komplexität des Modells nicht ausreichen. Es ist wichtig, das Prinzip der geringsten Berechtigung einzuhalten und nur die Ressourcen zu verwenden, die Sie für die Ausführung Ihres spezifischen Workflows benötigen. Dieser verantwortungsbewusste Ansatz sorgt für eine sorgfältige Nutzung von Ressourcen in der Distributed Cloud-Umgebung.
  • Wählen Sie nur Lösungen mit GPUs aus, wenn Sie diese für Ihr Modell benötigen.
  • Wenn für Ihr Modell GPUs erforderlich sind, sollten Sie den Maschinentyp a2-highgpu-1g-gdc in Betracht ziehen. Das ist die kleinste Lösung, die GPUs bietet.

Fallvorlage für Vorhersagecluster

Verwenden Sie die folgende Vorlage, um eine E‑Mail an Ihren IO zu senden. Durch die E-Mail wird ein Fall geöffnet, um den Vorhersagecluster zu erstellen, den Sie für Onlinevorhersagen benötigen.

Good day,

I need to create a prediction cluster and associate it with a project in my organization to use online predictions.

Please use the following information for the creation of the cluster:

- **Cluster name:** vtx-ai-prediction
- **Name of the organization:** [Specify your organization's name.]
- **Project name:** [Specify the name of your project to associate with the prediction cluster.]
- **Machine type for the node pool:** [Specify the machine type you chose from the list of available machine types for the cluster nodes based on node selection recommendations. Please note that the IO can respond with a different suggestion based on your needs.]
- **Compute resources:** [Optionally, if you know how many compute resources your workloads need, describe them in this field.]
- **Memory resources:** [Optionally, if you know how many memory resources your workloads need, describe them in this field.]
- **GPU resources:** [Optionally, if you know how many GPU resources your workloads need, describe them in this field.]

**Note for IO:** Review the instructions to create the prediction cluster in the following section of the documentation: Operator > Configure the deployment > Create the Prediction cluster

Thank you,
[Your name]