Vous devez déployer vos ressources personnalisées de prédiction dans le cluster de prédiction que l'opérateur d'infrastructure (IO) crée pour vous. L'opérateur crée des charges de travail de prédiction dans ce même cluster.
Pour créer le cluster de prédiction, collaborez avec l'IO afin d'associer votre projet de prédiction et d'allouer les pools de nœuds nécessaires aux prédictions en ligne dans Google Distributed Cloud (GDC) air-gapped.
Pour créer un cluster de prédiction, procédez comme suit :
Identifiez le projet de votre organisation que vous souhaitez associer au nouveau cluster pour les prédictions en ligne.
Pour créer un projet, consultez Configurer un projet pour Vertex AI. Vous avez besoin de l'ID de votre projet pour effectuer des appels d'API.
Dans la liste des types de machines disponibles dans Distributed Cloud, choisissez le type de machine pour les nœuds dont vos charges de travail ont besoin dans le cluster.
Le type de machine que vous choisissez dépend de la taille et de la complexité de votre modèle de prédiction. Il détermine les ressources de calcul et d'unité de traitement graphique (GPU) que votre IO fournit au cluster. Suivez les recommandations de sélection de nœuds lorsque vous choisissez le type de machine pour vos nœuds.
Envoyez un e-mail à l'équipe chargée des opérations d'insertion à l'aide du modèle de demande concernant les clusters de prédiction pour ouvrir une demande et demander la création du cluster.
Si nécessaire, communiquez avec l'IO jusqu'à ce qu'il ait terminé de créer le cluster de prédiction associé à votre projet et d'attribuer les pools de nœuds appropriés au sein du cluster.
Une fois le provisionnement du cluster terminé, le cluster de prédiction est prêt pour les prédictions en ligne.
Recommandations de sélection de nœuds
Lorsque l'IO crée des pools de nœuds dans un cluster, il attribue l'un des types de machines disponibles dans Distributed Cloud pour fournir un ensemble prédéfini de ressources pour les nœuds de calcul. En fonction de la taille et de la complexité du modèle, vous avez besoin de performances de calcul différentes et, par conséquent, d'une quantité spécifique de CPU, de mémoire et de GPU. Vous devez fournir ces informations dans votre communication avec l'IO lorsque vous souhaitez créer un cluster de prédiction.
Lorsque vous déterminez avec l'IO le type de machine pour les pools de nœuds dont vous avez besoin dans le cluster de prédiction, vous devez respecter les pratiques suivantes :
- Le cloud distribué ajoute une surcharge de calcul aux nœuds pour les composants système obligatoires. Vous devez donc choisir un type de machine plus grand pour vos pools de nœuds que celui que vous prévoyez d'utiliser dans le pool de ressources pour vos modèles.
- Choisissez la solution qui fournit le minimum de ressources de mémoire et de calcul nécessaires pour répondre à vos besoins. Par exemple, si votre modèle nécessite huit processeurs virtuels, choisissez le type de machine
n2-highcpu-8-gdc
, qui est la plus petite solution avec huit processeurs virtuels et 8 Go de mémoire dans Distributed Cloud. - Au fur et à mesure de votre progression, n'envisagez des solutions plus performantes que si les plus petites ne répondent pas à vos besoins, et à la taille et à la complexité du modèle. Il est essentiel de respecter le principe du moindre privilège et de n'utiliser que les ressources dont vous avez besoin pour exécuter votre workflow spécifique. Cette approche responsable garantit une utilisation réfléchie des ressources dans l'environnement Distributed Cloud.
- Ne choisissez que les solutions disposant de GPU si vous en avez besoin pour votre modèle.
- Si votre modèle nécessite des GPU, envisagez le type de machine
a2-highgpu-1g-gdc
, qui est la plus petite solution fournissant des GPU.
Modèle de cas de cluster de prédiction
Utilisez le modèle suivant pour envoyer un e-mail à votre OI. L'e-mail ouvre une demande pour créer le cluster de prédiction dont vous avez besoin pour les prédictions en ligne.
Good day,
I need to create a prediction cluster and associate it with a project in my organization to use online predictions.
Please use the following information for the creation of the cluster:
- **Cluster name:** vtx-ai-prediction
- **Name of the organization:** [Specify your organization's name.]
- **Project name:** [Specify the name of your project to associate with the prediction cluster.]
- **Machine type for the node pool:** [Specify the machine type you chose from the list of available machine types for the cluster nodes based on node selection recommendations. Please note that the IO can respond with a different suggestion based on your needs.]
- **Compute resources:** [Optionally, if you know how many compute resources your workloads need, describe them in this field.]
- **Memory resources:** [Optionally, if you know how many memory resources your workloads need, describe them in this field.]
- **GPU resources:** [Optionally, if you know how many GPU resources your workloads need, describe them in this field.]
**Note for IO:** Review the instructions to create the prediction cluster in the following section of the documentation: Operator > Configure the deployment > Create the Prediction cluster
Thank you,
[Your name]