Cette page a été traduite par l'API Cloud Translation.

Créer un modèle d'environnement d'exécution

Cette page vous explique comment créer un modèle d'exécution dans Colab Enterprise.

Pour exécuter du code dans votre notebook, vous devez utiliser une ressource de calcul appelée environnement d'exécution. Vous pouvez vous servir de l'environnement d'exécution par défaut ou d'un environnement d'exécution créé à partir d'un modèle d'exécution. En créant un modèle d'exécution, vous pouvez le configurer pour optimiser les performances, le coût et d'autres caractéristiques d'un environnement d'exécution en fonction de vos besoins.

Obtenez plus d'informations sur les environnements d'exécution et les modèles d'exécution.

Avant de commencer

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI, Dataform, and Compute Engine APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI, Dataform, and Compute Engine APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Rôles requis

Pour obtenir les autorisations nécessaires pour créer un modèle d'exécution dans Colab Enterprise, demandez à votre administrateur de vous accorder le rôle IAM Administrateur Colab Enterprise (roles/aiplatform.colabEnterpriseAdmin) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

Un ou plusieurs des rôles requis incluent l'autorisation dataform.repositories.list. Les utilisateurs disposant de l'autorisation dataform.repositories.list ou du rôle Créateur de code (roles/dataform.codeCreator) dans un projet peuvent lister les noms des composants de code de ce projet à l'aide de l'API Dataform ou de l'interface de ligne de commande (CLI) Dataform. Les utilisateurs sans droits d'administrateur qui utilisent BigQuery Studio ne peuvent voir que les composants de code qu'ils ont créés ou qui ont été partagés avec eux.

Créer le modèle d'exécution

Pour créer un modèle d'exécution, vous pouvez utiliser la console Google Cloud , la Google Cloud CLI, l'API REST ou Terraform.

Console

Pour créer un modèle d'exécution :

Dans la console Google Cloud , accédez à la page Modèles d'exécution de Colab Enterprise.

Accéder à la page "Modèles d'exécution"
Cliquez sur Nouveau modèle.

La boîte de dialogue Créer un modèle d'exécution s'affiche.

Blocs de base de l'environnement d'exécution

Dans la section Blocs de base de l'environnement d'exécution, saisissez un nom à afficher.
Dans le menu Région, sélectionnez la région dans laquelle vous souhaitez créer votre modèle d'exécution.
Facultatif : renseignez le champ Description pour votre modèle d'exécution.
Facultatif : pour ajouter une étiquette, cliquez sur Ajouter une étiquette, puis saisissez une paire Clé et Valeur. Pour ajouter d'autres étiquettes, répétez cette étape.
Cliquez sur Continuer.

Configurer le calcul

Dans la section Configurer le calcul, accédez au menu Type de machine et sélectionnez un type de machine. Pour en savoir plus sur les types de machines, consultez Guide des ressources de familles de machines et guide comparatif.

Si vous sélectionnez un type de machine comportant des GPU, sélectionnez le type d'accélérateur et le nombre d'accélérateurs. Si vous ne parvenez pas à sélectionner le nombre de GPU souhaité, vous devrez peut-être augmenter votre quota. Consultez Demander un ajustement de quota.
Dans le menu Type de disque de données, sélectionnez un type de disque.
Dans le champ Taille du disque de données, saisissez une taille en Go.
Dans la section Arrêt en cas d'inactivité :
- Pour désactiver l'arrêt en cas d'inactivité, désélectionnez Activer l'arrêt en cas d'inactivité.
- Pour modifier la période d'inactivité, dans le champ Temps d'inactivité avant l'arrêt (en minutes), remplacez la valeur par le nombre de minutes d'inactivité souhaité. Dans la console Google Cloud , ce paramètre peut être défini sur une valeur entière comprise entre 10 et 1 440.
Cliquez sur Continuer.

Environnement

Dans la section Environnement, sélectionnez un environnement. La valeur par défaut est Dernière version (actuellement Python 3.11).
Facultatif : Dans le champ Script post-démarrage, saisissez l'URI d'un script post-démarrage. Pour en savoir plus sur l'utilisation d'un script post-démarrage, consultez Utiliser un script post-démarrage.
Facultatif : Sous l'URL du script post-démarrage, sélectionnez le comportement de votre script post-démarrage. Le comportement par défaut est Exécuter une fois. Pour en savoir plus, consultez Comportement des scripts post-démarrage.
Facultatif : Pour ajouter une variable d'environnement, cliquez sur Ajouter une variable d'environnement, puis saisissez une paire Clé et Valeur. Pour ajouter d'autres variables d'environnement, répétez cette étape.
Cliquez sur Continuer.

Mise en réseau et sécurité

Dans la section Mise en réseau et sécurité, accédez au menu Réseau et sélectionnez un réseau. Si vous ne sélectionnez pas de réseau, votre réseau par défaut est sélectionné.
Dans le menu Sous-réseau, sélectionnez un sous-réseau.
Pour désactiver l'accès Internet public, désélectionnez Activer l'accès Internet public.
Pour désactiver l'accès aux identifiants de l'utilisateur final, décochez la case Activer les identifiants de l'utilisateur final.

Terminer la création du modèle d'exécution

Cliquez sur Créer pour terminer la création du modèle d'exécution.

Votre modèle d'exécution apparaît dans la liste de l'onglet Modèles d'exécution.

gcloud

Avant d'utiliser les données de la commande ci-dessous, effectuez les remplacements suivants :

DISPLAY_NAME : nom à afficher de votre modèle d'exécution
PROJECT_ID : ID de votre projet
REGION : région dans laquelle vous souhaitez placer votre modèle d'exécution
MACHINE_TYPE : type de machine à utiliser pour votre environnement d'exécution
ACCELERATOR_TYPE : type d'accélérateur matériel à utiliser pour votre environnement d'exécution
ACCELERATOR_COUNT : nombre d'accélérateurs à utiliser pour votre environnement d'exécution

Exécutez la commande suivante :

Linux, macOS ou Cloud Shell

gcloud colab runtime-templates create --display-name="DISPLAY_NAME" \
    --project=PROJECT_ID \
    --region=REGION \
    --machine-type=MACHINE_TYPE \
    --accelerator-type=ACCELERATOR_TYPE \
    --accelerator-count=ACCELERATOR_COUNT

Windows (PowerShell)

gcloud colab runtime-templates create --display-name="DISPLAY_NAME" `
    --project=PROJECT_ID `
    --region=REGION `
    --machine-type=MACHINE_TYPE `
    --accelerator-type=ACCELERATOR_TYPE `
    --accelerator-count=ACCELERATOR_COUNT

Windows (cmd.exe)

gcloud colab runtime-templates create --display-name="DISPLAY_NAME" ^
    --project=PROJECT_ID ^
    --region=REGION ^
    --machine-type=MACHINE_TYPE ^
    --accelerator-type=ACCELERATOR_TYPE ^
    --accelerator-count=ACCELERATOR_COUNT

Pour en savoir plus sur la commande permettant de créer un modèle d'exécution à partir de la ligne de commande, consultez la documentation de la gcloud CLI.

REST

Avant d'utiliser les données de requête, effectuez les remplacements suivants :

REGION : région dans laquelle vous souhaitez placer votre modèle d'exécution
PROJECT_ID : ID de votre projet
DISPLAY_NAME : nom à afficher de votre modèle d'exécution
MACHINE_TYPE : type de machine à utiliser pour votre environnement d'exécution
ACCELERATOR_TYPE : type d'accélérateur matériel à utiliser pour votre environnement d'exécution
ACCELERATOR_COUNT : nombre d'accélérateurs à utiliser pour votre environnement d'exécution

Méthode HTTP et URL :

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates

Corps JSON de la requête :

{
  "displayName": "DISPLAY_NAME",
  "machineSpec": {
    {
      "machineType": MACHINE_TYPE
      "acceleratorType": ACCELERATOR_TYPE,
      "acceleratorCount": ACCELERATOR_COUNT,
    }
  },
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Remarque : Pour la commande suivante, nous partons du principe que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login, ou en utilisant Cloud Shell, qui vous connecte automatiquement à la CLI gcloud. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates"

PowerShell

Remarque : Pour la commande suivante, nous partons du principe que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates" | Select-Object -Expand Content

Si elle aboutit, le corps de la réponse contient une instance d'Operation.

Pour en savoir plus, reportez-vous à la. documentation de l'API REST notebookRuntimeTemplates.create.

Terraform

Pour savoir comment appliquer ou supprimer une configuration Terraform, consultez Commandes Terraform de base. Pour en savoir plus, lisez la documentation de référence du fournisseur Terraform.

L'exemple suivant utilise la ressource Terraform google_colab_runtime_template pour créer un modèle d'exécution Colab Enterprise.

resource "google_compute_network" "my_network" {
  name = "{{index $.Vars "network_name"}}"
  auto_create_subnetworks = false
}

resource "google_compute_subnetwork" "my_subnetwork" {
  name   = "{{index $.Vars "network_name"}}"
  network = google_compute_network.my_network.id
  region = "us-central1"
  ip_cidr_range = "10.0.1.0/24"
}

resource "google_colab_runtime_template" "{{$.PrimaryResourceId}}" {
  name        = "{{index $.Vars "runtime_template_name"}}"
  display_name = "Runtime template full"
  location    = "us-central1"
  description = "Full runtime template"
  machine_spec {
    machine_type     = "n1-standard-2"
    accelerator_type = "NVIDIA_TESLA_T4"
    accelerator_count = "1"
  }

  data_persistent_disk_spec {
    disk_type    = "pd-standard"
    disk_size_gb = 200
  }

  network_spec {
    enable_internet_access = true
    network = google_compute_network.my_network.id
    subnetwork = google_compute_subnetwork.my_subnetwork.id
  }

  labels = {
    k = "val"
  }

  idle_shutdown_config {
    idle_timeout = "3600s"
  }

  euc_config {
    euc_disabled = false
  }

  shielded_vm_config {
    enable_secure_boot = false
  }

  network_tags = ["abc", "def"]

  encryption_spec {
    kms_key_name = "{{index $.Vars "key_name"}}"
  }
}

Accorder l'accès au modèle d'exécution

Après avoir créé un modèle d'exécution, vous devez y accorder l'accès pour qu'un compte principal puisse l'utiliser. Un compte principal ne peut créer un environnement d'exécution à partir d'un modèle d'exécution que s'il répond aux exigences suivantes :

Il peut accéder au modèle d'exécution.
Il dispose des autorisations requises pour créer des environnements d'exécution.

Consultez Gérer l'accès à un modèle d'exécution.

Supprimer un modèle d'exécution

Pour supprimer un modèle d'exécution :

Dans la console Google Cloud , accédez à la page Modèles d'exécution de Colab Enterprise.

Accéder aux modèles d'exécution
Dans le menu Région, sélectionnez la région qui contient votre modèle d'exécution.
Sélectionnez le modèle d'exécution que vous souhaitez supprimer.
Cliquez sur Supprimer.
Cliquez sur Confirmer.

Résoudre les problèmes

Cette section explique comment résoudre les problèmes de création de modèles d'exécution dans Colab Enterprise.

Impossible de sélectionner suffisamment de GPU

Lorsque vous créez un modèle d'exécution, vous ne pouvez pas sélectionner le nombre de GPU souhaité. Cela peut être dû à un quota insuffisant.

Colab Enterprise utilise un quota Compute Engine pour les GPU. Pour en savoir plus, consultez la présentation des quotas et des limites de Compute Engine.

Pour résoudre ce problème, demandez un ajustement du quota.

Étapes suivantes

Obtenez plus d'informations sur les environnements d'exécution et les modèles d'exécution.
Découvrez comment créer un environnement d'exécution basé sur un modèle d'exécution.