Créer un modèle d'environnement d'exécution

Cette page vous explique comment créer un modèle d'exécution dans Colab Enterprise.

Pour exécuter du code dans votre notebook, vous devez utiliser une ressource de calcul appelée environnement d'exécution. Vous pouvez vous servir de l'environnement d'exécution par défaut ou d'un environnement d'exécution créé à partir d'un modèle d'exécution. En créant un modèle d'exécution, vous pouvez le configurer pour optimiser les performances, le coût et d'autres caractéristiques d'un environnement d'exécution en fonction de vos besoins.

Obtenez plus d'informations sur les environnements d'exécution et les modèles d'exécution.

Avant de commencer

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI, Dataform, and Compute Engine APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI, Dataform, and Compute Engine APIs.

    Enable the APIs

  8. Rôles requis

    Pour obtenir les autorisations nécessaires pour créer un modèle d'exécution dans Colab Enterprise, demandez à votre administrateur de vous accorder le rôle IAM Administrateur Colab Enterprise (roles/aiplatform.colabEnterpriseAdmin) sur le projet. Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

    Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

    Créer le modèle d'exécution

    Pour créer un modèle d'exécution, vous pouvez utiliser la console Google Cloud , la Google Cloud CLI, l'API REST ou Terraform.

    Console

    Pour créer un modèle d'exécution :

    1. Dans la console Google Cloud , accédez à la page Modèles d'exécution de Colab Enterprise.

      Accéder à la page "Modèles d'exécution"

    2. Cliquez sur  Nouveau modèle.

      La boîte de dialogue Créer un modèle d'exécution s'affiche.

    Blocs de base de l'environnement d'exécution

    1. Dans la section Blocs de base de l'environnement d'exécution, saisissez un nom à afficher.

    2. Dans le menu Région, sélectionnez la région dans laquelle vous souhaitez créer votre modèle d'exécution.

    3. Facultatif : renseignez le champ Description pour votre modèle d'exécution.

    4. Facultatif : pour ajouter une étiquette, cliquez sur  Ajouter une étiquette, puis saisissez une paire Clé et Valeur. Pour ajouter d'autres étiquettes, répétez cette étape.

    5. Cliquez sur Continuer.

    Configurer le calcul

    1. Dans la section Configurer le calcul, accédez au menu Type de machine et sélectionnez un type de machine. Pour en savoir plus sur les types de machines, consultez Guide des ressources de familles de machines et guide comparatif.

      Si vous sélectionnez un type de machine comportant des GPU, sélectionnez le type d'accélérateur et le nombre d'accélérateurs. Si vous ne parvenez pas à sélectionner le nombre de GPU souhaité, vous devrez peut-être augmenter votre quota. Consultez la section Demander un ajustement de quota.

    2. Dans le menu Type de disque de données, sélectionnez un type de disque.

    3. Dans le champ Taille du disque de données, saisissez une taille en Go.

    4. Dans la section Arrêt en cas d'inactivité :

      • Pour désactiver l'arrêt en cas d'inactivité, désélectionnez Activer l'arrêt en cas d'inactivité.

      • Pour modifier la période d'inactivité, dans le champ Temps d'inactivité avant l'arrêt (en minutes), remplacez la valeur par le nombre de minutes d'inactivité souhaité. Dans la console Google Cloud , ce paramètre peut être défini sur une valeur entière comprise entre 10 et 1 440.

    5. Cliquez sur Continuer.

    Environnement

    1. Dans la section Environnement, sélectionnez un environnement. La valeur par défaut est Dernière version (actuellement Python 3.11).

    2. Cliquez sur Continuer.

    Mise en réseau et sécurité

    1. Dans la section Mise en réseau et sécurité, accédez au menu Réseau et sélectionnez un réseau. Si vous ne sélectionnez pas de réseau, votre réseau par défaut est sélectionné.

    2. Dans le menu Sous-réseau, sélectionnez un sous-réseau.

    3. Pour désactiver l'accès Internet public, désélectionnez Activer l'accès Internet public.

    4. Pour désactiver l'accès aux identifiants de l'utilisateur final, décochez la case Activer les identifiants de l'utilisateur final.

    Terminer la création du modèle d'exécution

    Cliquez sur Créer pour terminer la création du modèle d'exécution.

    Votre modèle d'exécution apparaît dans la liste de l'onglet Modèles d'exécution.

    gcloud

    Avant d'utiliser les données de la commande ci-dessous, effectuez les remplacements suivants :

    • DISPLAY_NAME : nom à afficher de votre modèle d'exécution
    • PROJECT_ID : ID de votre projet
    • REGION : région dans laquelle vous souhaitez placer votre modèle d'exécution
    • MACHINE_TYPE : type de machine à utiliser pour votre environnement d'exécution
    • ACCELERATOR_TYPE : type d'accélérateur matériel à utiliser pour votre environnement d'exécution
    • ACCELERATOR_COUNT : nombre d'accélérateurs à utiliser pour votre environnement d'exécution

    Exécutez la commande suivante :

    Linux, macOS ou Cloud Shell

    gcloud colab runtime-templates create --display-name="DISPLAY_NAME" \
        --project=PROJECT_ID \
        --region=REGION \
        --machine-type=MACHINE_TYPE \
        --accelerator-type=ACCELERATOR_TYPE \
        --accelerator-count=ACCELERATOR_COUNT

    Windows (PowerShell)

    gcloud colab runtime-templates create --display-name="DISPLAY_NAME" `
        --project=PROJECT_ID `
        --region=REGION `
        --machine-type=MACHINE_TYPE `
        --accelerator-type=ACCELERATOR_TYPE `
        --accelerator-count=ACCELERATOR_COUNT

    Windows (cmd.exe)

    gcloud colab runtime-templates create --display-name="DISPLAY_NAME" ^
        --project=PROJECT_ID ^
        --region=REGION ^
        --machine-type=MACHINE_TYPE ^
        --accelerator-type=ACCELERATOR_TYPE ^
        --accelerator-count=ACCELERATOR_COUNT

    Pour en savoir plus sur la commande permettant de créer un modèle d'exécution à partir de la ligne de commande, consultez la documentation de la gcloud CLI.

    REST

    Avant d'utiliser les données de requête, effectuez les remplacements suivants :

    • REGION : région dans laquelle vous souhaitez placer votre modèle d'exécution
    • PROJECT_ID : ID de votre projet
    • DISPLAY_NAME : nom à afficher de votre modèle d'exécution
    • MACHINE_TYPE : type de machine à utiliser pour votre environnement d'exécution
    • ACCELERATOR_TYPE : type d'accélérateur matériel à utiliser pour votre environnement d'exécution
    • ACCELERATOR_COUNT : nombre d'accélérateurs à utiliser pour votre environnement d'exécution

    Méthode HTTP et URL :

    POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates

    Corps JSON de la requête :

    {
      "displayName": "DISPLAY_NAME",
      "machineSpec": {
        {
          "machineType": MACHINE_TYPE
          "acceleratorType": ACCELERATOR_TYPE,
          "acceleratorCount": ACCELERATOR_COUNT,
        }
      },
    }
    

    Pour envoyer votre requête, choisissez l'une des options suivantes :

    curl

    Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates"

    PowerShell

    Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates" | Select-Object -Expand Content
    Si elle aboutit, le corps de la réponse contient une instance d'Operation.

    Pour en savoir plus, reportez-vous à la. documentation de l'API REST notebookRuntimeTemplates.create.

    Terraform

    Pour savoir comment appliquer ou supprimer une configuration Terraform, consultez Commandes Terraform de base. Pour en savoir plus, consultez la documentation de référence du fournisseur Terraform.

    L'exemple suivant utilise la ressource Terraform google_colab_runtime_template pour créer un modèle d'exécution Colab Enterprise.

    resource "google_compute_network" "my_network" {
      name = "{{index $.Vars "network_name"}}"
      auto_create_subnetworks = false
    }
    
    resource "google_compute_subnetwork" "my_subnetwork" {
      name   = "{{index $.Vars "network_name"}}"
      network = google_compute_network.my_network.id
      region = "us-central1"
      ip_cidr_range = "10.0.1.0/24"
    }
    
    resource "google_colab_runtime_template" "{{$.PrimaryResourceId}}" {
      name        = "{{index $.Vars "runtime_template_name"}}"
      display_name = "Runtime template full"
      location    = "us-central1"
      description = "Full runtime template"
      machine_spec {
        machine_type     = "n1-standard-2"
        accelerator_type = "NVIDIA_TESLA_T4"
        accelerator_count = "1"
      }
    
      data_persistent_disk_spec {
        disk_type    = "pd-standard"
        disk_size_gb = 200
      }
    
      network_spec {
        enable_internet_access = true
        network = google_compute_network.my_network.id
        subnetwork = google_compute_subnetwork.my_subnetwork.id
      }
    
      labels = {
        k = "val"
      }
    
      idle_shutdown_config {
        idle_timeout = "3600s"
      }
    
      euc_config {
        euc_disabled = false
      }
    
      shielded_vm_config {
        enable_secure_boot = false
      }
    
      network_tags = ["abc", "def"]
    
      encryption_spec {
        kms_key_name = "{{index $.Vars "key_name"}}"
      }
    }
    

    Accorder l'accès au modèle d'exécution

    Après avoir créé un modèle d'exécution, vous devez y accorder l'accès pour qu'un compte principal puisse l'utiliser. Un compte principal ne peut créer un environnement d'exécution à partir d'un modèle d'exécution que s'il répond aux exigences suivantes :

    • Il peut accéder au modèle d'exécution.
    • Il dispose des autorisations requises pour créer des environnements d'exécution.

    Consultez Gérer l'accès à un modèle d'exécution.

    Supprimer un modèle d'exécution

    Pour supprimer un modèle d'exécution:

    1. Dans la console Google Cloud , accédez à la page Modèles d'exécution de Colab Enterprise.

      Accéder aux modèles d'exécution

    2. Dans le menu Région, sélectionnez la région qui contient votre modèle d'exécution.

    3. Sélectionnez le modèle d'exécution que vous souhaitez supprimer.

    4. Cliquez sur  Supprimer.

    5. Cliquez sur Confirmer.

    Résoudre les problèmes

    Cette section explique comment résoudre les problèmes de création de modèles d'exécution dans Colab Enterprise.

    Impossible de sélectionner suffisamment de GPU

    Lorsque vous créez un modèle d'environnement d'exécution, vous ne pouvez pas sélectionner le nombre de GPU souhaité. Cela peut être dû au fait que vous ne disposez pas d'un quota suffisant.

    Colab Enterprise utilise un quota Compute Engine pour les GPU. Pour en savoir plus, consultez la page Présentation des quotas et des limites de Compute Engine.

    Pour résoudre ce problème, demandez un ajustement de quota.

    Étapes suivantes