Créer des sessions interactives et des modèles de session Dataproc sans serveur pour Spark

Cette page explique comment créer des sessions interactives et des modèles de session Dataproc sans serveur. Un modèle de session peut être utilisé pour créer plusieurs sessions interactives en fonction de la configuration du modèle de session.

Créer une session Dataproc sans serveur

Vous pouvez utiliser la console Google Cloud, la Google Cloud CLI ou l'API Dataproc pour créer une session interactive Dataproc sans serveur.

Console

Pour créer une session Dataproc sans serveur à l'aide de la console Google Cloud, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Sessions interactives.

    Accéder aux sessions interactives

    1. Cliquez sur Créer.
  2. Sur la page Ajouter une session interactive (Preview), saisissez ou confirmez les paramètres de configuration de la session. Veuillez noter les points suivants :

  3. Cliquez sur Envoyer pour créer la session.

gcloud

Vous pouvez utiliser gcloud beta dataproc sessions create command SESSION_NAME pour créer une session interactive Dataproc sans serveur.

Remarques sur les options de commande:

REST

Vous pouvez utiliser l'API Dataproc sessions.create pour créer une session interactive Dataproc sans serveur.

Remarques :

Créer un modèle de session Dataproc sans serveur

Un modèle de session Dataproc sans serveur définit les paramètres de configuration pour la création d'une ou de plusieurs sessions interactives Dataproc sans serveur.

Vous pouvez utiliser la console Google Cloud, gcloud CLI ou l'API Dataproc pour créer un modèle de session Dataproc sans serveur.

Console

Pour créer un modèle de session Dataproc sans serveur à l'aide de la console Google Cloud, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Modèles de session interactive.

    Accéder à la page "Modèles de sessions interactives"

    1. Cliquez sur Créer.
  2. Sur la page Créer un modèle de session, saisissez ou confirmez les paramètres de configuration du modèle. Veuillez noter les points suivants :

    • ID d'exécution du modèle:obligatoire. Acceptez l'ID (nom) par défaut ou spécifiez un nom d'exécution du modèle.
    • Région: obligatoire. Acceptez la région par défaut ou spécifiez une région disponible pour les sessions de modèle.
    • Version d'exécution:facultatif. Les environnements d'exécution de session sélectionnables correspondent aux versions d'exécution Dataproc sans serveur pour Spark.
    • Template configuration type (Type de configuration du modèle) : obligatoire. Sélectionnez un type. Si vous sélectionnez Jupyter, spécifiez le nom à afficher et sélectionnez le type de kernel Jupyter. Pour en savoir plus, consultez la section Lancer un notebook Jupyter sur Dataproc sans serveur.
    • Compte de service:facultatif. Compte de service à utiliser pour exécuter des sessions modélisées. Si elle n'est pas spécifiée, le compte de service Compute Engine par défaut est utilisé.
    • Image de conteneur personnalisée:facultatif. Une image de conteneur personnalisée à utiliser pour vos sessions modélisées.
    • Propriétés:facultatif. Cliquez sur Ajouter un élément pour chaque propriété à définir pour vos sessions modélisées. Pour en savoir plus, consultez la section Propriétés Spark.
    • Configuration réseau : * Obligatoire. L'sous-réseau de la session doit être configuré avec l'accès privé à Google (PGA) activé et doit autoriser la communication de sous-réseau sur tous les ports. Seuls les réseaux avec des sous-réseaux dans la session Region (Région) avec PGA activé sont listés dans cette section. Pour en savoir plus, consultez la section Configuration du réseau Dataproc sans serveur pour Spark.
  3. Cliquez sur Envoyer pour créer le modèle de session.

gcloud

Vous ne pouvez pas créer directement un modèle de session sans serveur Dataproc à l'aide de la gcloud CLI, mais vous pouvez utiliser la commande gcloud beta dataproc session-templates import pour importer un modèle de session existant. Vous pouvez modifier le modèle importé, puis l'exporter à l'aide de la commande gcloud beta dataproc session-templates export.

REST

Vous pouvez utiliser l'API Dataproc sessionTemplates.create pour créer un modèle de session Dataproc sans serveur.

Remarques :