Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Dataproc sur GKE vous permet d'exécuter des applications de big data à l'aide de l'API Dataproc jobs sur des clusters GKE.
Utilisez la console Google Cloud , Google Cloud CLI ou l'API Dataproc (requête HTTP ou bibliothèques clientes Cloud) pour créer un cluster virtuel Dataproc sur GKE, puis envoyez une tâche Spark, PySpark, SparkR ou Spark-SQL au service Dataproc.
Dataproc sur GKE déploie des clusters virtuels Dataproc sur un cluster GKE. Contrairement aux clusters Dataproc sur Compute Engine, les clusters virtuels Dataproc sur GKE n'incluent pas de VM maîtres ni de VM de nœud de calcul distinctes. En revanche, lorsque vous créez un cluster virtuel Dataproc sur GKE, Dataproc sur GKE crée des pools de nœuds dans un cluster GKE. Les tâches Dataproc sur GKE sont exécutées en tant que pods sur ces pools de nœuds. Les pools de nœuds et la planification des pods sur les pools de nœuds sont gérés par GKE.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/07/14 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/07/14 (UTC)."],[[["Dataproc on GKE enables the execution of Big Data applications on GKE clusters through the Dataproc `jobs` API."],["You can create a Dataproc on GKE virtual cluster and then submit Spark, PySpark, SparkR, or Spark-SQL jobs via the Google Cloud console, Cloud CLI, or the Dataproc API."],["Dataproc on GKE utilizes virtual clusters, which, unlike Dataproc on Compute Engine clusters, do not have separate master and worker VMs."],["Dataproc on GKE job are run as pods on node pools and is managed by GKE."],["Dataproc on GKE supports Spark 3.5 versions."]]],[]]