Tarifs de Dataproc
Tarifs de Dataproc sur Compute Engine
Les tarifs de Dataproc sur Compute Engine sont définis en fonction de la taille et de la durée d'exécution des clusters Dataproc. La taille dépend du nombre total de processeurs virtuels sur l'ensemble du cluster, y compris les nœuds maîtres et de calcul. La durée d'exécution correspond à la période comprise entre la création du cluster et son arrêt ou sa suppression.
La formule tarifaire appliquée pour Dataproc est la suivante : $0.010 * # of vCPUs * hourly duration
.
Bien que les tarifs soient exprimés sous forme de taux horaire, Dataproc est facturé à la seconde et tous les clusters Dataproc sont facturés par tranche d'une seconde, avec une facturation minimale d'une minute. L'utilisation est mesurée en fractions d'heures (par exemple, 30 minutes correspondent à 0,5 heure) afin d'appliquer un tarif horaire à l'utilisation à la seconde près.
Les tarifs de Dataproc s'ajoutent au prix par instance de Compute Engine pour chaque machine virtuelle (voir Utilisation d'autres ressources Google Cloud).
Frais constatés
Les opérations et scénarios Dataproc suivants entraînent l'accumulation de frais:
Scaling et autoscaling : Lorsque des VM sont ajoutées au cluster, les frais augmentent tant que les VM sont actives. Ces frais s'accumulent jusqu'à ce que les VM soient supprimées.
Clusters en état d'erreur: lorsqu'un cluster Dataproc est en état d'erreur, les VM du cluster restent actives et les frais continuent de s'accumuler. Ces frais s'accumulent jusqu'à la suppression du cluster.
Exemple de tarification
Prenons l'exemple d'un cluster (avec nœud maître et nœud de calcul) présentant la configuration suivante :
Élément | Type de machine | Processeurs virtuels | Disque persistant associé | Nombre dans le cluster |
---|---|---|---|---|
Nœud maître | n1-standard-4 | 4 | 500 Go | 1 |
Nœuds de calcul | n1-standard-4 | 4 | 500 Go | 5 |
Ce cluster Dataproc contient 24 processeurs virtuels, 4 pour le nœud maître et 20 répartis entre les nœuds de calcul. Dans le cadre de la facturation Dataproc, le prix serait calculé en fonction de ces 24 processeurs virtuels et de la durée d'exécution du cluster (si aucun nœud n'est réduit ni préempté). Si le cluster s'exécute pendant 2 heures, Dataproc serait facturé selon la formule suivante :
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
Dans cet exemple de cluster, des frais seraient également facturés pour l'utilisation de Compute Engine et l'espace provisionné sur le disque persistant standard, en plus des coûts liés à Dataproc (voir Utilisation d'autres ressources Google Cloud). Le simulateur de facturation vous permet de calculer ces coûts de ressources Google Cloud additionnels.
Utilisation d'autres ressources Google Cloud
Solution gérée et intégrée, Dataproc repose sur d'autres technologies Google Cloud. Les clusters Dataproc consomment les ressources suivantes, chacune faisant l'objet d'une facturation spécifique :
- Compute Engine : toutes les instances Compute Engine d'un cluster Dataproc font l'objet d'une facturation minimale d'une minute, par tranche d'une seconde et selon les règles de tarification en cas d'utilisation soutenue.
- Espace provisionné sur disque persistant standard.
- Cloud Monitoring : consultez la page Tarification de Google Cloud Observability
Les clusters Dataproc peuvent aussi utiliser les ressources suivantes, chacune faisant l'objet d'une facturation spécifique, y compris, mais sans s'y limiter :
Tarifs de Dataproc sur GKE
Cette section explique les frais qui s'appliquent uniquement au cluster Dataproc virtuel exécuté sur un cluster GKE géré par l'utilisateur. Consultez les tarifs de GKE pour en savoir plus sur les frais supplémentaires qui s'appliquent au cluster GKE géré par l'utilisateur.
La formule de tarification de Dataproc sur GKE, $0.010 * # of vCPUs * hourly duration
, est identique à celle de Dataproc sur Compute Engine. Elle s'applique au nombre total de processeurs virtuels exécutés dans les instances de VM des pools de nœuds créés par Dataproc du cluster. La durée d'une instance de machine virtuelle correspond à la période entre sa création et sa suppression. Comme pour Dataproc sur Compute Engine, Dataproc sur GKE est facturé à la seconde, avec un minimum d'une minute par instance de machine virtuelle. D'autres frais Google Cloud s'appliquent en plus des frais Dataproc.
Les pools de nœuds créés par Dataproc continuent d'exister après la suppression du cluster Dataproc, car ils peuvent être partagés par plusieurs clusters. Si vous supprimez les pools de nœuds ou réduisez le nombre d'instances de pools de nœuds à zéro, vous ne serez plus facturé pour Dataproc. Les VM de pool de nœuds restantes continueront d'être facturées tant que vous ne les supprimerez pas.
Tarifs de Dataproc sans serveur
Consultez la page Tarifs de Dataproc sans serveur.
Étape suivante
- Consultez la documentation Dataproc.
- Premiers pas avec Dataproc.
- Essayez le Simulateur de coût.
- Découvrez les solutions et cas d'utilisation Dataproc.