Tarifs des workflows tabulaires

Lorsque vous entraînez un modèle à l'aide d'un workflow tabulaire, le prix que vous devez payer est calculé en fonction du coût de l'infrastructure et des services dépendants. Lorsque vous effectuez des prédictions avec ce modèle, celles-ci vous sont facturées sur la base du coût de l'infrastructure.

Le coût de l'infrastructure dépend des facteurs suivants :

  • Nombre de machines que vous utilisez. Vous pouvez définir des paramètres associés lors de l'entraînement du modèle, de prédictions par lots ou de prédictions en ligne.
  • Type de machine que vous utilisez. Vous pouvez définir ce paramètre lors de l'entraînement du modèle, de prédictions par lots ou de prédictions en ligne.
  • Durée d'utilisation des machines.
    • Si vous entraînez un modèle ou effectuez des prédictions par lots, il s'agit d'une mesure du temps de traitement total de l'opération.
    • Si vous effectuez des prédictions en ligne, il s'agit d'une mesure de la durée pendant laquelle votre modèle est déployé sur un point de terminaison.

Le workflow tabulaire exécute plusieurs services dépendants dans votre projet pour vous : Dataflow, BigQuery, Cloud Storage, Vertex AI Pipelines et Vertex AI Training. Ces services vous seront facturés directement.

Exemples de calculs des coûts d'entraînement

Exemple 1 : Ensemble de données de 110 Mo au format CSV, entraîné pendant une heure avec la configuration matérielle par défaut

La répartition des coûts pour le workflow par défaut avec la recherche d'architecture et l'entraînement est la suivante :

Service Coût
Exemple Dataflow et génération de statistiques 2 $ (Dataflow exécuté pendant 7 min)
Données Dataflow et transformations de caractéristiques 3 $ (Dataflow exécuté pendant 10 minutes)
Vertex AI Training 0,8 h x 20 $ + 0,2 h x 20 $ + 3,3 $ de coût SSD + coût du conteneur de pipeline = 24 $ (48 minutes de réglage, 12 minutes d'entraînement)
Vertex AI Pipelines 1 exécution x 0,03 $ = 0,03 $
Total, hors distillation du modèle 27,03 $

Vous pouvez éventuellement activer la distillation du modèle pour réduire la taille du modèle obtenu. La répartition des coûts est la suivante :

Service Coût
Total, hors distillation du modèle 27,03 $
Vertex AI Training pour la distillation du modèle 1 $
Données Dataflow, transformations de caractéristiques pour la distillation du modèle 3 $ (Dataflow exécuté pendant 10 minutes)
Prédiction par lots pour la distillation du modèle 7 $
Total (distillation du modèle incluse) 38,03 $

Exemple 2 : Ensemble de données de 1,84 To dans BigQuery, entraîné pendant 20 heures avec remplacement de matériel

Dans cet exemple, la configuration matérielle est la suivante :

Nom de la configuration matérielle Valeur
stats_and_example_gen_dataflow_machine_type n1-standard-16
stats_and_example_gen_dataflow_max_num_workers 100
stats_and_example_gen_dataflow_disk_size_gb 40
transform_dataflow_machine_type n1-standard-16
transform_dataflow_max_num_workers 100
transform_dataflow_disk_size_gb 200
distill_batch_predict_machine_type n1-standard-2
distill_batch_predict_starting_replica_count 200
distill_batch_predict_max_replica_count 200

La répartition des coûts pour le workflow par défaut avec la recherche d'architecture et l'entraînement est la suivante :

Service Coût
Exemple Dataflow et génération de statistiques 518 $ (Dataflow exécuté pendant 6 heures)
Données Dataflow, transformations de caractéristiques 471 $ (Dataflow exécuté pendant 6 heures)
Vertex AI Training 17 h x 20 $ + 3 h x 20 $ + 41,5 $ de coût SSD + coût du conteneur de pipeline = 555 $ (17 heures de réglage, 3 heures d'entraînement)
Vertex AI Pipelines 1 exécution x 0,03 $ = 0,03 $
Total 1 544,03 $