Modèles de provisionnement d'instances Compute Engine


Ce document décrit les modèles de provisionnement pour les instances Compute Engine. Pour en savoir plus sur les options de déploiement, consultez Choisir une stratégie de déploiement Compute Engine pour votre charge de travail.

Les modèles de provisionnement déterminent la disponibilité, la durée de vie et le prix de vos instances. Si vous comprenez ces modèles, vous pouvez choisir la meilleure option pour votre charge de travail.

Modèles de provisionnement disponibles

Lorsque vous créez une instance de calcul, vous pouvez spécifier l'un des modèles d'approvisionnement suivants. Si vous ne spécifiez pas de modèle d'approvisionnement, Compute Engine utilise le modèle d'approvisionnement standard par défaut.

  • Standard

  • Spot

  • Démarrage Flex (Aperçu)

  • Liée à la réservation

Le tableau suivant vous aide à comparer les cas d'utilisation et les tarifs de chaque modèle de provisionnement :

Standard Spot Démarrage Flex (Aperçu) Liée à la réservation
Résumé
  • En fonction de la disponibilité des ressources, vous pouvez créer des instances immédiatement.
  • Vous pouvez contrôler quand arrêter ou supprimer des instances.
  • En fonction de la disponibilité des ressources, vous pouvez créer des instances immédiatement.
  • Vous pouvez contrôler quand arrêter ou supprimer des instances. Toutefois, vous autorisez également Compute Engine à arrêter ou supprimer des instances à tout moment pour récupérer de la capacité.
  • Une fois que vous avez créé un groupe d'instances géré (MIG) zonal, vous demandez à Compute Engine d'ajouter des instances avec des GPU associés au MIG. Compute Engine planifie le provisionnement des instances en fonction de la disponibilité des ressources.
  • Vous pouvez choisir quand supprimer les instances. Toutefois, vous ne pouvez pas les arrêter, les suspendre ni les recréer. Les instances s'exécutent pendant sept jours maximum. Compute Engine les supprime ensuite.
  • Vous pouvez demander à réserver de la capacité à une date ultérieure pour créer des instances avec des GPU associés. Si Google Cloud approuve votre demande, Compute Engine crée une réservation. Au début de la période de réservation, vous pouvez utiliser la réservation en créant des instances de GPU qui correspondent à la réservation.
  • Pendant la période de réservation approuvée, vous pouvez arrêter, redémarrer, supprimer et recréer des instances pour consommer la réservation selon vos besoins. À la fin de la période de réservation, Compute Engine supprime la réservation et arrête ou supprime toutes les instances qui la consomment.
Cas d'utilisation Idéal pour les charges de travail qui nécessitent de la stabilité et un fonctionnement continu, telles que les suivantes :
  • Serveurs Web
  • Bases de données
  • Applications d'entreprise
  • Développement et tests
Idéal pour les charges de travail qui peuvent tolérer les interruptions, telles que les charges de travail suivantes :
  • Traitement par lot
  • Calcul hautes performances (HPC)
  • Intégration continue et déploiement continu (CI/CD)
  • Analyse de données
  • Encodage de contenus multimédias
  • Inférence en ligne
Charges de travail nécessitant de la stabilité et devant s'exécuter pendant sept jours maximum, comme les charges de travail suivantes :
  • Pré-entraînement de petits modèles
  • Affinage de modèles
  • Simulation HPC
  • Inférence par lot
Idéal pour les charges de travail qui nécessitent de la stabilité et une durée d'exécution spécifique, comme les suivantes :
  • Pour les charges de travail d'une durée maximale de 90 jours :
    • Jobs de pré-entraînement de modèles
    • Jobs d'affinage de modèles
    • Charges de travail de simulation HPC
    • Augmentations attendues à court terme des charges de travail d'inférence
  • Pour les charges de travail de plus de 90 jours :
    • Charges de travail d'entraînement
    • Charges de travail d'inférence
Tarifs Les instances vous sont facturées au tarif standard. Pour en savoir plus, consultez la page Tarifs des instances de VM. La plupart des processeurs virtuels, GPU et disques SSD locaux sont disponibles avec une remise de 60 à 91 %. Pour en savoir plus, consultez Tarifs des VM Spot. En fonction de la famille de machines utilisée par vos instances, vous pouvez bénéficier d'une remise allant jusqu'à 53 % sur les processeurs virtuels et les GPU. Consultez la page Tarifs du planificateur de charges de travail dynamique. En fonction de la famille de machines utilisée par vos instances, vous pouvez bénéficier d'une remise allant jusqu'à 53 % sur les processeurs virtuels et les GPU. De plus, des frais vous sont facturés en fonction de la façon dont vous réservez de la capacité pour créer des instances :
Quota Lorsque vous créez une instance, le quota standard est utilisé. Lorsque vous créez une instance, le quota d'instances préemptives est utilisé. Si votre projet ne dispose pas de quota préemptif, le quota standard est utilisé. Les crédits de la version gratuite ne s'appliquent pas aux VM Spot.Google Cloud Lorsque le MIG ajoute des instances au groupe, le quota d'instances préemptives est consommé. Si votre projet ne dispose pas de quota préemptif, le quota standard est utilisé. Le quota ne s'applique pas au modèle de provisionnement lié aux réservations.

Disponibilité et durée de vie des instances

Le tableau suivant indique la disponibilité et la durée de vie des instances de calcul pour chaque modèle de provisionnement :

Standard Spot Démarrage Flex (Aperçu) Liée à la réservation
Conditions préalables à la création Aucun prérequis pour la création. Aucun prérequis pour la création. Aucun prérequis pour la création.

Pour créer des instances, vous devez d'abord réserver de la capacité à l'aide de l'une des méthodes suivantes :

À la date et à l'heure de livraison choisies, Compute Engine provisionne la capacité demandée. Vous pouvez ensuite utiliser la capacité en créant des instances.
Série de machines compatible Vous pouvez utiliser n'importe quelle série de machines, à l'exception des séries A4X, A4 et A3 Ultra. Vous pouvez utiliser n'importe quelle série de machines, à l'exception des suivantes :
  • M2 et M3
  • Instances Bare Metal
Vous ne pouvez utiliser que les séries de machines suivantes :
En fonction de la façon dont vous réservez de la capacité pour créer des VM, vous ne pouvez utiliser que les séries de machines suivantes :
Disponibilité des instances Vous pouvez créer des instances à tout moment, à condition que les ressources que vous demandez soient disponibles. Vous pouvez créer des instances à tout moment, à condition que les ressources que vous demandez soient disponibles. Vous ne pouvez créer des instances qu'en créant des requêtes de redimensionnement dans un MIG. Compute Engine utilise DWS pour planifier le provisionnement de la capacité demandée en fonction de la disponibilité des ressources. DWS vous aide à obtenir des ressources très demandées, comme des GPU. Vous ne pouvez créer des instances qu'après avoir réservé de la capacité pour une date ultérieure. À la date demandée, Compute Engine fournit la capacité demandée, que vous pouvez ensuite utiliser pour créer des instances. Si vous réservez des ressources à l'aide de réservations futures en mode calendrier, Compute Engine utilise DWS pour provisionner la capacité demandée. DWS vous aide à obtenir des ressources très demandées, comme des GPU.
Durée de vie de l'instance Vous pouvez contrôler le moment où arrêter ou supprimer une instance, sauf dans les cas suivants :
  • Si le type de machine utilisé par l'instance ne prend pas en charge la migration à chaud, Compute Engine arrête vos instances lors des événements de maintenance de l'hôte.
  • Dans de rares cas, l'instance peut s'arrêter en raison d'une erreur d'hôte.
Vous pouvez contrôler le moment où arrêter ou supprimer une instance, sauf dans les cas suivants :
  • Compute Engine peut arrêter ou supprimer l'instance à tout moment pour récupérer de la capacité. Ce processus est appelé préemption.
  • Si le type de machine utilisé par l'instance ne prend pas en charge la migration à chaud, Compute Engine arrête vos instances lors des événements de maintenance de l'hôte.
  • Dans de rares cas, l'instance peut s'arrêter en raison d'une erreur d'hôte.
Les instances provisionnées s'exécutent pendant la durée de votre choix, qui peut aller jusqu'à sept jours. Vous ne pouvez pas arrêter, suspendre ni recréer des instances.

Compute Engine supprime les instances dans les cas suivants :
  • Vous demandez à supprimer des instances.
  • Les instances atteignent la fin de leur durée d'exécution.
Vous pouvez contrôler le moment où arrêter ou supprimer une instance, sauf dans les cas suivants :
  • Compute Engine arrête votre instance lors des événements de maintenance de l'hôte.
  • La réservation créée automatiquement pour provisionner la capacité demandée arrive à la fin de sa période de réservation engagée. À ce moment-là, Compute Engine supprime la réservation et arrête ou supprime toutes les instances qui l'utilisent.
  • Dans de rares cas, l'instance peut s'arrêter en raison d'une erreur d'hôte.

Étapes suivantes