Ce document décrit les différents types de réservations que vous pouvez utiliser pour réserver de la capacité pour les instances Compute Engine. Pour en savoir plus sur les ressources que vous pouvez utiliser pour créer des instances, consultez Instances Compute Engine.
Les réservations vous permettent de vous assurer que vous disposez des ressources disponibles pour créer des instances avec le même matériel (mémoire et processeurs virtuels) et les mêmes ressources facultatives (GPU, TPU ou disques SSD locaux) chaque fois que vous en avez besoin. Les réservations offrent les avantages suivants :
Capacité hautement assurée : vous réservez des ressources pour faire face aux futures augmentations de la demande, par exemple :
Croissance
Pics d'utilisation planifiés ou non planifiés
Migrations volumineuses
Sauvegarde et reprise après sinistre
Accès exclusif : les réservations empêchent d'autres personnes d'utiliser vos ressources réservées.
Propriétés héritées : les réservations héritent des mêmes propriétés que la famille de machines que vous avez choisie.
Une fois la capacité réservée, vous pouvez l'utiliser pour créer des instances correspondant à la réservation. La création de ces instances n'entraîne aucuns frais supplémentaires. Vous ne payez que les ressources qui ne font pas partie de la réservation, comme les disques ou les adresses IP.
Limites
Tous les types de réservations sont soumis aux limites suivantes :
Les réservations sont des ressources spécifiques à une zone.
Vous ne pouvez pas utiliser votre capacité réservée pour créer les ressources Compute Engine suivantes :
VM Spot ou instances préemptives
Nœuds à locataire unique
Choisir un type de réservation
Le schéma suivant vous aide à choisir le type de réservation Compute Engine qui correspond le mieux aux besoins de votre charge de travail :
Les questions du schéma précédent sont les suivantes :
Avez-vous besoin de capacité immédiatement ?
Oui : passez à la question suivante.
Non : passez à la question 3.
Avez-vous besoin de flexibilité concernant la durée de conservation de la capacité ?
Oui : consultez Utiliser les réservations à la demande.
Non : passez à la question suivante.
Avez-vous besoin de ressources très demandées, comme des GPU ?
Oui : passez à la question suivante.
Non : consultez Utiliser des réservations futures.
Avez-vous besoin de ressources pour plus de 90 jours ?
Oui : consultez Réserver de la capacité dans AI Hypercomputer.
Non : consultez Utiliser les réservations futures en mode calendrier.
Utiliser les réservations à la demande
Les réservations à la demande vous permettent de réserver de la capacité pour les instances de calcul et de l'obtenir dès que vous la réservez. Une fois que vous avez créé une réservation à la demande, vous pouvez la consommer, la modifier ou la supprimer à tout moment.
Pour en savoir plus, consultez À propos des réservations.
Utiliser les réservations futures
Pour réserver des instances pour une période définie, vous pouvez utiliser des réservations futures. Une fois que vous avez créé une demande de réservation, vous devez l'envoyer à Google Cloud pour examen.Google Cloud prend généralement cinq jours pour examiner votre demande. Si votre demande est approuvée, Compute Engine crée des réservations à la demande avec la capacité demandée à la date et à l'heure de votre choix. Pour utiliser ces réservations, vous devez créer des instances de calcul qui les utilisent. Une fois la période de réservation terminée, vous pouvez modifier ou supprimer les réservations.
Pour en savoir plus, consultez À propos des demandes de réservations futures.
Utiliser les réservations futures en mode calendrier
Pour réserver des instances de GPU ou des TPU pendant 90 jours maximum, vous pouvez utiliser les réservations futures en mode Agenda. Pour créer ce type de réservation, vérifiez d'abord quand le nombre et le type de ressources de votre choix sont disponibles dans une région. Ensuite, créez et envoyez une demande de réservation avec les propriétés que vous avez confirmées comme disponibles. Si vous parvenez à créer la demande,Google Cloud l'approuve en une minute. Une fois la demande approuvée, Compute Engine effectue les opérations suivantes :
Compute Engine crée une réservation à la demande.
Compute Engine réserve les ressources demandées aussi près les unes des autres que possible pour minimiser la latence du réseau.
Au début de votre période de réservation, vous pouvez utiliser la réservation en créant des instances de GPU ou de TPU. À la fin de la période de réservation, Compute Engine supprime la réservation et arrête ou supprime toutes les instances qui consomment la réservation en fonction de l'action d'arrêt que vous avez spécifiée pour les instances.
Pour en savoir plus, consultez À propos des demandes de réservations futures en mode Agenda.
Réserver de la capacité dans AI Hypercomputer
Contactez l'équipe chargée de votre compte et demandez à réserver des instances de GPU pour les charges de travail d'intelligence artificielle (IA) et de machine learning (ML) à grande échelle. Une fois que Google a créé un brouillon de demande de réservation pour vous, envoyez-le pour examen si tout semble correct. Google Cloud approuve immédiatement la demande, puis Compute Engine effectue les opérations suivantes :
Compute Engine crée des réservations à la demande.
Compute Engine réserve les ressources demandées aussi près les unes des autres que possible pour minimiser la latence du réseau.
Compute Engine réserve des ressources avec une planification tenant compte de la topologie, ainsi qu'une surveillance et une maintenance améliorées.
Au début de votre période de réservation, vous pouvez utiliser la réservation en créant des instances de GPU. À la fin de la période de réservation, Compute Engine supprime la réservation et arrête ou supprime toutes les instances qui consomment la réservation en fonction de l'action d'arrêt que vous avez spécifiée pour les instances.
Pour en savoir plus, consultez Réserver de la capacité dans la documentation AI Hypercomputer.