Acheter du débit provisionné

Cette page fournit des informations à prendre en compte avant de vous abonner au débit provisionné, les autorisations dont vous devez disposer pour passer ou afficher une commande de débit provisionné, ainsi que les instructions pour passer et afficher vos commandes.

Éléments à prendre en compte avant d'acheter

Pour vous aider à décider si vous souhaitez acheter le débit provisionné, tenez compte des éléments suivants :

  • Vous ne pouvez pas annuler votre commande en cours de période.

    Votre achat de débit provisionné est un engagement, ce qui signifie que vous ne pouvez pas annuler la commande en cours de contrat. Toutefois, vous pouvez augmenter le nombre de GSU achetés. Si vous souscrivez un engagement par accident ou si votre configuration pose problème, contactez votre responsable de compteGoogle Cloud pour obtenir de l'aide.

  • Vous pouvez renouveler automatiquement votre abonnement.

    Lorsque vous envoyez votre commande, vous pouvez choisir de renouveler automatiquement votre abonnement une fois arrivé à échéance ou de le laisser expirer. Vous pouvez annuler le processus de renouvellement automatique. Pour annuler votre abonnement avant son renouvellement automatique, annulez le renouvellement automatique 30 jours avant le début de la période suivante.

    Vous pouvez configurer le renouvellement automatique des abonnements mensuels. Les conditions hebdomadaires ne sont pas compatibles avec le renouvellement automatique.

    Pour en savoir plus, consultez Modifier l'ordre du débit provisionné. Vous pouvez également contacter votre responsable de compte pour obtenir de l'aide. Google Cloud

  • Vous pouvez modifier le comportement du renouvellement automatique, le modèle, la version du modèle ou la région avec préavis.

    Une fois que vous avez choisi votre projet, votre région, votre modèle, votre version de modèle et le comportement du renouvellement automatique, et que votre commande a été approuvée et activée, le débit provisionné est activé, sous réserve de la capacité disponible. Vous pouvez modifier le comportement de renouvellement automatique, le modèle, la version du modèle ou la région en modifiant votre commande de débit provisionné existante à l'aide de la console Google Cloud .

    Toutes les modifications sont traitées du mieux possible et sont généralement appliquées dans les 10 jours ouvrés suivant la demande initiale.

    Les modifications du modèle sont limitées à un éditeur spécifique. Par exemple, vous pouvez modifier l'attribution de modèle du débit provisionné de Google Gemini 2.0 Pro à Google Gemini 2.0 Flash, mais vous ne pouvez pas passer de Google Gemini 2.0 Flash à Claude 3.5 Sonnet v2 d'Anthropic.

  • Par défaut, le dépassement est facturé au tarif de paiement à l'usage.

    Si votre débit dépasse le montant de votre commande de débit provisionné, les dépassements sont traités et facturés sous forme de paiement à l'usage standard. Vous pouvez contrôler les dépassements par requête. Pour en savoir plus, consultez Utiliser le débit provisionné.

Pour en savoir plus sur les tarifs, consultez la section Débit provisionné.

Acheter du débit provisionné pour les modèles en preview

Vous pouvez acheter du débit provisionné pour les modèles Google en aperçu, à condition qu'une version en disponibilité générale du modèle n'ait pas été publiée.

Si vous avez une commande de débit provisionné active pour un modèle en version preview et qu'une version en disponibilité générale du modèle est publiée, vous pouvez effectuer l'une des opérations suivantes :

  • Transférez la commande vers la version en disponibilité générale du modèle. Notez qu'une fois votre commande transférée vers le modèle disponible pour tous, vous ne pourrez plus la repasser vers le modèle en version Preview. Pour en savoir plus sur la modification d'une commande, consultez Modifier une commande de débit provisionné.

  • Vous pouvez également continuer à utiliser le débit provisionné pour la version Preview d'un modèle tant que celle-ci est stable. Pour en savoir plus sur les modèles stables et ceux qui ont été abandonnés, consultez Versions et cycle de vie des modèles.

Rôles et autorisations

Le rôle suivant accorde un accès complet à la gestion du débit provisionné Vertex AI :

  • roles/aiplatform.provisionedThroughputAdmin : vous pouvez accéder aux ressources Vertex AI Provisioned Throughput.

Ce rôle inclut les autorisations suivantes :

Autorisations Description
aiplatform.googleapis.com/provisionedThroughputs.create Envoyez une nouvelle commande de débit provisionné.
aiplatform.googleapis.com/provisionedThroughputs.get Affichez une commande de débit provisionné spécifique.
aiplatform.googleapis.com/provisionedThroughputs.list Affichez toutes les commandes de débit provisionné.
aiplatform.googleapis.com/provisionedThroughputs.update Modifier une commande de débit provisionné
aiplatform.googleapis.com/provisionedThroughputs.cancel Annuler une commande ou une mise à jour en attente

Passer une commande de débit provisionné

Il est possible que certaines fonctionnalités d'Imagen ne soient pas disponibles publiquement. Pour en savoir plus, consultez Fonctionnalités en disponibilité générale restreinte et version bêta.

Avant de passer une commande pour utiliser MedLM-large-1.5, contactez votre représentant Google Cloud pour demander l'accès.

Si vous pensez que votre nombre de RPM sera supérieur à 30 000, optimisez votre commande de débit provisionné en demandant un ajustement de quota pour votre quota système Vertex AI par défaut à l'aide des informations suivantes :

  • Service : API Vertex AI.
  • Nom : Online prediction requests per minute per region
  • Type de service : un quota.
  • Dimensions : région dans laquelle vous avez commandé le débit provisionné.
  • Valeur : limite de trafic des prédictions en ligne que vous avez choisie.

Les commandes de débit provisionné sont traitées en fonction de la taille de la commande et de la capacité disponible. Selon le nombre d'UGS demandées et la capacité disponible, le traitement de votre commande peut prendre de quelques minutes à quelques semaines.

Pour souscrire un abonnement au débit provisionné, procédez comme suit :

Console

  1. Dans la console Google Cloud , accédez à la page "Débit provisionné".

    Accéder à la page "Débit provisionné"

  2. Pour créer une commande, cliquez sur Nouvelle commande.
  3. Indiquez un nom de commande.
  4. Sélectionnez le modèle.
  5. Sélectionnez la Région.
  6. Saisissez le nombre d'unités d'échelle d'IA générative (GSU) que vous devez acheter.

    Facultatif : Vous pouvez utiliser l'outil d'estimation des unités de scaling pour l'IA générative afin d'évaluer le nombre de GSU dont vous aurez besoin. Pour utiliser cet outil, procédez comme suit :

    1. Cliquez sur Outil d'estimation.
    2. Sélectionnez votre modèle.
    3. En fonction du modèle sélectionné, saisissez les détails pour estimer le nombre de GSU nécessaires.

      • Pour les modèles Gemini 2.5, saisissez ce qui suit :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons de texte d'entrée par requête
        • Jetons d'image d'entrée par requête
        • Jetons vidéo d'entrée par requête
        • Jetons audio d'entrée par requête
        • Jetons de texte de réponse de sortie par requête
        • Jetons de texte de raisonnement de sortie par requête
      • Pour le modèle Gemini 2.5 Flash-Lite (preview), saisissez ce qui suit :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons de texte d'entrée par requête
        • Jetons d'image d'entrée par requête
        • Jetons vidéo d'entrée par requête
        • Jetons audio d'entrée par requête
        • Jetons de texte de sortie par requête
      • Pour les modèles Gemini 2.0, saisissez ce qui suit :

        • Estimation du nombre de requêtes par seconde nécessitant une assurance
        • Jetons d'entrée par requête
        • Jetons d'image d'entrée par requête
        • Jetons vidéo d'entrée par requête
        • Jetons audio d'entrée par requête
        • Jetons de texte de sortie par requête
      • Pour les modèles Imagen, saisissez les éléments suivants :

        • Requêtes par seconde
        • Images de sortie par requête
    4. Si vous souhaitez utiliser les valeurs que vous avez saisies dans l'outil d'estimation, cliquez sur Utiliser les valeurs calculées.

  7. Sélectionnez la durée. Notez que les frais de période ne peuvent pas être annulés pendant la durée de la période et s'appliquent quelle que soit votre utilisation effective ou l'arrêt du modèle. Google vous recommande de modifier le modèle attribué avant sa date d'arrêt. Google n'annulera pas de manière proactive le renouvellement automatique des modèles arrêtés.

    Les options suivantes sont disponibles :

    • 1 semaine
    • 1 mois
    • 3 mois
    • 1 an
  8. Facultatif : Sélectionnez la date et l'heure de début de votre période (aperçu).

    Vous pouvez indiquer une date et une heure de début dans les deux semaines suivant la date de la commande. Si vous ne spécifiez pas de date et d'heure de début, la commande est traitée dès que la capacité est disponible. Les dates et heures de début demandées sont respectées dans la mesure du possible. Il n'est pas garanti qu'une commande soit honorée en fonction de ces valeurs tant que l'état de la commande n'est pas défini sur Approuvée.

    Si la date de début que vous avez demandée est trop proche de la date actuelle, il est possible que votre commande soit approuvée et activée après la date de début demandée. Dans ce cas, la date de fin est ajustée en fonction de la durée du forfait sélectionné, à partir de la date d'activation. Pour savoir comment annuler une commande en attente, consultez Modifier une commande de débit provisionné.

  9. Dans la liste Renouvellement, indiquez si vous souhaitez renouveler automatiquement la commande à la fin de la période. Vous ne pouvez spécifier l'option de renouvellement que si vous sélectionnez 1 mois, 3 mois ou 1 an comme durée.

  10. Cliquez sur Continuer.

  11. Dans la section Résumé, vérifiez les estimations de prix et de débit de votre commande. Lisez les conditions indiquées et accessibles dans les liens du formulaire.

  12. Pour finaliser votre commande, cliquez sur Confirmer.

    Le traitement d'une commande peut prendre de quelques minutes à quelques semaines, selon sa taille et la capacité disponible. Une fois la commande traitée, son état dans la console Google Cloud passe à Actif. Vous n'êtes facturé pour la commande qu'une fois qu'elle est active.

Modifier une commande de débit provisionné

Ce tableau décrit comment modifier vos commandes de débit provisionné dans la consoleGoogle Cloud en fonction de l'état de votre commande et des conditions existantes. La modification de vos commandes est une fonctionnalité en version bêta. Elle n'est disponible que pour les commandes en ligne passées via la console. Pour toute modification concernant les commandes hors connexion, contactez votre responsable de compteGoogle Cloud pour obtenir de l'aide.

De plus, les modifications apportées à votre modèle ou à la version de votre modèle lorsque vous utilisez la console Google Cloud modifient la commande existante tout en conservant la même date de fin d'abonnement.

État de la commande Action Remarque Étapes à suivre dans la console Google Cloud
En attente d'examen Vous pouvez annuler votre commande.

Si vous souhaitez apporter d'autres modifications à votre commande, annulez la commande en attente et passez-en une nouvelle.

Si vous avez plusieurs modèles, chacun ne peut avoir qu'une seule révision de commande ou commande en attente à la fois.

Pour annuler votre commande en attente dans la console Google Cloud , procédez comme suit :
  1. Accédez à la page Débit provisionné.
  2. Sélectionnez la région dans laquelle se trouve votre commande en attente.
  3. Pour accéder à la page Détails de la commande, cliquez sur l'ID de la commande que vous souhaitez annuler.
  4. Cliquez sur Annuler.
  5. Dans la boîte de dialogue Voulez-vous vraiment annuler la commande ?, cliquez sur Annuler la commande.
Approved Vous ne pouvez pas modifier votre commande. La commande est en attente d'activation. Vous ne pouvez pas modifier votre commande pour le moment. Non applicable
Actif

Vous ne pouvez apporter les modifications suivantes que si la commande n'expire pas dans les cinq prochains jours ou si elle se renouvelle automatiquement :

  • Augmentez le nombre de GSU sur les commandes existantes. Une augmentation des UGS est appliquée immédiatement après l'approbation, quel que soit le calendrier de renouvellement automatique.
  • Diminuer le nombre d'unités SKU Google sur les commandes existantes Une diminution du nombre de GSU est appliquée lors du renouvellement automatique pour la période suivante.
  • Activez ou désactivez le renouvellement automatique.
  • Modifiez le modèle ou la version du modèle.
  • Modifiez la région.
Vous ne pouvez pas modifier une commande active si elle expire dans moins de cinq jours et si le renouvellement automatique n'est pas configuré. Pour modifier votre commande active dans la console Google Cloud , utilisez l'une des méthodes suivantes :
  • Sur la page Débit provisionné, cliquez sur le symbole  dans la colonne Actions, puis sur Modifier.
  • Sur la page Détails de la commande, cliquez sur le bouton Modifier.

Suivi de la commande

Une fois que vous avez envoyé votre commande de débit provisionné, l'état de la commande peut apparaître comme suit :

  • En attente d'examen : vous avez passé votre commande. L'approbation dépend de la capacité disponible pour provisionner votre commande. Votre commande est donc en attente d'examen et d'approbation. Pour en savoir plus sur l'état de votre commande en attente, contactez votre responsable de compte Google Cloud .
  • Approuvée : Google a approuvé votre commande, qui est en attente d'activation. Vous ne pouvez pas apporter de modifications une fois la commande approuvée.
  • Actif : Google a activé votre commande, et la facturation commence.
  • Expiré : votre commande a expiré.

Afficher les commandes de débit provisionné

Pour afficher vos commandes de débit provisionné, procédez comme suit :

Console

  1. Dans la console Google Cloud , accédez à la page "Débit provisionné".

    Accéder à la page "Débit provisionné"

  2. Sélectionnez la Région. Votre liste de commandes s'affiche.

Étapes suivantes