Éléments à prendre en compte avant d'acheter
Pour vous aider à décider si vous souhaitez acheter le débit provisionné, tenez compte des éléments suivants :
Vous ne pouvez pas annuler votre commande en cours de période.
Votre achat de débit provisionné est un engagement, ce qui signifie que vous ne pouvez pas annuler la commande en cours de contrat. Toutefois, vous pouvez augmenter le nombre de GSU achetés. Si vous souscrivez un engagement par accident ou si votre configuration pose problème, contactez votre responsable de compteGoogle Cloud pour obtenir de l'aide.
Vous pouvez renouveler automatiquement votre abonnement.
Lorsque vous envoyez votre commande, vous pouvez choisir de renouveler automatiquement votre abonnement une fois arrivé à échéance ou de le laisser expirer. Vous pouvez annuler le processus de renouvellement automatique. Pour annuler votre abonnement avant son renouvellement automatique, annulez le renouvellement automatique 30 jours avant le début de la période suivante.
Vous pouvez configurer le renouvellement automatique des abonnements mensuels. Les conditions hebdomadaires ne sont pas compatibles avec le renouvellement automatique.
Pour en savoir plus, consultez Modifier l'ordre du débit provisionné. Vous pouvez également contacter votre responsable de compte pour obtenir de l'aide. Google Cloud
Vous pouvez modifier le comportement du renouvellement automatique, le modèle, la version du modèle ou la région avec préavis.
Une fois que vous avez choisi votre projet, votre région, votre modèle, votre version de modèle et le comportement du renouvellement automatique, et que votre commande a été approuvée et activée, le débit provisionné est activé, sous réserve de la capacité disponible. Vous pouvez modifier le comportement de renouvellement automatique, le modèle, la version du modèle ou la région en modifiant votre commande de débit provisionné existante à l'aide de la console Google Cloud .
Toutes les modifications sont traitées du mieux possible et sont généralement appliquées dans les 10 jours ouvrés suivant la demande initiale.
Les modifications du modèle sont limitées à un éditeur spécifique. Par exemple, vous pouvez modifier l'attribution de modèle du débit provisionné de Google Gemini 2.0 Pro à Google Gemini 2.0 Flash, mais vous ne pouvez pas passer de Google Gemini 2.0 Flash à Claude 3.5 Sonnet v2 d'Anthropic.
Par défaut, le dépassement est facturé au tarif de paiement à l'usage.
Si votre débit dépasse le montant de votre commande de débit provisionné, les dépassements sont traités et facturés sous forme de paiement à l'usage standard. Vous pouvez contrôler les dépassements par requête. Pour en savoir plus, consultez Utiliser le débit provisionné.
Pour en savoir plus sur les tarifs, consultez la section Débit provisionné.
Acheter du débit provisionné pour les modèles en preview
Vous pouvez acheter du débit provisionné pour les modèles Google en aperçu, à condition qu'une version en disponibilité générale du modèle n'ait pas été publiée.
Si vous avez une commande de débit provisionné active pour un modèle en version preview et qu'une version en disponibilité générale du modèle est publiée, vous pouvez effectuer l'une des opérations suivantes :
Transférez la commande vers la version en disponibilité générale du modèle. Notez qu'une fois votre commande transférée vers le modèle disponible pour tous, vous ne pourrez plus la repasser vers le modèle en version Preview. Pour en savoir plus sur la modification d'une commande, consultez Modifier une commande de débit provisionné.
Vous pouvez également continuer à utiliser le débit provisionné pour la version Preview d'un modèle tant que celle-ci est stable. Pour en savoir plus sur les modèles stables et ceux qui ont été abandonnés, consultez Versions et cycle de vie des modèles.
Rôles et autorisations
Le rôle suivant accorde un accès complet à la gestion du débit provisionné Vertex AI :
roles/aiplatform.provisionedThroughputAdmin
: vous pouvez accéder aux ressources Vertex AI Provisioned Throughput.
Ce rôle inclut les autorisations suivantes :
Autorisations | Description |
---|---|
aiplatform.googleapis.com/provisionedThroughputs.create |
Envoyez une nouvelle commande de débit provisionné. |
aiplatform.googleapis.com/provisionedThroughputs.get |
Affichez une commande de débit provisionné spécifique. |
aiplatform.googleapis.com/provisionedThroughputs.list |
Affichez toutes les commandes de débit provisionné. |
aiplatform.googleapis.com/provisionedThroughputs.update |
Modifier une commande de débit provisionné |
aiplatform.googleapis.com/provisionedThroughputs.cancel |
Annuler une commande ou une mise à jour en attente |
Passer une commande de débit provisionné
Il est possible que certaines fonctionnalités d'Imagen ne soient pas disponibles publiquement. Pour en savoir plus, consultez Fonctionnalités en disponibilité générale restreinte et version bêta.
Avant de passer une commande pour utiliser MedLM-large-1.5, contactez votre représentant Google Cloud pour demander l'accès.
Si vous pensez que votre nombre de RPM sera supérieur à 30 000, optimisez votre commande de débit provisionné en demandant un ajustement de quota pour votre quota système Vertex AI par défaut à l'aide des informations suivantes :
- Service : API Vertex AI.
- Nom :
Online prediction requests per minute per region
- Type de service : un quota.
- Dimensions : région dans laquelle vous avez commandé le débit provisionné.
- Valeur : limite de trafic des prédictions en ligne que vous avez choisie.
Les commandes de débit provisionné sont traitées en fonction de la taille de la commande et de la capacité disponible. Selon le nombre d'UGS demandées et la capacité disponible, le traitement de votre commande peut prendre de quelques minutes à quelques semaines.
Pour souscrire un abonnement au débit provisionné, procédez comme suit :
Console
- Dans la console Google Cloud , accédez à la page "Débit provisionné".
- Pour créer une commande, cliquez sur Nouvelle commande.
- Indiquez un nom de commande.
- Sélectionnez le modèle.
- Sélectionnez la Région.
Saisissez le nombre d'unités d'échelle d'IA générative (GSU) que vous devez acheter.
Facultatif : Vous pouvez utiliser l'outil d'estimation des unités de scaling pour l'IA générative afin d'évaluer le nombre de GSU dont vous aurez besoin. Pour utiliser cet outil, procédez comme suit :
- Cliquez sur Outil d'estimation.
- Sélectionnez votre modèle.
En fonction du modèle sélectionné, saisissez les détails pour estimer le nombre de GSU nécessaires.
Pour les modèles Gemini 2.5, saisissez ce qui suit :
- Estimation du nombre de requêtes par seconde nécessitant une assurance
- Jetons de texte d'entrée par requête
- Jetons d'image d'entrée par requête
- Jetons vidéo d'entrée par requête
- Jetons audio d'entrée par requête
- Jetons de texte de réponse de sortie par requête
- Jetons de texte de raisonnement de sortie par requête
Pour le modèle Gemini 2.5 Flash-Lite (preview), saisissez ce qui suit :
- Estimation du nombre de requêtes par seconde nécessitant une assurance
- Jetons de texte d'entrée par requête
- Jetons d'image d'entrée par requête
- Jetons vidéo d'entrée par requête
- Jetons audio d'entrée par requête
- Jetons de texte de sortie par requête
Pour les modèles Gemini 2.0, saisissez ce qui suit :
- Estimation du nombre de requêtes par seconde nécessitant une assurance
- Jetons d'entrée par requête
- Jetons d'image d'entrée par requête
- Jetons vidéo d'entrée par requête
- Jetons audio d'entrée par requête
- Jetons de texte de sortie par requête
Pour les modèles Imagen, saisissez les éléments suivants :
- Requêtes par seconde
- Images de sortie par requête
Si vous souhaitez utiliser les valeurs que vous avez saisies dans l'outil d'estimation, cliquez sur Utiliser les valeurs calculées.
Sélectionnez la durée. Notez que les frais de période ne peuvent pas être annulés pendant la durée de la période et s'appliquent quelle que soit votre utilisation effective ou l'arrêt du modèle. Google vous recommande de modifier le modèle attribué avant sa date d'arrêt. Google n'annulera pas de manière proactive le renouvellement automatique des modèles arrêtés.
Les options suivantes sont disponibles :
- 1 semaine
- 1 mois
- 3 mois
- 1 an
Facultatif : Sélectionnez la date et l'heure de début de votre période (aperçu).
Vous pouvez indiquer une date et une heure de début dans les deux semaines suivant la date de la commande. Si vous ne spécifiez pas de date et d'heure de début, la commande est traitée dès que la capacité est disponible. Les dates et heures de début demandées sont respectées dans la mesure du possible. Il n'est pas garanti qu'une commande soit honorée en fonction de ces valeurs tant que l'état de la commande n'est pas défini sur Approuvée.
Si la date de début que vous avez demandée est trop proche de la date actuelle, il est possible que votre commande soit approuvée et activée après la date de début demandée. Dans ce cas, la date de fin est ajustée en fonction de la durée du forfait sélectionné, à partir de la date d'activation. Pour savoir comment annuler une commande en attente, consultez Modifier une commande de débit provisionné.
Dans la liste Renouvellement, indiquez si vous souhaitez renouveler automatiquement la commande à la fin de la période. Vous ne pouvez spécifier l'option de renouvellement que si vous sélectionnez 1 mois, 3 mois ou 1 an comme durée.
Cliquez sur Continuer.
Dans la section Résumé, vérifiez les estimations de prix et de débit de votre commande. Lisez les conditions indiquées et accessibles dans les liens du formulaire.
Pour finaliser votre commande, cliquez sur Confirmer.
Le traitement d'une commande peut prendre de quelques minutes à quelques semaines, selon sa taille et la capacité disponible. Une fois la commande traitée, son état dans la console Google Cloud passe à Actif. Vous n'êtes facturé pour la commande qu'une fois qu'elle est active.
Modifier une commande de débit provisionné
Ce tableau décrit comment modifier vos commandes de débit provisionné dans la consoleGoogle Cloud en fonction de l'état de votre commande et des conditions existantes. La modification de vos commandes est une fonctionnalité en version bêta. Elle n'est disponible que pour les commandes en ligne passées via la console. Pour toute modification concernant les commandes hors connexion, contactez votre responsable de compteGoogle Cloud pour obtenir de l'aide.
De plus, les modifications apportées à votre modèle ou à la version de votre modèle lorsque vous utilisez la console Google Cloud modifient la commande existante tout en conservant la même date de fin d'abonnement.
État de la commande | Action | Remarque | Étapes à suivre dans la console Google Cloud |
---|---|---|---|
En attente d'examen | Vous pouvez annuler votre commande. |
Si vous souhaitez apporter d'autres modifications à votre commande, annulez la commande en attente et passez-en une nouvelle. Si vous avez plusieurs modèles, chacun ne peut avoir qu'une seule révision de commande ou commande en attente à la fois. |
Pour annuler votre commande en attente dans la console Google Cloud , procédez comme suit :
|
Approved | Vous ne pouvez pas modifier votre commande. | La commande est en attente d'activation. Vous ne pouvez pas modifier votre commande pour le moment. | Non applicable |
Actif |
Vous ne pouvez apporter les modifications suivantes que si la commande n'expire pas dans les cinq prochains jours ou si elle se renouvelle automatiquement :
|
Vous ne pouvez pas modifier une commande active si elle expire dans moins de cinq jours et si le renouvellement automatique n'est pas configuré. | Pour modifier votre commande active dans la console Google Cloud , utilisez l'une des méthodes suivantes :
|
Suivi de la commande
Une fois que vous avez envoyé votre commande de débit provisionné, l'état de la commande peut apparaître comme suit :
- En attente d'examen : vous avez passé votre commande. L'approbation dépend de la capacité disponible pour provisionner votre commande. Votre commande est donc en attente d'examen et d'approbation. Pour en savoir plus sur l'état de votre commande en attente, contactez votre responsable de compte Google Cloud .
- Approuvée : Google a approuvé votre commande, qui est en attente d'activation. Vous ne pouvez pas apporter de modifications une fois la commande approuvée.
- Actif : Google a activé votre commande, et la facturation commence.
- Expiré : votre commande a expiré.
Afficher les commandes de débit provisionné
Pour afficher vos commandes de débit provisionné, procédez comme suit :
Console
- Dans la console Google Cloud , accédez à la page "Débit provisionné".
- Sélectionnez la Région. Votre liste de commandes s'affiche.