Éléments à prendre en compte avant d'acheter
Pour vous aider à décider si vous souhaitez acheter du débit provisionné, tenez compte des points suivants:
Vous ne pouvez pas annuler votre commande en cours de période.
Votre achat de débit provisionné est un engagement, ce qui signifie que vous ne pouvez pas annuler la commande en cours de période. Toutefois, vous pouvez augmenter le nombre de GSU achetés. Si vous souscrivez un engagement par accident ou si votre configuration pose problème, contactez votre responsable de compteGoogle Cloud pour obtenir de l'aide.
Vous pouvez renouveler automatiquement votre abonnement.
Lorsque vous envoyez votre commande, vous pouvez choisir de renouveler automatiquement votre abonnement une fois arrivé à échéance ou de le laisser expirer. Vous pouvez annuler le processus de renouvellement automatique. Pour annuler votre abonnement avant son renouvellement automatique, annulez le renouvellement automatique 30 jours avant le début de la période suivante.
Vous pouvez configurer les abonnements mensuels pour qu'ils soient renouvelés automatiquement chaque mois. Les conditions hebdomadaires ne sont pas compatibles avec le renouvellement automatique.
Pour en savoir plus, consultez Modifier l'ordre du débit provisionné. Vous pouvez également contacter votre Google Cloud responsable de compte pour obtenir de l'aide.
Vous pouvez modifier le comportement de renouvellement automatique, le modèle, la version du modèle ou la région avec préavis.
Une fois que vous avez choisi votre projet, votre région, votre modèle, la version de votre modèle et le comportement de renouvellement automatique, et que votre commande est approuvée et activée, le débit provisionné est activé, sous réserve de la capacité disponible. Vous pouvez modifier le comportement de renouvellement automatique, le modèle ou la version du modèle à l'aide de la console Google Cloud, qui vous permet également de modifier votre commande existante. Pour en savoir plus, consultez la section Modifier l'ordre du débit provisionné.
Pour modifier votre région, contactez votre Google Cloud responsable de compte pour obtenir de l'aide. Une nouvelle commande avec une nouvelle date de fin d'abonnement peut être nécessaire.
Toutes les modifications sont traitées de la manière la plus optimale possible et sont généralement effectuées dans les 10 jours ouvrés suivant la demande initiale.
Les modifications de modèle sont limitées à un éditeur spécifique. Par exemple, vous pouvez modifier l'attribution de modèle du débit provisionné de Google Gemini 2.0 Pro vers Google Gemini 2.0 Flash, mais vous ne pouvez pas passer de Google Gemini 2.0 Flash à Claude 3.5 Sonnet v2 d'Anthropic.
Par défaut, le dépassement est facturé au tarif de paiement à l'usage.
Si votre débit dépasse le montant de votre commande de débit provisionné, les dépassements sont traités et facturés sous forme de paiement à l'usage standard. Vous pouvez contrôler les dépassements par requête. Pour en savoir plus, consultez la section Utiliser le débit provisionné.
Acheter du débit provisionné pour une durée d'une semaine
Au lieu d'un abonnement mensuel, vous pouvez acheter un débit provisionné pour une durée d'une semaine, avec la possibilité de définir une date de début dans les deux semaines suivant la date de votre commande après avoir envoyé le formulaire de contrôle des accès au débit provisionné.
Pour en savoir plus sur les tarifs, consultez la section Débit provisionné.
Rôles et autorisations
Le rôle suivant accorde un accès complet pour gérer le débit provisionné Vertex AI:
roles/aiplatform.provisionedThroughputAdmin
: vous pouvez accéder aux ressources de débit provisionné Vertex AI.
Ce rôle inclut les autorisations suivantes :
Autorisations | Description |
---|---|
aiplatform.googleapis.com/provisionedThroughputs.create |
Passez une nouvelle commande de débit provisionné. |
aiplatform.googleapis.com/provisionedThroughputs.get |
Afficher une commande de débit provisionné spécifique. |
aiplatform.googleapis.com/provisionedThroughputs.list |
Afficher toutes les commandes de débit provisionné. |
aiplatform.googleapis.com/provisionedThroughputs.update |
Modifier une commande de débit provisionné |
aiplatform.googleapis.com/provisionedThroughputs.cancel |
Annuler une commande ou une mise à jour en attente |
Passer une commande de débit provisionné
Certaines fonctionnalités d'Imagen ne sont pas accessibles au public. Pour en savoir plus, consultez la section Fonctionnalités en disponibilité générale restreinte et version bêta.
Avant de passer une commande pour utiliser MedLM-large-1.5, contactez votre Google Cloud représentant du compte pour demander l'accès. Si vous pensez que votre nombre de RPM sera supérieur à 30 000, optimisez votre commande de débit provisionné en demandant une augmentation de votre quota système Vertex AI par défaut à l'aide des informations suivantes:
- Service: API Vertex AI.
- Nom :
Online prediction requests per minute per region
- Type de service: quota.
- Dimensions: région dans laquelle vous avez commandé le débit provisionné.
- Valeur: limite de trafic des prédictions en ligne que vous avez choisie.
Les commandes de débit provisionné sont traitées en fonction de la taille de la commande et de la capacité disponible. Selon le nombre de GSU demandées et la capacité disponible, le traitement de votre commande peut prendre de quelques minutes à quelques semaines.
Pour acheter du débit provisionné, procédez comme suit:
Console
- Dans la console Google Cloud, accédez à la page du débit provisionné.
- Pour créer une commande, cliquez sur Nouvelle commande.
- Indiquez un nom de commande.
- Sélectionnez le modèle.
- Sélectionnez la Région.
Saisissez le nombre d'unités d'échelle d'IA générative (GSU) que vous devez acheter.
Facultatif: vous pouvez utiliser l'outil d'estimation des unités de scaling pour l'IA générative pour estimer le nombre d'unités dont vous aurez besoin. Pour utiliser cet outil, procédez comme suit:
- Cliquez sur Outil d'estimation.
- Sélectionnez votre modèle.
En fonction du modèle sélectionné, saisissez les détails pour estimer le nombre de GSU nécessaires.
Pour les modèles Gemini 2.0, saisissez les éléments suivants:
- Estimation du nombre de requêtes par seconde nécessitant une assurance
- Jetons d'entrée par requête
- Jetons d'image d'entrée par requête
- Saisir des jetons vidéo par requête
- Jetons audio d'entrée par requête
- Jetons de texte de sortie par requête
Pour les modèles Imagen, saisissez les éléments suivants:
- Requêtes par seconde
- Images de sortie par requête
Si vous souhaitez utiliser les valeurs que vous avez saisies dans l'outil d'estimation, cliquez sur Utiliser les valeurs calculées.
Sélectionnez la durée. Les options suivantes sont disponibles :
- 1 semaine (disponible en version Preview privée)
- 1 mois
- 3 mois
- 1 an
Facultatif: Sélectionnez la date et l'heure de début de votre période (aperçu).
Vous pouvez indiquer une date et une heure de début dans les deux semaines suivant la date de la commande. Si vous ne spécifiez pas de date et d'heure de début, la commande est traitée dès que la capacité est disponible. Les dates et heures de début demandées sont respectées dans la mesure du possible. Il n'est pas garanti qu'une commande soit honorée en fonction de ces valeurs tant que l'état de la commande n'est pas défini sur Approuvé.
Si la date de début souhaitée est trop proche de la date actuelle, votre commande risque d'être approuvée et activée après la date de début souhaitée. Dans ce cas, la date de fin est ajustée en fonction de la durée du terme sélectionné, à compter de la date d'activation. Pour savoir comment annuler une commande en attente, consultez la section Modifier l'ordre de débit provisionné.
Dans la liste Renouvellement, indiquez si vous souhaitez renouveler automatiquement la commande à la fin de la période. Vous ne pouvez spécifier l'option de renouvellement que si vous sélectionnez 1 mois, 3 mois ou 1 an comme durée.
Cliquez sur Continuer.
Dans la section Résumé, vérifiez les estimations de prix et de débit de votre commande. Lisez les conditions indiquées et accessibles dans les liens du formulaire.
Pour finaliser votre commande, cliquez sur Confirmer.
Le traitement d'une commande peut prendre de quelques minutes à plusieurs semaines, en fonction de sa taille et de la capacité disponible. Une fois la commande traitée, son état dans la console Google Cloud passe à Active. Vous ne serez facturé pour la commande qu'une fois qu'elle sera active.
Modifier une commande de débit provisionné
Ce tableau explique comment modifier vos commandes de débit provisionné via la console Google Cloud en fonction de l'état de votre commande et des conditions existantes. La modification de vos commandes est une fonctionnalité en preview et n'est disponible que pour les commandes passées en ligne via la console. Pour modifier des commandes hors connexion, contactez votre représentant du compte pour obtenir de l'aide.Google Cloud
De plus, les modifications apportées à votre modèle ou à votre version de modèle à l'aide de la console Google Cloud modifient la commande existante tout en conservant la même date de fin d'abonnement.
État de la commande | Action | Remarque | Étapes dans la console Google Cloud |
---|---|---|---|
En attente d'examen | Vous pouvez annuler votre commande. |
Si vous souhaitez apporter d'autres modifications à votre commande, annulez-la et passez-en une nouvelle. Si vous avez plusieurs modèles, chaque modèle ne peut avoir qu'une seule révision de commande ou commande en attente à la fois. |
Pour annuler votre commande en attente dans la console Google Cloud, procédez comme suit:
|
Actif |
Vous pouvez augmenter le nombre de GSU sur les commandes existantes. Vous pouvez activer ou désactiver les renouvellements automatiques. Vous pouvez modifier le modèle ou la version du modèle. |
Si ces deux conditions sont remplies, vous ne pouvez pas modifier votre commande:
|
Pour modifier votre commande active dans la console Google Cloud, utilisez l'une des méthodes suivantes:
|
Suivi de la commande
Une fois que vous avez envoyé votre commande de débit provisionné, l'état de la commande peut apparaître comme suit :
- En attente d'examen : vous avez passé votre commande. L'approbation dépend de la capacité disponible pour provisionner votre commande. Votre commande est donc en attente d'examen et d'approbation. Pour en savoir plus sur l'état de votre commande en attente, contactez votre Google Cloud responsable de compte.
- Approuvé: Google a approuvé votre commande.
- Actif: Google a activé votre commande, et la facturation commence.
- Expiré : votre commande a expiré.
Afficher les commandes de débit provisionné
Pour afficher vos commandes de débit provisionné, procédez comme suit :
Console
- Dans la console Google Cloud, accédez à la page du débit provisionné.
- Sélectionnez la Région. Votre liste de commandes s'affiche.