Coût de création et de déploiement de modèles d'IA dans Vertex AI

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.

Vous ne payez que les requêtes renvoyant un code de réponse 200. Les requêtes renvoyant d'autres codes de réponse, tels que les codes 4xx et 5xx, ne sont pas facturées pour les entrées ni les sorties.

Cette page présente les tarifs de l'IA générative sur Vertex AI. Pour tous les autres tarifs de Vertex AI, y compris les services ML Platform et MLOps, consultez la page des tarifs de Vertex AI.

Modèles Google

Gemini 2.5

Modèle Type Prix (/1 M de jetons) <= 200 k de jetons d'entrée Prix (/1 M de jetons) > 200 k jetons d'entrée Prix (/1 M de jetons) <= 200 k jetons d'entrée avec l'API de traitement par lot Prix (/1 M de jetons) > 200 k jetons d'entrée avec l'API de traitement par lot
Gemini 2.5 Pro
Entrée (texte, image, vidéo, audio) 1,25 $ 2,5 $ 0,625 $ 1,25 $
Sortie textuelle (réponse et raisonnement) 10 $ 15 $ 5 $ 7,5 $


Gemini 2.5
Flash GA
Entrée (texte, image, vidéo) 0,30 $ 0,30 $ 0,15 $ 0,15 $
Entrée audio 1 $ 1 $ 0,5 $ 0,5 $
Sortie textuelle 2,50 $ 2,50 $ 1,25 $ 1,25 $
Réglage pour 1 million de jetons d'entraînement 5 $ N/A N/A N/A




Gemini 2.5 Flash Preview
(Endpoints Retired on 7/15/2025)
Entrée (texte, image, vidéo) 0,15 $ 0,15 $ 0,075 $ 0,075 $
Entrée audio 1 $ 1 $ 0,5 $ 0,5 $
Sortie texte (pas de réflexion) 0,60 $ 0,60 $ 0,30 $ 0,30 $
Sortie texte (réflexion, réponse et raisonnement) 3,50 $ 3,50 $ 1,75 $ 1,75 $




API Gemini 2.5 Flash Live
1 million de jetons de texte en entrée 0,5 $ 0,5 $ N/A N/A
1 million de jetons audio d'entrée 3 $ 3 $ N/A N/A
1 million de jetons vidéo d'entrée 3 $ 3 $ N/A N/A
1 million de jetons de sortie 2 $ 2 $ N/A N/A
1 million de jetons audio de sortie 12 $ 12 $ N/A N/A



Gemini 2.5 Flash Lite
Entrée (texte, image, vidéo) 0,1 $ 0,1 $ N/A N/A
Entrée audio 0,5 $ 0,5 $ N/A N/A
Sortie textuelle (réponse et raisonnement) 0,4 € 0,4 € N/A N/A


Ancrage avec la recherche Google
Gemini 2.0 Flash, 2.5 Flash et 2.5 Flash-Lite incluent 1 500 requêtes fondées par jour sans frais supplémentaires. Gemini 2.5 Pro inclut 10 000 requêtes fondées par jour sans frais supplémentaires.

Si vous dépassez ces limites,les requêtes ancrées vous seront facturées 35$pour 1 000 requêtes ancrées.

Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google&ast;&ast;. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations.

Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.

Web Grounding pour les grandes entreprises
45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises**. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations.

Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe chargée de votre compte.
Ancrage basé sur vos données 2,5 $ pour 1 000 requêtes à partir du 16 juin 2025.

* Si le contexte d'entrée de la requête est plus long que 200 000 jetons, tous les jetons (d'entrée et de sortie) sont facturés au tarif des contextes longs.
** L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL de prise en charge de l'ancrage sur le Web). Les frais d'utilisation des modèles Gemini s'appliquent séparément.

Gemini 2.0

Gemini 2.0 est facturé en fonction du nombre de jetons. Pour calculer le nombre de jetons d'entrée dans votre requête avant de l'envoyer, vous pouvez utiliser le tokenizer du SDK ou l'API countTokens. Si votre requête échoue avec un code d'erreur 400 ou 500, vous n'êtes pas facturé pour les jetons utilisés.

Utilisez le bouton dans la grille tarifaire pour comparer la tarification basée sur les jetons et la tarification basée sur la modalité.

Tarification basée sur les jetons

Modèle Type Prix Prix avec l'API Batch




Gemini 2.0 Flash
1 million de jetons d'entrée 0,15 $ 0,075 $
1 M de jetons audio d'entrée 1,00 $ 0,50 $
1 million de jetons de texte de sortie 0,60 $ 0,30 $
Réglage pour 1 million de jetons d'entraînement 3 $




Génération d'images Gemini 2.0 Flash
1 million de jetons d'entrée 0,15 $
1 million de jetons audio d'entrée 1,00 $
1 million de jetons vidéo d'entrée 3 $
1 million de jetons de texte de sortie 0,60 $
1 million de jetons d'image de sortie $30.00




API Gemini 2.0 Flash Live
1 million de jetons de texte en entrée 0,5 $
1 million de jetons audio d'entrée 3 $
1 million de jetons vidéo d'entrée 3 $
1 million de jetons de texte en sortie 2 $
1 million de jetons audio de sortie 12 $




Gemini 2.0 Flash-Lite
1 million de jetons d'entrée 0,075 $ 0,0375 $
1 M de jetons audio d'entrée 0,075 $ 0,0375 $
1 million de jetons de texte de sortie 0,30 $ 0,15 $
Réglage pour 1 million de jetons d'entraînement 1,00 $


Ancrage avec la recherche Google
Gemini 2.0 Flash et 2.5 Flash incluent un total de 1 500 requêtes fondées par jour,sans frais supplémentaires.

Les requêtes ancrées qui dépassent ces limites sont facturées 35$pour 1 000 requêtes ancrées.

Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des mots clés.

Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.

Web Grounding pour les grandes entreprises
45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête de type "requête contextuelle".

Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.
Ancrage basé sur vos données 2,5 $ pour 1 000 requêtes à partir du 16 juin 2025.

Tarifs basés sur les modalités

Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et ne servent qu'à titre de référence. La facturation réelle ne sera basée que sur les jetons:

  • 4 caractères correspondent à environ 1 jeton de texte, espaces compris.
  • Pour une image de 1 024 x 1 024, il consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour savoir comment calculer les jetons, consultez notre documentation.
  • L'entrée vidéo consomme 258 jetons par seconde à une fréquence d'échantillonnage d'une image par seconde. Vidéo avec facturation audio pour les jetons vidéo et audio.
  • L'entrée audio consomme 25 jetons par seconde sans horodatage.
Modèle Type Prix Prix avec l'API Batch




Gemini 2.0 Flash
Texte saisi ($/M caractères) 0,0375 $ 0,01875 $
Image d'entrée ($/image) 0,0001935 $ 0,00009675 $
Vidéo d'entrée ($/s) 0,0000387 $ 0,00001935 $
Audio d'entrée ($/s) 0,000025 $ 0,0000125 $
Texte de sortie (coût/million de caractères) 0,15 $ 0,075 $




Génération d'images Gemini 2.0 Flash
Texte saisi ($/M caractères) 0,0375 $
Image d'entrée ($/image) 0,0001935 $
Vidéo d'entrée ($/s) 0,0000387 $
Audio d'entrée ($/s) 0,000025 $
Texte de sortie (coût/million de caractères) 0,15 $
Image de sortie ($/image) 0,04 $





Gemini 2.0 Flash-Lite
Texte saisi ($/M caractères) 0,01875 $ 0,009375 $
Image d'entrée ($/image) 0,00009675 $ 0,000048375 $
Vidéo d'entrée ($/s) 0,00001935 $ 0,000009675 $
Audio d'entrée ($/s) 0,000001875 $ 0,000000938 $
Texte de sortie (coût/million de caractères) 0,075 $ 0,0375 $


Ancrage avec la recherche Google
Gemini 2.0 Flash et 2.5 Flash incluent un total de 1 500 requêtes fondées par jour,sans frais supplémentaires.

Les requêtes ancrées qui dépassent ces limites sont facturées 35$pour 1 000 requêtes ancrées.

Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des mots clés.

Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.

Web Grounding pour les grandes entreprises
45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations.

Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.

* Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Le nombre de jetons d'entraînement est calculé en multipliant le nombre total de jetons dans votre ensemble de données d'entraînement par le nombre d'époques.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL de prise en charge de l'ancrage sur le Web). Les frais d'utilisation des modèles Gemini s'appliquent séparément.
* API Gemini 2.0 Flash Live: 25 jetons par seconde d'audio (entrée/sortie), 258 jetons par seconde de vidéo (entrée). L'ancrage avec la recherche Google reste sans frais tant que l'API Gemini 2.0 Flash Live est en preview.

Tarification de Vertex AI Model Optimizer (expérimental)*

Vertex AI Model Optimizer simplifie l'utilisation de Gemini pour les clients professionnels en fournissant un métapoint de terminaison unique pour les requêtes de modèles Gemini. Les clients qui utilisent ce service n'ont pas à spécifier s'ils doivent utiliser Flash, Pro ou une version spécifique. Ils doivent simplement indiquer leurs préférences à l'aide d'un paramètre configurable (coût, qualité ou équilibre), et Model Optimizer applique le niveau d'intelligence approprié à la tâche en envoyant chaque requête au modèle le mieux adapté.

Vertex AI Model Optimizer applique une tarification dynamique. Cela signifie que le prix moyen par jeton dépend du niveau d'intelligence du modèle appliqué pour effectuer la tâche. C'est pourquoi nous vous fournissons ci-dessous des exemples de tarifs pour illustrer les scénarios probables en fonction de votre configuration (voir les tableaux ci-dessous). Les SKU Model Optimizer sont des SKU d'un dollar qui servent d'unité d'achat pour votre facturation. Vous êtes toujours facturé en fonction de la consommation après avoir utilisé les modèles.

Ratio E/S : 5:1 Exemple 1 :
chatbot
REMARQUE: Ces fourchettes ne sont pas garanties. Les résultats peuvent varier d'un client à l'autre.
Préférence du client Jetons d'entrée client envoyés à l'objectif marketing jetons de sortie client envoyés à MO Prix d'entrée moyen par million de jetons (fourchette haute) Prix de sortie moyen par million de jetons (fourchette haute) Prix d'entrée moyen par million de jetons (fourchette basse) Prix de sortie moyen par million de jetons (fourchette basse)
Coût 10 000 000 2 000 000 0,63 $ 2,50 $ 0,16 $ 0,63 $
Équilibré 10 000 000 2 000 000 1,26 $ 5 $ 0,63 $ 2,50 $
Qualité 10 000 000 2 000 000 1,89 $ 7,50 $ 1,26 $ 5 $
Ratio E/S : 1:20 Exemple 2 : Génération de contenu
Préférence du client Jetons d'entrée client envoyés à l'objectif marketing jetons de sortie client envoyés à MO Prix d'entrée moyen par million de jetons (fourchette haute) Prix de sortie moyen par million de jetons (fourchette haute) Prix d'entrée moyen par million de jetons (fourchette basse) Prix de sortie moyen par million de jetons (fourchette basse)
Coût 1 000 000 20 000 000 0,63 $ 2,50 $ 0,16 $ 0,63 $
Équilibré 1 000 000 20 000 000 1,26 $ 5 $ 0,63 $ 2,50 $
Qualité 1 000 000 20 000 000 1,89 $ 7,50 $ 1,26 $ 5 $

* Model Optimizer est une offre expérimentale payante, et il peut être amené à acheminer des requêtes vers des versions expérimentales de Gemini sur Vertex.

Autres modèles Gemini

Tous les modèles Gemini, à l'exception de Gemini 2.0, sont facturés en fonction de modalités telles que les caractères, les images, les secondes de vidéo/audio, etc. Les entrées de texte sont facturées pour chaque tranche de 1 000 caractères d'entrée (requête) et pour chaque tranche de 1 000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Le nombre de caractères par jeton est donc d'environ quatre. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime. Les entrées de type médias sont facturées par image ou par seconde (vidéo). Si votre requête échoue avec un code d'erreur 400 ou 500, vous n'êtes pas facturé pour les jetons utilisés.

Modèle Caractéristique Type Prix
( =< 128 k jetons d'entrée)
Prix
(> 128 k jetons d'entrée)
Gemini 1.5 Flash Multimode Entrée image
Entrée vidéo
Entrée texte
Entrée audio
0,00002 $ par image
0,00002$par seconde
0,00001875$pour 1 000 caractères
0,000002$par seconde
0,00004 $ par image
0,00004$par seconde
0,0000375$pour 1 000 caractères
0,000004$par seconde
Sortie textuelle 0,000075 $ pour 1 000 caractères 0,00015 $ pour 1 000 caractères
Réglage* Jeton de formation 8 $ / M de jetons
Gemini 1.5 Pro Multimode Entrée image
Entrée vidéo
Entrée texte
Entrée audio
0,00032875 $ par image
0,00032875$par seconde
0,0003125$pour 1 000 caractères
0,00003125$par seconde
0,0006575 $ par image
0,0006575$par seconde
0,000625$pour 1 000 caractères
0,0000625$par seconde
Sortie textuelle 0,00125 $ pour 1 000 caractères 0,0025 $ pour 1 000 caractères
Réglage* Jeton de formation 80 $ / M de jetons
Gemini 1.0 Pro Multimode Entrée image
Entrée vidéo
Entrée textuelle
0,0025 $ par image
0,002 $ par seconde
0,000125 $ pour 1 000 caractères
Sortie textuelle 0,000375 $ pour 1 000 caractères
Ancrage avec la recherche Google Texte 35$par 1 000 requêtes ancrées.

Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations.

Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.
Ancrage Web pour les entreprises Texte 45$pour 1 000 requêtes ancrées.

Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête de type "requête contextuelle".

Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.
Ancrage basé sur vos données Texte 2,5 $ pour 1 000 requêtes à partir du 16 juin 2025.

* Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Si le contexte d'une requête est plus long que 128 000 jetons, tous les jetons sont facturés au tarif des contextes longs.
* Les modèles Gemini sont disponibles en mode lot avec une remise de 50 %.
* Gemini 1.0 Pro ne prend en charge que les fenêtres de contexte de 32 k au maximum.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL de prise en charge de l'ancrage sur le Web). Les frais d'utilisation des modèles Gemini s'appliquent séparément.

Imagen

Avec Imagen sur Vertex AI, vous pouvez générer de nouvelles images ou modifier des images existantes sur la base de requêtes de texte que vous fournissez, modifier partiellement des images à l'aide d'une zone de masquage que vous définissez, et bien d'autres fonctionnalités encore.

Modèle Fonctionnalité Description Entrée Sortie Prix
Imagen 4 Ultra Génération d'images Générer une image Requête textuelle Image 0,06 $ par image
Image 4 Génération d'images Générer une image Requête textuelle Image 0,04 $ par image
Imagen 4 Fast Génération d'images Générer une image Requête textuelle Image 0,02 $ par image
Image 3 Génération d'images Générer une image
Modifier une image
Personnaliser une image
Requête textuelle Image 0,04 $ par image
Imagen 3 Fast Génération d'images Générer une image Requête textuelle Image 0,02 $ par image
Imagen 2, Imagen Génération d'images Générer une image Requête textuelle Images 0,020 $ par image
Édition d'images Modifier une image par une approche avec masque ou sans masque Image/Requête textuelle Images 0,020 $ par image
Augmentation de la résolution Augmenter la résolution d'une image générée à 2k ou 4k Images Images 0,003 $ par image
Réglage Permettre l'utilisation d'un "sujet" fourni par l'utilisateur dans les requêtes Imagen (entraînement "few-shot") Sujet(s) avec identifiant textuel et 4 à 8 images par sujet Modèle affiné (après l'entraînement avec des sujets fournis par l'utilisateur) $ par heure-nœud (tarifs d'entraînement personnalisé Vertex AI)
Visual Captioning Générer une légende textuelle courte ou longue pour une image Images Légende textuelle 0,0015 $ par image
Questions/réponses visuelles Fournir une réponse basée sur une question faisant référence à une image Image/Requête textuelle Réponse textuelle 0,0015 $ par image

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Veo

Veo 2 crée des vidéos d'une qualité incroyable sur une grande variété de sujets et dans différents styles. Il permet ainsi de mieux comprendre les lois de la physique réelle et les nuances des mouvements et des expressions humaines.

Modèle Fonctionnalité Description Entrée Sortie Prix
Veo 3 Génération de vidéos Générez des vidéos à partir d'une requête textuelle ou d'une image de référence Requête textuelle/image Vidéo 0,50 $/seconde
Veo 3 Génération de vidéos et d'audio Générer une vidéo avec des effets vocaux/son synchronisés à partir d'une requête textuelle ou d'une image de référence Requête textuelle/image Vidéo et audio 0,75 $/seconde
Veo 2 Génération de vidéos Générez des vidéos à partir d'une requête textuelle ou d'une image de référence Requête textuelle/image Vidéo 0,50 $/seconde
Veo 2 Commandes avancées Générez des vidéos en interpolant les images de début et de fin, prolongez les vidéos générées et appliquez des commandes de caméra Requête textuelle/image/vidéo Vidéo 0,50 $/seconde

Lyria

Lyria 2 permet de générer de la musique instrumentale de haute qualité, ce qui est idéal pour les compositions sophistiquées et les explorations créatives détaillées où la nuance est essentielle.

Modèle Fonctionnalité Description Entrée Sortie Prix
Lyria 2 Génération de musique Générer de la musique à partir d'une requête textuelle Requête textuelle Musique 0,06 $ toutes les 30 secondes

Comprendre les coûts d'intégration pour vos applications d'IA

Modèle Type Région Prix par 1 000 tokens d'entrée
Intégration Gemini Entrée Monde
  • Requêtes en ligne: 0,00015 $
  • Requêtes par lot: 0,00012 $
Sortie Monde
  • Requêtes en ligne : sans frais
  • Requêtes par lot : sans frais
Modèle Type Région Prix par tranche de 1000 caractères
Représentations vectorielles continues pour le texte
(à l'exception des représentations vectorielles continues Gemini)
Entrée Globaux
  • Requêtes en ligne : 0,000025 $
  • Requêtes par lot : 0,00002 $
Sortie Monde
  • Requêtes en ligne : sans frais
  • Requêtes par lot : sans frais
Modèle Fonctionnalité Description Entrée Sortie Prix
Embedding multimodal Embeddings multimodaux: texte Générer des représentations vectorielles continues en utilisant du texte comme entrée Texte Embeddings 0,0002 $ pour 1000 caractères d'entrée
Représentations vectorielles continues pour la requête multimodale: image Générer des représentations vectorielles continues en utilisant une image comme entrée Images Embeddings 0,0001 $ par image d'entrée
Embeddings multimodaux: vidéo plus Vidéo Plus Vidéo Représentations vectorielles continues (jusqu'à 15 représentations vectorielles continues par minute de vidéo) 0,0020 $ par seconde de vidéo
Embeddings multimodaux: vidéo standard Vidéo Standard Vidéo Représentations vectorielles continues (jusqu'à 8 représentations vectorielles continues par minute de vidéo) 0,0010 $ par seconde de vidéo
Embeddings multimodaux: vidéo Vidéo Essentiel Vidéo Représentations vectorielles continues (jusqu'à quatre embeddings par minute de vidéo) 0,0005 $ par seconde de vidéo

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Tarifs de la fonctionnalité de complétion de code de Vertex AI

La prise en charge de l'IA générative sur Vertex AI est facturée pour chaque tranche de 1000 caractères d'entrée (requête) et pour chaque tranche de 1000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Pendant la phase de bêta, les frais sont réduits de 100 %. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime.

Modèle Type Région Prix par tranche de 1000 caractères
Codey pour la saisie de code Entrée Global
  • Requêtes en ligne : 0,00025 $
Sortie Global
  • Requêtes en ligne : 0,0005 $

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Traduction (texte)

Utilisez l'API Vertex AI et le LLM de traduction pour traduire du texte. Les traductions LLM ont tendance à être plus fluides et naturelles que celles des modèles de traduction classiques, mais elles sont moins compatibles avec les langues (En savoir plus).

Modèle Méthode Utilisation Prix par million de caractères
LLM Traduction de texte* Nombre de caractères d'entrée par mois

10 $ par million de caractères*

Nombre de caractères de sortie par mois

10 $ par million de caractères*

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Le prix est calculé en fonction du nombre de caractères traités par le modèle. Pour en savoir plus sur le comptage de caractères, consultez la section Caractères facturés

Optimiser les coûts avec le cache de contexte de Vertex AI

La mise en cache du contexte vous permet de réduire le coût du traitement des jetons d'entrée Gemini de 75% et la latence de la génération de contenu en mettant en cache la partie contextuelle de votre texte ou de vos éléments multimédias d'entrée dans les modèles Gemini. La durée de stockage des données dans le cache, qui peut être contrôlée par l'utilisateur, détermine les frais de stockage du cache de contexte. Lorsque vous créez un contexte mis en cache, le coût du jeton d'entrée standard est facturé aux utilisateurs. Les correspondances de cache sur les données d'entrée sont facturées à un tarif réduit, "Données d'entrée mises en cache", au lieu du coût normal des données d'entrée. La taille des données pour le stockage et l'entrée est calculée de la même manière que le prix des entrées Gemini.

Modèles Gemini 2.5

Modèle Caractéristique Type Prix (/1 M de jetons)
<= 200 k de jetons d'entrée
Prix (/1 M de jetons)
> 200 000 jetons d'entrée
Gemini 2.5 Pro Entrée mise en cache Entrée (texte, image, vidéo, audio) 0,31 $ (/1 M de jetons) 0,625 $ (/1 M de jetons)
Sortie N/A N/A
Espace de stockage du cache contextuel Entrée (texte, image, vidéo, audio) 4,5 $ (/M Tok/h) 4,5 $ (/M Tok/h)
Gemini 2.5 Flash Entrée mise en cache Entrée (texte, image, vidéo, audio) 0,0375 $ (/1 M de jetons) 0,0375 $ (/1 M de jetons)
Sortie N/A N/A
Espace de stockage du cache contextuel Entrée (texte, image, vidéo, audio) 1 $ (/M Tok/h) 1 $ (/M Tok/h)

Modèles Gemini 2.0

Tarification basée sur les jetons


Modèle

 Type
Stockage
(M de tok-heures)
Prix




Gemini 2.0 Flash
1 million de jetons d'entrée 1,00 $ 0,0375 $
1 M de jetons audio d'entrée 1,00 $ 0,25 $
1 million de jetons de texte de sortie N/A N/A


Gemini 2.0 Flash-Lite
1 million de jetons d'entrée 1,00 $ 0,01875 $
1 M de jetons audio d'entrée 1,00 $ 0,01875 $
1 million de jetons de texte de sortie N/A N/A

Tarifs basés sur les modalités

Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et ne servent qu'à titre de référence. La facturation réelle ne sera basée que sur les jetons:

  • 4 caractères correspondent à environ 1 jeton de texte, espaces compris.
  • Pour une image de 1 024 x 1 024, il consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour savoir comment calculer les jetons, consultez notre documentation.
  • L'entrée vidéo consomme 258 jetons par seconde à une fréquence d'échantillonnage d'une image par seconde. Vidéo avec facturation audio pour les jetons vidéo et audio.
  • L'entrée audio consomme 25 jetons par seconde sans horodatage.

Modèle

 Type
Stockage
(Modalité-heure)

Prix




Gemini 2.0 Flash
Texte saisi ($/M caractères) 0,25 $ 0,009375 $
Image d'entrée ($/image) 0,00129 $ 0,000048375 $
Vidéo d'entrée ($/s) 0,000258 $ 0,000009675 $
Audio d'entrée ($/s) 0,000025 $ 0,00000625 $
Texte de sortie (coût/million de caractères) N/A N/A




Gemini 2.0 Flash-Lite
Texte saisi ($/M caractères) 0,25 $ 0,0046875 $
Image d'entrée ($/image) 0,00129 $ 0,0000241875 $
Vidéo d'entrée ($/s) 0,000258 $ 0,000009675 $
Audio d'entrée ($/s) 0,000258 $ 0,0000048375 $
Texte de sortie (coût/million de caractères) N/A N/A


Ancrage avec la recherche Google
Gemini 2.0 Flash inclut jusqu'à 1 500 requêtes fondées par jour sans frais supplémentaires. Les requêtes Grounded
dépassant 1 500 par jour sont facturées 35 $par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour).

Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes par jour.

Web Grounding pour les grandes entreprises
45 $ par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour) à partir du 5 mai 2025.

Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes par jour.

* Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* L'ancrage avec la recherche Google n'est facturé que pour les demandes qui renvoient des résultats contenant au moins une URL de support d'ancrage sur le Web. Les frais d'utilisation standards du modèle Gemini s'appliquent également.

Débit provisionné

Le débit provisionné assure le débit nécessaire à vos besoins en IA générative et est traité via des unités de scaling pour l'IA générative (GSU). Pour en savoir plus sur le débit fourni par chaque GSU, cliquez ici et utilisez notre outil d'estimation en ligne ici.

Durée Prix par GSU Par
Commit d'il y a une semaine 1 200 $ Semaine
Engagement d'un mois 2 700 $ Mois
Engagement de trois mois 2 400 $ Mois
Engagement sur 1 an 2 000 $ Mois

Exemple de calcul des coûts

Un utilisateur doit s'assurer qu'il peut traiter 10 requêtes par seconde (RPS) avec une entrée de 1 000 jetons de texte et 500 jetons audio,et recevoir une sortie de 300 jetons de texte à l'aide de gemini-2.0-flash.

En nous basant sur la table des débits et des taux d'utilisation, nous savons que pour gemini-2.0-flash, le taux d'utilisation d'un jeton de texte d'entrée est de 1 jeton, celui d'un jeton audio d'entrée est de 7 jetons et celui d'un jeton de texte de sortie est de 4 jetons.

Le nombre total de jetons d'entrée de l'utilisateur est de 1 000* (1 jeton par jeton de texte d'entrée) + 500* (7 jetons par jeton audio d'entrée) = 4 500 jetons d'entrée ajustés en fonction de la diminution. Le nombre total de jetons de sortie de l'utilisateur est de 300* (4 jetons par jeton de texte de sortie) = 1 200 jetons de sortie ajustés en fonction du burndown. En les additionnant, nous obtenons 4 500 jetons d'entrée ajustés par épuisement + 1 200 jetons de sortie ajustés par épuisement = 5 700 jetons au total par requête.

En multipliant le nombre total de jetons par requête par le RPS, nous obtenons 5 700 jetons au total par requête * 10 RPS = 57 000 jetons au total par seconde.

En divisant ce nombre par le débit total par seconde et par GSU,nous obtenons 57 000 jetons au total par seconde ÷ 3 360 par seconde et par GSU = 16,96 GSU. L'incrément minimal d'achat de GSU pour ce modèle est de 1, ce qui signifie que l'utilisateur a besoin de 17 GSU.

Si l'utilisateur souhaite maintenir ce débit pendant une semaine, le coût sera de 1 200 $ * 17 GSU = 20 400 $par semaine. Si l'entreprise souhaite maintenir ce débit pendant un mois, cela lui coûtera 2 700 $ * 17 GSU = 45 900 $par mois. Si l'entreprise souhaite maintenir ce débit pendant trois mois, le coût sera de 2 400 $x 17 GSU = 40 800 $par mois. Enfin, si l'entreprise souhaite maintenir ce débit pendant un an, cela lui coûtera 2 000 $ * 17 GSU = 34 000 $par mois.

Comparer les tarifs des modèles partenaires sur Vertex AI

Les modèles partenaires sont une liste organisée de modèles d'IA générative développés par les partenaires de Google. Les modèles partenaires sont proposés en tant qu'API gérées. Pour en savoir plus, consultez la présentation des modèles partenaires. Les sections suivantes listent les détails de tarification des modèles Google pour les partenaires.

Modèles d'AI21 Labs

Modèle Tarifs
Jamba 1.5 Large Entrée: 2 $ par million de jetons
Sortie: 8 $ par million de jetons
Jamba 1.5 Mini Entrée: 0,20 $ par million de jetons
Sortie: 0,40 $ par million de jetons

Modèles Claude d'Anthropic

Modèle Tarifs
Claude Opus 4 Entrée: 15 $ / million de jetons
Sortie: 75 $ / million de jetons

Entrée par lot: 7,5 $ / million de jetons
Sortie par lot: 37,5 $ / million de jetons

Écriture dans le cache: 18,75 $ / million de jetons
Récupération dans le cache: 1,5 $ / million de jetons

Écriture dans le cache par lot: 9,375 $ / million de jetons
Récupération dans le cache par lot: 0,75 $ / million de jetons
Claude Sonnet 4 Entrée: 3 $ par million de jetons
Sortie: 15 $ par million de jetons

Entrée par lot: 1,50 $ par million de jetons
Sortie par lot: 7,50 $ par million de jetons

Écriture dans le cache: 3,75 $ par million de jetons
Récupération dans le cache: 0,30 $ par million de jetons

Écriture dans le cache par lot: 1,875 $ par million de jetons
Récupération dans le cache par lot: 0,15 $ par million de jetons
Claude 3.7 Sonnet Entrée: 3 $ par million de jetons
Sortie: 15 $ par million de jetons

Entrée par lot: 1,50 $ par million de jetons
Sortie par lot: 7,50 $ par million de jetons

Écriture dans le cache: 3,75 $ par million de jetons
Récupération dans le cache: 0,30 $ par million de jetons

Écriture dans le cache par lot: 1,875 $ par million de jetons
Récupération dans le cache par lot: 0,15 $ par million de jetons
Claude 3.5 Haiku Entrée: 0,80 $ / million de jetons
Sortie: 4 $ / million de jetons

Entrée par lot: 0,40 $ / million de jetons
Sortie par lot: 2 $ / million de jetons

Écriture dans le cache: 1 $ / million de jetons
Récupération dans le cache: 0,08 $ / million de jetons

Écriture dans le cache par lot: 0,50 $ / million de jetons
Récupération dans le cache par lot: 0,04 $ / million de jetons
Claude 3.5 Sonnet v2 Entrée: 3 $ par million de jetons
Sortie: 15 $ par million de jetons

Entrée par lot: 1,50 $ par million de jetons
Sortie par lot: 7,50 $ par million de jetons

Écriture dans le cache: 3,75 $ par million de jetons
Récupération dans le cache: 0,30 $ par million de jetons

Écriture dans le cache par lot: 1,875 $ par million de jetons
Récupération dans le cache par lot: 0,15 $ par million de jetons
Claude 3.5 Sonnet Entrée: 3 $ par million de jetons
Sortie: 15 $ par million de jetons

Écriture dans le cache: 3,75 $ par million de jetons
Coup de chance dans le cache: 0,30 $ par million de jetons
Claude 3 Haiku Entrée: 0,25 $ par million de jetons
Sortie: 1,25 $ par million de jetons

Écriture dans le cache: 0,30 $ par million de jetons
Coup de chance dans le cache: 0,03 $ par million de jetons
Claude 3 Sonnet (deprecated) Entrée: 3 $ par million de jetons
Sortie: 15 $ par million de jetons
Claude 3 Opus Entrée: 15 $ par million de jetons
Sortie: 75 $ par million de jetons

Écriture dans le cache: 18,75 $ par million de jetons
Coup de chance dans le cache: 1,50 $ par million de jetons

Modèles Llama de Meta

Modèle Tarifs
Llama 3.1 405B Entrée: 5 $ par million de jetons
Sortie: 16 $ par million de jetons
Llama 3.3 70 Mrd * Entrée: 0,72 $ par million de jetons
Sortie: 0,72 $ par million de jetons
Llama 4 Scout * Entrée: 0,25 $ par million de jetons
Sortie: 0,70 $ par million de jetons
Llama 4 Maverick * Entrée: 0,35 $ / million de jetons
Sortie: 1,15 $ / million de jetons
  • Disponible sans frais jusqu'au 1er mai 2025.

Modèles Mistral AI

Modèle Tarifs
Mistral OCR (25.05) Entrée: 0,0005 $ / million de jetons (ou 0,0005 $/page)
Sortie: 0,0005 $ / million de jetons (ou 0,0005 $/page)
Mistral Small 3.1 (25.03) Entrée: 0,10 $ par million de jetons
Sortie: 0,30 $ par million de jetons
Mistral Large (24.11) Entrée: 2 $ / million de jetons
Sortie: 6 $ / million de jetons
Mistral Nemo Entrée: 0,15 $ / million de jetons
Sortie: 0,15 $ / million de jetons
Codestral (25.01) Entrée: 0,30 $ par million de jetons
Sortie: 0,90 $ par million de jetons

Demander un devis personnalisé

Avec le paiement à l'usage de Google Cloud, vous ne payez que pour les services que vous utilisez. Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.
Contacter le service commercial