Cette page a été traduite par l'API Cloud Translation.

Coût de création et de déploiement de modèles d'IA dans Vertex AI

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.

Vous ne payez que les requêtes renvoyant un code de réponse 200. Les requêtes renvoyant d'autres codes de réponse, tels que les codes 4xx et 5xx, ne sont pas facturées pour les entrées ni les sorties.

Cette page présente les tarifs de l'IA générative sur Vertex AI. Pour tous les autres tarifs de Vertex AI, y compris les services ML Platform et MLOps, consultez la page des tarifs de Vertex AI.

Modèles Google

Gemini 2.5

Modèle	Type	Prix (/1 M de jetons) <= 200 k de jetons d'entrée	Prix (/1 M de jetons) > 200 k jetons d'entrée	Prix (/1 M de jetons) <= 200 k jetons d'entrée avec l'API de traitement par lot	Prix (/1 M de jetons) > 200 k jetons d'entrée avec l'API de traitement par lot
Gemini 2.5 Pro
	Entrée (texte, image, vidéo, audio)	1,25 $	2,5 $	0,625 $	1,25 $
	Sortie textuelle (réponse et raisonnement)	10 $	15 $	5 $	7,5 $
Gemini 2.5 Flash GA
	Entrée (texte, image, vidéo)	0,30 $	0,30 $	0,15 $	0,15 $
	Entrée audio	1 $	1 $	0,5 $	0,5 $
	Sortie textuelle	2,50 $	2,50 $	1,25 $	1,25 $
	Réglage pour 1 million de jetons d'entraînement	5 $	N/A	N/A	N/A
Gemini 2.5 Flash Preview (Endpoints Retired on 7/15/2025)
	Entrée (texte, image, vidéo)	0,15 $	0,15 $	0,075 $	0,075 $
	Entrée audio	1 $	1 $	0,5 $	0,5 $
	Sortie texte (pas de réflexion)	0,60 $	0,60 $	0,30 $	0,30 $
	Sortie texte (réflexion, réponse et raisonnement)	3,50 $	3,50 $	1,75 $	1,75 $
API Gemini 2.5 Flash Live
	1 million de jetons de texte en entrée	0,5 $	0,5 $	N/A	N/A
	1 million de jetons audio d'entrée	3 $	3 $	N/A	N/A
	1 million de jetons vidéo d'entrée	3 $	3 $	N/A	N/A
	1 million de jetons de sortie	2 $	2 $	N/A	N/A
	1 million de jetons audio de sortie	12 $	12 $	N/A	N/A
Gemini 2.5 Flash Lite
	Entrée (texte, image, vidéo)	0,1 $	0,1 $	N/A	N/A
	Entrée audio	0,5 $	0,5 $	N/A	N/A
	Sortie textuelle (réponse et raisonnement)	0,4 €	0,4 €	N/A	N/A
Ancrage avec la recherche Google	Gemini 2.0 Flash, 2.5 Flash et 2.5 Flash-Lite incluent 1 500 requêtes fondées par jour sans frais supplémentaires. Gemini 2.5 Pro inclut 10 000 requêtes fondées par jour sans frais supplémentaires. Si vous dépassez ces limites,les requêtes ancrées vous seront facturées 35$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google&ast;&ast;. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.
Web Grounding pour les grandes entreprises	45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises**. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations. Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe chargée de votre compte.
Ancrage basé sur vos données	2,5 $ pour 1 000 requêtes à partir du 16 juin 2025.

* Si le contexte d'entrée de la requête est plus long que 200 000 jetons, tous les jetons (d'entrée et de sortie) sont facturés au tarif des contextes longs.
** L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL de prise en charge de l'ancrage sur le Web). Les frais d'utilisation des modèles Gemini s'appliquent séparément.

Gemini 2.0

Gemini 2.0 est facturé en fonction du nombre de jetons. Pour calculer le nombre de jetons d'entrée dans votre requête avant de l'envoyer, vous pouvez utiliser le tokenizer du SDK ou l'API countTokens. Si votre requête échoue avec un code d'erreur 400 ou 500, vous n'êtes pas facturé pour les jetons utilisés.

Utilisez le bouton dans la grille tarifaire pour comparer la tarification basée sur les jetons et la tarification basée sur la modalité.

Tarification basée sur les jetons

Modèle	Type	Prix	Prix avec l'API Batch
Gemini 2.0 Flash
	1 million de jetons d'entrée	0,15 $	0,075 $
	1 M de jetons audio d'entrée	1,00 $	0,50 $
	1 million de jetons de texte de sortie	0,60 $	0,30 $
	Réglage pour 1 million de jetons d'entraînement	3 $
Génération d'images Gemini 2.0 Flash
	1 million de jetons d'entrée	0,15 $
	1 million de jetons audio d'entrée	1,00 $
	1 million de jetons vidéo d'entrée	3 $
	1 million de jetons de texte de sortie	0,60 $
	1 million de jetons d'image de sortie	$30.00
API Gemini 2.0 Flash Live
	1 million de jetons de texte en entrée	0,5 $
	1 million de jetons audio d'entrée	3 $
	1 million de jetons vidéo d'entrée	3 $
	1 million de jetons de texte en sortie	2 $
	1 million de jetons audio de sortie	12 $
Gemini 2.0 Flash-Lite
	1 million de jetons d'entrée	0,075 $	0,0375 $
	1 M de jetons audio d'entrée	0,075 $	0,0375 $
	1 million de jetons de texte de sortie	0,30 $	0,15 $
	Réglage pour 1 million de jetons d'entraînement	1,00 $
Ancrage avec la recherche Google	Gemini 2.0 Flash et 2.5 Flash incluent un total de 1 500 requêtes fondées par jour,sans frais supplémentaires. Les requêtes ancrées qui dépassent ces limites sont facturées 35$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des mots clés. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.
Web Grounding pour les grandes entreprises	45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête de type "requête contextuelle". Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.
Ancrage basé sur vos données	2,5 $ pour 1 000 requêtes à partir du 16 juin 2025.

Tarifs basés sur les modalités

Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et ne servent qu'à titre de référence. La facturation réelle ne sera basée que sur les jetons:

4 caractères correspondent à environ 1 jeton de texte, espaces compris.

Pour une image de 1 024 x 1 024, il consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour savoir comment calculer les jetons, consultez notre documentation.

L'entrée vidéo consomme 258 jetons par seconde à une fréquence d'échantillonnage d'une image par seconde. Vidéo avec facturation audio pour les jetons vidéo et audio.

L'entrée audio consomme 25 jetons par seconde sans horodatage.

Modèle	Type	Prix	Prix avec l'API Batch
Gemini 2.0 Flash
	Texte saisi ($/M caractères)	0,0375 $	0,01875 $
	Image d'entrée ($/image)	0,0001935 $	0,00009675 $
	Vidéo d'entrée ($/s)	0,0000387 $	0,00001935 $
	Audio d'entrée ($/s)	0,000025 $	0,0000125 $
	Texte de sortie (coût/million de caractères)	0,15 $	0,075 $
Génération d'images Gemini 2.0 Flash
	Texte saisi ($/M caractères)	0,0375 $
	Image d'entrée ($/image)	0,0001935 $
	Vidéo d'entrée ($/s)	0,0000387 $
	Audio d'entrée ($/s)	0,000025 $
	Texte de sortie (coût/million de caractères)	0,15 $
	Image de sortie ($/image)	0,04 $
Gemini 2.0 Flash-Lite
	Texte saisi ($/M caractères)	0,01875 $	0,009375 $
	Image d'entrée ($/image)	0,00009675 $	0,000048375 $
	Vidéo d'entrée ($/s)	0,00001935 $	0,000009675 $
	Audio d'entrée ($/s)	0,000001875 $	0,000000938 $
	Texte de sortie (coût/million de caractères)	0,075 $	0,0375 $
Ancrage avec la recherche Google	Gemini 2.0 Flash et 2.5 Flash incluent un total de 1 500 requêtes fondées par jour,sans frais supplémentaires. Les requêtes ancrées qui dépassent ces limites sont facturées 35$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des mots clés. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.
Web Grounding pour les grandes entreprises	45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.

* Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Le nombre de jetons d'entraînement est calculé en multipliant le nombre total de jetons dans votre ensemble de données d'entraînement par le nombre d'époques.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL de prise en charge de l'ancrage sur le Web). Les frais d'utilisation des modèles Gemini s'appliquent séparément.
* API Gemini 2.0 Flash Live: 25 jetons par seconde d'audio (entrée/sortie), 258 jetons par seconde de vidéo (entrée). L'ancrage avec la recherche Google reste sans frais tant que l'API Gemini 2.0 Flash Live est en preview.

Tarification de Vertex AI Model Optimizer (expérimental)*

Vertex AI Model Optimizer simplifie l'utilisation de Gemini pour les clients professionnels en fournissant un métapoint de terminaison unique pour les requêtes de modèles Gemini. Les clients qui utilisent ce service n'ont pas à spécifier s'ils doivent utiliser Flash, Pro ou une version spécifique. Ils doivent simplement indiquer leurs préférences à l'aide d'un paramètre configurable (coût, qualité ou équilibre), et Model Optimizer applique le niveau d'intelligence approprié à la tâche en envoyant chaque requête au modèle le mieux adapté.

Vertex AI Model Optimizer applique une tarification dynamique. Cela signifie que le prix moyen par jeton dépend du niveau d'intelligence du modèle appliqué pour effectuer la tâche. C'est pourquoi nous vous fournissons ci-dessous des exemples de tarifs pour illustrer les scénarios probables en fonction de votre configuration (voir les tableaux ci-dessous). Les SKU Model Optimizer sont des SKU d'un dollar qui servent d'unité d'achat pour votre facturation. Vous êtes toujours facturé en fonction de la consommation après avoir utilisé les modèles.

Ratio E/S : 5:1	Exemple 1 : chatbot	REMARQUE: Ces fourchettes ne sont pas garanties. Les résultats peuvent varier d'un client à l'autre.
Préférence du client	Jetons d'entrée client envoyés à l'objectif marketing	jetons de sortie client envoyés à MO	Prix d'entrée moyen par million de jetons (fourchette haute)	Prix de sortie moyen par million de jetons (fourchette haute)	Prix d'entrée moyen par million de jetons (fourchette basse)	Prix de sortie moyen par million de jetons (fourchette basse)
Coût	10 000 000	2 000 000	0,63 $	2,50 $	0,16 $	0,63 $
Équilibré	10 000 000	2 000 000	1,26 $	5 $	0,63 $	2,50 $
Qualité	10 000 000	2 000 000	1,89 $	7,50 $	1,26 $	5 $

Ratio E/S : 1:20	Exemple 2 : Génération de contenu
Préférence du client	Jetons d'entrée client envoyés à l'objectif marketing	jetons de sortie client envoyés à MO	Prix d'entrée moyen par million de jetons (fourchette haute)	Prix de sortie moyen par million de jetons (fourchette haute)	Prix d'entrée moyen par million de jetons (fourchette basse)	Prix de sortie moyen par million de jetons (fourchette basse)
Coût	1 000 000	20 000 000	0,63 $	2,50 $	0,16 $	0,63 $
Équilibré	1 000 000	20 000 000	1,26 $	5 $	0,63 $	2,50 $
Qualité	1 000 000	20 000 000	1,89 $	7,50 $	1,26 $	5 $

* Model Optimizer est une offre expérimentale payante, et il peut être amené à acheminer des requêtes vers des versions expérimentales de Gemini sur Vertex.

Autres modèles Gemini

Tous les modèles Gemini, à l'exception de Gemini 2.0, sont facturés en fonction de modalités telles que les caractères, les images, les secondes de vidéo/audio, etc. Les entrées de texte sont facturées pour chaque tranche de 1 000 caractères d'entrée (requête) et pour chaque tranche de 1 000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Le nombre de caractères par jeton est donc d'environ quatre. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime. Les entrées de type médias sont facturées par image ou par seconde (vidéo). Si votre requête échoue avec un code d'erreur 400 ou 500, vous n'êtes pas facturé pour les jetons utilisés.

Modèle	Caractéristique	Type	Prix ( =< 128 k jetons d'entrée)	Prix (> 128 k jetons d'entrée)
Gemini 1.5 Flash	Multimode	Entrée image Entrée vidéo Entrée texte Entrée audio	0,00002 $ par image 0,00002$par seconde 0,00001875$pour 1 000 caractères 0,000002$par seconde	0,00004 $ par image 0,00004$par seconde 0,0000375$pour 1 000 caractères 0,000004$par seconde
		Sortie textuelle	0,000075 $ pour 1 000 caractères	0,00015 $ pour 1 000 caractères
	Réglage*	Jeton de formation	8 $ / M de jetons
Gemini 1.5 Pro	Multimode	Entrée image Entrée vidéo Entrée texte Entrée audio	0,00032875 $ par image 0,00032875$par seconde 0,0003125$pour 1 000 caractères 0,00003125$par seconde	0,0006575 $ par image 0,0006575$par seconde 0,000625$pour 1 000 caractères 0,0000625$par seconde
		Sortie textuelle	0,00125 $ pour 1 000 caractères	0,0025 $ pour 1 000 caractères
	Réglage*	Jeton de formation	80 $ / M de jetons
Gemini 1.0 Pro	Multimode	Entrée image Entrée vidéo Entrée textuelle	0,0025 $ par image 0,002 $ par seconde 0,000125 $ pour 1 000 caractères
Gemini 1.0 Pro		Sortie textuelle	0,000375 $ pour 1 000 caractères
Ancrage avec la recherche Google	Texte	35$par 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.
Ancrage Web pour les entreprises	Texte	45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête de type "requête contextuelle". Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour.
Ancrage basé sur vos données	Texte	2,5 $ pour 1 000 requêtes à partir du 16 juin 2025.

* Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Si le contexte d'une requête est plus long que 128 000 jetons, tous les jetons sont facturés au tarif des contextes longs.
* Les modèles Gemini sont disponibles en mode lot avec une remise de 50 %.
* Gemini 1.0 Pro ne prend en charge que les fenêtres de contexte de 32 k au maximum.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL de prise en charge de l'ancrage sur le Web). Les frais d'utilisation des modèles Gemini s'appliquent séparément.

Imagen

Avec Imagen sur Vertex AI, vous pouvez générer de nouvelles images ou modifier des images existantes sur la base de requêtes de texte que vous fournissez, modifier partiellement des images à l'aide d'une zone de masquage que vous définissez, et bien d'autres fonctionnalités encore.

Modèle	Fonctionnalité	Description	Entrée	Sortie	Prix
Imagen 4 Ultra	Génération d'images	Générer une image	Requête textuelle	Image	0,06 $ par image
Image 4	Génération d'images	Générer une image	Requête textuelle	Image	0,04 $ par image
Imagen 4 Fast	Génération d'images	Générer une image	Requête textuelle	Image	0,02 $ par image
Image 3	Génération d'images	Générer une image Modifier une image Personnaliser une image	Requête textuelle	Image	0,04 $ par image
Imagen 3 Fast	Génération d'images	Générer une image	Requête textuelle	Image	0,02 $ par image
Imagen 2, Imagen	Génération d'images	Générer une image	Requête textuelle	Images	0,020 $ par image
	Édition d'images	Modifier une image par une approche avec masque ou sans masque	Image/Requête textuelle	Images	0,020 $ par image
	Augmentation de la résolution	Augmenter la résolution d'une image générée à 2k ou 4k	Images	Images	0,003 $ par image
	Réglage	Permettre l'utilisation d'un "sujet" fourni par l'utilisateur dans les requêtes Imagen (entraînement "few-shot")	Sujet(s) avec identifiant textuel et 4 à 8 images par sujet	Modèle affiné (après l'entraînement avec des sujets fournis par l'utilisateur)	$ par heure-nœud (tarifs d'entraînement personnalisé Vertex AI)
	Visual Captioning	Générer une légende textuelle courte ou longue pour une image	Images	Légende textuelle	0,0015 $ par image
	Questions/réponses visuelles	Fournir une réponse basée sur une question faisant référence à une image	Image/Requête textuelle	Réponse textuelle	0,0015 $ par image

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Veo

Veo 2 crée des vidéos d'une qualité incroyable sur une grande variété de sujets et dans différents styles. Il permet ainsi de mieux comprendre les lois de la physique réelle et les nuances des mouvements et des expressions humaines.

Modèle	Fonctionnalité	Description	Entrée	Sortie	Prix
Veo 3	Génération de vidéos	Générez des vidéos à partir d'une requête textuelle ou d'une image de référence	Requête textuelle/image	Vidéo	0,50 $/seconde
Veo 3	Génération de vidéos et d'audio	Générer une vidéo avec des effets vocaux/son synchronisés à partir d'une requête textuelle ou d'une image de référence	Requête textuelle/image	Vidéo et audio	0,75 $/seconde
Veo 2	Génération de vidéos	Générez des vidéos à partir d'une requête textuelle ou d'une image de référence	Requête textuelle/image	Vidéo	0,50 $/seconde
Veo 2	Commandes avancées	Générez des vidéos en interpolant les images de début et de fin, prolongez les vidéos générées et appliquez des commandes de caméra	Requête textuelle/image/vidéo	Vidéo	0,50 $/seconde

Lyria

Lyria 2 permet de générer de la musique instrumentale de haute qualité, ce qui est idéal pour les compositions sophistiquées et les explorations créatives détaillées où la nuance est essentielle.

Modèle	Fonctionnalité	Description	Entrée	Sortie	Prix
Lyria 2	Génération de musique	Générer de la musique à partir d'une requête textuelle	Requête textuelle	Musique	0,06 $ toutes les 30 secondes

Comprendre les coûts d'intégration pour vos applications d'IA

Modèle	Type	Région	Prix par 1 000 tokens d'entrée
Intégration Gemini	Entrée	Monde	Requêtes en ligne: 0,00015 $ Requêtes par lot: 0,00012 $
Intégration Gemini	Sortie	Monde	Requêtes en ligne : sans frais Requêtes par lot : sans frais

Modèle	Type	Région	Prix par tranche de 1000 caractères
Représentations vectorielles continues pour le texte (à l'exception des représentations vectorielles continues Gemini)	Entrée	Globaux	Requêtes en ligne : 0,000025 $ Requêtes par lot : 0,00002 $
	Sortie	Monde	Requêtes en ligne : sans frais Requêtes par lot : sans frais

Modèle	Fonctionnalité	Description	Entrée	Sortie	Prix
Embedding multimodal	Embeddings multimodaux: texte	Générer des représentations vectorielles continues en utilisant du texte comme entrée	Texte	Embeddings	0,0002 $ pour 1000 caractères d'entrée
	Représentations vectorielles continues pour la requête multimodale: image	Générer des représentations vectorielles continues en utilisant une image comme entrée	Images	Embeddings	0,0001 $ par image d'entrée
	Embeddings multimodaux: vidéo plus	Vidéo Plus	Vidéo	Représentations vectorielles continues (jusqu'à 15 représentations vectorielles continues par minute de vidéo)	0,0020 $ par seconde de vidéo
	Embeddings multimodaux: vidéo standard	Vidéo Standard	Vidéo	Représentations vectorielles continues (jusqu'à 8 représentations vectorielles continues par minute de vidéo)	0,0010 $ par seconde de vidéo
	Embeddings multimodaux: vidéo	Vidéo Essentiel	Vidéo	Représentations vectorielles continues (jusqu'à quatre embeddings par minute de vidéo)	0,0005 $ par seconde de vidéo

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Tarifs de la fonctionnalité de complétion de code de Vertex AI

La prise en charge de l'IA générative sur Vertex AI est facturée pour chaque tranche de 1000 caractères d'entrée (requête) et pour chaque tranche de 1000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Pendant la phase de bêta, les frais sont réduits de 100 %. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime.

Modèle	Type	Région	Prix par tranche de 1000 caractères
Codey pour la saisie de code	Entrée	Global	Requêtes en ligne : 0,00025 $
Codey pour la saisie de code	Sortie	Global	Requêtes en ligne : 0,0005 $

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.

Traduction (texte)

Utilisez l'API Vertex AI et le LLM de traduction pour traduire du texte. Les traductions LLM ont tendance à être plus fluides et naturelles que celles des modèles de traduction classiques, mais elles sont moins compatibles avec les langues (En savoir plus).

Modèle	Méthode	Utilisation	Prix par million de caractères
LLM	Traduction de texte^*	Nombre de caractères d'entrée par mois	10 $ par million de caractères^*
	Traduction de texte^*	Nombre de caractères de sortie par mois	10 $ par million de caractères^*

Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
^* Le prix est calculé en fonction du nombre de caractères traités par le modèle. Pour en savoir plus sur le comptage de caractères, consultez la section Caractères facturés

Optimiser les coûts avec le cache de contexte de Vertex AI

La mise en cache du contexte vous permet de réduire le coût du traitement des jetons d'entrée Gemini de 75% et la latence de la génération de contenu en mettant en cache la partie contextuelle de votre texte ou de vos éléments multimédias d'entrée dans les modèles Gemini. La durée de stockage des données dans le cache, qui peut être contrôlée par l'utilisateur, détermine les frais de stockage du cache de contexte. Lorsque vous créez un contexte mis en cache, le coût du jeton d'entrée standard est facturé aux utilisateurs. Les correspondances de cache sur les données d'entrée sont facturées à un tarif réduit, "Données d'entrée mises en cache", au lieu du coût normal des données d'entrée. La taille des données pour le stockage et l'entrée est calculée de la même manière que le prix des entrées Gemini.

Modèles Gemini 2.5

Modèle	Caractéristique	Type	Prix (/1 M de jetons) <= 200 k de jetons d'entrée	Prix (/1 M de jetons) > 200 000 jetons d'entrée
Gemini 2.5 Pro	Entrée mise en cache	Entrée (texte, image, vidéo, audio)	0,31 $ (/1 M de jetons)	0,625 $ (/1 M de jetons)
		Sortie	N/A	N/A
	Espace de stockage du cache contextuel	Entrée (texte, image, vidéo, audio)	4,5 $ (/M Tok/h)	4,5 $ (/M Tok/h)
Gemini 2.5 Flash	Entrée mise en cache	Entrée (texte, image, vidéo, audio)	0,0375 $ (/1 M de jetons)	0,0375 $ (/1 M de jetons)
		Sortie	N/A	N/A
	Espace de stockage du cache contextuel	Entrée (texte, image, vidéo, audio)	1 $ (/M Tok/h)	1 $ (/M Tok/h)

Modèles Gemini 2.0

Tarification basée sur les jetons

Modèle	Type	Stockage (M de tok-heures)	Prix
Gemini 2.0 Flash
	1 million de jetons d'entrée	1,00 $	0,0375 $
	1 M de jetons audio d'entrée	1,00 $	0,25 $
	1 million de jetons de texte de sortie	N/A	N/A
Gemini 2.0 Flash-Lite
	1 million de jetons d'entrée	1,00 $	0,01875 $
	1 M de jetons audio d'entrée	1,00 $	0,01875 $
	1 million de jetons de texte de sortie	N/A	N/A

Tarifs basés sur les modalités

Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et ne servent qu'à titre de référence. La facturation réelle ne sera basée que sur les jetons:

4 caractères correspondent à environ 1 jeton de texte, espaces compris.

L'entrée vidéo consomme 258 jetons par seconde à une fréquence d'échantillonnage d'une image par seconde. Vidéo avec facturation audio pour les jetons vidéo et audio.

L'entrée audio consomme 25 jetons par seconde sans horodatage.

Modèle	Type	Stockage (Modalité-heure)	Prix
Gemini 2.0 Flash
	Texte saisi ($/M caractères)	0,25 $	0,009375 $
	Image d'entrée ($/image)	0,00129 $	0,000048375 $
	Vidéo d'entrée ($/s)	0,000258 $	0,000009675 $
	Audio d'entrée ($/s)	0,000025 $	0,00000625 $
	Texte de sortie (coût/million de caractères)	N/A	N/A
Gemini 2.0 Flash-Lite
	Texte saisi ($/M caractères)	0,25 $	0,0046875 $
	Image d'entrée ($/image)	0,00129 $	0,0000241875 $
	Vidéo d'entrée ($/s)	0,000258 $	0,000009675 $
	Audio d'entrée ($/s)	0,000258 $	0,0000048375 $
	Texte de sortie (coût/million de caractères)	N/A	N/A
Ancrage avec la recherche Google	Gemini 2.0 Flash inclut jusqu'à 1 500 requêtes fondées par jour sans frais supplémentaires. Les requêtes Grounded dépassant 1 500 par jour sont facturées 35 $par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour). Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes par jour.
Web Grounding pour les grandes entreprises	45 $ par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour) à partir du 5 mai 2025. Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes par jour.

* Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* L'ancrage avec la recherche Google n'est facturé que pour les demandes qui renvoient des résultats contenant au moins une URL de support d'ancrage sur le Web. Les frais d'utilisation standards du modèle Gemini s'appliquent également.

Débit provisionné

Le débit provisionné assure le débit nécessaire à vos besoins en IA générative et est traité via des unités de scaling pour l'IA générative (GSU). Pour en savoir plus sur le débit fourni par chaque GSU, cliquez ici et utilisez notre outil d'estimation en ligne ici.

Durée	Prix par GSU	Par
Commit d'il y a une semaine	1 200 $	Semaine
Engagement d'un mois	2 700 $	Mois
Engagement de trois mois	2 400 $	Mois
Engagement sur 1 an	2 000 $	Mois

Exemple de calcul des coûts

Un utilisateur doit s'assurer qu'il peut traiter 10 requêtes par seconde (RPS) avec une entrée de 1 000 jetons de texte et 500 jetons audio,et recevoir une sortie de 300 jetons de texte à l'aide de gemini-2.0-flash.

En nous basant sur la table des débits et des taux d'utilisation, nous savons que pour gemini-2.0-flash, le taux d'utilisation d'un jeton de texte d'entrée est de 1 jeton, celui d'un jeton audio d'entrée est de 7 jetons et celui d'un jeton de texte de sortie est de 4 jetons.

Le nombre total de jetons d'entrée de l'utilisateur est de 1 000* (1 jeton par jeton de texte d'entrée) + 500* (7 jetons par jeton audio d'entrée) = 4 500 jetons d'entrée ajustés en fonction de la diminution. Le nombre total de jetons de sortie de l'utilisateur est de 300* (4 jetons par jeton de texte de sortie) = 1 200 jetons de sortie ajustés en fonction du burndown. En les additionnant, nous obtenons 4 500 jetons d'entrée ajustés par épuisement + 1 200 jetons de sortie ajustés par épuisement = 5 700 jetons au total par requête.

En multipliant le nombre total de jetons par requête par le RPS, nous obtenons 5 700 jetons au total par requête * 10 RPS = 57 000 jetons au total par seconde.

En divisant ce nombre par le débit total par seconde et par GSU,nous obtenons 57 000 jetons au total par seconde ÷ 3 360 par seconde et par GSU = 16,96 GSU. L'incrément minimal d'achat de GSU pour ce modèle est de 1, ce qui signifie que l'utilisateur a besoin de 17 GSU.

Si l'utilisateur souhaite maintenir ce débit pendant une semaine, le coût sera de 1 200 $ * 17 GSU = 20 400 $par semaine. Si l'entreprise souhaite maintenir ce débit pendant un mois, cela lui coûtera 2 700 $ * 17 GSU = 45 900 $par mois. Si l'entreprise souhaite maintenir ce débit pendant trois mois, le coût sera de 2 400 $x 17 GSU = 40 800 $par mois. Enfin, si l'entreprise souhaite maintenir ce débit pendant un an, cela lui coûtera 2 000 $ * 17 GSU = 34 000 $par mois.

Comparer les tarifs des modèles partenaires sur Vertex AI

Les modèles partenaires sont une liste organisée de modèles d'IA générative développés par les partenaires de Google. Les modèles partenaires sont proposés en tant qu'API gérées. Pour en savoir plus, consultez la présentation des modèles partenaires. Les sections suivantes listent les détails de tarification des modèles Google pour les partenaires.

Modèles d'AI21 Labs

Modèle	Tarifs
Jamba 1.5 Large	Entrée: 2 $ par million de jetons Sortie: 8 $ par million de jetons
Jamba 1.5 Mini	Entrée: 0,20 $ par million de jetons Sortie: 0,40 $ par million de jetons

Modèles Claude d'Anthropic

Modèle	Tarifs
Claude Opus 4	Entrée: 15 $ / million de jetons Sortie: 75 $ / million de jetons Entrée par lot: 7,5 $ / million de jetons Sortie par lot: 37,5 $ / million de jetons Écriture dans le cache: 18,75 $ / million de jetons Récupération dans le cache: 1,5 $ / million de jetons Écriture dans le cache par lot: 9,375 $ / million de jetons Récupération dans le cache par lot: 0,75 $ / million de jetons
Claude Sonnet 4	Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons Entrée par lot: 1,50 $ par million de jetons Sortie par lot: 7,50 $ par million de jetons Écriture dans le cache: 3,75 $ par million de jetons Récupération dans le cache: 0,30 $ par million de jetons Écriture dans le cache par lot: 1,875 $ par million de jetons Récupération dans le cache par lot: 0,15 $ par million de jetons
Claude 3.7 Sonnet	Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons Entrée par lot: 1,50 $ par million de jetons Sortie par lot: 7,50 $ par million de jetons Écriture dans le cache: 3,75 $ par million de jetons Récupération dans le cache: 0,30 $ par million de jetons Écriture dans le cache par lot: 1,875 $ par million de jetons Récupération dans le cache par lot: 0,15 $ par million de jetons
Claude 3.5 Haiku	Entrée: 0,80 $ / million de jetons Sortie: 4 $ / million de jetons Entrée par lot: 0,40 $ / million de jetons Sortie par lot: 2 $ / million de jetons Écriture dans le cache: 1 $ / million de jetons Récupération dans le cache: 0,08 $ / million de jetons Écriture dans le cache par lot: 0,50 $ / million de jetons Récupération dans le cache par lot: 0,04 $ / million de jetons
Claude 3.5 Sonnet v2	Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons Entrée par lot: 1,50 $ par million de jetons Sortie par lot: 7,50 $ par million de jetons Écriture dans le cache: 3,75 $ par million de jetons Récupération dans le cache: 0,30 $ par million de jetons Écriture dans le cache par lot: 1,875 $ par million de jetons Récupération dans le cache par lot: 0,15 $ par million de jetons
Claude 3.5 Sonnet	Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons Écriture dans le cache: 3,75 $ par million de jetons Coup de chance dans le cache: 0,30 $ par million de jetons
Claude 3 Haiku	Entrée: 0,25 $ par million de jetons Sortie: 1,25 $ par million de jetons Écriture dans le cache: 0,30 $ par million de jetons Coup de chance dans le cache: 0,03 $ par million de jetons
Claude 3 Sonnet (deprecated)	Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons
Claude 3 Opus	Entrée: 15 $ par million de jetons Sortie: 75 $ par million de jetons Écriture dans le cache: 18,75 $ par million de jetons Coup de chance dans le cache: 1,50 $ par million de jetons

Modèles Llama de Meta

Modèle	Tarifs
Llama 3.1 405B	Entrée: 5 $ par million de jetons Sortie: 16 $ par million de jetons
Llama 3.3 70 Mrd *	Entrée: 0,72 $ par million de jetons Sortie: 0,72 $ par million de jetons
Llama 4 Scout *	Entrée: 0,25 $ par million de jetons Sortie: 0,70 $ par million de jetons
Llama 4 Maverick *	Entrée: 0,35 $ / million de jetons Sortie: 1,15 $ / million de jetons

Disponible sans frais jusqu'au 1er mai 2025.

Modèles Mistral AI

Modèle	Tarifs
Mistral OCR (25.05)	Entrée: 0,0005 $ / million de jetons (ou 0,0005 $/page) Sortie: 0,0005 $ / million de jetons (ou 0,0005 $/page)
Mistral Small 3.1 (25.03)	Entrée: 0,10 $ par million de jetons Sortie: 0,30 $ par million de jetons
Mistral Large (24.11)	Entrée: 2 $ / million de jetons Sortie: 6 $ / million de jetons
Mistral Nemo	Entrée: 0,15 $ / million de jetons Sortie: 0,15 $ / million de jetons
Codestral (25.01)	Entrée: 0,30 $ par million de jetons Sortie: 0,90 $ par million de jetons

Demander un devis personnalisé

Avec le paiement à l'usage de Google Cloud, vous ne payez que pour les services que vous utilisez. Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.

Contacter le service commercial