Coût de création et de déploiement de modèles d'IA dans Vertex AI
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des SKU de Cloud Platform s'appliquent.
Vous ne payez que les requêtes renvoyant un code de réponse 200. Les requêtes renvoyant d'autres codes de réponse, tels que les codes 4xx et 5xx, ne sont pas facturées pour les entrées ni les sorties.
Cette page présente les tarifs de l'IA générative sur Vertex AI. Pour tous les autres tarifs de Vertex AI, y compris les services ML Platform et MLOps, consultez la page des tarifs de Vertex AI.
Modèles Google
Gemini 2.5
Modèle | Type | Prix (/1 M de jetons) <= 200 k de jetons d'entrée | Prix (/1 M de jetons) > 200 k jetons d'entrée | Prix (/1 M de jetons) <= 200 k jetons d'entrée avec l'API de traitement par lot | Prix (/1 M de jetons) > 200 k jetons d'entrée avec l'API de traitement par lot |
---|---|---|---|---|---|
Gemini 2.5 Pro | |||||
Entrée (texte, image, vidéo, audio) | 1,25 $ | 2,5 $ | 0,625 $ | 1,25 $ | |
Sortie textuelle (réponse et raisonnement) | 10 $ | 15 $ | 5 $ | 7,5 $ | |
Gemini 2.5 Flash GA |
|||||
Entrée (texte, image, vidéo) | 0,30 $ | 0,30 $ | 0,15 $ | 0,15 $ | |
Entrée audio | 1 $ | 1 $ | 0,5 $ | 0,5 $ | |
Sortie textuelle | 2,50 $ | 2,50 $ | 1,25 $ | 1,25 $ | |
Réglage pour 1 million de jetons d'entraînement | 5 $ | N/A | N/A | N/A | |
Gemini 2.5 Flash Preview (Endpoints Retired on 7/15/2025) |
|||||
Entrée (texte, image, vidéo) | 0,15 $ | 0,15 $ | 0,075 $ | 0,075 $ | |
Entrée audio | 1 $ | 1 $ | 0,5 $ | 0,5 $ | |
Sortie texte (pas de réflexion) | 0,60 $ | 0,60 $ | 0,30 $ | 0,30 $ | |
Sortie texte (réflexion, réponse et raisonnement) | 3,50 $ | 3,50 $ | 1,75 $ | 1,75 $ | |
API Gemini 2.5 Flash Live |
|||||
1 million de jetons de texte en entrée | 0,5 $ | 0,5 $ | N/A | N/A | |
1 million de jetons audio d'entrée | 3 $ | 3 $ | N/A | N/A | |
1 million de jetons vidéo d'entrée | 3 $ | 3 $ | N/A | N/A | |
1 million de jetons de sortie | 2 $ | 2 $ | N/A | N/A | |
1 million de jetons audio de sortie | 12 $ | 12 $ | N/A | N/A | |
Gemini 2.5 Flash Lite |
|||||
Entrée (texte, image, vidéo) | 0,1 $ | 0,1 $ | N/A | N/A | |
Entrée audio | 0,5 $ | 0,5 $ | N/A | N/A | |
Sortie textuelle (réponse et raisonnement) | 0,4 € | 0,4 € | N/A | N/A | |
Ancrage avec la recherche Google |
Gemini 2.0 Flash, 2.5 Flash et 2.5 Flash-Lite incluent 1 500 requêtes fondées par jour sans frais supplémentaires. Gemini 2.5 Pro inclut 10 000 requêtes fondées par jour sans frais supplémentaires. Si vous dépassez ces limites,les requêtes ancrées vous seront facturées 35$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google**. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour. |
||||
Web Grounding pour les grandes entreprises |
45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises**. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations. Si vous avez besoin de plus d'un million de requêtes ancrées par jour, veuillez contacter l'équipe chargée de votre compte. |
||||
Ancrage basé sur vos données | 2,5 $ pour 1 000 requêtes à partir du 16 juin 2025. |
* Si le contexte d'entrée de la requête est plus long que 200 000 jetons, tous les jetons (d'entrée et de sortie) sont facturés au tarif des contextes longs.
** L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL de prise en charge de l'ancrage sur le Web). Les frais d'utilisation des modèles Gemini s'appliquent séparément.
Gemini 2.0
Gemini 2.0 est facturé en fonction du nombre de jetons. Pour calculer le nombre de jetons d'entrée dans votre requête avant de l'envoyer, vous pouvez utiliser le tokenizer du SDK ou l'API countTokens. Si votre requête échoue avec un code d'erreur 400 ou 500, vous n'êtes pas facturé pour les jetons utilisés.
Utilisez le bouton dans la grille tarifaire pour comparer la tarification basée sur les jetons et la tarification basée sur la modalité.
Tarification basée sur les jetons
Modèle | Type | Prix | Prix avec l'API Batch |
---|---|---|---|
Gemini 2.0 Flash |
|||
1 million de jetons d'entrée | 0,15 $ | 0,075 $ | |
1 M de jetons audio d'entrée | 1,00 $ | 0,50 $ | |
1 million de jetons de texte de sortie | 0,60 $ | 0,30 $ | |
Réglage pour 1 million de jetons d'entraînement | 3 $ | ||
Génération d'images Gemini 2.0 Flash |
|||
1 million de jetons d'entrée | 0,15 $ | ||
1 million de jetons audio d'entrée | 1,00 $ | ||
1 million de jetons vidéo d'entrée | 3 $ | ||
1 million de jetons de texte de sortie | 0,60 $ | ||
1 million de jetons d'image de sortie | $30.00 | ||
API Gemini 2.0 Flash Live |
|||
1 million de jetons de texte en entrée | 0,5 $ | ||
1 million de jetons audio d'entrée | 3 $ | ||
1 million de jetons vidéo d'entrée | 3 $ | ||
1 million de jetons de texte en sortie | 2 $ | ||
1 million de jetons audio de sortie | 12 $ | ||
Gemini 2.0 Flash-Lite |
|||
1 million de jetons d'entrée | 0,075 $ | 0,0375 $ | |
1 M de jetons audio d'entrée | 0,075 $ | 0,0375 $ | |
1 million de jetons de texte de sortie | 0,30 $ | 0,15 $ | |
Réglage pour 1 million de jetons d'entraînement | 1,00 $ | ||
Ancrage avec la recherche Google |
Gemini 2.0 Flash et 2.5 Flash incluent un total de 1 500 requêtes fondées par jour,sans frais supplémentaires. Les requêtes ancrées qui dépassent ces limites sont facturées 35$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des mots clés. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour. |
||
Web Grounding pour les grandes entreprises |
45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête de type "requête contextuelle". Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour. |
||
Ancrage basé sur vos données | 2,5 $ pour 1 000 requêtes à partir du 16 juin 2025. |
Tarifs basés sur les modalités
Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et ne servent qu'à titre de référence. La facturation réelle ne sera basée que sur les jetons:
- 4 caractères correspondent à environ 1 jeton de texte, espaces compris.
- Pour une image de 1 024 x 1 024, il consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour savoir comment calculer les jetons, consultez notre documentation.
- L'entrée vidéo consomme 258 jetons par seconde à une fréquence d'échantillonnage d'une image par seconde. Vidéo avec facturation audio pour les jetons vidéo et audio.
- L'entrée audio consomme 25 jetons par seconde sans horodatage.
Modèle | Type | Prix | Prix avec l'API Batch |
---|---|---|---|
Gemini 2.0 Flash |
|||
Texte saisi ($/M caractères) | 0,0375 $ | 0,01875 $ | |
Image d'entrée ($/image) | 0,0001935 $ | 0,00009675 $ | |
Vidéo d'entrée ($/s) | 0,0000387 $ | 0,00001935 $ | |
Audio d'entrée ($/s) | 0,000025 $ | 0,0000125 $ | |
Texte de sortie (coût/million de caractères) | 0,15 $ | 0,075 $ | |
Génération d'images Gemini 2.0 Flash |
|||
Texte saisi ($/M caractères) | 0,0375 $ | ||
Image d'entrée ($/image) | 0,0001935 $ | ||
Vidéo d'entrée ($/s) | 0,0000387 $ | ||
Audio d'entrée ($/s) | 0,000025 $ | ||
Texte de sortie (coût/million de caractères) | 0,15 $ | ||
Image de sortie ($/image) | 0,04 $ | ||
Gemini 2.0 Flash-Lite |
|||
Texte saisi ($/M caractères) | 0,01875 $ | 0,009375 $ | |
Image d'entrée ($/image) | 0,00009675 $ | 0,000048375 $ | |
Vidéo d'entrée ($/s) | 0,00001935 $ | 0,000009675 $ | |
Audio d'entrée ($/s) | 0,000001875 $ | 0,000000938 $ | |
Texte de sortie (coût/million de caractères) | 0,075 $ | 0,0375 $ | |
Ancrage avec la recherche Google |
Gemini 2.0 Flash et 2.5 Flash incluent un total de 1 500 requêtes fondées par jour,sans frais supplémentaires. Les requêtes ancrées qui dépassent ces limites sont facturées 35$pour 1 000 requêtes ancrées. Une requête ancrée est une demande envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des mots clés. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour. |
||
Web Grounding pour les grandes entreprises |
45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour. |
* Les tarifs sont indiqués en dollars américains (USD).
Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Le nombre de jetons d'entraînement est calculé en multipliant le nombre total de jetons dans votre ensemble de données d'entraînement par le nombre d'époques.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL de prise en charge de l'ancrage sur le Web). Les frais d'utilisation des modèles Gemini s'appliquent séparément.
* API Gemini 2.0 Flash Live: 25 jetons par seconde d'audio (entrée/sortie), 258 jetons par seconde de vidéo (entrée). L'ancrage avec la recherche Google reste sans frais tant que l'API Gemini 2.0 Flash Live est en preview.
Tarification de Vertex AI Model Optimizer (expérimental)*
Vertex AI Model Optimizer simplifie l'utilisation de Gemini pour les clients professionnels en fournissant un métapoint de terminaison unique pour les requêtes de modèles Gemini. Les clients qui utilisent ce service n'ont pas à spécifier s'ils doivent utiliser Flash, Pro ou une version spécifique. Ils doivent simplement indiquer leurs préférences à l'aide d'un paramètre configurable (coût, qualité ou équilibre), et Model Optimizer applique le niveau d'intelligence approprié à la tâche en envoyant chaque requête au modèle le mieux adapté.
Vertex AI Model Optimizer applique une tarification dynamique. Cela signifie que le prix moyen par jeton dépend du niveau d'intelligence du modèle appliqué pour effectuer la tâche. C'est pourquoi nous vous fournissons ci-dessous des exemples de tarifs pour illustrer les scénarios probables en fonction de votre configuration (voir les tableaux ci-dessous). Les SKU Model Optimizer sont des SKU d'un dollar qui servent d'unité d'achat pour votre facturation. Vous êtes toujours facturé en fonction de la consommation après avoir utilisé les modèles.
Ratio E/S : 5:1 | Exemple 1 : chatbot |
REMARQUE: Ces fourchettes ne sont pas garanties. Les résultats peuvent varier d'un client à l'autre. | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Préférence du client | Jetons d'entrée client envoyés à l'objectif marketing | jetons de sortie client envoyés à MO | Prix d'entrée moyen par million de jetons (fourchette haute) | Prix de sortie moyen par million de jetons (fourchette haute) | Prix d'entrée moyen par million de jetons (fourchette basse) | Prix de sortie moyen par million de jetons (fourchette basse) | |||||
Coût | 10 000 000 | 2 000 000 | 0,63 $ | 2,50 $ | 0,16 $ | 0,63 $ | |||||
Équilibré | 10 000 000 | 2 000 000 | 1,26 $ | 5 $ | 0,63 $ | 2,50 $ | |||||
Qualité | 10 000 000 | 2 000 000 | 1,89 $ | 7,50 $ | 1,26 $ | 5 $ |
Ratio E/S : 1:20 | Exemple 2 : Génération de contenu | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Préférence du client | Jetons d'entrée client envoyés à l'objectif marketing | jetons de sortie client envoyés à MO | Prix d'entrée moyen par million de jetons (fourchette haute) | Prix de sortie moyen par million de jetons (fourchette haute) | Prix d'entrée moyen par million de jetons (fourchette basse) | Prix de sortie moyen par million de jetons (fourchette basse) | |||||
Coût | 1 000 000 | 20 000 000 | 0,63 $ | 2,50 $ | 0,16 $ | 0,63 $ | |||||
Équilibré | 1 000 000 | 20 000 000 | 1,26 $ | 5 $ | 0,63 $ | 2,50 $ | |||||
Qualité | 1 000 000 | 20 000 000 | 1,89 $ | 7,50 $ | 1,26 $ | 5 $ |
Autres modèles Gemini
Tous les modèles Gemini, à l'exception de Gemini 2.0, sont facturés en fonction de modalités telles que les caractères, les images, les secondes de vidéo/audio, etc. Les entrées de texte sont facturées pour chaque tranche de 1 000 caractères d'entrée (requête) et pour chaque tranche de 1 000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Le nombre de caractères par jeton est donc d'environ quatre. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime. Les entrées de type médias sont facturées par image ou par seconde (vidéo). Si votre requête échoue avec un code d'erreur 400 ou 500, vous n'êtes pas facturé pour les jetons utilisés.
Modèle | Caractéristique | Type | Prix ( =< 128 k jetons d'entrée) |
Prix (> 128 k jetons d'entrée) |
||
---|---|---|---|---|---|---|
Gemini 1.5 Flash | Multimode | Entrée image Entrée vidéo Entrée texte Entrée audio |
0,00002 $ par image 0,00002$par seconde 0,00001875$pour 1 000 caractères 0,000002$par seconde |
0,00004 $ par image 0,00004$par seconde 0,0000375$pour 1 000 caractères 0,000004$par seconde |
||
Sortie textuelle | 0,000075 $ pour 1 000 caractères | 0,00015 $ pour 1 000 caractères | ||||
Réglage* | Jeton de formation | 8 $ / M de jetons | ||||
Gemini 1.5 Pro | Multimode | Entrée image Entrée vidéo Entrée texte Entrée audio |
0,00032875 $ par image 0,00032875$par seconde 0,0003125$pour 1 000 caractères 0,00003125$par seconde |
0,0006575 $ par image 0,0006575$par seconde 0,000625$pour 1 000 caractères 0,0000625$par seconde |
||
Sortie textuelle | 0,00125 $ pour 1 000 caractères | 0,0025 $ pour 1 000 caractères | ||||
Réglage* | Jeton de formation | 80 $ / M de jetons | ||||
Gemini 1.0 Pro | Multimode | Entrée image Entrée vidéo Entrée textuelle |
0,0025 $ par image 0,002 $ par seconde 0,000125 $ pour 1 000 caractères |
|||
Sortie textuelle | 0,000375 $ pour 1 000 caractères | |||||
Ancrage avec la recherche Google | Texte | 35$par 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes dans la recherche Google*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête basée sur des informations. Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour. |
||||
Ancrage Web pour les entreprises | Texte | 45$pour 1 000 requêtes ancrées. Une requête ancrée est une requête envoyée à Gemini qui effectue une ou plusieurs requêtes à Web Grounding pour les entreprises*. Même si plusieurs requêtes de recherche sont envoyées à la recherche Google, une seule facturation est effectuée pour une requête de type "requête contextuelle". Veuillez contacter l'équipe chargée de votre compte si vous avez besoin de plus d'un million de requêtes basées sur des données réelles par jour. |
||||
Ancrage basé sur vos données | Texte | 2,5 $ pour 1 000 requêtes à partir du 16 juin 2025. |
* Les tarifs sont indiqués en dollars américains (USD).
Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Si le contexte d'une requête est plus long que 128 000 jetons, tous les jetons sont facturés au tarif des contextes longs.
* Les modèles Gemini sont disponibles en mode lot avec une remise de 50 %.
* Gemini 1.0 Pro ne prend en charge que les fenêtres de contexte de 32 k au maximum.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* L'ancrage avec la recherche Google et l'ancrage Web pour les entreprises ne sont facturés que lorsqu'une requête renvoie des résultats Web (c'est-à-dire des résultats contenant au moins une URL de prise en charge de l'ancrage sur le Web). Les frais d'utilisation des modèles Gemini s'appliquent séparément.
Imagen
Avec Imagen sur Vertex AI, vous pouvez générer de nouvelles images ou modifier des images existantes sur la base de requêtes de texte que vous fournissez, modifier partiellement des images à l'aide d'une zone de masquage que vous définissez, et bien d'autres fonctionnalités encore.
Modèle | Fonctionnalité | Description | Entrée | Sortie | Prix |
---|---|---|---|---|---|
Imagen 4 Ultra | Génération d'images | Générer une image | Requête textuelle | Image | 0,06 $ par image |
Image 4 | Génération d'images | Générer une image | Requête textuelle | Image | 0,04 $ par image |
Imagen 4 Fast | Génération d'images | Générer une image | Requête textuelle | Image | 0,02 $ par image |
Image 3 | Génération d'images | Générer une image Modifier une image Personnaliser une image |
Requête textuelle | Image | 0,04 $ par image |
Imagen 3 Fast | Génération d'images | Générer une image | Requête textuelle | Image | 0,02 $ par image |
Imagen 2, Imagen | Génération d'images | Générer une image | Requête textuelle | Images | 0,020 $ par image |
Édition d'images | Modifier une image par une approche avec masque ou sans masque | Image/Requête textuelle | Images | 0,020 $ par image | |
Augmentation de la résolution | Augmenter la résolution d'une image générée à 2k ou 4k | Images | Images | 0,003 $ par image | |
Réglage | Permettre l'utilisation d'un "sujet" fourni par l'utilisateur dans les requêtes Imagen (entraînement "few-shot") | Sujet(s) avec identifiant textuel et 4 à 8 images par sujet | Modèle affiné (après l'entraînement avec des sujets fournis par l'utilisateur) | $ par heure-nœud (tarifs d'entraînement personnalisé Vertex AI) | |
Visual Captioning | Générer une légende textuelle courte ou longue pour une image | Images | Légende textuelle | 0,0015 $ par image | |
Questions/réponses visuelles | Fournir une réponse basée sur une question faisant référence à une image | Image/Requête textuelle | Réponse textuelle | 0,0015 $ par image |
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Veo
Veo 2 crée des vidéos d'une qualité incroyable sur une grande variété de sujets et dans différents styles. Il permet ainsi de mieux comprendre les lois de la physique réelle et les nuances des mouvements et des expressions humaines.
Modèle | Fonctionnalité | Description | Entrée | Sortie | Prix |
---|---|---|---|---|---|
Veo 3 | Génération de vidéos | Générez des vidéos à partir d'une requête textuelle ou d'une image de référence | Requête textuelle/image | Vidéo | 0,50 $/seconde |
Veo 3 | Génération de vidéos et d'audio | Générer une vidéo avec des effets vocaux/son synchronisés à partir d'une requête textuelle ou d'une image de référence | Requête textuelle/image | Vidéo et audio | 0,75 $/seconde |
Veo 2 | Génération de vidéos | Générez des vidéos à partir d'une requête textuelle ou d'une image de référence | Requête textuelle/image | Vidéo | 0,50 $/seconde |
Veo 2 | Commandes avancées | Générez des vidéos en interpolant les images de début et de fin, prolongez les vidéos générées et appliquez des commandes de caméra | Requête textuelle/image/vidéo | Vidéo | 0,50 $/seconde |
Lyria
Lyria 2 permet de générer de la musique instrumentale de haute qualité, ce qui est idéal pour les compositions sophistiquées et les explorations créatives détaillées où la nuance est essentielle.
Modèle | Fonctionnalité | Description | Entrée | Sortie | Prix |
---|---|---|---|---|---|
Lyria 2 | Génération de musique | Générer de la musique à partir d'une requête textuelle | Requête textuelle | Musique | 0,06 $ toutes les 30 secondes |
Comprendre les coûts d'intégration pour vos applications d'IA
Modèle | Type | Région | Prix par 1 000 tokens d'entrée |
---|---|---|---|
Intégration Gemini | Entrée | Monde |
|
Sortie | Monde |
|
Modèle | Type | Région | Prix par tranche de 1000 caractères |
---|---|---|---|
Représentations vectorielles continues pour le texte (à l'exception des représentations vectorielles continues Gemini) |
Entrée | Globaux |
|
Sortie | Monde |
|
Modèle | Fonctionnalité | Description | Entrée | Sortie | Prix |
---|---|---|---|---|---|
Embedding multimodal | Embeddings multimodaux: texte | Générer des représentations vectorielles continues en utilisant du texte comme entrée | Texte | Embeddings | 0,0002 $ pour 1000 caractères d'entrée |
Représentations vectorielles continues pour la requête multimodale: image | Générer des représentations vectorielles continues en utilisant une image comme entrée | Images | Embeddings | 0,0001 $ par image d'entrée | |
Embeddings multimodaux: vidéo plus | Vidéo Plus | Vidéo | Représentations vectorielles continues (jusqu'à 15 représentations vectorielles continues par minute de vidéo) | 0,0020 $ par seconde de vidéo | |
Embeddings multimodaux: vidéo standard | Vidéo Standard | Vidéo | Représentations vectorielles continues (jusqu'à 8 représentations vectorielles continues par minute de vidéo) | 0,0010 $ par seconde de vidéo | |
Embeddings multimodaux: vidéo | Vidéo Essentiel | Vidéo | Représentations vectorielles continues (jusqu'à quatre embeddings par minute de vidéo) | 0,0005 $ par seconde de vidéo |
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Tarifs de la fonctionnalité de complétion de code de Vertex AI
La prise en charge de l'IA générative sur Vertex AI est facturée pour chaque tranche de 1000 caractères d'entrée (requête) et pour chaque tranche de 1000 caractères de sortie (réponse). Les caractères sont comptabilisés avec les points de code UTF-8, et les espaces sont exclus du décompte. Pendant la phase de bêta, les frais sont réduits de 100 %. Les requêtes de prédiction qui aboutissent à des réponses filtrées ne sont facturées que pour l'entrée. À la fin de chaque cycle de facturation, les fractions de centime (0,01 $) sont arrondies à un centime.
Modèle | Type | Région | Prix par tranche de 1000 caractères |
---|---|---|---|
Codey pour la saisie de code | Entrée | Global |
|
Sortie | Global |
|
Les tarifs sont indiqués en dollars américains (USD). Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
Traduction (texte)
Utilisez l'API Vertex AI et le LLM de traduction pour traduire du texte. Les traductions LLM ont tendance à être plus fluides et naturelles que celles des modèles de traduction classiques, mais elles sont moins compatibles avec les langues (En savoir plus).
Modèle | Méthode | Utilisation | Prix par million de caractères |
---|---|---|---|
LLM | Traduction de texte* | Nombre de caractères d'entrée par mois |
10 $ par million de caractères* |
Nombre de caractères de sortie par mois |
10 $ par million de caractères* |
Les tarifs sont indiqués en dollars américains (USD).
Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Le prix est calculé en fonction du nombre de caractères traités par le modèle. Pour en savoir plus sur le comptage de caractères, consultez la section Caractères facturés
Optimiser les coûts avec le cache de contexte de Vertex AI
La mise en cache du contexte vous permet de réduire le coût du traitement des jetons d'entrée Gemini de 75% et la latence de la génération de contenu en mettant en cache la partie contextuelle de votre texte ou de vos éléments multimédias d'entrée dans les modèles Gemini. La durée de stockage des données dans le cache, qui peut être contrôlée par l'utilisateur, détermine les frais de stockage du cache de contexte. Lorsque vous créez un contexte mis en cache, le coût du jeton d'entrée standard est facturé aux utilisateurs. Les correspondances de cache sur les données d'entrée sont facturées à un tarif réduit, "Données d'entrée mises en cache", au lieu du coût normal des données d'entrée. La taille des données pour le stockage et l'entrée est calculée de la même manière que le prix des entrées Gemini.
Modèles Gemini 2.5
Modèle | Caractéristique | Type | Prix (/1 M de jetons) <= 200 k de jetons d'entrée |
Prix (/1 M de jetons) > 200 000 jetons d'entrée |
---|---|---|---|---|
Gemini 2.5 Pro | Entrée mise en cache | Entrée (texte, image, vidéo, audio) | 0,31 $ (/1 M de jetons) | 0,625 $ (/1 M de jetons) |
Sortie | N/A | N/A | ||
Espace de stockage du cache contextuel | Entrée (texte, image, vidéo, audio) | 4,5 $ (/M Tok/h) | 4,5 $ (/M Tok/h) | |
Gemini 2.5 Flash | Entrée mise en cache | Entrée (texte, image, vidéo, audio) | 0,0375 $ (/1 M de jetons) | 0,0375 $ (/1 M de jetons) |
Sortie | N/A | N/A | ||
Espace de stockage du cache contextuel | Entrée (texte, image, vidéo, audio) | 1 $ (/M Tok/h) | 1 $ (/M Tok/h) |
Modèles Gemini 2.0
Tarification basée sur les jetons
Modèle |
Type |
Stockage (M de tok-heures) |
Prix |
---|---|---|---|
Gemini 2.0 Flash |
|||
1 million de jetons d'entrée | 1,00 $ | 0,0375 $ | |
1 M de jetons audio d'entrée | 1,00 $ | 0,25 $ | |
1 million de jetons de texte de sortie | N/A | N/A | |
Gemini 2.0 Flash-Lite |
|||
1 million de jetons d'entrée | 1,00 $ | 0,01875 $ | |
1 M de jetons audio d'entrée | 1,00 $ | 0,01875 $ | |
1 million de jetons de texte de sortie | N/A | N/A |
Tarifs basés sur les modalités
Les tarifs des modalités ci-dessous sont basés sur des cas d'utilisation moyens et ne servent qu'à titre de référence. La facturation réelle ne sera basée que sur les jetons:
- 4 caractères correspondent à environ 1 jeton de texte, espaces compris.
- Pour une image de 1 024 x 1 024, il consomme 1 290 jetons. Le nombre de jetons par image varie en fonction de la résolution de l'image. Pour savoir comment calculer les jetons, consultez notre documentation.
- L'entrée vidéo consomme 258 jetons par seconde à une fréquence d'échantillonnage d'une image par seconde. Vidéo avec facturation audio pour les jetons vidéo et audio.
- L'entrée audio consomme 25 jetons par seconde sans horodatage.
Modèle |
Type |
Stockage (Modalité-heure) |
Prix |
---|---|---|---|
Gemini 2.0 Flash |
|||
Texte saisi ($/M caractères) | 0,25 $ | 0,009375 $ | |
Image d'entrée ($/image) | 0,00129 $ | 0,000048375 $ | |
Vidéo d'entrée ($/s) | 0,000258 $ | 0,000009675 $ | |
Audio d'entrée ($/s) | 0,000025 $ | 0,00000625 $ | |
Texte de sortie (coût/million de caractères) | N/A | N/A | |
Gemini 2.0 Flash-Lite |
|||
Texte saisi ($/M caractères) | 0,25 $ | 0,0046875 $ | |
Image d'entrée ($/image) | 0,00129 $ | 0,0000241875 $ | |
Vidéo d'entrée ($/s) | 0,000258 $ | 0,000009675 $ | |
Audio d'entrée ($/s) | 0,000258 $ | 0,0000048375 $ | |
Texte de sortie (coût/million de caractères) | N/A | N/A | |
Ancrage avec la recherche Google |
Gemini 2.0 Flash inclut jusqu'à 1 500 requêtes fondées par jour sans frais supplémentaires. Les requêtes Grounded dépassant 1 500 par jour sont facturées 35 $par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour). Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes par jour. |
||
Web Grounding pour les grandes entreprises |
45 $ par tranche de 1 000 requêtes (jusqu'à 1 million de requêtes par jour) à partir du 5 mai 2025. Veuillez contacter l'équipe de gestion de votre compte si vous avez besoin de plus d'un million de requêtes par jour. |
* Les tarifs sont indiqués en dollars américains (USD).
Si vous ne payez pas en USD, les tarifs indiqués dans votre devise sur la page des codes SKU Cloud Platform s'appliquent.
* Les PDF sont facturés comme des entrées d'image, une page PDF étant équivalente à une image.
* Le point de terminaison du modèle réglé est facturé au même prix que le modèle de base.
* L'ancrage avec la recherche Google n'est facturé que pour les demandes qui renvoient des résultats contenant au moins une URL de support d'ancrage sur le Web. Les frais d'utilisation standards du modèle Gemini s'appliquent également.
Débit provisionné
Le débit provisionné assure le débit nécessaire à vos besoins en IA générative et est traité via des unités de scaling pour l'IA générative (GSU). Pour en savoir plus sur le débit fourni par chaque GSU, cliquez ici et utilisez notre outil d'estimation en ligne ici.
Durée | Prix par GSU | Par |
---|---|---|
Commit d'il y a une semaine | 1 200 $ | Semaine |
Engagement d'un mois | 2 700 $ | Mois |
Engagement de trois mois | 2 400 $ | Mois |
Engagement sur 1 an | 2 000 $ | Mois |
Exemple de calcul des coûts
Un utilisateur doit s'assurer qu'il peut traiter 10 requêtes par seconde (RPS) avec une entrée de 1 000 jetons de texte et 500 jetons audio,et recevoir une sortie de 300 jetons de texte à l'aide de gemini-2.0-flash.
En nous basant sur la table des débits et des taux d'utilisation, nous savons que pour gemini-2.0-flash, le taux d'utilisation d'un jeton de texte d'entrée est de 1 jeton, celui d'un jeton audio d'entrée est de 7 jetons et celui d'un jeton de texte de sortie est de 4 jetons.
Le nombre total de jetons d'entrée de l'utilisateur est de 1 000* (1 jeton par jeton de texte d'entrée) + 500* (7 jetons par jeton audio d'entrée) = 4 500 jetons d'entrée ajustés en fonction de la diminution. Le nombre total de jetons de sortie de l'utilisateur est de 300* (4 jetons par jeton de texte de sortie) = 1 200 jetons de sortie ajustés en fonction du burndown. En les additionnant, nous obtenons 4 500 jetons d'entrée ajustés par épuisement + 1 200 jetons de sortie ajustés par épuisement = 5 700 jetons au total par requête.
En multipliant le nombre total de jetons par requête par le RPS, nous obtenons 5 700 jetons au total par requête * 10 RPS = 57 000 jetons au total par seconde.
En divisant ce nombre par le débit total par seconde et par GSU,nous obtenons 57 000 jetons au total par seconde ÷ 3 360 par seconde et par GSU = 16,96 GSU. L'incrément minimal d'achat de GSU pour ce modèle est de 1, ce qui signifie que l'utilisateur a besoin de 17 GSU.
Si l'utilisateur souhaite maintenir ce débit pendant une semaine, le coût sera de 1 200 $ * 17 GSU = 20 400 $par semaine. Si l'entreprise souhaite maintenir ce débit pendant un mois, cela lui coûtera 2 700 $ * 17 GSU = 45 900 $par mois. Si l'entreprise souhaite maintenir ce débit pendant trois mois, le coût sera de 2 400 $x 17 GSU = 40 800 $par mois. Enfin, si l'entreprise souhaite maintenir ce débit pendant un an, cela lui coûtera 2 000 $ * 17 GSU = 34 000 $par mois.
Comparer les tarifs des modèles partenaires sur Vertex AI
Les modèles partenaires sont une liste organisée de modèles d'IA générative développés par les partenaires de Google. Les modèles partenaires sont proposés en tant qu'API gérées. Pour en savoir plus, consultez la présentation des modèles partenaires. Les sections suivantes listent les détails de tarification des modèles Google pour les partenaires.
Modèles d'AI21 Labs
Modèle | Tarifs |
---|---|
Jamba 1.5 Large | Entrée: 2 $ par million de jetons Sortie: 8 $ par million de jetons |
Jamba 1.5 Mini | Entrée: 0,20 $ par million de jetons Sortie: 0,40 $ par million de jetons |
Modèles Claude d'Anthropic
Modèle | Tarifs |
---|---|
Claude Opus 4 | Entrée: 15 $ / million de jetons Sortie: 75 $ / million de jetons Entrée par lot: 7,5 $ / million de jetons Sortie par lot: 37,5 $ / million de jetons Écriture dans le cache: 18,75 $ / million de jetons Récupération dans le cache: 1,5 $ / million de jetons Écriture dans le cache par lot: 9,375 $ / million de jetons Récupération dans le cache par lot: 0,75 $ / million de jetons |
Claude Sonnet 4 | Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons Entrée par lot: 1,50 $ par million de jetons Sortie par lot: 7,50 $ par million de jetons Écriture dans le cache: 3,75 $ par million de jetons Récupération dans le cache: 0,30 $ par million de jetons Écriture dans le cache par lot: 1,875 $ par million de jetons Récupération dans le cache par lot: 0,15 $ par million de jetons |
Claude 3.7 Sonnet | Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons Entrée par lot: 1,50 $ par million de jetons Sortie par lot: 7,50 $ par million de jetons Écriture dans le cache: 3,75 $ par million de jetons Récupération dans le cache: 0,30 $ par million de jetons Écriture dans le cache par lot: 1,875 $ par million de jetons Récupération dans le cache par lot: 0,15 $ par million de jetons |
Claude 3.5 Haiku | Entrée: 0,80 $ / million de jetons Sortie: 4 $ / million de jetons Entrée par lot: 0,40 $ / million de jetons Sortie par lot: 2 $ / million de jetons Écriture dans le cache: 1 $ / million de jetons Récupération dans le cache: 0,08 $ / million de jetons Écriture dans le cache par lot: 0,50 $ / million de jetons Récupération dans le cache par lot: 0,04 $ / million de jetons |
Claude 3.5 Sonnet v2 | Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons Entrée par lot: 1,50 $ par million de jetons Sortie par lot: 7,50 $ par million de jetons Écriture dans le cache: 3,75 $ par million de jetons Récupération dans le cache: 0,30 $ par million de jetons Écriture dans le cache par lot: 1,875 $ par million de jetons Récupération dans le cache par lot: 0,15 $ par million de jetons |
Claude 3.5 Sonnet | Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons Écriture dans le cache: 3,75 $ par million de jetons Coup de chance dans le cache: 0,30 $ par million de jetons |
Claude 3 Haiku | Entrée: 0,25 $ par million de jetons Sortie: 1,25 $ par million de jetons Écriture dans le cache: 0,30 $ par million de jetons Coup de chance dans le cache: 0,03 $ par million de jetons |
Claude 3 Sonnet (deprecated) | Entrée: 3 $ par million de jetons Sortie: 15 $ par million de jetons |
Claude 3 Opus | Entrée: 15 $ par million de jetons Sortie: 75 $ par million de jetons Écriture dans le cache: 18,75 $ par million de jetons Coup de chance dans le cache: 1,50 $ par million de jetons |
Modèles Llama de Meta
Modèle | Tarifs |
---|---|
Llama 3.1 405B | Entrée: 5 $ par million de jetons Sortie: 16 $ par million de jetons |
Llama 3.3 70 Mrd * | Entrée: 0,72 $ par million de jetons Sortie: 0,72 $ par million de jetons |
Llama 4 Scout * | Entrée: 0,25 $ par million de jetons Sortie: 0,70 $ par million de jetons |
Llama 4 Maverick * | Entrée: 0,35 $ / million de jetons Sortie: 1,15 $ / million de jetons |
- Disponible sans frais jusqu'au 1er mai 2025.
Modèles Mistral AI
Modèle | Tarifs |
---|---|
Mistral OCR (25.05) | Entrée: 0,0005 $ / million de jetons (ou 0,0005 $/page) Sortie: 0,0005 $ / million de jetons (ou 0,0005 $/page) |
Mistral Small 3.1 (25.03) | Entrée: 0,10 $ par million de jetons Sortie: 0,30 $ par million de jetons |
Mistral Large (24.11) | Entrée: 2 $ / million de jetons Sortie: 6 $ / million de jetons |
Mistral Nemo | Entrée: 0,15 $ / million de jetons Sortie: 0,15 $ / million de jetons |
Codestral (25.01) | Entrée: 0,30 $ par million de jetons Sortie: 0,90 $ par million de jetons |