Cette page a été traduite par l'API Cloud Translation.

Modèles Google

Vertex AI propose une liste croissante de modèles de fondation que vous pouvez tester, déployer et personnaliser pour les utiliser dans vos applications basées sur l'IA. Les modèles de fondation sont adaptés à des cas d'utilisation spécifiques et proposés à des prix différents. Cette page récapitule les modèles disponibles dans les différentes API et vous guide sur le choix des modèles par cas d'utilisation.

Pour en savoir plus sur tous les modèles d'IA et les API sur Vertex AI, consultez la section Explorer les modèles d'IA dans Model Garden.

Modèles Gemini

Le tableau suivant récapitule les modèles disponibles dans l'API Gemini. Pour en savoir plus sur l'API, consultez la documentation de référence de l'API Gemini.

Pour explorer un modèle dans la console Google Cloud, sélectionnez sa fiche de modèle dans Model Garden.

Modèle	Entrées	Résultats	Cas d'utilisation	Essayer le modèle
Gemini 2.0 Flash `gemini-2.0-flash`	Texte, code, images, audio, vidéo, vidéo avec audio, PDF	Texte, Audio (aperçu privé), Images (aperçu privé)	Modèle de travail pour toutes les tâches quotidiennes. Offre des performances globales élevées et est compatible avec l'API Live en streaming en temps réel.	Essayer Gemini 2.0 Flash
Preview de Gemini 2.5 Pro `gemini-2.5-pro-preview-03-25`	Texte, images, vidéo, audio, PDF	Texte	Modèle Gemini de raisonnement le plus avancé, en particulier pour la compréhension multimodale, le codage et la connaissance du monde.	Essayer la version preview de Gemini 2.5 Pro
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	Texte, images, vidéo, audio, PDF	Texte	Notre offre économique pour un débit élevé	Essayer Gemini 2.0 Flash-Lite
Flash Thinking Gemini 2.0 `gemini-2.0-flash-thinking-exp-01-21`	Texte, images	Texte	Fournit des capacités de raisonnement plus efficaces et inclut le processus de réflexion dans les réponses.	Essayer la fonctionnalité Flash Thinking de Gemini 2.0

Les informations suivantes fournissent des détails sur chaque modèle Gemini.

Gemini 2.0 Flash

Nouvelle génération de nos modèles Gemini Flash. Gemini 2.0 Flash offre une vitesse supérieure et prend en charge un plus grand nombre de fonctionnalités, comme le streaming bidirectionnel avec notre API Multimodal Live, la génération de réponses multimodales et l'utilisation d'outils intégrés.

Capacités

Capacité	Disponibilité
Ancrage avec la recherche Google
Exécution du code
Réglage
Instruction système	Consultez la section Utiliser les instructions système.
Génération contrôlée
Débit provisionné	Consultez la section Modèles compatibles.
Prédiction par lot
Appel de fonction

Spécifications

Spécification	Valeur
Nombre maximal de jetons d'entrée	1 048 576
Nombre maximal de jetons de sortie	8 192
Données d'entraînement	Jusqu'en juin 2024

Aperçu de Gemini 2.5 Pro

Gemini 2.5 Pro Preview est notre modèle le plus performant pour la compréhension multimodale, le codage et la connaissance du monde. Il dispose d'une fenêtre de contexte de 1 million de jetons. Gemini 2.5 Pro Preview est disponible en tant que modèle preview dans Vertex AI. Il s'agit d'un chemin d'accès à la mise à niveau pour les utilisateurs de 1.5 Pro qui souhaitent une meilleure qualité ou qui sont particulièrement investis dans le contexte et le code longs.

Capacités

Capacité	Disponibilité
Ancrage avec la recherche Google
Exécution du code
Réglage
Instruction système	Consultez la section Utiliser les instructions système.
Génération contrôlée
Débit provisionné	Consultez la section Modèles compatibles.

Spécifications

Spécification	Valeur
Nombre maximal de jetons d'entrée	1 048 576
Nombre maximal de jetons de sortie	64 000
Données d'entraînement	Jusqu'en janvier 2025
Limite de quota	20 requêtes par minute (RPM)

Gemini 2.0 Flash-Lite

Gemini 2.0 Flash-Lite est notre modèle Flash le plus rapide et le plus économique. Il offre une meilleure qualité et une meilleure vitesse.

Capacités

Capacité	Disponibilité
Ancrage avec la recherche Google
Exécution du code
Réglage
Instruction système	Consultez la section Utiliser les instructions système.
Génération contrôlée
Débit provisionné	Consultez la section Modèles compatibles.
Prédiction par lot
Appel de fonction

Spécifications

Spécification	Valeur
Nombre maximal de jetons d'entrée	1 048 576
Nombre maximal de jetons de sortie	8 192
Données d'entraînement	Jusqu'en janvier 2025

Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking est un modèle de calcul expérimental au moment du test, qui est entraîné à générer le "processus de réflexion" que le modèle suit dans le cadre de sa réponse. Par conséquent, Flash Thinking est capable de fournir des capacités de raisonnement plus efficaces dans ses réponses que le modèle de base Gemini 2.0 Flash. Pour en savoir plus, consultez la documentation sur la réflexion Flash de Gemini 2.0.

Capacités

Capacité	Disponibilité
Ancrage avec la recherche Google
Réglage
Instruction système	Consultez la section Utiliser les instructions système.
Génération contrôlée
Débit provisionné	Consultez la section Modèles compatibles.

Spécifications

Spécification	Valeur
Nombre maximal de jetons d'entrée	1 048 576
Nombre maximal de jetons de sortie	65 536
Données d'entraînement	Jusqu'en mai 2024

Langues compatibles avec Gemini

Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes :

Arabe (ar), bengali (bn), bulgare (bg), chinois simplifié et traditionnel (zh), croate (hr), tchèque (cs), danois (da), néerlandais (nl), anglais (en), estonien (et), finnois (fi), français (fr), allemand (de), grec (el), hébreu (iw), hindi (hi), hongrois (hu), indonésien (id), italien (it), japonais (ja), coréen (ko), letton (lv), lituanien (lt), norvégien (no), polonais (pl), portugais (pt), roumain (ro), russe (ru), serbe (sr), slovaque (sk), slovène (sl), espagnol (es), swahili (sw), suédois (sv), thaï (th), turc (tr), ukrainien (uk), vietnamien (vi)
Les modèles Gemini 2.0 Flash, Gemini 1.5 Pro et Gemini 1.5 Flash peuvent comprendre et répondre dans les langues supplémentaires suivantes:

Afrikaans (af), amharique (am), assamais (as), azéri (az), biélorusse (be), bosniaque (bs), catalan (ca), cebuano (ceb), corse (co), gallois (cy), divehi (dv), espéranto (eo), basque (eu), farsi (fa), philippin (tagalog) (fil), frison (fy), irlandais (ga), gaélique écossais (gd), galicien (gl), gujarati (gu), haoussa (ha), hawaïen (haw), hmong (hmn), créole haïtien (ht), arménien (hy), igbo (ig), islandais (is), javanais (jv), géorgien (ka), kazakh (kk), khmer (km), kannara (kn), krio (kri), kurde (ku), kirghize (ky), latin (la), luxembourgeois (lb), lao (lo), malgache (mg), maori (mi), macédonien (mk), malayalam (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marathi (mr), malais (ms), maltais (mt), myanmar (birman) (my), népalais (ne), nyanja (chichewa) (ny), odia (oriya) (or), pendjabi (pa), pachto (ps), sindhî (sd), singhalais (sinhalé) (si), samoan (sm), shona (sn), somali (so), albanais (sq), sesotho (st), Soundanais (su), tamoul (ta), télougou (te), tadjik (tg), ouïghour (ug), ourdou (ur), ouzbek (uz), xhosa (xh), yiddish (yi), yoruba (yo), zoulou (zu)

Modèles Gemma

Le tableau suivant récapitule les modèles Gemma.

Modèle	Entrées	Résultats	Cas d'utilisation	Essayer le modèle
Gemma 3 Détails du modèle	Texte, images	Texte	Modèle ouvert léger et de petite taille compatible avec la génération de texte et les tâches de compréhension des images, y compris la réponse à des questions, la synthèse et le raisonnement. Déployable dans des environnements dont les ressources sont limitées.	Essayer Gemma 3
Gemma 2 Détails du modèle	Texte	Texte	Modèle de texte ouvert léger et de petite taille compatible avec la génération, la synthèse et l'extraction de texte. Déployable dans des environnements dont les ressources sont limitées.	Essayer Gemma 2
Gemma Détails du modèle	Texte	Texte	Modèle de texte ouvert léger et de petite taille compatible avec la génération, la synthèse et l'extraction de texte. Déployable dans des environnements dont les ressources sont limitées.	Essayer Gemma
CodeGemma Détails du modèle	Texte, code, PDF	Texte	Ensemble de modèles de code ouvert légers basés sur Gemma. Idéal pour la génération et la complétion de code.	Essayer CodeGemma
PaliGemma 2 Détails du modèle	Texte, images	Texte	Un modèle de vision-langage léger (VLM). Idéal pour les tâches de légendes d'images et de questions-réponses visuelles.	Essayer PaliGemma 2
PaliGemma Détails du modèle	Texte, images	Texte	Un modèle de vision-langage léger (VLM). Idéal pour les tâches de légendes d'images et de questions-réponses visuelles.	Essayer PaliGemma
ShieldGemma 2 Détails du modèle	Texte, images	Texte	Un modèle de vision-langage léger (VLM) qui vérifie la sécurité des images naturelles et synthétiques pour vous aider à créer des ensembles de données et des modèles robustes.	Essayer ShieldGemma 2
TxGemma Détails du modèle	Texte	Texte	Ensemble de modèles de langage légers et ouverts pour accélérer le développement de produits thérapeutiques. Idéal pour les tâches de prédiction thérapeutique, y compris la classification, la régression ou la génération, ainsi que les tâches de raisonnement.	Essayer TxGemma

Langues acceptées avec Gemma

Gemma et Gemma 2 ne sont disponibles qu'en anglais. Gemma 3 est disponible dans plus de 140 langues.

Modèles d'embeddings

Le tableau suivant récapitule les modèles disponibles dans l'API Embeddings :

Nom du modèle	Description	Spécifications	Essayer le modèle
Embeddings pour le texte (`text-embedding-004, text-embedding-005`) Détails du modèle	Renvoie des embeddings pour les entrées de texte en anglais. Compatible avec le réglage supervisé des modèles d'Embeddings pour le texte, en anglais uniquement.	Nombre maximal de jetons d'entrée: 2 048. Dimensions d'embedding: `text-embedding-004, text-embedding-005`: <=768. Autres: 768.	Essayer les embeddings pour le texte
Embeddings pour le texte multilingue (`text-multilingual-embedding-002`) Détails du modèle	Renvoie des embeddings pour des entrées de texte dans plus de 100 langues Compatible avec le réglage supervisé du modèle `text-multilingual-embedding-002`. Plus de 100 langues acceptées	Nombre maximal de jetons d'entrée : 2 048 Dimension d'embedding : `text-multilingual-embedding-002` : <=768 Autres : 768	Essayer les embeddings pour le texte multilingue
Embeddings multimodaux `(multimodalembedding)` Détails du modèle	Renvoie des embeddings pour les entrées de texte, d'image et de vidéo, afin de comparer les contenus entre différents modèles. Convertit le texte, les images et les vidéos dans le même espace vectoriel. La vidéo n'accepte que 1 408 dimensions. Anglais uniquement	Nombre maximal de jetons d'entrée : 32. Taille maximale de l'image : 20 Mo. Durée maximale de la vidéo : deux minutes. Dimensions d'embedding : 128, 256, 512, ou 1 408 pour l'entrée texte+image, 1 408 pour l'entrée vidéo.	Essayer les embeddings multimodaux
Embeddings pour le texte (anglais, multilingue, code) (`text-embedding-large-exp-03-07`) Détails du modèle	Renvoie des embeddings pour des entrées de texte dans plus de 100 langues, ainsi que pour le code Python et Java. Il s'agit d'un modèle expérimental. Les modèles expérimentaux ne suivent pas le plan de cycle de vie et le schéma de gestion des versions standards de Google, et un modèle peut être remplacé par un autre sans préavis. Nous ne garantissons pas qu'un modèle expérimental deviendra un modèle stable à l'avenir.	Nombre maximal de jetons d'entrée: 8 192 Dimensions d'embedding: 3 072	Essayer les embeddings pour le texte volumineux

Langues compatibles avec les embeddings

Les modèles d'embeddings multilingues de texte sont compatibles avec les langues suivantes :
afrikaans, albanais, amharique, arabe, arménien, azéri, basque, biélorusse, bengali, bulgare, birman, catalan, cebuano, chewa, chinois, corse, tchèque danois, néerlandais, anglais, esperanto, estonien, philippin, finlandais, français, galicien, géorgien, allemand, grec, gujarati, créole haïtien, haoussa, hawaïen, hébreu, hindi, hmong, hongrois, islandais, igbo, indonésien, irlandais, italien, japonais, javanais, kannada, kazakh, khmer, coréen, kurde, kirghize, lao, latin, letton, lituanien, luxembourgeois, macédonien, malgache, malais, malayalam, malte, maori, marathi, mongolien, népalais, norvégien, pachto, perse, polonais, portugais, pendjabi, roumain, russe, samoan, gaélique écossais, serbe, shona, sindhi, singhalais, slovaque, slovénien, somalien, sotho, espagnol, soudanais, swahili, suédois, tadjik, tamoul, telougou, thaï, turc, ukrainien, ourdou, ouzbek, vietnamien, gallois, frison occidental, xhosa, yiddish, yoruba, zoulou.

Modèle Imagen

Le tableau suivant récapitule les modèles disponibles dans l'API Imagen :

Modèle	Entrées	Résultats	Cas d'utilisation	Essayer le modèle
Imagen 3 (`imagen-3.0-generate-001`, `imagen-3.0-fast-generate-001`) Imagen 2 (`imagegeneration@006`, `imagegeneration@005`) Imagen (`imagegeneration@002`) Détails du modèle	Texte	Images	Ce modèle est compatible avec la génération et la modification d'images pour créer des images de haute qualité en quelques secondes. Cela inclut la génération d'images à l'aide de l'apprentissage sans échantillon.	Essayez Imagen pour la génération d'images
Imagen 3 (Modification et personnalisation) (`imagen-3.0-capability-001`) Imagen 2 (Modification) (`imagegeneration@006`) Imagen (Modification) `imagegeneration@002`) Détails du modèle	Texte et images	Images	Ce modèle est compatible avec la modification et la génération d'images personnalisées (à quelques images) pour créer des images de haute qualité en quelques secondes. La fonctionnalité de retouche permet de réaliser des inpaintings (suppression ou insertion d'objets), des outpaintings et de modifier des images de produits. La personnalisation est compatible avec l'apprentissage few-shot, ce qui vous permet de fournir des images de référence pour guider la génération d'images de sortie. Ce modèle est compatible avec les types de personnalisation suivants : sujet (produit, personne et animal de compagnie), style, personnalisation contrôlée (croquis ou bordure intelligente) et personnalisation par instruction (transfert de style).	Essayez Imagen pour la modification et la personnalisation

Langues acceptées avec Imagen 3

Imagen 3 est compatible avec les langues suivantes :
anglais, chinois, hindi, japonais, coréen, portugais et espagnol.

Modèle de complétion de code

Le tableau suivant récapitule les modèles disponibles dans les API Codey :

Modèle	Entrées	Résultats	Cas d'utilisation	Essayer le modèle
Codey pour la complétion de code (`code-gecko`) Détails du modèle	Code dans les langages acceptés	Code dans les langages acceptés	Un modèle affiné pour suggérer la complétion de code en fonction du contexte du code écrit.	Essayer Codey pour la complétion de code

Langues acceptées avec le modèle de complétion de code

Le modèle de complétion de code est compatible avec l'anglais.

Modèles MedLM

Le tableau suivant récapitule les modèles disponibles dans l'API MedLM :

Nom du modèle	Description	Spécifications	Essayer le modèle
MedLM-medium (`medlm-medium`) Détails du modèle	Suite conforme à la loi HIPAA, qui repose sur des API et des modèles médicaux optimisés mis en œuvre par Google Research. Ce modèle aide les professionnels de la santé à répondre à des questions médicales et à résumer des documents médicaux et de santé. Offre un meilleur débit et inclut des données plus récentes que le modèle `medlm-large`.	Nombre maximal de jetons (entrée + sortie) : 32 768 Nombre maximal de jetons de sortie : 8 192	Essayer MedLM-medium
MedLM-large (`medlm-large`) Détails du modèle	Suite conforme à la loi HIPAA, qui repose sur des API et des modèles médicaux optimisés mis en œuvre par Google Research. Ce modèle aide les professionnels de la santé à répondre à des questions médicales et à résumer des documents médicaux et de santé.	Nombre maximal de jetons d'entrée : 8 192 Nombre maximal de jetons de sortie : 1 024	Essayer MedLM-large

Compatibilité avec le débit provisionné MedLM

MedLM-medium et MedLM-large sont compatibles avec le débit provisionné. Consultez la section Modèles compatibles.

Langues compatibles avec MedLM

Le modèle MedLM est compatible avec l'anglais.

Emplacements

Pour obtenir la liste des emplacements où ces modèles sont disponibles, consultez la section IA générative sur les emplacements Vertex AI.

Versions de modèle

Pour en savoir plus sur les versions de modèles, consultez la section Versions de modèles.

Explorer tous les modèles dans Model Garden

Model Garden est une plate-forme qui vous permet de découvrir, de tester, de personnaliser et de déployer des modèles de Google, puis de sélectionner des modèles et des éléments OSS. Pour explorer les modèles d'IA générative et les API disponibles sur Vertex AI, accédez à Model Garden dans la console Google Cloud.

Accéder à la page "Jardin de modèles"

Pour en savoir plus sur Model Garden, y compris sur les modèles et fonctionnalités disponibles, consultez la page Explorer les modèles d'IA dans Model Garden.

Étapes suivantes

Suivez un tutoriel de démarrage rapide sur Vertex AI Studio ou sur l'API Vertex AI.
Découvrez comment tester les requêtes de texte.
Découvrez comment tester les requêtes de chat.
Découvrez les modèles pré-entraînés dans Model Garden.
Découvrez comment ajuster un modèle de fondation.
Découvrez les bonnes pratiques d'IA responsable et les filtres de sécurité de Vertex AI.
Découvrez comment contrôler l'accès à des modèles spécifiques dans Model Garden à l'aide d'une règle d'administration Model Garden.

Modèles Google Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Modèles Gemini

Gemini 2.0 Flash

Capacités

Spécifications

Aperçu de Gemini 2.5 Pro

Capacités

Spécifications

Gemini 2.0 Flash-Lite

Capacités

Spécifications

Gemini 2.0 Flash Thinking

Capacités

Spécifications

Langues compatibles avec Gemini

Modèles Gemma

Langues acceptées avec Gemma

Modèles d'embeddings

Langues compatibles avec les embeddings

Modèle Imagen

Langues acceptées avec Imagen 3

Modèle de complétion de code

Langues acceptées avec le modèle de complétion de code

Modèles MedLM

Compatibilité avec le débit provisionné MedLM

Langues compatibles avec MedLM

Emplacements

Versions de modèle

Explorer tous les modèles dans Model Garden

Étapes suivantes

Modèles Google