Versions de modèle et cycle de vie

Chaque modèle de langage de l'IA générative sur Vertex AI est d'abord disponible dans une version Preview, puis dans une version stable. Chaque version stable dispose d'un alias mis à jour automatiquement. Cette page explique comment fonctionne la gestion des versions de modèles avec tous les modèles Google.

Pour en savoir plus sur les versions d'Imagen sur Vertex AI et leur cycle de vie, consultez la page Versions et cycle de vie des modèles d'Imagen sur Vertex AI.

Si vous réglez un modèle Gemini, le modèle réglé partage la même date d'arrêt que le modèle de base que vous avez utilisé dans le processus de réglage. Pour en savoir plus, consultez Présentation du réglage de modèle pour Gemini.

Version stable de Gemini

Une version stable d'un modèle Gemini ne change pas et reste disponible jusqu'à sa date d'abandon. N'utilisez pas de version stable après sa date d'abandon. Passez à une version stable plus récente et disponible. Vous pouvez identifier une version de modèle stable grâce au numéro à trois chiffres ajouté au nom du modèle. Par exemple, gemini-1.5-pro-001 est la version 1 de la version stable du modèle Gemini 1.5 Pro.

Google publie des versions stables à intervalles réguliers. Vous pouvez passer d'une version stable à une autre tant que l'autre version est toujours disponible. Dans ce cas, exécutez à nouveau vos tâches de réglage, car une requête, une sortie et d'autres différences peut exister entre les versions.

Pour utiliser la version stable d'un modèle Gemini, ajoutez le numéro de version à trois chiffres au modèle avec un trait d'union (-). Par exemple, pour spécifier la version un du modèle gemini-1.5-pro stable, ajoutez -001 au nom du modèle :

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.5-pro-001

Versions de modèle Gemini stables et disponibles

Les versions de modèle stables suivantes sont disponibles pour les modèles Gemini en disponibilité générale :

Modèle Gemini 1.5 Flash Date de disponibilité Date d'arrêt Points clés de la version du modèle
gemini-1.5-flash-002 24 septembre 2024 24 septembre 2025 Amélioration de la qualité générale des modèles avec des gains importants dans les catégories suivantes :
  • Factualité et réduction des hallucinations du modèle.
  • Questions/Réponses Openbook pour les cas d'utilisation de la RAG.
  • Suivi des instructions
  • Compréhension multilingue dans 102 langues, en particulier en coréen, français, allemand, espagnol, japonais, russe et chinois.
  • Génération SQL.
  • Compréhension audio.
  • Compréhension des documents.
  • Contexte long.
  • Mathématiques et raisonnement.

Gemini 1.5 Flash 002 utilise un quota partagé dynamique.

Parfois, gemini-1.5-flash-002 peut répondre dans votre langue locale, même si la requête est écrite dans une autre langue. Ce problème ne concerne que les requêtes non en anglais. Pour atténuer ce problème, nous vous recommandons d'ajouter les éléments suivants à vos instructions système afin de vous assurer que le modèle répond dans la même langue que la requête :

All questions should be answered comprehensively with details, unless the user requests a concise response specifically. Respond in the same language as the query.

gemini-1.5-flash-001 24 mai 2024 24 mai 2025 Version initiale de Gemini 1.5 Flash.
Modèle Gemini 1.5 Pro Date de disponibilité Date d'arrêt Points clés de la version du modèle
gemini-1.5-pro-002 24 septembre 2024 24 septembre 2025 Amélioration de la qualité générale des modèles avec des gains importants dans les catégories suivantes :
  • Factualité et réduction des hallucinations du modèle.
  • Questions/Réponses Openbook pour les cas d'utilisation de la RAG.
  • Suivi des instructions
  • Compréhension multilingue dans 102 langues, en particulier en coréen, français, allemand, espagnol, japonais, russe et chinois.
  • Génération SQL.
  • Compréhension audio.
  • Compréhension des documents.
  • Contexte long.
  • Mathématiques et raisonnement.

Gemini 1.5 Pro 002 utilise un quota partagé dynamique.

Parfois, gemini-1.5-pro-002 peut répondre dans votre langue locale, même si la requête est écrite dans une autre langue. Ce problème ne concerne que les requêtes non en anglais. Pour atténuer ce problème, nous vous recommandons d'ajouter les éléments suivants à vos instructions système afin de vous assurer que le modèle répond dans la même langue que la requête :

All questions should be answered comprehensively with details, unless the user requests a concise response specifically. Respond in the same language as the query.

gemini-1.5-pro-001 24 mai 2024 24 mai 2025 Version initiale de Gemini 1.5 Pro.
Modèle Gemini 1.0 Pro Vision Date de disponibilité Date d'arrêt
gemini-1.0-pro-vision-001 15 février 2024 15 février 2024
Modèle Gemini 1.0 Pro Date de disponibilité Date d'arrêt
gemini-1.0-pro-001 15 février 2024 15 février 2024
gemini-1.0-pro-002 09 avril 2024 9 avril 2025

Alias Gemini mis à jour automatiquement

La version mise à jour automatiquement d'un modèle Gemini pointe vers la version stable la plus récente. Lorsqu'une nouvelle version stable est publiée, la version mise à jour automatiquement pointe vers la nouvelle version. Cela signifie que si vous spécifiez dans votre code la version mise à jour automatiquement d'un modèle Gemini, elle peut se comporter différemment sans préavis lorsque la prochaine version stable est publiée. Par conséquent, soyez prudent si vous réglez votre modèle en utilisant un alias mis à jour automatiquement.

Pour utiliser l'alias mis à jour automatiquement pour un modèle, n'ajoutez rien au nom du modèle. Par exemple, la commande suivante utilise la version gemini-1.0-pro-vision mise à jour automatiquement du modèle :

https://us-central1-aiplatform.googleapis.com/v1/projects/my_project/locations/us-central1/publishers/google/models/gemini-1.0-pro-vision

Alias Gemini mis à jour automatiquement

Le tableau suivant présente les alias mis à jour automatiquement disponibles pour les versions de modèle Gemini et la version stable à chaque référence.

Alias mis à jour automatiquement Version stable référencée
gemini-1.5-flash gemini-1.5-flash-001
Remarque : Pour utiliser la dernière version (002), ajoutez -002 au nom du modèle au lieu d'utiliser l'alias.
gemini-1.0-pro-vision gemini-1.0-pro-vision-001
gemini-1.5-pro gemini-1.5-pro-001
Remarque : Pour utiliser la dernière version (002), ajoutez -002 au nom du modèle au lieu d'utiliser l'alias.
gemini-1.0-pro gemini-1.0-pro-002
gemini-pro-experimental Consultez la section Modèles expérimentaux.
gemini-flash-experimental Consultez la section Modèles expérimentaux.

Versions de modèle stables de complétion de code

Les versions de modèle stables suivantes sont disponibles pour les modèles d'IA générative en disponibilité générale :

modèle code-gecko Date de disponibilité Date d'arrêt
code-gecko@002 6 décembre 2023 9 avril 2025

Versions de modèle stables d'embeddings

Les versions de modèle stables suivantes sont disponibles pour les modèles d'IA générative en disponibilité générale :

Nom du modèle Date de disponibilité Date d'arrêt
text-embedding-004 14 mai 2024 À déterminer.
text-multilingual-embedding-002 14 mai 2024 À déterminer.
textembedding-gecko@003 12 décembre 2021 14 mai 2025
textembedding-gecko-multilingual@001 2 novembre 2023 14 mai 2025
textembedding-gecko@002
(régressif, mais encore compatible)
2 novembre 2023 9 avril 2025
textembedding-gecko@001
(régressif, mais encore compatible)
7 juin 2023 9 avril 2025
multimodalembedding@001 12 février 2024 À déterminer.

Anciens modèles

Pour en savoir plus sur les dates d'arrêt des anciens modèles tels que PaLM 2, consultez la section Informations sur les anciens modèles.