Migrer votre application vers Gemini 2 avec l'API Gemini dans Vertex AI

Ce guide explique comment migrer des applications d'IA générative depuis les modèles Gemini 1.x et PaLM vers les modèles Gemini 2.

Pourquoi migrer vers Gemini 2 ?

Gemini 2 offre de bien meilleures performances que les modèles Gemini 1.x et PaLM, et comporte de nouvelles fonctionnalités. De plus, chaque version de modèle dispose de son propre calendrier de compatibilité et de disponibilité.

La mise à niveau de la plupart des applications d'IA générative vers Gemini 2 ne devrait pas nécessiter de refonte importante des requêtes et du code. Toutefois, les requêtes de certaines applications doivent être modifiées. Ces modifications sont difficiles à prévoir sans exécuter d'abord les requêtes dans Gemini 2. Par conséquent, nous vous recommandons de tester Gemini 2 avant la migration.

Des modifications de code importantes ne sont nécessaires que pour certaines modifications destructives ou pour utiliser les nouvelles fonctionnalités de Gemini 2.

Vers quel modèle Gemini 2 migrer ?

Lorsque vous choisissez le modèle Gemini 2 vers lequel migrer, vous devez tenir compte des fonctionnalités requises par votre application, ainsi que de leur coût.

Pour en savoir plus sur les fonctionnalités du modèle Gemini 2, consultez Gemini 2. Pour en savoir plus sur tous les modèles Google, consultez Modèles Google.

Pour comparer les modèles Gemini disponibles, consultez le tableau suivant.

Fonctionnalité Gemini 1.5 Pro Gemini 1.5 Flash Gemini 2.0 Flash Gemini 2.0 Flash-Lite Gemini 2.5 Pro Gemini 2.5 Flash
Modes d'entrée Texte, document, image, vidéo, audio Texte, document, image, vidéo, audio Texte, document, image, vidéo, audio Texte, document, image, vidéo, audio Texte, document, image, vidéo, audio Texte, document, image, vidéo, audio
Modes de sortie Texte Texte Texte Texte Texte Texte
Fenêtre de contexte, limite totale de jetons 2 097 152 1 048 576 1 048 576 1 048 576 1 048 576 1 048 576
Longueur du contexte de sortie 8 192 8 192 8 192 8 192 64 192 64 192
Ancrage avec la recherche Oui Oui Oui Non Oui Oui
Appel de fonction Oui Oui Oui Oui Oui Oui
Exécution de code Non Non Oui Non Oui Oui
Mise en cache du contexte Oui Oui Oui Non Oui Oui
Prédiction par lot Oui Oui Oui Oui Oui Oui
API Live Non Non Non Non Non Non
Latence Le plus performant de la famille 1.5 Le plus rapide de la famille 1.5 Rapide et économique Rapide et le plus économique Plus lent que Flash, mais bonne efficacité en termes de coûts Rapide et le plus économique
Réglage Oui Oui Oui Oui Oui Oui
SDK recommandé SDK Vertex AI SDK Vertex AI SDK Gen AI SDK Gen AI SDK Gen AI SDK Gen AI
Unités de tarification Caractère Caractère Jeton Jeton Jeton Jeton

Présentation du processus de migration

Ce document décrit un processus en huit étapes pour migrer votre application vers Gemini 2. Utilisez le diagramme suivant pour accéder à chaque étape.

Processus

Avant de commencer

Exigences concernant l'évaluation et les tests du modèle

Mises à niveau et tests du code

Évaluation hors connexion

Évaluer les résultats de l'évaluation et régler les requêtes et les hyperparamètres de Gemini 2

Tests de charge

Évaluation en ligne

Déploiement en production

Améliorer les performances du modèle

Une fois votre migration terminée, suivez les conseils ci-dessous pour optimiser les performances du modèle Gemini 2:

  • Examinez vos instructions système, vos requêtes et vos exemples d'apprentissage few-shot pour détecter les incohérences, les contradictions, ou les instructions et exemples non pertinents.
  • Testez un modèle plus puissant. Par exemple, si vous avez évalué Gemini 2.0 Flash-Lite, essayez Gemini 2.0 Flash.
  • Examinez les résultats de l'évaluation automatisée pour vous assurer qu'ils correspondent à ceux du jugement humain, en particulier les résultats qui utilisent un modèle d'évaluation. Assurez-vous que les instructions de votre modèle d'évaluation ne contiennent pas d'incohérences ni d'ambiguïtés.
  • Pour améliorer les instructions du modèle d'évaluation, vous pouvez les tester avec plusieurs personnes de manière isolée et vérifier si leurs jugements sont cohérents. Si ces personnes interprètent les instructions différemment et ont des jugements différents, les instructions de votre modèle d'évaluation sont ambiguës.
  • Réglez le modèle Gemini 2.
  • Examinez les résultats de l'évaluation pour rechercher des tendances de types d'échecs spécifiques. En regroupant les échecs dans différents modèles, types ou catégories, vous pouvez obtenir des données d'évaluation plus ciblées et ainsi ajuster plus facilement les requêtes pour corriger ces erreurs.
  • Assurez-vous d'évaluer indépendamment les différents composants d'IA générative.
  • Essayez d'ajuster les paramètres d'échantillonnage des jetons.

Obtenir de l'aide

Si vous avez besoin d'aide, Google Cloud propose des formules d'assistance répondant à différents besoins, telles que la couverture 24h/24, 7j/7, l'assistance téléphonique et l'accès à un responsable de l'assistance technique. Pour en savoir plus, consultez l'assistance Google Cloud.

Étapes suivantes