L'optimiseur de modèle Vertex AI est un point de terminaison dynamique conçu pour simplifier la sélection des modèles en appliquant automatiquement le modèle Gemini qui répond le mieux à vos besoins. Cela vous permet de pointer vos requêtes vers un seul métapoint de terminaison. Le service sélectionne alors intelligemment le modèle Gemini le plus approprié pour votre requête (Pro, Flash, etc.) en fonction de vos préférences en termes de coût et de qualité.
Pour en savoir plus sur la tarification de l'optimiseur de modèle, consultez la page Tarification.
Avantages
Avec l'optimiseur de modèle, vous pouvez :
- simplifier la sélection de votre modèle plutôt que choisir un modèle pour chaque application ;
- optimiser les coûts, la qualité ou les deux, ce qui vous permet de trouver le juste équilibre entre performances et budget ;
- effectuer une intégration transparente aux API et SDK Gemini existants ;
- suivre l'utilisation et identifier les opportunités d'économies ;
- gérer efficacement les tâches basées sur le texte sans avoir à sélectionner manuellement le point de terminaison.
Modèles compatibles
- Gemini 2.0 Flash (GA)
- Gemini 2.5 Pro (preview 03-25)
Langages acceptés
L'optimiseur de modèle est compatible avec tous les langages également pris en charge par les modèles Gemini. (voir Langages compatibles avec Gemini)
Modalité
L'optimiseur de modèle est compatible avec les cas d'utilisation de texte, y compris :
- Le codage, dont l'appel de fonction et l'exécution de code
- La synthèse
- Le chat à un seul tour ou multitour
- Les questions et réponses
Pour en savoir plus sur les limites et sur la manière de les gérer, consultez Gérer les fonctionnalités non compatibles.
Premiers pas
Pour commencer à utiliser l'optimiseur de modèle, consultez le guide de démarrage rapide sur le notebook Colab.
Utiliser l'optimiseur de modèle Vertex AI
Gen AI SDK for Python
Installer
pip install --upgrade google-genai
Pour en savoir plus, consultez la documentation de référence du SDK.
Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Gérer les fonctionnalités non compatibles
L'optimiseur de modèle n'accepte que les entrées et les sorties textuelles. Toutefois, la requête peut inclure des modalités ou des outils différents qui ne sont pas compatibles. Les sections suivantes expliquent comment l'optimiseur de modèle gère ces fonctionnalités non compatibles.
Requêtes multimodales
Les requêtes qui incluent des requêtes avec des données multimodales, telles que des vidéos, des images ou de l'audio, génèrent une erreur INVALID_ARGUMENT
.
Outils non compatibles
L'optimiseur de modèle n'accepte que la déclaration de fonction pour les requêtes. Si une requête contient d'autres types d'outils, y compris google_maps
, google_search
, enterprise_web_search
, retrieval
ou browse
, une erreur INVALID_ARGUMENT
est générée.
Envoyer des commentaires
Pour nous faire part de votre expérience avec l'optimiseur de modèle, répondez à notre enquête de satisfaction.
Si vous avez des questions, des problèmes techniques ou des commentaires concernant l'optimiseur de modèle, contactez model-optimizer-support@google.com.
Groupe de discussion client
Pour communiquer directement avec l'équipe de développement, vous pouvez rejoindre le groupe d'écoute sur l'optimiseur de modèle Vertex AI. Cela vous permettra de découvrir le produit et de nous aider à améliorer les fonctionnalités. Les activités du groupe sont les suivantes :
- Ateliers virtuels permettant d'en savoir plus sur les fonctionnalités
- Enquêtes de satisfaction pour faire part de vos besoins et priorités
- Sessions privées avec les employés Google Cloud pour explorer les nouvelles fonctionnalités
Des activités sont proposées environ toutes les six à huit semaines. Vous pouvez participer à autant d'activités que vous le souhaitez ou vous pouvez vous désinscrire à tout moment. Pour rejoindre le groupe, remplissez le formulaire d'inscription au groupe de discussion sur l'optimiseur de modèle Vertex AI.