Créer et optimiser des requêtes Gemini dans Vertex AI Studio

Utilisez Vertex AI Studio pour concevoir, tester et personnaliser les requêtes envoyées aux grands modèles de langage (LLM) Gemini et PaLM 2 de Google. Vous pouvez afficher l'API Gemini dans Vertex AI et le code de l'API Vertex AI utilisé pour générer les réponses.

À partir de Vertex AI Studio, vous pouvez effectuer les opérations suivantes :

Tester des modèles à l'aide d'exemples de requête fournis
Concevoir et gérer vos requêtes
Comparer le résultat de la requête par modèle
Évaluer vos requêtes avec des métriques de qualité sélectionnées
Régler les modèles pour obtenir des réponses personnalisées
Ancrer la sortie du modèle à Vertex AI Search ou à la recherche Google
Obtenir le code de l'API Vertex AI pour implémenter votre travail

Avant de commencer à créer des requêtes dans Vertex AI Studio

Lorsque vous utilisez Vertex AI Studio avec un compte d'essai gratuit Google Cloud ou sans vous connecter à Google Cloud, certaines fonctionnalités ne sont pas disponibles, comme indiqué dans le tableau suivant. Pour tester Vertex AI Studio, acceptez les conditions d'utilisation de Vertex AI Studio dans la console Google Cloud.

	Utiliser sans compte Google Cloud	Utiliser avec un compte d'essai gratuit Google Cloud	Utiliser avec un compte Google Cloud existant
Connexion obligatoire	Non	Oui	Oui
Requêtes par minute (RPM)	2 RPM pour tous les modèles multimodaux	Consulter les limites de quota	Consulter les limites de quota
Crédits offerts	0 $	Jusqu'à 300 $ pendant 90 jours	0 $
Galerie de requêtes	Non	Oui	Oui
Outil de conception de requêtes	Oui	Oui	Oui
Enregistrer les requêtes	Non	Oui	Oui
Historique des requêtes	Non	Oui	Oui
Paramètres avancés	Non	Non	Oui
Réglage	Non	Non	Oui
Utilisation de l'API	Non	Oui	Oui
Facturation obligatoire	Non	Non	Oui
Premiers pas	Accéder à Vertex AI Studio	S'inscrire à un essai gratuit	Essayer Vertex AI Studio dans votre console

Créer un compte Google Cloud pour commencer

Pour essayer ce guide de démarrage rapide, vous devez créer un compte Google Cloud. Avec ce compte, vous bénéficiez d'un crédit de 300 $ et de l'utilisation gratuite de plus de 20 produits, non déduits de votre crédit de 300 $.

Essai gratuit

Pour en savoir plus sur la configuration dans Google Cloud après la création de votre compte, consultez la page Configurer Google Cloud.

Tester un modèle de langage à partir de la galerie de requêtes

Accédez à la page Galerie de requêtes à partir de la section Vertex AI dans la console Google Cloud.
Accéder à la galerie de requêtes
Dans le menu déroulant Tâches, sélectionnez Synthèse.
Ouvrez la fiche Résumé de la transcription.

Le modèle, les paramètres, les exemples et la requête de test sont préremplis.
Pour générer un résumé de la requête, cliquez sur Envoyer dans la section Test.

La réponse s'affiche dans la section Sortie.
Facultatif : Pour afficher d'autres résultats, sélectionnez un autre modèle dans la liste Modèle ou modifiez les paramètres, puis cliquez sur Envoyer.
Facultatif : Pour afficher le code de l'API Vertex AI dont vous avez besoin pour générer un résumé de la transcription, cliquez sur Obtenir le code.

Maîtriser la conception et le test des requêtes dans Vertex AI Studio

Vous pouvez créer et tester vos requêtes (entrées) pour des tâches pertinentes dans votre cas d'utilisation métier, et générer des réponses correspondantes. En ajoutant des entrées et des sorties, le LLM est capable d'apprendre en contexte à partir des exemples de réponses.

Vous pouvez créer une requête qui donne une instruction précise et demande au LLM de terminer une phrase pour vous ou de répondre à des questions individuelles.

Accédez à la page Vertex AI Studio à partir de la section Vertex AI dans la console Google Cloud.
Accéder à Vertex AI Studio
Dans la section Générer avec Gemini, cliquez sur Ouvrir le mode forme libre.

Une requête sans titre s'affiche.
Dans la zone de requête, ajoutez une description claire et concise de la tâche que le modèle doit effectuer, par exemple, Suggest a name for a flower shop that sells bouquets of dried flowers.
Cliquez sur Envoyer.

Une réponse s'affiche dans la zone de réponse.
Facultatif : Pour afficher différents résultats, ajustez la requête, le modèle ou les paramètres, puis cliquez sur Envoyer.
Facultatif : Pour afficher le code de l'API Vertex AI dont vous avez besoin pour générer une réponse similaire, cliquez sur Obtenir le code.

Comprendre les catégories de requêtes Vertex AI Studio

Dans Vertex AI Studio, vous pouvez tester et personnaliser des requêtes pour différents modèles d'IA générative.

Forme libre : testez les requêtes textuelles et multimodales à l'aide de différents modèles. Pour en savoir plus sur les modèles, consultez la section Modèles Gemini.
Chat : testez des requêtes multitours à l'aide de différents modèles de langage. Pour en savoir plus sur les modèles, consultez la section Modèles Gemini.
Traduction : effectuez une traduction.
Vision : testez la génération de modèles d'images à l'aide de Imagen sur Vertex AI.
Voix : effectuez des opérations de synthèse vocale et de reconnaissance vocale. Pour ce faire, utilisez le modèle Chirp. Pour en savoir plus sur Chirp, consultez la section Chirp : modèle de reconnaissance vocale universel.

Explorer la galerie de requêtes Gemini dans Vertex AI Studio

Des exemples de requêtes sont disponibles dans les sections Forme libre et Chat de Vertex AI Studio. Ils contiennent divers exemples de requêtes préconçus pour illustrer les capacités des modèles. Les exemples de requêtes sont classés par type de tâche, tels que la synthèse, la classification et l'extraction. Chaque requête est préconfigurée avec un modèle et une valeur de paramètre spécifiés. Il vous suffit d'ouvrir l'exemple de requête et de cliquer sur Envoyer pour que le modèle génère une réponse.

Personnaliser et améliorer les requêtes Gemini

La conception de requête est le processus de création manuelle de requêtes qui déclenchent la réponse prévue d'un modèle de langage. En concevant soigneusement les requêtes, vous pouvez inciter le modèle à générer un résultat approprié pour votre cas d'utilisation. La conception d'une requête peut être un moyen efficace de tester la sortie du modèle.

Vertex AI Studio permet à votre équipe de créer, d'enregistrer et d'affiner des requêtes de manière collaborative. Lorsque vous concevez une nouvelle requête, vous pouvez saisir le texte de la requête, choisir le modèle idéal, ajuster les paramètres et tester le modèle pour obtenir un retour immédiat. Lorsqu'une requête est finalisée, vous pouvez l'enregistrer dans votre projet partagé dans Vertex AI Studio.

Pour découvrir comment concevoir des requêtes, consultez la section Présentation des requêtes.

Comparer la sortie du modèle Gemini à l'aide de différentes requêtes

Dans Vertex AI Studio, vous pouvez comparer les résultats de la requête pour voir quelle association de modèle et de paramètres convient le mieux à votre cas d'utilisation.

Dans l'onglet Forme libre, affichez vos requêtes et sélectionnez Comparer à côté des requêtes que vous souhaitez comparer. Vous pouvez comparer jusqu'à trois requêtes côte à côte.

Gérer et organiser les requêtes Gemini à l'aide des pages de requêtes enregistrées

Si vous avez de nombreuses requêtes, vous devez disposer d'un emplacement centralisé pour les gérer. Vous pouvez afficher toutes vos requêtes par type sur la page Requêtes enregistrées. Vous pouvez gérer les versions de vos requêtes, restaurer les versions précédentes, supprimer, exporter et gérer la dénomination des requêtes. Vous pouvez également ajouter des notes aux requêtes à des fins d'archivage et pour collaborer de manière centralisée avec votre équipe chargée des requêtes.

Accéder aux requêtes enregistrées

Ancrer vos requêtes d'IA avec des données vérifiables dans Vertex AI Studio

Dans le contexte de l'IA générative, l'ancrage désigne la capacité à connecter les résultats du modèle à des sources d'information vérifiables. Sur les pages Forme libre et Chat de Vertex AI Studio, vous pouvez choisir d'ancrer la sortie du modèle à Vertex AI Search ou à la recherche Google. Pour en savoir plus sur l'ancrage, consultez la section Présentation de l'ancrage. Pour en savoir plus sur l'ancrage de la sortie du modèle dans la recherche Google, consultez Ancrer avec la recherche Google.

Découvrir des modèles d'IA générative puissants dans Model Garden

Model Garden est une plate-forme qui vous permet de découvrir, de tester, de personnaliser et de déployer des modèles de Google, puis de sélectionner des modèles et des éléments OSS. Pour explorer les modèles d'IA générative et les API disponibles sur Vertex AI, accédez à Model Garden dans la console Google Cloud.

Accéder à la page "Jardin de modèles"

Pour en savoir plus sur Model Garden, y compris sur les modèles et fonctionnalités disponibles, consultez la page Explorer les modèles d'IA dans Model Garden.

Ajuster un modèle Gemini pour améliorer les performances

Bien que la conception de requêtes soit idéale pour les tests rapides, si des données d'entraînement sont disponibles, vous pouvez améliorer la qualité en ajustant le modèle. Le réglage d'un modèle vous permet de personnaliser la réponse du modèle en fonction d'exemples de la tâche que vous souhaitez que le modèle effectue.

Pour savoir comment ajuster un modèle de fondation, consultez la page Ajuster les modèles de fondation.

Utilisez Vertex AI Studio pour concevoir, tester et personnaliser les requêtes envoyées aux grands modèles de langage (LLM) Gemini et PaLM 2 de Google. Une fois qu'un LLM a traité votre requête, il vous envoie sa réponse. Pour en savoir plus sur Vertex AI Studio, consultez la section Tester des modèles dans Vertex AI Studio.

Découvrez les prochaines étapes avec Vertex AI Studio

Découvrez comment concevoir des requêtes textuelles et des requêtes de chat écrit.
Découvrez les embeddings textuels.
Essayez de régler un modèle de langage de fondation.l
Découvrez les bonnes pratiques d'IA responsable et les filtres de sécurité de Vertex AI.
Apprenez à diffuser des réponses en streaming à partir d'un modèle.

Créer et optimiser des requêtes Gemini dans Vertex AI Studio Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.