Dans le contexte de l'IA générative, l'ancrage désigne la capacité à connecter les résultats du modèle à des sources d'information vérifiables. Si vous autorisez des modèles à accéder à des sources de données spécifiques, l'ancrage lie leurs résultats à ces données et réduit les chances d'inventer du contenu. Cela est particulièrement important dans les cas où la justesse et la fiabilité sont importantes.
L'ancrage offre les avantages suivants :
- Réduit les hallucinations du modèle, c'est-à-dire les cas où le modèle génère un contenu qui n'est pas factuel.
- Ancre les réponses du modèle à des informations spécifiques.
- Améliore la fiabilité et l'applicabilité du contenu généré.
Dans Vertex AI, vous pouvez ancrer les résultats de modèle compatibles de deux manières principales :
Ancrage avec la recherche Google
Lorsque vous utilisez l'ancrage avec la recherche Google, il associe le modèle Google à Internet. Étant donné que les réponses d'un modèle d'IA générative sans ancrage sont considérées comme du nouveau contenu reposant sur des schémas appris, vous n'obtiendrez pas de réponses factuelles spécifiques à un moment précis, par exemple si vous demandez des prévisions météorologiques dans votre requête. Étant donné qu'Internet permet d'accéder à des informations existantes et nouvelles, une requête avec ancrage peut vous fournir des réponses de requête nuancées et spécifiques, avec peu d'erreurs et avec des sources citées.
L'ancrage avec la recherche Google est compatible avec la récupération dynamique, qui vous permet de générer des résultats ancrés avec la recherche Google uniquement lorsque cela est nécessaire. Par conséquent, la configuration de récupération dynamique évalue si une requête nécessite des connaissances sur les événements récents et active la fonctionnalité Grounding avec la recherche Google. Pour en savoir plus, consultez la section Récupération dynamique.
Voici un exemple comparant une réponse de requête sans ancrage et une réponse avec ancrage :
Gemini sans ancrage | Ancrage avec la recherche Google |
---|---|
Requête : Quelle est la limite de contribution du 401k ? Réponse : Pour 2023, la limite de contribution annuelle pour les 401(k) est de 22 500 $, contre 20 500 $ en 2022. Les contributions de rattrapage pour les personnes âgées de plus 50 ans restent à 7500 $. |
Requête : Quelle est la limite de contribution du 401k ? Réponse : Voici les limites de contribution 401(k) en 2024 : La limite de base pour les contributions des salariés est de 23 000 $ pour 2024. Ce chiffre était de 22 500 $ en 2023. Si vous avez au moins 50 ans, vous pouvez également verser 7 500 $ de contributions de rattrapage supplémentaires. |
- Pour utiliser l'ancrage avec la recherche Google, consultez Ancrage avec des données publiques en utilisant la recherche Google.
Lorsque vous utilisez l'ancrage avec la recherche Google et que vous recevez des suggestions de recherche Google dans votre réponse, vous devez afficher les suggestions de recherche en production et dans vos applications. Consultez la section Suggestions de recherche pour connaître les conditions requises lors de l'utilisation de l'ancrage avec la recherche Google.
Le schéma suivant explique comment l'utilisation de l'ancrage avec la recherche Google fonctionne pour l'API Gemini :
Ancrage basé sur vos propres données
Vous pouvez ancrer des modèles de langage sur vos propres données textuelles en utilisant Vertex AI Search en tant que datastore. Avec Vertex AI Search, vous intégrez vos propres données, quel que soit leur format, pour affiner la sortie du modèle. Les types de données suivants sont pris en charge :
- Données de site Web : utilisez directement le contenu de votre site Web.
- Données non structurées : utilisez des données brutes non formatées.
Avec l'ancrage basé sur vos propres données spécifiques, le modèle peut fonctionner au-delà de ses données d'entraînement. En établissant un lien à des data stores désignés dans Vertex AI Search, le modèle ancré peut produire des réponses plus précises et plus pertinentes, ainsi que des réponses directement liées à votre cas d'utilisation.
Voici un exemple comparant une réponse de requête sans ancrage privé et une réponse avec ancrage :
Gemini sans ancrage | Gemini avec ancrage privé |
---|---|
Requête : Quelle est la politique de mon entreprise concernant les PTO ? Réponse : Je ne peux pas répondre définitivement aux questions concernant la politique de votre entreprise concernant les PTO. Les règles concernant les PTO sont définies par les entreprises individuelles et peuvent varier en fonction de la taille, de la zone géographique et du secteur de votre entreprise. |
Requête : Quelle est la politique de mon entreprise concernant les PTO ? Réponse : Votre entreprise dispose d'une politique de PTO illimitée. L'approbation est toujours requise : votre responsable doit approuver ou refuser les demandes en fonction de la charge de travail, de la couverture et des besoins de l'entreprise. |
- Pour ancrer des modèles Gemini sur vos données, consultez la section Ancrage basé sur vos propres données.