Ancrer avec la recherche Google

Cette page explique comment ancrer les réponses d'un modèle à l'aide de la recherche Google, qui utilise des données Web accessibles au public.

Si vous souhaitez associer votre modèle à des connaissances du monde entier, à un large éventail de sujets ou à des informations à jour sur Internet, utilisez l'ancrage avec la recherche Google.

L'ancrage avec la recherche Google est compatible avec la récupération dynamique, qui vous permet de générer des réponses ancrées avec la recherche Google. Par conséquent, la configuration de récupération dynamique évalue si une requête nécessite des connaissances sur les événements récents et active la fonctionnalité Grounding avec la recherche Google. Pour en savoir plus, consultez la section Récupération dynamique.

Pour en savoir plus sur l'ancrage des modèles dans Vertex AI, consultez la page Présentation de l'ancrage.

Modèles compatibles

Cette section liste les modèles compatibles avec l'ancrage avec la recherche. Pour découvrir comment chaque modèle génère des réponses fondées, suivez ces instructions:

  1. Essayez un modèle listé dans ce tableau dans la console Google Cloud.

  2. Cliquez sur le bouton Ancrage pour l'activer.

Modèle Description Essayer un modèle
Gemini 2.0 Flash

Texte, code, images, audio, vidéo, vidéo avec audio, PDF

La récupération dynamique n'est pas prise en charge. Pour en savoir plus, consultez la section Considérations.

Essayer le modèle Gemini 2.0 Flash
Gemini 1.5 Pro
Saisie de texte uniquement Essayer le modèle Gemini 1.5 Pro
Gemini 1.5 Flash
Saisie de texte uniquement Essayer le modèle Gemini 1.5 Flash

Langues disponibles

Pour obtenir la liste des langues acceptées, consultez la page Langues.

Suivez les instructions ci-dessous pour ancrer un modèle avec des données Web accessibles au public.

Récupération dynamique

Vous pouvez utiliser la récupération dynamique dans votre requête pour choisir quand désactiver l'ancrage dans la recherche Google. Cela est utile lorsque la requête ne nécessite pas de réponse basée sur la recherche Google et que les modèles compatibles peuvent fournir une réponse basée sur leurs connaissances sans ancrage. Cela vous permet de gérer plus efficacement la latence, la qualité et les coûts.

Avant d'appeler la configuration de récupération dynamique dans votre requête, comprenez la terminologie suivante :

  • Score de prédiction: lorsque vous demandez une réponse fondée, Vertex AI attribue un score de prédiction à la requête. Le score de prédiction est une valeur à virgule flottante comprise entre 0 et 1. Sa valeur dépend de la possibilité de l'ancrer avec les informations les plus récentes de la recherche Google. Par conséquent, une requête qui nécessite une réponse basée sur les faits les plus récents sur le Web a un score de prédiction plus élevé. Une requête pour laquelle une réponse générée par le modèle est suffisante a un score de prédiction plus faible.

    Voici des exemples de suggestions et leurs scores de prédiction.

    Requête Score de prédiction Commentaire
    "Écris un poème sur les pivoines" 0,13 Le modèle peut s'appuyer sur ses connaissances et la réponse n'a pas besoin d'être ancrée
    "Propose un jouet pour un enfant de 2 ans" 0,36 Le modèle peut s'appuyer sur ses connaissances et la réponse n'a pas besoin d'être ancrée
    "Peux-tu me donner la recette d'un guacamole d'inspiration asiatique ?" 0.55 La recherche Google peut fournir une réponse fondée, mais la justification n'est pas strictement nécessaire. Les connaissances du modèle peuvent suffire.
    "Qu'est-ce qu'Agent Builder ? Comment est facturé l'ancrage dans Agent Builder ?" 0.72 Nécessite la recherche Google pour générer une réponse pertinente
    "Qui a remporté le dernier Grand Prix de F1 ?" 0,97 Nécessite la recherche Google pour générer une réponse pertinente
  • Seuil : dans votre requête, vous pouvez spécifier une configuration de récupération dynamique avec un seuil. Le seuil est une valeur à virgule flottante comprise entre 0 et 1, et sa valeur par défaut est 0,7. Si la valeur du seuil est nulle, la réponse est toujours ancrée dans la recherche Google. Pour toutes les autres valeurs de seuil, les règles suivantes s'appliquent :

    • Si le score de prédiction est supérieur ou égal au seuil, la réponse est basée sur la recherche Google. Un seuil plus faible implique que davantage de requêtes ont des réponses générées à l'aide de l'ancrage avec la recherche Google.
    • Si le score de prédiction est inférieur au seuil, le modèle peut générer la réponse, mais elle n'est pas ancrée dans la recherche Google.

Pour trouver un seuil adapté à vos besoins commerciaux, vous pouvez créer un ensemble représentatif de requêtes que vous êtes susceptible de rencontrer. Vous pouvez ensuite trier les requêtes en fonction du score de prédiction dans la réponse et sélectionner un seuil adapté à votre cas d'utilisation.

Remarques

  • Pour utiliser l'ancrage avec la recherche Google, vous devez activer les suggestions de recherche Google. Pour en savoir plus, consultez Suggestions de recherche Google.

  • Pour obtenir des résultats optimaux, utilisez une température de 0.0. Pour en savoir plus sur la définition de cette configuration, consultez le corps de la requête API Gemini dans la documentation de référence du modèle.

  • La validation avec la recherche Google est limitée à un million de requêtes par jour. Si vous avez d'autres questions, contactez l'assistanceGoogle Cloud pour obtenir de l'aide.

  • Seuls les modèles Gemini 1.0 et Gemini 1.5 sont compatibles avec la récupération dynamique. Les modèles Gemini 2.0 ne sont pas compatibles avec la récupération dynamique.

Gen AI SDK for Python

Installer

pip install --upgrade google-genai
Pour en savoir plus, consultez la Documentation de référence du SDK.

Définissez des variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import (
    GenerateContentConfig,
    GoogleSearch,
    HttpOptions,
    Tool,
)

client = genai.Client(http_options=HttpOptions(api_version="v1"))

response = client.models.generate_content(
    model="gemini-2.0-flash-001",
    contents="When is the next total solar eclipse in the United States?",
    config=GenerateContentConfig(
        tools=[
            # Use Google Search Tool
            Tool(google_search=GoogleSearch())
        ],
    ),
)

print(response.text)
# Example response:
# 'The next total solar eclipse in the United States will occur on ...'

Console

Pour utiliser l'ancrage avec la recherche Google avec Vertex AI Studio, procédez comme suit :

  1. Dans la console Google Cloud, accédez à la page Studio Vertex AI.

    Accéder à Vertex AI Studio

  2. Cliquez sur l'onglet Forme libre.
  3. Dans le panneau latéral, cliquez sur le bouton d'activation Ancrer des réponses de modèle.
  4. Cliquez sur Personnaliser et définissez la recherche Google comme source.
  5. Saisissez votre requête dans la zone de texte et cliquez sur Envoyer.

Vos réponses de requête sont désormais basées sur la recherche Google.

REST

Avant d'utiliser les données de requête, effectuez les remplacements suivants :

  • LOCATION : région dans laquelle traiter la requête.
  • PROJECT_ID : l'ID de votre projet.
  • MODEL_ID : ID du modèle multimodal. Les modèles Gemini 2.0 et versions ultérieures ne sont pas compatibles avec la récupération dynamique.
  • TEXT : instructions textuelles à inclure dans la requête.
  • DYNAMIC_THRESHOLD : champ facultatif permettant de définir le seuil pour appeler la configuration de récupération dynamique. Il s'agit d'une valeur à virgule flottante comprise entre 0 et 1. Si vous ne définissez pas le champ dynamicThreshold, la valeur du seuil est définie par défaut sur 0,7.

Méthode HTTP et URL :

POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Corps JSON de la requête :

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "googleSearchRetrieval": {
      "dynamicRetrievalConfig": {
        "mode": "MODE_DYNAMIC",
        "dynamicThreshold": DYNAMIC_THRESHOLD
      }
    }
  }],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Pour envoyer votre requête, développez l'une des options suivantes :

Vous devriez recevoir une réponse JSON de ce type :

{
   "candidates": [
     {
       "content": {
         "role": "model",
         "parts": [
           {
             "text": "Chicago weather changes rapidly, so layers let you adjust easily. Consider a base layer, a warm mid-layer (sweater-fleece), and a weatherproof outer layer."
           }
         ]
       },
       "finishReason": "STOP",
       "safetyRatings":[
       "..."
    ],
       "groundingMetadata": {
         "webSearchQueries": [
           "What's the weather in Chicago this weekend?"
         ],
         "searchEntryPoint": {
            "renderedContent": "....................."
         }
         "groundingSupports": [
            {
              "segment": {
                "startIndex": 0,
                "endIndex": 65,
                "text": "Chicago weather changes rapidly, so layers let you adjust easily."
              },
              "groundingChunkIndices": [
                0
              ],
              "confidenceScores": [
                0.99
              ]
            },
          ]
          "retrievalMetadata": {
              "webDynamicRetrievalScore": 0.96879
            }
       }
     }
   ],
   "usageMetadata": { "..."
   }
 }

Comprendre votre réponse

Si la requête de votre modèle est correctement ancrée dans la recherche Google depuis Vertex AI Studio ou depuis l'API, les réponses incluent des métadonnées avec des liens sources (URL Web). Toutefois, il existe plusieurs raisons pour lesquelles ces métadonnées peuvent ne pas être fournies et la réponse de la requête ne sera pas ancrée. Ces raisons incluent une faible pertinence de la source ou des informations incomplètes dans la réponse du modèle.

Citations

Nous vous recommandons vivement d'afficher des citations. Elles aident les utilisateurs à valider les réponses des éditeurs eux-mêmes et à trouver d'autres moyens d'apprendre.

Les citations des réponses provenant de sources de la recherche Google doivent être affichées à la fois de manière intégrée et globale. Consultez l'image suivante pour savoir comment procéder.

Exemples de citations

Utilisation d'options de moteur de recherche alternatives

L'utilisation de la fonctionnalité Grounding avec la recherche Google par le Client ne l'empêche pas de proposer d'autres options de moteur de recherche, de définir ces options comme option par défaut pour les applications du Client ou d'afficher ses propres suggestions de recherche ou résultats de recherche dans les applications du Client, à condition que ces services autres que la recherche Google ou les résultats associés soient affichés séparément des résultats et suggestions de recherche de Grounding et ne puissent pas raisonnablement être attribués à Google ni être confondus avec les résultats fournis par Google.

Étape suivante