Se usó la API de Cloud Translation para traducir esta página.

Fundamentación con Vertex AI Search

En esta página, se explica cómo puedes fundamentar las respuestas con tus datos de Vertex AI Search.

Fundamenta Gemini con tus datos

Si deseas realizar una generación aumentada de recuperación (RAG), conecta tu modelo a los datos de tu sitio web o a tus conjuntos de documentos y, luego, usa la fundamentación con Vertex AI Search.

La fundamentación en tus datos admite un máximo de 10 fuentes de datos de Vertex AI Search y se puede combinar con la Fundamentación con la Búsqueda de Google.

Modelos compatibles

En esta sección, se enumeran los modelos que admiten la fundamentación con tus datos.

Gemini 2.5 Flash (versión preliminar)
Gemini 2.5 Flash-Lite (versión preliminar)
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash con audio nativo de la API de Live (versión preliminar)
Gemini 2.0 Flash con la API en vivo (versión preliminar)
Gemini 2.5 Pro
Gemini 2.5 Flash
Gemini 2.0 Flash

Requisitos previos

Antes de poder fundamentar el resultado del modelo en tus datos, haz lo siguiente:

En la consola de Google Cloud , ve a la página IAM y busca el permisodiscoveryengine.servingConfigs.search, que es necesario para que funcione el servicio de fundamentación.

Ir a IAM
Habilita las APIs para AI Applications y activa la API.
Crea una fuente de datos y una aplicación de AI Applications.

Consulta la Introducción a Vertex AI Search para obtener más información.

Habilita AI Applications

En la consola de Google Cloud , ve a la página AI Applications.

Aplicaciones basadas en IA
Lee y acepta las Condiciones del Servicio y, luego, haz clic en Continuar y activar la API.

Importante: Debes aceptar las condiciones de uso de datos de las soluciones de descubrimiento para cada proyecto con el que desees usar las Aplicaciones basadas en IA.

Las aplicaciones de IA están disponibles en la ubicación global o en la multirregión eu y us. Para obtener más información, consulta Ubicaciones de las aplicaciones de IA.

Crea un almacén de datos en Aplicaciones de IA

Para crear un almacén de datos en Aplicaciones de IA, puedes optar por fundamentar la respuesta con datos o documentos de sitios web.

Sitio web

Abre la página Create Data Store desde la consola de Google Cloud .
En el cuadro Contenido de sitios web, haz clic en Seleccionar.
Se mostrará el panel Especifica los sitios web para tu almacén de datos.
Si la opción Indexación avanzada de sitios web no está marcada, selecciona la casilla de verificación Indexación avanzada de sitios web para activarla.
Aparecerá el panel Configura tu almacén de datos.
En la sección Especificar los patrones de URL que se indexarán, haz lo siguiente:
- Agrega URLs para Sitios para incluir.
- Opcional: Agrega URLs para Sitios para excluir.
Haz clic en Continuar.
En el panel Configura tu almacén de datos,
1. Selecciona un valor de la lista Ubicación de tu almacén de datos.
2. Ingresa un nombre en el campo Nombre de tu almacén de datos. Se genera el ID. Usa este ID cuando generes tus respuestas fundamentadas con tu almacén de datos. Para obtener más información, consulta Cómo generar respuestas fundamentadas con tu almacén de datos.
3. Haz clic en Crear.

Documentos

Abre la página Create Data Store desde la consola de Google Cloud .
En el cuadro Cloud Storage, haz clic en Seleccionar.
Se mostrará el panel Importar datos desde Cloud Storage.
En la sección Documentos no estructurados (PDF, HTML, TXT y más), selecciona Documentos no estructurados (PDF, HTML, TXT y más).
Selecciona una opción de Frecuencia de sincronización.
Selecciona una opción de Selecciona una carpeta o un archivo que desees importar y, luego, ingresa la ruta de acceso en el campo.
Haz clic en Continuar.
Se mostrará el panel Configura tu almacén de datos.
En el panel Configura tu almacén de datos,
1. Selecciona un valor de la lista Ubicación de tu almacén de datos.
2. Ingresa un nombre en el campo Nombre de tu almacén de datos. Se genera el ID.
3. Para seleccionar las opciones de análisis y fragmentación de tus documentos, expande la sección Opciones de procesamiento de documentos. Para obtener más información sobre los diferentes analizadores, consulta Cómo analizar documentos.
4. Haz clic en Crear.
Haz clic en Crear.

Genera respuestas fundamentadas con tu almacén de datos

Usa las siguientes instrucciones para fundamentar un modelo con tus datos. Se admite un máximo de 10 almacenes de datos.

Si no conoces el ID del almacén de datos, sigue estos pasos:

En la consola de Google Cloud , ve a la página AI Applications y, en el menú de navegación, haz clic en Data stores.

Ve a la página Almacenes de datos.
Haz clic en el nombre de tu almacén de datos.
En la página Datos de tu almacén de datos, obtén el ID del almacén de datos.

Console

Para fundamentar el resultado de tu modelo en AI Applications con Vertex AI Studio en la consola deGoogle Cloud , sigue estos pasos:

En la Google Cloud consola, ve a la página Vertex AI Studio Freeform.
Ir a Formato libre
Para activar la fundamentación, haz clic en el botón de activación Fundamentación: tus datos.
Haz clic en Personalizar.
1. Selecciona Vertex AI Search como tu fuente.
2. Con este formato de ruta de acceso, reemplaza el ID del proyecto y el ID del almacén de datos:
  
  projects/project_id/locations/global/collections/default_collection/dataStores/data_store_id.
Haz clic en Guardar.
Ingresa tu instrucción en el cuadro de texto y haz clic en Enviar.

Tus respuestas a las instrucciones se basan en las aplicaciones de IA.

Python

Instalar

pip install --upgrade google-genai

Para obtener más información, consulta la documentación de referencia del SDK.

Establece variables de entorno para usar el SDK de IA generativa con Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import (
    GenerateContentConfig,
    VertexAISearch,
    Retrieval,
    Tool,
    HttpOptions,
)

client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Replace with your Vertex AI Search data store details
DATA_STORE_PATH = "projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID"

tool = Tool(
    retrieval=Retrieval(
        vertex_ai_search=VertexAISearch(
            data_store=DATA_STORE_PATH
        )
    )
)

response = client.models.generate_content(
    model="gemini-2.5-flash",  # Or another supported model
    contents="What information can you find about topic X in the provided documents?", # Your query
    config=GenerateContentConfig(
        tools=[tool],
    ),
)

print(response.text)

REST

Para probar un mensaje de texto con la API de Vertex AI, envía una solicitud POST al extremo del modelo de publicador.

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

LOCATION: La región para procesar la solicitud. Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso en global.
PROJECT_ID: El ID del proyecto.
MODEL_ID: El ID del modelo multimodal.
PROMPT: Es la instrucción que se envía al modelo.

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Cuerpo JSON de la solicitud:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "PROMPT"
    }]
  }],
  "tools": [{
    "retrieval": {
      "vertexAiSearch": {
        "datastore": projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID
      }
    }
  }],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Para enviar tu solicitud, expande una de estas opciones:

curl (Linux, macOS o Cloud Shell)

Nota: Con el siguiente comando, se supone que accediste a la CLI de gcloud con tu cuenta de usuario a través de la ejecución de gcloud init o gcloud auth login, o a través del uso de Cloud Shell, que accede de forma automática a la CLI de gcloud. Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

Nota: El siguiente comando supone que accediste a la CLI de gcloud con tu cuenta de usuario mediante la ejecución de gcloud init o gcloud auth login. Para comprobar la cuenta activa actual, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

Deberías recibir una respuesta JSON similar a la que se muestra a continuación:

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "You can make an appointment on the website https://dmv.gov/"
          }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": [
        "..."
      ],
      "groundingMetadata": {
        "retrievalQueries": [
          "How to make appointment to renew driving license?"
        ],
        "groundingChunks": [
          {
            "retrievedContext": {
              "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/AXiHM.....QTN92V5ePQ==",
              "title": "dmv"
            }
          }
        ],
        "groundingSupport": [
          {
            "segment": {
              "startIndex": 25,
              "endIndex": 147
            },
            "segment_text": "ipsum lorem ...",
            "supportChunkIndices": [1, 2],
            "confidenceScore": [0.9541752, 0.97726375]
          },
          {
            "segment": {
              "startIndex": 294,
              "endIndex": 439
            },
            "segment_text": "ipsum lorem ...",
            "supportChunkIndices": [1],
            "confidenceScore": [0.9541752, 0.9325467]
          }
        ]
      }
    }
  ],
  "usageMetadata": {
    "..."
  }
}

Comprende tu respuesta

La respuesta de ambas APIs incluye el texto generado por el LLM, que se denomina candidato. Si la instrucción de tu modelo se fundamenta correctamente en tu fuente de datos, las respuestas incluirán metadatos de fundamentación, que identifican las partes de la respuesta que se derivaron de tus datos. Sin embargo, existen varios motivos por los que es posible que no se proporcionen estos metadatos, y la respuesta a la instrucción no se basará en ellos. Entre estos motivos, se incluyen la baja relevancia de la fuente o la información incompleta en la respuesta del modelo.

A continuación, se muestra un desglose de los datos de salida:

Rol: Indica el remitente de la respuesta fundamentada. Dado que la respuesta siempre contiene texto fundamentado, el rol siempre es model.
Texto: Es la respuesta fundamentada que genera el LLM.
Metadatos de fundamentación: Es la información sobre la fuente de fundamentación, que contiene los siguientes elementos:
- Fragmentos de fundamentación: Es una lista de resultados de tu índice que respaldan la respuesta.
- Fundamentación compatible: Información sobre una afirmación específica dentro de la respuesta que se puede usar para mostrar citas:
- Segmento: Es la parte de la respuesta del modelo que se fundamenta en un fragmento de fundamentación.
- Índice de fragmento de fundamentación: Es el índice de los fragmentos de fundamentación en la lista de fragmentos de fundamentación que corresponde a esta afirmación.
- Puntuaciones de confianza: Es un número del 0 al 1 que indica qué tan fundamentada está la afirmación en el conjunto proporcionado de fragmentos de fundamentación. No está disponible para Gemini 2.5 y versiones posteriores.

¿Qué sigue?

Para obtener información sobre cómo enviar solicitudes de instrucciones de chat, consulta Chat de varios turnos.
Para obtener información sobre las prácticas recomendadas de IA responsable y los filtros de seguridad de Vertex AI, consulta Prácticas recomendadas de seguridad.