Se usó la API de Cloud Translation para traducir esta página.

Genera respuestas fundamentadas con RAG

Como parte de tu experiencia de Generación mejorada por recuperación (RAG) en Vertex AI Search, puedes generar respuestas fundamentadas a las instrucciones basadas en las siguientes fuentes de fundamentación:

Búsqueda de Google: Usa la fundamentación con la Búsqueda de Google si deseas conectar el modelo con conocimiento mundial, una amplia variedad de temas o información actualizada en Internet. La fundamentación con la Búsqueda de Google admite la recuperación dinámica, que te brinda la opción de generar Resultados Fundamentados con la Búsqueda de Google solo cuando sea necesario. Por lo tanto, la configuración de recuperación dinámica evalúa si una instrucción requiere conocimiento sobre eventos recientes y habilita la fundamentación con la Búsqueda de Google. Para obtener más información, consulta Recuperación dinámica.
Importante: Si recibes Sugerencias de la Búsqueda de Google con una respuesta, esa respuesta es un "Resultado Fundamentado" sujeto a las condiciones de Fundamentación con la Búsqueda de Google que se encuentran en la sección Condiciones del Servicio de las Condiciones Específicas del Servicio. Para usar las sugerencias de la Búsqueda de Google, consulta Cómo usar las sugerencias de la Búsqueda de Google.
Texto intercalado: Usa la fundamentación con texto intercalado para fundamentar la respuesta en fragmentos de texto llamados texto de hechos que se proporcionan en la solicitud. Un texto de hecho es una declaración proporcionada por el usuario que se considera fáctica para una solicitud determinada. El modelo no verifica la autenticidad del texto de la verificación de datos.
Almacenes de datos de Vertex AI Search: Usa la fundamentación con Vertex AI Search si deseas conectar el modelo a los documentos de tu empresa desde los almacenes de datos de Vertex AI Search.

En esta página, se describe cómo generar respuestas fundamentadas basadas en estas fuentes de fundamentación con los siguientes enfoques:

Generación de respuestas de un solo turno
- Texto intercalado y almacén de datos de Vertex AI Search
- Búsqueda de Google
Generación de respuestas de varios turnos

Además, puedes elegir transmitir las respuestas del modelo. La generación de una respuesta fundamentada por transmisión es una función experimental.

Puedes usar otros métodos para generar respuestas fundamentadas que se adapten a tu aplicación. Para obtener más información, consulta APIs de Vertex AI para crear experiencias de búsqueda y RAG.

Terminología

Antes de usar el método de generación de respuestas fundamentadas, es útil comprender las entradas y salidas, cómo estructurar tu solicitud y la terminología relacionada con la RAG.

Términos de RAG

La RAG es una metodología que permite que los modelos de lenguaje grandes (LLM) generen respuestas basadas en la fuente de datos que elijas. Existen dos etapas en RAG:

Recuperación: Obtener los datos más relevantes rápidamente puede ser un problema de búsqueda común. Con la RAG, puedes recuperar rápidamente los hechos importantes para generar una respuesta.
Generación: El LLM usa los hechos recuperados para generar una respuesta fundamentada.

Por lo tanto, el método de generación de respuestas fundamentadas recupera los hechos de la fuente de fundamentación y genera una respuesta fundamentada.

Datos de entrada

El método de generación de respuestas fundamentadas requiere las siguientes entradas en la solicitud:

Rol: Es el remitente de un texto determinado, que puede ser un usuario (user) o un modelo (model).
Texto: Cuando el rol es user, el texto es una instrucción, y cuando el rol es model, el texto es una respuesta fundamentada. La forma en que especificas el rol y el texto en una solicitud se determina de la siguiente manera:
- En el caso de la generación de respuestas de un solo turno, el usuario envía el texto de la instrucción en la solicitud y el modelo envía el texto de la respuesta en la respuesta.
- Para la generación de respuestas en varios turnos, la solicitud contiene el par de instrucción-respuesta para todos los turnos anteriores y el texto de la instrucción del usuario para el turno actual. Por lo tanto, en una solicitud de este tipo, el rol es user para el texto de la instrucción y model para el texto de la respuesta.
Instrucción del sistema: Es un preámbulo de tu instrucción que rige el comportamiento del modelo y modifica el resultado según corresponda. Por ejemplo, puedes agregar un personaje a la respuesta generada o indicarle al modelo que formatee el texto de salida de una manera determinada. Para la generación de respuestas en varios turnos, debes proporcionar las instrucciones del sistema para cada turno. Para obtener más información, consulta Usa instrucciones del sistema.

Fuente de fundamentación: Es la fuente en la que se fundamenta la respuesta y puede ser una o más de las siguientes:

Búsqueda de Google: Fundamenta las respuestas con los resultados de la Búsqueda de Google. Cuando la fuente de fundamentación es la Búsqueda de Google, puedes especificar una configuración de recuperación dinámica con un umbral de recuperación dinámica. Para obtener más información, consulta Recuperación dinámica.
Importante: Si recibes Sugerencias de la Búsqueda de Google con una respuesta, esa respuesta es un "Resultado Fundamentado" sujeto a las condiciones de Fundamentación con la Búsqueda de Google que se encuentran en la sección Condiciones del Servicio de las Condiciones Específicas del Servicio. Para usar las sugerencias de la Búsqueda de Google, consulta Cómo usar las sugerencias de la Búsqueda de Google.
Texto intercalado: Fundamenta la respuesta en el texto de hechos que se proporciona en la solicitud. Un texto de hecho es una declaración proporcionada por el usuario que se considera fáctica para una solicitud determinada. El modelo no verifica la autenticidad del texto de la verificación de datos. Puedes proporcionar un máximo de 100 textos de hechos en cada fuente de texto intercalado. Los textos de hechos se pueden admitir con atributos de metadatos, como el título, el autor y el URI. Estos atributos de metadatos se devuelven en la respuesta cuando se citan los fragmentos que respaldan la respuesta.
Almacenes de datos de Vertex AI Search: Fundamenta la respuesta en los documentos de los almacenes de datos de Vertex AI Search. No puedes especificar un almacén de datos de búsqueda de sitios web como fuente de fundamentación.

En una solicitud determinada, puedes proporcionar una fuente de texto intercalada y una fuente de almacén de datos de Vertex AI Search. No puedes combinar la Búsqueda de Google con ninguna de estas fuentes. Por lo tanto, si deseas fundamentar tus respuestas con los resultados de la Búsqueda de Google, debes enviar una solicitud independiente en la que se especifique la Búsqueda de Google como la única fuente de fundamentación.

Puedes proporcionar un máximo de 10 fuentes de fundamentación en cualquier orden. Por ejemplo, supongamos que proporcionas las fuentes de fundamentación con el siguiente recuento, en el siguiente orden, para obtener un total de 10 fuentes de fundamentación:

Tres fuentes de texto intercaladas, cada una de las cuales puede contener un máximo de 100 textos de hechos
Seis almacenes de datos de Vertex AI Search
Una fuente de texto intercalado que contiene un máximo de 100 textos de hechos

A cada fuente se le asigna un índice en el orden en que se especifica en la solicitud. Por ejemplo, si especificaste una combinación de fuentes en tu solicitud, el índice de fuente se asigna como se ilustra en la siguiente tabla:

Fuente de los fundamentos	Índice
Texto intercalado núm. 1	0
Texto intercalado núm. 2	1
Almacén de datos de Vertex AI Search núm. 1	2
Texto intercalado núm. 3	3
Almacén de datos de Vertex AI Search núm. 2	4

Este índice se cita en la respuesta y es útil para rastrear la procedencia.

Especificaciones de generación: Son las especificaciones para la configuración del modelo que constan de la siguiente información:
- ID del modelo: Especifica el modelo de Gemini de Vertex AI que se usará para generar respuestas. Para obtener una lista de los modelos que puedes usar para generar respuestas fundamentadas, consulta Modelos compatibles.
- Parámetros del modelo: Especifica los parámetros que puedes establecer para el modelo que elijas usar. Estos parámetros son: idioma, temperatura, Top-P y Top-K. Para obtener detalles sobre estos parámetros, consulta Parámetros del modelo de Gemini.
Código de idioma: Por lo general, el idioma de la respuesta generada se establece para que coincida con el idioma de la instrucción. Si no hay un solo idioma en la instrucción (por ejemplo, si la instrucción es muy corta y puede ser válida en varios idiomas), el campo de código de idioma determina el idioma de la respuesta.

Para obtener una lista de los códigos de idioma, consulta Idiomas.
Latitud y longitud: Especifica la latitud y la longitud del usuario. Si la búsqueda contiene preguntas específicas de la ubicación, como "Encuentra una cafetería cerca de mí", se usan estos campos. Si no se puede determinar el idioma de la búsqueda y no se establece el código de idioma, se usan la latitud y la longitud para determinar el idioma de la respuesta.

Datos de salida

La respuesta que genera el modelo se denomina candidata y contiene los siguientes datos. Es posible que no todos los campos estén presentes en el resultado.

Rol: Es el remitente de la respuesta fundamentada. La respuesta siempre contiene el texto de la respuesta fundamentada. Por lo tanto, el rol en una respuesta siempre es un modelo.
Texto: Es una respuesta fundamentada.
Puntuación de fundamentación: Es un valor de punto flotante en el rango [0, 1] que indica qué tan bien se fundamenta una respuesta en las fuentes proporcionadas.
Metadatos de fundamentación: Son los metadatos sobre la fuente de fundamentación. Los metadatos de fundamentación contienen la siguiente información:
- Fragmentos de apoyo: Es una lista de fragmentos que respaldan la respuesta. A cada fragmento de asistencia se le asigna un índice que resulta útil para rastrear la procedencia. Cada fragmento de asistencia contiene lo siguiente:
  - Texto de fragmento: Es una porción de texto citado textualmente de la fuente de la que se extrae la respuesta o una parte de la respuesta (llamada texto de la afirmación). Es posible que no siempre esté presente en la respuesta.
  - Fuente: Es un índice asignado a la fuente en la solicitud.
  - Metadatos de origen: Son los metadatos sobre el fragmento. Según la fuente, los metadatos de la fuente pueden ser cualquiera de los siguientes:
    - En el caso de una fuente intercalada, los metadatos pueden ser los detalles adicionales que se especificaron en la solicitud, como el título, el autor o el URI.
    - En el caso del almacén de datos de Vertex AI Search, los metadatos pueden ser el ID del documento, el título del documento, el URI (ubicación de Cloud Storage) o el número de página.
    - En el caso de la fundamentación con la Búsqueda de Google, cuando se genera un resultado fundamentado, los metadatos contienen un URI que redirecciona al editor del contenido que se usó para generar el resultado fundamentado. Los metadatos también contienen el dominio del publicador. Se puede acceder a los URIs proporcionados durante un máximo de 30 días después de que se genera el resultado de la conexión a tierra.
    Importante: Los usuarios finales deben poder acceder directamente al URI proporcionado y no se debe consultar de forma programática a través de medios automatizados. Si se detecta acceso automatizado, es posible que el servicio de fundamentación con la Búsqueda de Google deje de proporcionar los URIs de redireccionamiento. Para reiniciar los URIs de redireccionamiento, comunícate con el ingeniero de atención al cliente.
- Compatibilidad con la fundamentación: Información de fundamentación para una afirmación en la respuesta. La asistencia de fundamentación contiene la siguiente información:
  - Texto de la respuesta: Es la respuesta o una parte de la respuesta que se fundamenta con el texto del fragmento de apoyo.
  - Índice de fragmento de asistencia: Es un índice asignado al fragmento de asistencia en el orden en que aparece en la lista de fragmentos de asistencia.
  - Consultas de búsqueda web: Son las consultas de búsqueda sugeridas para las sugerencias de la Búsqueda de Google.
  - Sugerencias de Búsqueda: Si recibes Sugerencias de Búsqueda de Google con una respuesta, esa respuesta es un "Resultado Fundamentado" sujeto a las condiciones del servicio de Fundamentación con la Búsqueda de Google. Para obtener más información, consulta las Condiciones del Servicio. El campo renderedContent dentro del campo searchEntryPoint es el código proporcionado para implementar las sugerencias de la Búsqueda de Google. Para usar las sugerencias de la Búsqueda de Google, consulta Cómo usar las sugerencias de la Búsqueda de Google.

Generar una respuesta fundamentada en un solo turno

En esta sección, se describe cómo generar respuestas basadas en las siguientes fuentes:

Texto intercalado y almacén de datos de Vertex AI Search
Búsqueda de Google

Fundamentar la respuesta en texto intercalado y en el almacén de datos de Vertex AI Search

En el siguiente ejemplo, se muestra cómo enviar texto de instrucciones especificando un texto intercalado y un almacén de datos de Vertex AI Search como fuente de fundamentación. No puedes especificar un almacén de datos de búsqueda de sitios web como fuente de fundamentación. En este ejemplo, se usa el método generateGroundedContent.

REST

Envía la instrucción en la siguiente solicitud curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "inlineSource": {
       "groundingFacts": [
         {
           "factText": "FACT_TEXT_1",
           "attributes": {
             "title": "TITLE_1",
             "uri": "URI_1",
             "author": "AUTHOR_1"
           }
         }
       ]
     }
   },
   {
     "inlineSource": {
       "groundingFacts": [
         {
           "factText": "FACT_TEXT_2",
           "attributes": {
             "title": "TITLE_2",
             "uri": "URI_2"
           }
         },
         {
           "factText": "FACT_TEXT_3",
           "attributes": {
             "title": "TITLE_3",
             "uri": "URI_3"
           }
         }
       ]
     }
   },
   {
     "searchSource": {
       "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID_1/servingConfigs/default_search"
     }
   },
   {
     "searchSource": {
       "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID_2/servingConfigs/default_search"
     }
   }
  ]
},
"generationSpec": {
  "modelId": "MODEL_ID",
  "temperature": TEMPERATURE,
  "topP": TOP_P,
  "topK": TOP_K
},
"user_context": {
  "languageCode: "LANGUAGE_CODE",
  "latLng": {
    "latitude": LATITUDE,
    "longitude": LONGITUDE
 },
}
}'

Reemplaza lo siguiente:

PROJECT_NUMBER: Es el número de tu proyecto de Google Cloud .
PROMPT_TEXT: La instrucción del usuario.
SYSTEM_INSTRUCTION: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional.
FACT_TEXT_N: Es el texto intercalado para fundamentar la respuesta. Puedes proporcionar un máximo de 100 textos de hechos.
TITLE_N: Es un campo opcional para establecer el atributo de metadatos del título para el texto intercalado.
URI_N: Es un campo opcional para establecer el atributo de metadatos del URI para el texto intercalado.
AUTHOR_N: Es un campo opcional para establecer el atributo de metadatos del autor para el texto intercalado.
APP_ID_N: Es el ID de la app de Vertex AI Search.
MODEL_ID: Es un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelos disponibles, consulta Modelos compatibles.
TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_P: Es un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_K: Es un campo opcional para establecer el valor de Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
LANGUAGE_CODE: Es un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se devuelve. Si no se puede determinar el idioma a partir de la búsqueda, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
LONGITUDE: un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore": GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {
           "chunkText": "CHUNK_TEXT_FROM_A_DOCUMENT_IN_A_DATA_STORE ",
           "source": "4",
           "sourceMetadata": {
             "title": "DOCUMENT_TITLE",
             "uri": "gs://PATH/TO/DOCUMENT.pdf",
             "document_id": "DOCUMENT_ID",
             "page_identifier": "PAGE_NUMBER"
           }
         },
         {
           "chunkText": "CHUNK_TEXT_FROM_FACT_TEXT_1",
           "source": "0",
           "sourceMetadata": {
             "title": "TITLE_1",
             "uri": "URI_1",
             "author": "AUTHOR_1"
           }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportChunkIndices": [
             0,
             1
           ]
         }
       ]
     }
   }
 ]
}

Ejemplo de generación de respuestas de un solo turno fundamentadas en texto intercalado y Vertex AI Search

En el siguiente ejemplo, la solicitud especifica las siguientes fuentes de fundamentación: un hecho de texto intercalado y un almacén de datos de Vertex AI Search. En este ejemplo, se usa el método generateGroundedContent. En este ejemplo, también se usa una instrucción del sistema para finalizar la respuesta con un emoji de cara sonriente.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "How did Google do in 2020? Where can I find BigQuery docs?"
        }
      ]
    }
  ],
  "systemInstruction": {
      "parts": {
          "text": "Add a smiley emoji after the answer."
      }
  },
  "groundingSpec": {
    "groundingSources": [
      {
        "inline_source": {
          "grounding_facts": [
            {
              "fact_text": "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction",
              "attributes": {
                "title": "BigQuery Overview",
                "uri": "https://cloud.google.com/bigquery/docs/introduction"
              }
            }
          ]
        }
      },
      {
        "searchSource": {
          "servingConfig": "projects/123456/locations/global/collections/default_collection/engines/app_id_example/servingConfigs/default_search"
        }
      }
    ]
  },
  "generationSpec": {
    "modelId": "gemini-1.5-flash"
  },
  "user_context": {
    "languageCode: "en",
    "latLng": {
       "latitude": 37.422131,
       "longitude": -122.084801
    }
  }
}'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "Google's revenue increased by 23% in 2020, reaching $182.5 billion. Google Cloud revenue was $13.1 billion for 2020. You can find BigQuery documentation at https://cloud.google.com/bigquery/docs/introduction. 😊 \n"
         }
       ]
     },
     "groundingScore": 0.86738646,
     "groundingMetadata": {
       "supportChunks": [
         {
           "chunkText": "Alphabet Announces Fourth Quarter and Fiscal Year 2020 Results\nMOUNTAIN VIEW, Calif. – February 2, 2021 – Alphabet Inc. (NASDAQ: GOOG, GOOGL) today announced\nfinancial results for the quarter and fiscal year ended December 31, 2020. Sundar Pichai, CEO of Google and Alphabet, said: "Our strong results this quarter reflect the helpfulness of our\nproducts and services to people and businesses, as well as the accelerating transition to online services and the\ncloud. Google succeeds when we help our customers and partners succeed, and we see significant opportunities to\nforge meaningful partnerships as businesses increasingly look to a digital future." Ruth Porat, CFO of Google and Alphabet, said: "Our strong fourth quarter performance, with revenues of $56.9\nbillion, was driven by Search and YouTube, as consumer and business activity recovered from earlier in the year. Google Cloud revenues were $13.1 billion for 2020, with significant ongoing momentum, and we remain focused on\ndelivering value across the growth opportunities we see." New reporting segment structure and operating results\nWe are now reporting results for three segments: Google Services, Google Cloud, and Other Bets. \n...\nIn 2020, we entered into derivatives that hedged the changes in fair value of certain marketable equity securities, which\nresulted in a $497 million net loss for the quarter ended December 31, 2020. The offsetting recognized gains on the\nmarketable equity securities are reflected in Gain (loss) on equity securities, net. Segment results\nThe following table presents our revenues and operating income (loss) (in millions; unaudited): Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Revenues:\nGoogle Services $ 43,198 $ 38,198 $ 34,991 $ 42,573 $ 52,873 $ 130,524 $ 151,825 $ 168,635 Google Cloud 2,614 2,777 3,007 3,444 3,831 5,838 8,918 13,059 Other Bets 172 135 148 178 196 595 659 657 Hedging gains (losses) 91 49 151 (22) (2) (138) 455 176 Total revenues $ 46,075 $ 41,159 $ 38,297 $ 46,173 $ 56,898 $ 136,819 $ 161,857 $ 182,527 Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Operating income (loss):\nGoogle Services $ 13,488 $ 11,548 $ 9,539 $ 14,453 $ 19,066 $ 43,137 $ 48,999 $ 54,606 Google Cloud (1,194) (1,730) (1,426) (1,208) (1,243) (4,348) (4,645) (5,607) Other Bets (2,026) (1,121) (1,116) (1,103) (1,136) \n...\nQ4 2020 financial highlights\nThe following table summarizes our consolidated financial results for the quarters ended December 31, 2019 and\n2020 (in millions, except for per share information and percentages; unaudited). Quarter Ended December 31,\n2019 2020 Revenues $ 46,075 $ 56,898 Increase in revenues year over year 17 % 23 % Increase in constant currency revenues year over year(1) 19 % 23 % Operating income $ 9,266 $ 15,651 Operating margin 20 % 28 % Other income (expense), net $ 1,438 $ 3,038 Net income $ 10,671 $ 15,227 Diluted EPS $ 15.35 $ 22.30 (1) Non-GAAP measure. See the table captioned "Reconciliation from GAAP revenues to non-GAAP constant currency\nrevenues" for more details. Q4 2020 supplemental information (in millions, except for number of employees; unaudited)\nRevenues, Traffic Acquisition Costs (TAC) and number of employees\nThe following table summarizes our revenues, total TAC and number of employees. Quarter Ended December 31,\n2019 2020 Google Search & other $ 27,185 $ 31,903 YouTube ads 4,717 6,885 Google Network Members' properties 6,032 7,411 Google advertising 37,934 46,199 Google other 5,264 6,674 Google Services total 43,198 52,873 Google Cloud 2,614 3,831 Other Bets 172 196 Hedging gains (losses) 91 (2) Total revenues $ 46,075 $ 56,898 Total TAC $ 8,501 $ 10,466 Number of employees 118,899 135,301 ",
           "source": "1",
           "sourceMetadata": {
             "title": "GOOG Exhibit 99.1 Q4'20",
             "page_identifier": "2",
             "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2020Q4_alphabet_earnings_release.pdf",
             "document_id": "projects/123456/locations/global/collections/default_collection/dataStores/data_store_id_example/branches/0/documents/217e8bedecfe08e3c43f5b289af15243"
           }
         },
         {
           "chunkText": "Alphabet Announces Fourth Quarter and Fiscal Year 2020 Results\nMOUNTAIN VIEW, Calif. – February 2, 2021 – Alphabet Inc. (NASDAQ: GOOG, GOOGL) today announced\nfinancial results for the quarter and fiscal year ended December 31, 2020. Sundar Pichai, CEO of Google and Alphabet, said: "Our strong results this quarter reflect the helpfulness of our\nproducts and services to people and businesses, as well as the accelerating transition to online services and the\ncloud. Google succeeds when we help our customers and partners succeed, and we see significant opportunities to\nforge meaningful partnerships as businesses increasingly look to a digital future." Ruth Porat, CFO of Google and Alphabet, said: "Our strong fourth quarter performance, with revenues of $56.9\nbillion, was driven by Search and YouTube, as consumer and business activity recovered from earlier in the year. Google Cloud revenues were $13.1 billion for 2020, with significant ongoing momentum, and we remain focused on\ndelivering value across the growth opportunities we see." New reporting segment structure and operating results\nWe are now reporting results for three segments: Google Services, Google Cloud, and Other Bets. \n...\nIn 2020, we entered into derivatives that hedged the changes in fair value of certain marketable equity securities, which\nresulted in a $497 million net loss for the quarter ended December 31, 2020. The offsetting recognized gains on the\nmarketable equity securities are reflected in Gain (loss) on equity securities, net. Segment results\nThe following table presents our revenues and operating income (loss) (in millions; unaudited): Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Revenues:\nGoogle Services $ 43,198 $ 38,198 $ 34,991 $ 42,573 $ 52,873 $ 130,524 $ 151,825 $ 168,635 Google Cloud 2,614 2,777 3,007 3,444 3,831 5,838 8,918 13,059 Other Bets 172 135 148 178 196 595 659 657 Hedging gains (losses) 91 49 151 (22) (2) (138) 455 176 Total revenues $ 46,075 $ 41,159 $ 38,297 $ 46,173 $ 56,898 $ 136,819 $ 161,857 $ 182,527 Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Operating income (loss):\nGoogle Services $ 13,488 $ 11,548 $ 9,539 $ 14,453 $ 19,066 $ 43,137 $ 48,999 $ 54,606 Google Cloud (1,194) (1,730) (1,426) (1,208) (1,243) (4,348) (4,645) (5,607) Other Bets (2,026) (1,121) (1,116) (1,103) (1,136) \n...\nQ4 2020 financial highlights\nThe following table summarizes our consolidated financial results for the quarters ended December 31, 2019 and\n2020 (in millions, except for per share information and percentages; unaudited). Quarter Ended December 31,\n2019 2020 Revenues $ 46,075 $ 56,898 Increase in revenues year over year 17 % 23 % Increase in constant currency revenues year over year(1) 19 % 23 % Operating income $ 9,266 $ 15,651 Operating margin 20 % 28 % Other income (expense), net $ 1,438 $ 3,038 Net income $ 10,671 $ 15,227 Diluted EPS $ 15.35 $ 22.30 (1) Non-GAAP measure. See the table captioned "Reconciliation from GAAP revenues to non-GAAP constant currency\nrevenues" for more details. Q4 2020 supplemental information (in millions, except for number of employees; unaudited)\nRevenues, Traffic Acquisition Costs (TAC) and number of employees\nThe following table summarizes our revenues, total TAC and number of employees. Quarter Ended December 31,\n2019 2020 Google Search & other $ 27,185 $ 31,903 YouTube ads 4,717 6,885 Google Network Members' properties 6,032 7,411 Google advertising 37,934 46,199 Google other 5,264 6,674 Google Services total 43,198 52,873 Google Cloud 2,614 3,831 Other Bets 172 196 Hedging gains (losses) 91 (2) Total revenues $ 46,075 $ 56,898 Total TAC $ 8,501 $ 10,466 Number of employees 118,899 135,301 ",
           "source": "1",
           "sourceMetadata": {
             "document_id": "projects/123456/locations/global/collections/default_collection/dataStores/data_store_id_example/branches/0/documents/217e8bedecfe08e3c43f5b289af15243",
             "page_identifier": "2",
             "title": "GOOG Exhibit 99.1 Q4'20",
             "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2020Q4_alphabet_earnings_release.pdf"
           }
         },
         {
           "chunkText": "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction ",
           "source": "0",
           "sourceMetadata": {
             "uri": "https://cloud.google.com/bigquery/docs/introduction",
             "title": "BigQuery Overview"
           }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "Google's revenue increased by 23% in 2020, reaching $182.5 billion.",
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "Google Cloud revenue was $13.1 billion for 2020.",
           "supportChunkIndices": [
             1
           ]
         },
         {
           "claimText": "You can find BigQuery documentation at https://cloud.google.com/bigquery/docs/introduction.😊 ",
           "supportChunkIndices": [
             2
           ]
         }
       ]
     }
   }
 ]
}

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_number = "YOUR_PROJECT_NUMBER"
# engine_id = "YOUR_ENGINE_ID"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="gemini-2.5-flash",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="How did Google do in 2020? Where can I find BigQuery docs?"
                )
            ],
        )
    ],
    system_instruction=discoveryengine.GroundedGenerationContent(
        parts=[
            discoveryengine.GroundedGenerationContent.Part(
                text="Add a smiley emoji after the answer."
            )
        ],
    ),
    # What to ground on.
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                inline_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.InlineSource(
                    grounding_facts=[
                        discoveryengine.GroundingFact(
                            fact_text=(
                                "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction"
                            ),
                            attributes={
                                "title": "BigQuery Overview",
                                "uri": "https://cloud.google.com/bigquery/docs/introduction",
                            },
                        ),
                    ]
                ),
            ),
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.SearchSource(
                    # The full resource name of the serving config for a Vertex AI Search App
                    serving_config=f"projects/{project_number}/locations/global/collections/default_collection/engines/{engine_id}/servingConfigs/default_search",
                ),
            ),
        ]
    ),
)
response = client.generate_grounded_content(request)

# Handle the response
print(response)

Genera respuestas fundamentadas con la Búsqueda de Google

Puedes fundamentar las respuestas generadas con datos web disponibles públicamente.

Recuperación dinámica

Puedes usar la recuperación dinámica en tu solicitud para elegir cuándo desactivar la fundamentación con la Búsqueda de Google. Esto es útil cuando la instrucción no requiere una respuesta fundamentada en la Búsqueda de Google y los modelos compatibles pueden proporcionar una respuesta basada en su conocimiento sin fundamentación. Esto te ayuda a administrar la latencia, la calidad y el costo con mayor eficacia.

Puntuación y umbral de predicción de recuperación dinámica

Cuando envías una solicitud para generar una respuesta fundamentada, Vertex AI Search asigna una puntuación de predicción a la instrucción. La puntuación de predicción es un valor de punto flotante en el rango [0,1]. Su valor depende de si la instrucción puede beneficiarse de fundamentar la respuesta con la información más actualizada de la Búsqueda de Google. Por lo tanto, una instrucción que requiere una respuesta basada en los hechos más recientes de la Web tiene una puntuación de predicción más alta, y una instrucción para la que es suficiente una respuesta generada por el modelo tiene una puntuación de predicción más baja.

A continuación, se muestran ejemplos de algunas instrucciones y sus puntuaciones de predicción.

Instrucción	Puntuación de predicción	Comentario
"Escribe un poema sobre las peonías".	0.13	El modelo puede basarse en su conocimiento y la respuesta no necesita fundamentación.
"Sugerir un juguete para un niño de 2 años"	0.36	El modelo puede basarse en su conocimiento y la respuesta no necesita fundamentación.
"¿Puedes darme una receta de guacamole con inspiración asiática?"	0.55	La Búsqueda de Google puede proporcionar una respuesta fundamentada, pero la fundamentación no es estrictamente necesaria; el conocimiento del modelo podría ser suficiente.
"¿Qué es Vertex AI Search? ¿Cómo se factura la fundamentación en Vertex AI Search?"	0.72	Requiere la Búsqueda de Google para generar una respuesta bien fundamentada
"¿Quién ganó el último Gran Premio de F1?"	0.97	Requiere la Búsqueda de Google para generar una respuesta bien fundamentada

En tu solicitud de generación de respuestas fundamentadas, puedes especificar una configuración de recuperación dinámica con un umbral. El umbral es un valor de punto flotante en el rango [0,1] y su valor predeterminado es 0.7. Si el valor del umbral es cero, la respuesta siempre se basa en la Búsqueda de Google. Para todos los demás valores del umbral, se aplica lo siguiente:

Si la puntuación de predicción es mayor o igual que el umbral, la respuesta se fundamenta con la Búsqueda de Google. Un umbral más bajo implica que más instrucciones tienen respuestas que se generan con la fundamentación con la Búsqueda de Google.
Si la puntuación de predicción es inferior al umbral, es posible que el modelo genere la respuesta, pero no se basará en la Búsqueda de Google.

Para encontrar un buen umbral que se adapte a las necesidades de tu empresa, puedes crear un conjunto representativo de búsquedas que esperas encontrar. Luego, puedes ordenar las búsquedas según la puntuación de predicción en la respuesta y seleccionar un umbral adecuado para tu caso de uso.

Fundamenta la respuesta con la Búsqueda de Google

En el siguiente ejemplo, se muestra cómo generar una respuesta fundamentada a partir de una instrucción especificando la Búsqueda de Google como fuente de fundamentación. En este ejemplo, se usa el método generateGroundedContent.

REST

Envía la instrucción en la siguiente solicitud curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION"
   }
},
"groundingSpec": {
 "groundingSources": [
 {
     "googleSearchSource": {
          "dynamicRetrievalConfig": {
              "predictor":{
                  "threshold": DYNAMIC_RETRIEVAL_THRESHOLD
              }
          }
     }
 }
]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'

Reemplaza lo siguiente:

PROJECT_NUMBER: Es el número de tu proyecto de Google Cloud .
PROMPT_TEXT: La instrucción del usuario.
SYSTEM_INSTRUCTION: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional.
DYNAMIC_RETRIEVAL_THRESHOLD: Es un campo opcional para establecer el umbral para invocar la configuración de recuperación dinámica. Es un valor de punto flotante en el rango [0,1]. Si agregas el campo dynamicRetrievalConfig, pero no estableces el campo predictor o threshold, el valor del umbral se establece de forma predeterminada en 0.7. Si no configuras el campo dynamicRetrievalConfig, la respuesta siempre se basará en la Búsqueda.
MODEL_ID: Es un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelos disponibles, consulta Modelos compatibles.
TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_P: Es un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_K: Es un campo opcional para establecer el valor de Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
LANGUAGE_CODE: Es un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se devuelve. Si no se puede determinar el idioma a partir de la búsqueda, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
LONGITUDE: un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore":GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
            "uri": "REDIRECTION_URI",
            "domain": "PUBLISHER_DOMAIN"
          }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "CLAIM_TEXT_2",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       },
     }
   }
 ]
}
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore":GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {}
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "CLAIM_TEXT_2",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       },
       "retrievalMetadata": [
         {
           "source": "GOOGLE_SEARCH",
           "dynamicRetrievalMetadata": {
             "predictorMetadata": {
               "version": "V1_INDEPENDENT",
               "prediction": PREDICTION_SCORE
             }
           }
         }
       ]
     }
   }
 ]
}

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_number = "YOUR_PROJECT_NUMBER"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="gemini-2.5-flash",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="How much is Google stock?"
                )
            ],
        )
    ],
    system_instruction=discoveryengine.GroundedGenerationContent(
        parts=[
            discoveryengine.GroundedGenerationContent.Part(text="Be comprehensive.")
        ],
    ),
    # What to ground on.
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                google_search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.GoogleSearchSource(
                    # Optional: For Dynamic Retrieval
                    dynamic_retrieval_config=discoveryengine.GenerateGroundedContentRequest.DynamicRetrievalConfiguration(
                        predictor=discoveryengine.GenerateGroundedContentRequest.DynamicRetrievalConfiguration.DynamicRetrievalPredictor(
                            threshold=0.7
                        )
                    )
                )
            ),
        ]
    ),
)
response = client.generate_grounded_content(request)

# Handle the response
print(response)

Ejemplo de generación de respuestas de un solo turno fundamentadas con la Búsqueda de Google

En el siguiente ejemplo, la solicitud especifica la Búsqueda de Google como la fuente de fundamentación. En este ejemplo, se usa el método generateGroundedContent. En este ejemplo, también se usa una instrucción del sistema para finalizar la respuesta con un emoji de cara sonriente.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [{
  "role": "user",
  "parts": [{
    "text": "What is vertex ai search?"
}]
}],
"systemInstruction": {
   "parts": {
      "text": "Add a smiley emoji after the answer."
   }
},
"groundingSpec": {
  "groundingSources": [
  {
      "googleSearchSource": {
        "dynamicRetrievalConfig": {
               "predictor":{
                   "threshold": 0.6
               }
           }
      }
  }
 ]
},
"generationSpec": {
  "modelId": "gemini-1.5-flash"
}
}
'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "Vertex AI Search is a platform developed by Google Cloud that simplifies the creation and deployment of generative AI agents. It offers both no-code and code-first approaches, allowing developers of all skill levels to build AI-powered agents. \n\nHere are some key features of Vertex AI Search:\n\n* **No-code interface:**  Use natural language to design and build agents without writing code.\n* **Code-first approach:**  Utilize powerful orchestration and customization capabilities, including LangChain on Vertex AI.\n* **Enterprise-grade security and compliance:**  Built-in security, compliance, and governance features align with industry certifications like HIPAA, ISO 27000-series, SOC-1/2/3, VPC-SC, and CMEK.\n* **Integration with enterprise data:**  Easily ground your agents in enterprise data using Vertex AI Search and Retrieval Augmented Generation (RAG) APIs.\n* **Pre-built templates:**  Rapidly prototype and experiment with pre-built templates for conversational AI and process automation agents.\n* **Advanced integrations:**  Supports integrations with frameworks like LlamaIndex and LangChain for enhanced AI capabilities.\n* **Natural language understanding (NLU):**  Accurate query responses and support for multiple languages.\n\nVertex AI Search is designed to help developers create AI agents that can:\n\n* Answer complex questions\n* Provide support and personalize user experiences\n* Automate tasks and processes\n* Interact with backend systems\n\nOverall, Vertex AI Search is a powerful tool that makes it easier for developers to build and deploy generative AI agents, regardless of their experience level. 😊 \n"
         }
       ]
     },
     "groundingScore": 0.80400103,
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
          "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/{unique_string}",
          "domain": "example.com"
         }
        }
       ],
       "groundingSupport": [
         {
           "claimText": "Vertex AI Search is a platform developed by Google Cloud that simplifies the creation and deployment of generative AI agents.",
           "supportScore": 0.9541752,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "It offers both no-code and code-first approaches, allowing developers of all skill levels to build AI-powered agents.",
           "supportScore": 0.9648506,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **No-code interface:**  Use natural language to design and build agents without writing code.",
           "supportScore": 0.77115613,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Code-first approach:**  Utilize powerful orchestration and customization capabilities, including LangChain on Vertex AI.",
           "supportScore": 0.8540146,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Enterprise-grade security and compliance:**  Built-in security, compliance, and governance features align with industry certifications like HIPAA, ISO 27000-series, SOC-1/2/3, VPC-SC, and CMEK.",
           "supportScore": 0.9574074,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Integration with enterprise data:**  Easily ground your agents in enterprise data using Vertex AI Search and Retrieval Augmented Generation (RAG) APIs.",
           "supportScore": 0.9533333,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Pre-built templates:**  Rapidly prototype and experiment with pre-built templates for conversational AI and process automation agents.",
           "supportScore": 0.9457701,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Advanced integrations:**  Supports integrations with frameworks like LlamaIndex and LangChain for enhanced AI capabilities.",
           "supportScore": 0.9541752,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Natural language understanding (NLU):**  Accurate query responses and support for multiple languages.",
           "supportScore": 0.97726375,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* Provide support and personalize user experiences",
           "supportScore": 0.8540146,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* Automate tasks and processes",
           "supportScore": 0.82046676,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "what is vertex ai search"
       ],
       "searchEntryPoint": {
         "renderedContent": "\u003cstyle\u003e\n.container {\n  align-items: center;\n  border-radius: 8px;\n  display: flex;\n  font-family: Google Sans, Roboto, sans-serif;\n  font-size: 14px;\n  line-height: 20px;\n  padding: 8px 12px;\n}\n.chip {\n  display: inline-block;\n  border: solid 1px;\n  border-radius: 16px;\n  min-width: 14px;\n  padding: 5px 16px;\n  text-align: center;\n  user-select: none;\n  margin: 0 8px;\n  -webkit-tap-highlight-color: transparent;\n}\n.carousel {\n  overflow: auto;\n  scrollbar-width: none;\n  white-space: nowrap;\n  margin-right: -12px;\n}\n.headline {\n  display: flex;\n  margin-right: 4px;\n}\n.gradient-container {\n  position: relative;\n}\n.gradient {\n  position: absolute;\n  transform: translate(3px, -9px);\n  height: 36px;\n  width: 9px;\n}\n@media (prefers-color-scheme: light) {\n  .container {\n    background-color: #fafafa;\n    box-shadow: 0 0 0 1px #0000000f;\n  }\n  .headline-label {\n    color: #1f1f1f;\n  }\n  .chip {\n    background-color: #ffffff;\n    border-color: #d2d2d2;\n    color: #5e5e5e;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #f2f2f2;\n  }\n  .chip:focus {\n    background-color: #f2f2f2;\n  }\n  .chip:active {\n    background-color: #d8d8d8;\n    border-color: #b6b6b6;\n  }\n  .logo-dark {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #fafafa 15%, #fafafa00 100%);\n  }\n}\n@media (prefers-color-scheme: dark) {\n  .container {\n    background-color: #1f1f1f;\n    box-shadow: 0 0 0 1px #ffffff26;\n  }\n  .headline-label {\n    color: #fff;\n  }\n  .chip {\n    background-color: #2c2c2c;\n    border-color: #3c4043;\n    color: #fff;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #353536;\n  }\n  .chip:focus {\n    background-color: #353536;\n  }\n  .chip:active {\n    background-color: #464849;\n    border-color: #53575b;\n  }\n  .logo-light {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #1f1f1f 15%, #1f1f1f00 100%);\n  }\n}\n\u003c/style\u003e\n\u003cdiv class=\"container\"\u003e\n  \u003cdiv class=\"headline\"\u003e\n    \u003csvg class=\"logo-light\" width=\"18\" height=\"18\" viewBox=\"9 9 35 35\" fill=\"none\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M42.8622 27.0064C42.8622 25.7839 42.7525 24.6084 42.5487 23.4799H26.3109V30.1568H35.5897C35.1821 32.3041 33.9596 34.1222 32.1258 35.3448V39.6864H37.7213C40.9814 36.677 42.8622 32.2571 42.8622 27.0064V27.0064Z\" fill=\"#4285F4\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 43.8555C30.9659 43.8555 34.8687 42.3195 37.7213 39.6863L32.1258 35.3447C30.5898 36.3792 28.6306 37.0061 26.3109 37.0061C21.8282 37.0061 18.0195 33.9811 16.6559 29.906H10.9194V34.3573C13.7563 39.9841 19.5712 43.8555 26.3109 43.8555V43.8555Z\" fill=\"#34A853\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M16.6559 29.8904C16.3111 28.8559 16.1074 27.7588 16.1074 26.6146C16.1074 25.4704 16.3111 24.3733 16.6559 23.3388V18.8875H10.9194C9.74388 21.2072 9.06992 23.8247 9.06992 26.6146C9.06992 29.4045 9.74388 32.022 10.9194 34.3417L15.3864 30.8621L16.6559 29.8904V29.8904Z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 16.2386C28.85 16.2386 31.107 17.1164 32.9095 18.8091L37.8466 13.8719C34.853 11.082 30.9659 9.3736 26.3109 9.3736C19.5712 9.3736 13.7563 13.245 10.9194 18.8875L16.6559 23.3388C18.0195 19.2636 21.8282 16.2386 26.3109 16.2386V16.2386Z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003csvg class=\"logo-dark\" width=\"18\" height=\"18\" viewBox=\"0 0 48 48\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003ccircle cx=\"24\" cy=\"23\" fill=\"#FFF\" r=\"22\"/\u003e\n      \u003cpath d=\"M33.76 34.26c2.75-2.56 4.49-6.37 4.49-11.26 0-.89-.08-1.84-.29-3H24.01v5.99h8.03c-.4 2.02-1.5 3.56-3.07 4.56v.75l3.91 2.97h.88z\" fill=\"#4285F4\"/\u003e\n      \u003cpath d=\"M15.58 25.77A8.845 8.845 0 0 0 24 31.86c1.92 0 3.62-.46 4.97-1.31l4.79 3.71C31.14 36.7 27.65 38 24 38c-5.93 0-11.01-3.4-13.45-8.36l.17-1.01 4.06-2.85h.8z\" fill=\"#34A853\"/\u003e\n      \u003cpath d=\"M15.59 20.21a8.864 8.864 0 0 0 0 5.58l-5.03 3.86c-.98-2-1.53-4.25-1.53-6.64 0-2.39.55-4.64 1.53-6.64l1-.22 3.81 2.98.22 1.08z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath d=\"M24 14.14c2.11 0 4.02.75 5.52 1.98l4.36-4.36C31.22 9.43 27.81 8 24 8c-5.93 0-11.01 3.4-13.45 8.36l5.03 3.85A8.86 8.86 0 0 1 24 14.14z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003cdiv class=\"gradient-container\"\u003e\u003cdiv class=\"gradient\"\u003e\u003c/div\u003e\u003c/div\u003e\n  \u003c/div\u003e\n  \u003cdiv class=\"carousel\"\u003e\n    \u003ca class=\"chip\" href=\"https://www.google.com/search?q=what+is+ai-applications&client=app-vertex-grounding&safesearch=active\"\u003ewhat is vertex ai search\u003c/a\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n"
       },
       "retrievalMetadata": [
         {
           "source": "GOOGLE_SEARCH",
           "dynamicRetrievalMetadata": {
             "predictorMetadata": {
               "version": "V1_INDEPENDENT",
               "prediction": 0.671875
             }
           }
         }
       ]
     }
   }
 ]
}

Genera una respuesta fundamentada en varios turnos

En la generación de respuestas de varios turnos, en cada solicitud, debes enviar todo el texto intercambiado entre el usuario y el modelo en todos los turnos anteriores. Esto garantiza la continuidad y mantiene el contexto para generar la respuesta a la instrucción más reciente.

Para obtener una respuesta fundamentada a través de la generación de respuestas en varios turnos, haz lo siguiente:

REST

En los siguientes ejemplos, se muestra cómo enviar texto de instrucciones de seguimiento en varios turnos. En estas muestras, se usa el método generateGroundedContent y se fundamentan las respuestas con la Búsqueda de Google. Puedes seguir pasos similares para generar respuestas fundamentadas con otras fuentes de fundamentación.

Envía la primera instrucción en la siguiente solicitud curl.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_1"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION_TURN_1"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "googleSearchSource": {}
   }
 ]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'
```
Reemplaza lo siguiente:
- PROJECT_NUMBER: Es el número de tu proyecto de Google Cloud .
- PROMPT_TEXT_TURN_1: Es el texto de la instrucción del usuario en el primer turno.
- SYSTEM_INSTRUCTION_TURN_1: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional. Para la generación de respuestas en varios turnos, debes proporcionar las instrucciones del sistema para cada turno.
- MODEL_ID: Es un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelos disponibles, consulta Modelos compatibles.
- TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
- TOP_P: Es un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
- TOP_K: Es un campo opcional para establecer el valor de Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
- LANGUAGE_CODE: Es un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se devuelve. Si no se puede determinar el idioma a partir de la búsqueda, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
- LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
- LONGITUDE: un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.
Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.
```
{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "ANSWER_TEXT_TURN_1"
       }
     ]
   },
   "groundingScore": GROUNDING_SCORE,
   "groundingMetadata": {
     "supportChunks": [],
     "groundingSupport": [
       {
         "claimText": "CLAIM_TEXT_1",
         "supportChunkIndices": [
           0,
           1
         ]
       },
       {
         "claimText": "CLAIM_TEXT_2",
         "supportChunkIndices": [
           1
         ]
       }
     ],
     "webSearchQueries": [
       "QUERY_BUILT_FROM_USER_PROMPT"
     ],
     "searchEntryPoint": {
       "renderedContent": "RENDERED_CONTENT"
     }
   }
 }
]
} 
```
Envía la segunda instrucción como seguimiento. Agrega la primera instrucción del usuario seguida de la respuesta correspondiente del modelo para proporcionar contexto.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_1"
     }
   ]
 },
 {
   "role": "model",
   "parts": [
     {
       "text": "ANSWER_TEXT_TURN_1"
     }
   ]
 },
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_2"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION_TURN_2"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "googleSearchSource": {}
   }
 ]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'
```
Reemplaza lo siguiente:
- PROJECT_NUMBER: Es el número de tu proyecto de Google Cloud .
- PROMPT_TEXT_TURN_1: Es el texto de la instrucción del usuario en el primer turno.
- ANSWER_TEXT_TURN_1: Es el texto de respuesta del modelo en el primer turno.
- PROMPT_TEXT_TURN_2: Es el texto de la instrucción del usuario en el segundo turno.
- SYSTEM_INSTRUCTION_TURN_2: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional. Para la generación de respuestas en varios turnos, debes proporcionar las instrucciones del sistema para cada turno.
- MODEL_ID: Es un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelos disponibles, consulta Modelos compatibles.
- TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
- TOP_P: Es un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
- TOP_K: Es un campo opcional para establecer el valor de Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
- LANGUAGE_CODE: Es un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se devuelve. Si no se puede determinar el idioma a partir de la búsqueda, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
- LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
- LONGITUDE: un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.
Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.
```
{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "ANSWER_TEXT_TURN_2"
       }
     ]
   },
   "groundingScore": GROUNDING_SCORE,
   "groundingMetadata": {
     "supportChunks": [],
     "groundingSupport": [
       {
         "claimText": "CLAIM_TEXT_1",
         "supportChunkIndices": [
           0
         ]
       },
       {
         "claimText": "CLAIM_TEXT_2",
         "supportChunkIndices": [
           1,
           2
         ]
       }
     ],
     "webSearchQueries": [
       "QUERY_BUILT_FROM_USER_PROMPT"
     ],
     "searchEntryPoint": {
       "renderedContent": "RENDERED_CONTENT"
     }
   }
 }
]
}   
```
Repite este proceso para obtener más respuestas de seguimiento. En cada turno, agrega todas las instrucciones anteriores del usuario seguidas de las respuestas correspondientes del modelo.

Ejemplo de generación de respuestas de varios turnos

En el siguiente ejemplo, la solicitud especifica tres textos de hechos intercalados como la fuente de fundamentación para generar respuestas en dos turnos. En esta muestra, se usa el método generateGroundedContent. Este ejemplo también usa una instrucción del sistema para finalizar la respuesta en el primer turno con un emoji de cara sonriente.

REST

Envía la primera instrucción en la siguiente solicitud curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "Summarize what happened in 2023 in one paragraph."
     }
   ]
 }
],
"systemInstruction": {
  "parts": {
      "text": "Add a smiley emoji after the answer."
  }
},
"grounding_spec": {
 "grounding_sources": [
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come.",
           "attributes": {
             "title": "title_1",
             "uri": "some-uri-1"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries.",
           "attributes": {
             "title": "title_2",
             "uri": "some-uri-2"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources.",
           "attributes": {
             "title": "title_3",
             "uri": "some-uri-3"
           }
         }
       ]
     }
   }
 ]
},
"generationSpec": {
 "modelId": "gemini-1.5-flash"
}
}'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.  😊 \n"
       }
     ]
   },
   "groundingScore": 1,
   "groundingMetadata": {
     "supportChunks": [
       {
         "chunkText": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries. ",
         "source": "1",
         "sourceMetadata": {
           "uri": "some-uri-2",
           "title": "title_2"
         }
       },
       {
         "chunkText": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come. ",
         "source": "0",
         "sourceMetadata": {
           "uri": "some-uri-1",
           "title": "title_1"
         }
       },
       {
         "chunkText": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources. ",
         "source": "2",
         "sourceMetadata": {
           "title": "title_3",
           "uri": "some-uri-3"
         }
       }
     ],
     "groundingSupport": [
       {
         "claimText": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.",
         "supportScore": 1,
         "supportChunkIndices": [
           0,
           1,
           2
         ]
       }
     ]
   }
 }
]
}

Envía la segunda instrucción como seguimiento. Agrega la primera instrucción del usuario seguida de la respuesta correspondiente del modelo para proporcionar contexto.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "Summarize what happened in 2023 in one paragraph."
     }
   ]
 },
 {
   "role": "model",
   "parts": [
     {
       "text": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.  😊 \n"
     }
   ]
 },
 {
   "role": "user",
   "parts": [
     {
       "text": "Rephrase the answer in an abstracted list."
     }
   ]
 }
],
"grounding_spec": {
 "grounding_sources": [
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come.",
           "attributes": {
             "title": "title_1",
             "uri": "some-uri-1"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries.",
           "attributes": {
             "title": "title_2",
             "uri": "some-uri-2"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources.",
           "attributes": {
             "title": "title_3",
             "uri": "some-uri-3"
           }
         }
       ]
     }
   }
 ]
},
"generationSpec": {
 "modelId": "gemini-1.5-flash"
}
}'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "- The global average surface temperature increased in 2023.\n- The world population surpassed 8 billion in 2023.\n- Global e-commerce sales reached an estimated $5.7 trillion in 2023. \n"
       }
     ]
   },
   "groundingScore": 0.99073017,
   "groundingMetadata": {
     "supportChunks": [
       {
         "chunkText": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources. ",
         "source": "2",
         "sourceMetadata": {
           "uri": "some-uri-3",
           "title": "title_3"
         }
       },
       {
         "chunkText": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come. ",
         "source": "0",
         "sourceMetadata": {
           "uri": "some-uri-1",
           "title": "title_1"
         }
       },
       {
         "chunkText": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries. ",
         "source": "1",
         "sourceMetadata": {
           "title": "title_2",
           "uri": "some-uri-2"
         }
       }
     ],
     "groundingSupport": [
       {
         "claimText": "- The global average surface temperature increased in 2023.",
         "supportScore": 0.9883382,
         "supportChunkIndices": [
           0
         ]
       },
       {
         "claimText": "- The world population surpassed 8 billion in 2023.",
         "supportScore": 0.9919262,
         "supportChunkIndices": [
           1
         ]
       },
       {
         "claimText": "- Global e-commerce sales reached an estimated $5.7 trillion in 2023.",
         "supportScore": 0.9919262,
         "supportChunkIndices": [
           2
         ]
       }
     ]
   }
 }
]
}

Transmite respuestas fundamentadas

Puedes elegir transmitir las respuestas del modelo. Esto es útil en los casos de uso en los que la respuesta es especialmente larga y enviar toda la respuesta de una sola vez causa una demora significativa. La transmisión de la respuesta desglosa la respuesta en un array de varios candidatos que contienen partes secuenciales del texto de la respuesta.

Para obtener una respuesta fundamentada y transmitida, haz lo siguiente:

REST

En el siguiente ejemplo, se muestra cómo transmitir una respuesta fundamentada. En este ejemplo, se usa el método streamGenerateGroundedContent y se fundamenta la respuesta con la Búsqueda de Google sin la configuración de recuperación dinámica. Puedes seguir pasos similares para generar respuestas fundamentadas con otras fuentes de fundamentación.

Envía la instrucción en la siguiente solicitud curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_NUMBER/locations/global:streamGenerateGroundedContent" \
-d '
[
{
 "contents": [
   {
     "role": "user",
     "parts": [
       {
         "text": "PROMPT_TEXT"
       }
     ]
   }
 ],
 "systemInstruction": {
     "parts": {
         "text": "SYSTEM_INSTRUCTION"
     }
 },
 "groundingSpec": {
   "groundingSources": [
     {
       "googleSearchSource": {}
     }
   ]
 },
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}
]'

Reemplaza lo siguiente:

PROJECT_NUMBER: Es el número de tu proyecto de Google Cloud .
PROMPT_TEXT: La instrucción del usuario.
SYSTEM_INSTRUCTION: Es un campo opcional para proporcionar un preámbulo o algún contexto adicional.
MODEL_ID: Es un campo opcional para establecer el ID del modelo de Gemini que deseas usar para generar la respuesta fundamentada. Para obtener una lista de los IDs de modelos disponibles, consulta Modelos compatibles.
TEMPERATURE: Es un campo opcional para establecer la temperatura que se usa para el muestreo. Google recomienda una temperatura de 0.0. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_P: Es un campo opcional para establecer el valor de top-P del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
TOP_K: Es un campo opcional para establecer el valor de Top-K del modelo. Para obtener más información, consulta Parámetros del modelo de Gemini.
LANGUAGE_CODE: Es un campo opcional que se puede usar para establecer el idioma de la respuesta generada y del texto del fragmento que se devuelve. Si no se puede determinar el idioma a partir de la búsqueda, se usa este campo. El valor predeterminado es en. Para obtener una lista de los códigos de idioma, consulta Idiomas.
LATITUDE: Un campo opcional para establecer la latitud. Ingresa el valor en grados decimales, por ejemplo, -25.34.
LONGITUDE: un campo opcional para establecer la longitud. Ingresa el valor en grados decimales, por ejemplo, 131.04.

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

[{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_1"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_2"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_3"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
            "uri": "REDIRECTION_URI",
            "domain": "PUBLISHER_DOMAIN"
          }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       }
     }
   }
 ]
}]

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="gemini-2.5-flash",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="Summarize how to delete a data store in Vertex AI Agent Builder?"
                )
            ],
        )
    ],
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                google_search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.GoogleSearchSource()
            ),
        ]
    ),
)
responses = client.stream_generate_grounded_content(iter([request]))

for response in responses:
    # Handle the response
    print(response)

Ejemplo de respuestas fundamentadas de transmisión

En el siguiente ejemplo, la solicitud especifica la Búsqueda de Google como la fuente de fundamentación para transmitir una respuesta sin la configuración de recuperación dinámica. La respuesta transmitida se distribuye en varios candidatos de respuesta. En este ejemplo, se usa el método streamGenerateGroundedContent.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/123456/locations/global:streamGenerateGroundedContent" \
-d '
[
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Summarize How to delete a data store in Vertex AI Search?"
        }
      ]
    }
  ],
  "groundingSpec": {
    "groundingSources": [
      {
        "googleSearchSource": {}
      }
    ]
  },
  "generationSpec": {
    "modelId": "gemini-1.5-flash"
  }
}
]'

Respuesta

Deberías recibir una respuesta JSON similar a la siguiente respuesta truncada. Para comprender tu respuesta, consulta Datos de salida.

[{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "To"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " delete a data store in Vertex AI Search, you must first purge all data"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " from the data store. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "supportChunks": [
        {
          "source": "0",
          "sourceMetadata": {
            "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/{unique_string}",
            "domain": "cloud.google.com"
          }
        }
      ],
      "groundingSupport": [
        {
          "claimText": "To delete a data store in Vertex AI Search, you must first purge all data from the data store. ",
          "supportChunkIndices": [
            0
          ]
        }
      ],
      "webSearchQueries": [
        "how to delete a data store in vertex ai search"
      ],
      "searchEntryPoint": {
        "renderedContent": "\u003cstyle\u003e\n.container {\n  align-items: center;\n  border-radius: 8px;\n  display: flex;\n  font-family: Google Sans, Roboto, sans-serif;\n  font-size: 14px;\n  line-height: 20px;\n  padding: 8px 12px;\n}\n.chip {\n  display: inline-block;\n  border: solid 1px;\n  border-radius: 16px;\n  min-width: 14px;\n  padding: 5px 16px;\n  text-align: center;\n  user-select: none;\n  margin: 0 8px;\n  -webkit-tap-highlight-color: transparent;\n}\n.carousel {\n  overflow: auto;\n  scrollbar-width: none;\n  white-space: nowrap;\n  margin-right: -12px;\n}\n.headline {\n  display: flex;\n  margin-right: 4px;\n}\n.gradient-container {\n  position: relative;\n}\n.gradient {\n  position: absolute;\n  transform: translate(3px, -9px);\n  height: 36px;\n  width: 9px;\n}\n@media (prefers-color-scheme: light) {\n  .container {\n    background-color: #fafafa;\n    box-shadow: 0 0 0 1px #0000000f;\n  }\n  .headline-label {\n    color: #1f1f1f;\n  }\n  .chip {\n    background-color: #ffffff;\n    border-color: #d2d2d2;\n    color: #5e5e5e;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #f2f2f2;\n  }\n  .chip:focus {\n    background-color: #f2f2f2;\n  }\n  .chip:active {\n    background-color: #d8d8d8;\n    border-color: #b6b6b6;\n  }\n  .logo-dark {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #fafafa 15%, #fafafa00 100%);\n  }\n}\n@media (prefers-color-scheme: dark) {\n  .container {\n    background-color: #1f1f1f;\n    box-shadow: 0 0 0 1px #ffffff26;\n  }\n  .headline-label {\n    color: #fff;\n  }\n  .chip {\n    background-color: #2c2c2c;\n    border-color: #3c4043;\n    color: #fff;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #353536;\n  }\n  .chip:focus {\n    background-color: #353536;\n  }\n  .chip:active {\n    background-color: #464849;\n    border-color: #53575b;\n  }\n  .logo-light {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #1f1f1f 15%, #1f1f1f00 100%);\n  }\n}\n\u003c/style\u003e\n\u003cdiv class=\"container\"\u003e\n  \u003cdiv class=\"headline\"\u003e\n    \u003csvg class=\"logo-light\" width=\"18\" height=\"18\" viewBox=\"9 9 35 35\" fill=\"none\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M42.8622 27.0064C42.8622 25.7839 42.7525 24.6084 42.5487 23.4799H26.3109V30.1568H35.5897C35.1821 32.3041 33.9596 34.1222 32.1258 35.3448V39.6864H37.7213C40.9814 36.677 42.8622 32.2571 42.8622 27.0064V27.0064Z\" fill=\"#4285F4\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 43.8555C30.9659 43.8555 34.8687 42.3195 37.7213 39.6863L32.1258 35.3447C30.5898 36.3792 28.6306 37.0061 26.3109 37.0061C21.8282 37.0061 18.0195 33.9811 16.6559 29.906H10.9194V34.3573C13.7563 39.9841 19.5712 43.8555 26.3109 43.8555V43.8555Z\" fill=\"#34A853\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M16.6559 29.8904C16.3111 28.8559 16.1074 27.7588 16.1074 26.6146C16.1074 25.4704 16.3111 24.3733 16.6559 23.3388V18.8875H10.9194C9.74388 21.2072 9.06992 23.8247 9.06992 26.6146C9.06992 29.4045 9.74388 32.022 10.9194 34.3417L15.3864 30.8621L16.6559 29.8904V29.8904Z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 16.2386C28.85 16.2386 31.107 17.1164 32.9095 18.8091L37.8466 13.8719C34.853 11.082 30.9659 9.3736 26.3109 9.3736C19.5712 9.3736 13.7563 13.245 10.9194 18.8875L16.6559 23.3388C18.0195 19.2636 21.8282 16.2386 26.3109 16.2386V16.2386Z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003csvg class=\"logo-dark\" width=\"18\" height=\"18\" viewBox=\"0 0 48 48\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003ccircle cx=\"24\" cy=\"23\" fill=\"#FFF\" r=\"22\"/\u003e\n      \u003cpath d=\"M33.76 34.26c2.75-2.56 4.49-6.37 4.49-11.26 0-.89-.08-1.84-.29-3H24.01v5.99h8.03c-.4 2.02-1.5 3.56-3.07 4.56v.75l3.91 2.97h.88z\" fill=\"#4285F4\"/\u003e\n      \u003cpath d=\"M15.58 25.77A8.845 8.845 0 0 0 24 31.86c1.92 0 3.62-.46 4.97-1.31l4.79 3.71C31.14 36.7 27.65 38 24 38c-5.93 0-11.01-3.4-13.45-8.36l.17-1.01 4.06-2.85h.8z\" fill=\"#34A853\"/\u003e\n      \u003cpath d=\"M15.59 20.21a8.864 8.864 0 0 0 0 5.58l-5.03 3.86c-.98-2-1.53-4.25-1.53-6.64 0-2.39.55-4.64 1.53-6.64l1-.22 3.81 2.98.22 1.08z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath d=\"M24 14.14c2.11 0 4.02.75 5.52 1.98l4.36-4.36C31.22 9.43 27.81 8 24 8c-5.93 0-11.01 3.4-13.45 8.36l5.03 3.85A8.86 8.86 0 0 1 24 14.14z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003cdiv class=\"gradient-container\"\u003e\u003cdiv class=\"gradient\"\u003e\u003c/div\u003e\u003c/div\u003e\n  \u003c/div\u003e\n  \u003cdiv class=\"carousel\"\u003e\n    \u003ca class=\"chip\" href=\"https://www.google.com/search?q=how+to+delete+a+data+store+in+ai+applications&client=app-vertex-grounding&safesearch=active\"\u003ehow to delete a data store in vertex ai search\u003c/a\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n"
      }
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You can purge data from a data store"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " using the Google Cloud console or the command line. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You can purge data from a data store using the Google Cloud console or the command line. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "Once the data is purged, you can delete the data store. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "Once the data is purged, you can delete the data store. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You cannot delete"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " a data store that is connected to an app. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You cannot delete a data store that is connected to an app. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You must first delete the app that the data store is connected to. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You must first delete the app that the data store is connected to. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You also"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " cannot delete a data store that is in the process of upgrading or downgrading. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You also cannot delete a data store that is in the process of upgrading or downgrading. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You must wait for the upgrade or downgrade to complete before deleting the data store."
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " \n"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You must wait for the upgrade or downgrade to complete before deleting the data store. \n",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
]

Modelos compatibles

Los siguientes modelos admiten la fundamentación:

Gemini 1.5 Pro solo con entrada de texto
Gemini 1.5 Flash solo con entrada de texto

Para obtener más información sobre estos modelos de Gemini, consulta Versiones de modelos y ciclo de vida de Gemini.

Cuando llamas al método generateGroundedContent, puedes usar los siguientes IDs de modelo:

ID de modelo	Actualizado automáticamente
`default`	Sí
`gemini-1.5-flash`	Sí
`gemini-1.5-flash-001`	No
`gemini-1.5-flash-002`	No
`gemini-1.5-pro`	Sí
`gemini-1.5-pro-001`	No
`gemini-1.5-pro-002`	No

¿Qué sigue?

Aprende a usar el método de generación fundamentada con otras APIs de RAG para generar respuestas fundamentadas a partir de datos no estructurados.