Esta página foi traduzida pela API Cloud Translation.

Gerar respostas com base na realidade com o RAG

Como parte da sua experiência de Geração Aumentada de Recuperação (RAG) nos aplicativos de IA, você pode gerar respostas embasadas para comandos com base nas seguintes fontes:

Pesquisa Google: use o embasamento com a Pesquisa Google se quiser conectar o modelo ao conhecimento mundial, a uma ampla variedade de tópicos ou a informações atualizadas na Internet. A integração com a Pesquisa Google oferece suporte à recuperação dinâmica, que permite gerar Resultados Embasados com a Pesquisa Google apenas quando necessário. Portanto, a configuração de recuperação dinâmica avalia se um comando exige conhecimento sobre eventos recentes e ativa a integração com a Pesquisa Google. Para mais informações, consulte Recuperação dinâmica.
Importante:se você receber sugestões da Pesquisa Google com uma resposta, essa resposta é um "Resultado com embasamento" sujeito aos termos de "Embasamento com a Pesquisa Google" na seção Termos de serviço dos Termos específicos de serviço. Para usar as Sugestões da Pesquisa Google, consulte Usar as Sugestões da Pesquisa Google.
Texto inline: use o embasamento com texto inline para embasar a resposta em partes de texto chamadas de texto de fatos, que são fornecidas na solicitação. Um texto de fato é uma declaração fornecida pelo usuário que é considerada factual para uma determinada solicitação. O modelo não verifica a autenticidade do texto com fatos.
Repositórios de dados da Vertex AI para Pesquisa: use o embasamento com a Vertex AI para Pesquisa se quiser conectar o modelo aos seus documentos empresariais dos repositórios de dados da Vertex AI para Pesquisa.

Nesta página, descrevemos como gerar respostas embasadas com base nessas fontes usando as seguintes abordagens:

Geração de respostas com interação única
- Texto inline e repositório de dados da Vertex AI para Pesquisa
- Pesquisa Google
Geração de respostas multiturno

Além disso, você pode transmitir as respostas do modelo. Gerar uma resposta embasada por streaming é um recurso experimental.

Você pode usar outros métodos para gerar respostas embasadas, de acordo com seu aplicativo. Para mais informações, consulte APIs da Vertex AI para criar experiências de pesquisa e RAG.

Terminologia

Antes de usar o método de geração de respostas embasadas, é útil entender as entradas e saídas, como estruturar sua solicitação e a terminologia relacionada à RAG.

Termos da RAG

A RAG é uma metodologia que permite que modelos de linguagem grandes (LLMs) gerem respostas embasadas na fonte de dados escolhida. Há duas etapas no RAG:

Recuperação: encontrar os fatos mais relevantes rapidamente pode ser um problema comum de pesquisa. Com a RAG, você pode recuperar rapidamente os fatos importantes para gerar uma resposta.
Geração:os fatos recuperados são usados pelo LLM para gerar uma resposta fundamentada.

Portanto, o método de geração de respostas fundamentadas recupera os fatos da fonte de embasamento e gera uma resposta fundamentada.

Dados de entrada

O método de geração de respostas fundamentadas exige as seguintes entradas na solicitação:

Função: o remetente de um determinado texto, que pode ser um usuário (user) ou um modelo (model).
Texto: quando a função é user, o texto é um comando, e quando a função é model, o texto é uma resposta com embasamento. A maneira de especificar a função e o texto em uma solicitação é determinada da seguinte forma:
- Para uma geração de resposta única, o usuário envia o texto do comando na solicitação e o modelo envia o texto da resposta na resposta.
- Para uma geração de respostas em várias etapas, a solicitação contém o par solicitação-resposta de todas as etapas anteriores e o texto da solicitação do usuário para a etapa atual. Portanto, em uma solicitação desse tipo, a função é user para um texto de comando e model para o texto de resposta.
Instrução do sistema: um preâmbulo da sua solicitação que rege o comportamento do modelo e modifica a saída de acordo. Por exemplo, você pode adicionar uma persona à resposta gerada ou instruir o modelo a formatar o texto de saída de uma determinada maneira. Para gerar respostas em várias interações, você precisa fornecer as instruções do sistema para cada interação. Para mais informações, consulte Usar instruções do sistema.

Fonte de embasamento: a fonte em que a resposta se baseia e que pode ser uma ou mais das seguintes opções:

Pesquisa Google: baseie as respostas em resultados da Pesquisa Google. Quando a fonte de embasamento é a Pesquisa Google, é possível especificar uma configuração de recuperação dinâmica com um limite de recuperação dinâmica. Para mais informações, consulte Recuperação dinâmica.
Importante: se você receber sugestões da Pesquisa Google com uma resposta, essa resposta é um "Resultado com embasamento" sujeito aos termos de "Embasamento com a Pesquisa Google" na seção Termos de serviço dos Termos específicos de serviço. Para usar as Sugestões da Pesquisa Google, consulte Usar as Sugestões da Pesquisa Google.
Texto inline: baseie a resposta em texto de fatos fornecido na solicitação. Um texto de fato é uma declaração fornecida pelo usuário que é considerada factual para uma determinada solicitação. O modelo não verifica a autenticidade do texto com fatos. É possível fornecer no máximo 100 textos de fatos em cada fonte de texto inline. Os textos de fatos podem ser compatíveis com o uso de metatributos, como título, autor e URI. Esses atributos são retornados na resposta ao citar os trechos que apoiam a resposta.
Repositórios de dados da Vertex AI para Pesquisa: embasar a resposta nos documentos dos repositórios de dados da Vertex AI para Pesquisa. Não é possível especificar um repositório de dados de pesquisa de sites como a fonte de embasamento.

Em uma determinada solicitação, é possível fornecer uma fonte de texto inline e uma fonte de repositório de dados da Vertex AI para Pesquisa. Não é possível combinar a Pesquisa Google com nenhuma dessas fontes. Portanto, se quiser embasar suas respostas com os resultados da Pesquisa Google, envie uma solicitação separada especificando a Pesquisa Google como a única fonte de embasamento.

É possível fornecer no máximo 10 fontes de embasamento em qualquer ordem. Por exemplo, suponha que você forneça as fontes de embasamento com a seguinte contagem, na seguinte ordem, para obter um total de 10 fontes:

Três fontes de texto inline, cada uma com um máximo de 100 textos de fatos
Seis repositórios de dados da Vertex AI para Pesquisa
Uma fonte de texto inline, contendo no máximo 100 textos de fatos

Cada fonte recebe um índice na ordem em que é especificada na solicitação. Por exemplo, se você especificou uma combinação de fontes na sua solicitação, o índice de origem será atribuído conforme ilustrado na tabela a seguir:

Fonte de embasamento	Índice
Texto inline 1	0
Texto inline nº 2	1
Repositório de dados da Pesquisa da Vertex AI nº 1	2
Texto inline #3	3
Repositório de dados da Vertex AI para Pesquisa nº 2	4

Esse índice é citado na resposta e é útil ao rastrear a origem.

Especificações de geração: as especificações para configuração do modelo que consistem nas seguintes informações:
- ID do modelo: especifica o modelo do Gemini da Vertex AI a ser usado para geração de respostas. Para ver uma lista de modelos que podem ser usados para gerar respostas embasadas, consulte Modelos aceitos.
- Parâmetros do modelo: especifique os parâmetros que podem ser definidos para o modelo que você escolheu usar. São eles: idioma, temperatura, Top-P e Top-K. Para detalhes sobre esses parâmetros, consulte Parâmetros do modelo do Gemini.
Código do idioma: o idioma da resposta gerada geralmente é definido para corresponder ao idioma do comando. Se não houver um único idioma no comando (por exemplo, se o comando for muito curto e puder ser válido em vários idiomas), o campo de código de idioma vai determinar o idioma da resposta.

Para uma lista de códigos de idioma, consulte Idiomas.
Latitude e longitude: especifica a latitude e a longitude do usuário. Se a consulta contiver perguntas específicas de local, como "Encontre um café perto de mim", esses campos serão usados. Se o idioma da consulta não puder ser determinado e o código de idioma não estiver definido, a latitude e a longitude serão usadas para determinar o idioma da resposta.

Dados de saída

A resposta gerada pelo modelo é chamada de candidata e contém os seguintes dados. Nem todos os campos podem estar presentes na saída.

Função: o remetente da resposta embasada. A resposta sempre contém o texto da resposta embasada. Portanto, a função em uma resposta é sempre um modelo.
Texto: uma resposta fundamentada.
Pontuação de embasamento: um valor de ponto flutuante no intervalo [0, 1] que indica o quanto uma resposta é embasada nas fontes fornecidas.
Metadados de embasamento: metadados sobre a fonte de embasamento. Os metadados de embasamento contêm as seguintes informações:
- Trechos de suporte: uma lista de trechos que apoiam a resposta. Cada trecho de suporte recebe um índice que é útil ao rastrear a origem. Cada trecho de suporte contém o seguinte:
  - Texto de trecho: uma parte do texto citada literalmente da fonte de que a resposta ou parte dela (chamada de texto da declaração) é extraída. Isso nem sempre está presente na resposta.
  - Origem: um índice atribuído à origem na solicitação.
  - Metadados de origem: metadados sobre o trecho. Dependendo da fonte, os metadados podem ser:
    - Para uma fonte inline, os metadados podem ser os detalhes adicionais especificados na solicitação, como título, autor ou URI.
    - Para o repositório de dados da Vertex AI para Pesquisa, os metadados podem ser o ID do documento, o título do documento, o URI (local do Cloud Storage) ou o número da página.
    - No Embasamento com a Pesquisa Google, quando um resultado com base é gerado, os metadados contêm um URI que redireciona para o editor do conteúdo usado para gerar o resultado com embasamento. Os metadados também contêm o domínio do editor. Os URIs fornecidos permanecem acessíveis por até 30 dias após a geração do resultado com embasamento.
    Importante: o URI fornecido precisa ser acessado diretamente pelos usuários finais e não pode ser consultado de forma programática por meios automatizados. Se o acesso automatizado for detectado, o serviço de embasamento com a Pesquisa Google poderá parar de fornecer os URIs de redirecionamento. Para reiniciar os URIs de redirecionamento, entre em contato com o engenheiro de clientes.
- Suporte de embasamento: informações de embasamento para uma declaração na resposta. O suporte de embasamento contém as seguintes informações:
  - Texto da declaração: a resposta ou parte dela que é fundamentada com o texto do trecho de apoio.
  - Índice do trecho de suporte: um índice atribuído ao trecho de suporte na ordem em que ele aparece na lista de trechos de suporte.
  - Consultas de pesquisa na Web: as consultas de pesquisa sugeridas para as Sugestões da Pesquisa Google.
  - Sugestões de pesquisa: se você receber sugestões da Pesquisa Google com uma resposta, essa resposta é um "Resultado com embasamento" sujeito aos termos de serviço do Embasamento com a Pesquisa Google. Para mais informações, consulte Termos de serviço. O campo renderedContent em searchEntryPoint é o código fornecido para implementar as sugestões da Pesquisa Google. Para usar as Sugestões da Pesquisa Google, consulte Usar as Sugestões da Pesquisa Google.

Gerar uma resposta embasada em uma única interação

Esta seção descreve como gerar respostas embasadas nas seguintes fontes:

Texto inline e repositório de dados da Vertex AI para Pesquisa
Pesquisa Google

Baseie a resposta no texto inline e no repositório de dados da Vertex AI para Pesquisa

O exemplo a seguir mostra como enviar um texto de solicitação especificando um texto inline e um repositório de dados da Vertex AI para Pesquisa como a fonte de embasamento. Não é possível especificar um repositório de dados de pesquisa de sites como a fonte de embasamento. Este exemplo usa o método generateGroundedContent.

REST

Envie o comando na seguinte solicitação curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "inlineSource": {
       "groundingFacts": [
         {
           "factText": "FACT_TEXT_1",
           "attributes": {
             "title": "TITLE_1",
             "uri": "URI_1",
             "author": "AUTHOR_1"
           }
         }
       ]
     }
   },
   {
     "inlineSource": {
       "groundingFacts": [
         {
           "factText": "FACT_TEXT_2",
           "attributes": {
             "title": "TITLE_2",
             "uri": "URI_2"
           }
         },
         {
           "factText": "FACT_TEXT_3",
           "attributes": {
             "title": "TITLE_3",
             "uri": "URI_3"
           }
         }
       ]
     }
   },
   {
     "searchSource": {
       "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID_1/servingConfigs/default_search"
     }
   },
   {
     "searchSource": {
       "servingConfig": "projects/PROJECT_NUMBER/locations/global/collections/default_collection/engines/APP_ID_2/servingConfigs/default_search"
     }
   }
  ]
},
"generationSpec": {
  "modelId": "MODEL_ID",
  "temperature": TEMPERATURE,
  "topP": TOP_P,
  "topK": TOP_K
},
"user_context": {
  "languageCode: "LANGUAGE_CODE",
  "latLng": {
    "latitude": LATITUDE,
    "longitude": LONGITUDE
 },
}
}'

Substitua:

PROJECT_NUMBER: o número do seu projeto Google Cloud .
PROMPT_TEXT: o comando do usuário.
SYSTEM_INSTRUCTION: um campo opcional para fornecer um preâmbulo ou algum contexto adicional.
FACT_TEXT_N: o texto inline para fundamentar a resposta. É possível fornecer no máximo 100 textos de fatos.
TITLE_N: um campo opcional para definir o atributo meta de título do texto inline.
URI_N: um campo opcional para definir o atributo meta de URI do texto inline.
AUTHOR_N: um campo opcional para definir o atributo de metadados do autor para o texto inline.
APP_ID_N: o ID do app Vertex AI para Pesquisa.
MODEL_ID: um campo opcional para definir o ID do modelo do Gemini que você quer usar para gerar a resposta embasada. Para uma lista de IDs de modelos disponíveis, consulte Modelos compatíveis.
TEMPERATURE: um campo opcional para definir a temperatura usada na amostragem. O Google recomenda uma temperatura de 0,0. Para mais informações, consulte Parâmetros do modelo do Gemini.
TOP_P: um campo opcional para definir o valor de top-P do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
TOP_K: um campo opcional para definir o valor de top-K do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do trecho retornado. Se o idioma não puder ser determinado pela consulta, esse campo será usado. O valor padrão é en. Para conferir uma lista de códigos de idioma, consulte Idiomas.
LATITUDE: um campo opcional para definir a latitude. Insira o valor em graus decimais, por exemplo, -25.34.
LONGITUDE: um campo opcional para definir a longitude. Insira o valor em graus decimais, por exemplo, 131.04.

Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore": GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {
           "chunkText": "CHUNK_TEXT_FROM_A_DOCUMENT_IN_A_DATA_STORE ",
           "source": "4",
           "sourceMetadata": {
             "title": "DOCUMENT_TITLE",
             "uri": "gs://PATH/TO/DOCUMENT.pdf",
             "document_id": "DOCUMENT_ID",
             "page_identifier": "PAGE_NUMBER"
           }
         },
         {
           "chunkText": "CHUNK_TEXT_FROM_FACT_TEXT_1",
           "source": "0",
           "sourceMetadata": {
             "title": "TITLE_1",
             "uri": "URI_1",
             "author": "AUTHOR_1"
           }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportChunkIndices": [
             0,
             1
           ]
         }
       ]
     }
   }
 ]
}

Exemplo de geração de respostas em uma única interação embasada em texto inline e na Vertex AI para Pesquisa

No exemplo a seguir, a solicitação especifica estas fontes de fundamentação: um fato de texto inline e um repositório de dados da Vertex AI para Pesquisa. Este exemplo usa o método generateGroundedContent. Este exemplo também usa uma instrução do sistema para terminar a resposta com um emoji de sorriso.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "How did Google do in 2020? Where can I find BigQuery docs?"
        }
      ]
    }
  ],
  "systemInstruction": {
      "parts": {
          "text": "Add a smiley emoji after the answer."
      }
  },
  "groundingSpec": {
    "groundingSources": [
      {
        "inline_source": {
          "grounding_facts": [
            {
              "fact_text": "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction",
              "attributes": {
                "title": "BigQuery Overview",
                "uri": "https://cloud.google.com/bigquery/docs/introduction"
              }
            }
          ]
        }
      },
      {
        "searchSource": {
          "servingConfig": "projects/123456/locations/global/collections/default_collection/engines/app_id_example/servingConfigs/default_search"
        }
      }
    ]
  },
  "generationSpec": {
    "modelId": "gemini-1.5-flash"
  },
  "user_context": {
    "languageCode: "en",
    "latLng": {
       "latitude": 37.422131,
       "longitude": -122.084801
    }
  }
}'

Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "Google's revenue increased by 23% in 2020, reaching $182.5 billion. Google Cloud revenue was $13.1 billion for 2020. You can find BigQuery documentation at https://cloud.google.com/bigquery/docs/introduction. 😊 \n"
         }
       ]
     },
     "groundingScore": 0.86738646,
     "groundingMetadata": {
       "supportChunks": [
         {
           "chunkText": "Alphabet Announces Fourth Quarter and Fiscal Year 2020 Results\nMOUNTAIN VIEW, Calif. – February 2, 2021 – Alphabet Inc. (NASDAQ: GOOG, GOOGL) today announced\nfinancial results for the quarter and fiscal year ended December 31, 2020. Sundar Pichai, CEO of Google and Alphabet, said: "Our strong results this quarter reflect the helpfulness of our\nproducts and services to people and businesses, as well as the accelerating transition to online services and the\ncloud. Google succeeds when we help our customers and partners succeed, and we see significant opportunities to\nforge meaningful partnerships as businesses increasingly look to a digital future." Ruth Porat, CFO of Google and Alphabet, said: "Our strong fourth quarter performance, with revenues of $56.9\nbillion, was driven by Search and YouTube, as consumer and business activity recovered from earlier in the year. Google Cloud revenues were $13.1 billion for 2020, with significant ongoing momentum, and we remain focused on\ndelivering value across the growth opportunities we see." New reporting segment structure and operating results\nWe are now reporting results for three segments: Google Services, Google Cloud, and Other Bets. \n...\nIn 2020, we entered into derivatives that hedged the changes in fair value of certain marketable equity securities, which\nresulted in a $497 million net loss for the quarter ended December 31, 2020. The offsetting recognized gains on the\nmarketable equity securities are reflected in Gain (loss) on equity securities, net. Segment results\nThe following table presents our revenues and operating income (loss) (in millions; unaudited): Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Revenues:\nGoogle Services $ 43,198 $ 38,198 $ 34,991 $ 42,573 $ 52,873 $ 130,524 $ 151,825 $ 168,635 Google Cloud 2,614 2,777 3,007 3,444 3,831 5,838 8,918 13,059 Other Bets 172 135 148 178 196 595 659 657 Hedging gains (losses) 91 49 151 (22) (2) (138) 455 176 Total revenues $ 46,075 $ 41,159 $ 38,297 $ 46,173 $ 56,898 $ 136,819 $ 161,857 $ 182,527 Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Operating income (loss):\nGoogle Services $ 13,488 $ 11,548 $ 9,539 $ 14,453 $ 19,066 $ 43,137 $ 48,999 $ 54,606 Google Cloud (1,194) (1,730) (1,426) (1,208) (1,243) (4,348) (4,645) (5,607) Other Bets (2,026) (1,121) (1,116) (1,103) (1,136) \n...\nQ4 2020 financial highlights\nThe following table summarizes our consolidated financial results for the quarters ended December 31, 2019 and\n2020 (in millions, except for per share information and percentages; unaudited). Quarter Ended December 31,\n2019 2020 Revenues $ 46,075 $ 56,898 Increase in revenues year over year 17 % 23 % Increase in constant currency revenues year over year(1) 19 % 23 % Operating income $ 9,266 $ 15,651 Operating margin 20 % 28 % Other income (expense), net $ 1,438 $ 3,038 Net income $ 10,671 $ 15,227 Diluted EPS $ 15.35 $ 22.30 (1) Non-GAAP measure. See the table captioned "Reconciliation from GAAP revenues to non-GAAP constant currency\nrevenues" for more details. Q4 2020 supplemental information (in millions, except for number of employees; unaudited)\nRevenues, Traffic Acquisition Costs (TAC) and number of employees\nThe following table summarizes our revenues, total TAC and number of employees. Quarter Ended December 31,\n2019 2020 Google Search & other $ 27,185 $ 31,903 YouTube ads 4,717 6,885 Google Network Members' properties 6,032 7,411 Google advertising 37,934 46,199 Google other 5,264 6,674 Google Services total 43,198 52,873 Google Cloud 2,614 3,831 Other Bets 172 196 Hedging gains (losses) 91 (2) Total revenues $ 46,075 $ 56,898 Total TAC $ 8,501 $ 10,466 Number of employees 118,899 135,301 ",
           "source": "1",
           "sourceMetadata": {
             "title": "GOOG Exhibit 99.1 Q4'20",
             "page_identifier": "2",
             "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2020Q4_alphabet_earnings_release.pdf",
             "document_id": "projects/123456/locations/global/collections/default_collection/dataStores/data_store_id_example/branches/0/documents/217e8bedecfe08e3c43f5b289af15243"
           }
         },
         {
           "chunkText": "Alphabet Announces Fourth Quarter and Fiscal Year 2020 Results\nMOUNTAIN VIEW, Calif. – February 2, 2021 – Alphabet Inc. (NASDAQ: GOOG, GOOGL) today announced\nfinancial results for the quarter and fiscal year ended December 31, 2020. Sundar Pichai, CEO of Google and Alphabet, said: "Our strong results this quarter reflect the helpfulness of our\nproducts and services to people and businesses, as well as the accelerating transition to online services and the\ncloud. Google succeeds when we help our customers and partners succeed, and we see significant opportunities to\nforge meaningful partnerships as businesses increasingly look to a digital future." Ruth Porat, CFO of Google and Alphabet, said: "Our strong fourth quarter performance, with revenues of $56.9\nbillion, was driven by Search and YouTube, as consumer and business activity recovered from earlier in the year. Google Cloud revenues were $13.1 billion for 2020, with significant ongoing momentum, and we remain focused on\ndelivering value across the growth opportunities we see." New reporting segment structure and operating results\nWe are now reporting results for three segments: Google Services, Google Cloud, and Other Bets. \n...\nIn 2020, we entered into derivatives that hedged the changes in fair value of certain marketable equity securities, which\nresulted in a $497 million net loss for the quarter ended December 31, 2020. The offsetting recognized gains on the\nmarketable equity securities are reflected in Gain (loss) on equity securities, net. Segment results\nThe following table presents our revenues and operating income (loss) (in millions; unaudited): Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Revenues:\nGoogle Services $ 43,198 $ 38,198 $ 34,991 $ 42,573 $ 52,873 $ 130,524 $ 151,825 $ 168,635 Google Cloud 2,614 2,777 3,007 3,444 3,831 5,838 8,918 13,059 Other Bets 172 135 148 178 196 595 659 657 Hedging gains (losses) 91 49 151 (22) (2) (138) 455 176 Total revenues $ 46,075 $ 41,159 $ 38,297 $ 46,173 $ 56,898 $ 136,819 $ 161,857 $ 182,527 Quarter Fiscal Year Q4 2019 Q1 2020 Q2 2020 Q3 2020 Q4 2020 2018 2019 2020 Operating income (loss):\nGoogle Services $ 13,488 $ 11,548 $ 9,539 $ 14,453 $ 19,066 $ 43,137 $ 48,999 $ 54,606 Google Cloud (1,194) (1,730) (1,426) (1,208) (1,243) (4,348) (4,645) (5,607) Other Bets (2,026) (1,121) (1,116) (1,103) (1,136) \n...\nQ4 2020 financial highlights\nThe following table summarizes our consolidated financial results for the quarters ended December 31, 2019 and\n2020 (in millions, except for per share information and percentages; unaudited). Quarter Ended December 31,\n2019 2020 Revenues $ 46,075 $ 56,898 Increase in revenues year over year 17 % 23 % Increase in constant currency revenues year over year(1) 19 % 23 % Operating income $ 9,266 $ 15,651 Operating margin 20 % 28 % Other income (expense), net $ 1,438 $ 3,038 Net income $ 10,671 $ 15,227 Diluted EPS $ 15.35 $ 22.30 (1) Non-GAAP measure. See the table captioned "Reconciliation from GAAP revenues to non-GAAP constant currency\nrevenues" for more details. Q4 2020 supplemental information (in millions, except for number of employees; unaudited)\nRevenues, Traffic Acquisition Costs (TAC) and number of employees\nThe following table summarizes our revenues, total TAC and number of employees. Quarter Ended December 31,\n2019 2020 Google Search & other $ 27,185 $ 31,903 YouTube ads 4,717 6,885 Google Network Members' properties 6,032 7,411 Google advertising 37,934 46,199 Google other 5,264 6,674 Google Services total 43,198 52,873 Google Cloud 2,614 3,831 Other Bets 172 196 Hedging gains (losses) 91 (2) Total revenues $ 46,075 $ 56,898 Total TAC $ 8,501 $ 10,466 Number of employees 118,899 135,301 ",
           "source": "1",
           "sourceMetadata": {
             "document_id": "projects/123456/locations/global/collections/default_collection/dataStores/data_store_id_example/branches/0/documents/217e8bedecfe08e3c43f5b289af15243",
             "page_identifier": "2",
             "title": "GOOG Exhibit 99.1 Q4'20",
             "uri": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2020Q4_alphabet_earnings_release.pdf"
           }
         },
         {
           "chunkText": "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction ",
           "source": "0",
           "sourceMetadata": {
             "uri": "https://cloud.google.com/bigquery/docs/introduction",
             "title": "BigQuery Overview"
           }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "Google's revenue increased by 23% in 2020, reaching $182.5 billion.",
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "Google Cloud revenue was $13.1 billion for 2020.",
           "supportChunkIndices": [
             1
           ]
         },
         {
           "claimText": "You can find BigQuery documentation at https://cloud.google.com/bigquery/docs/introduction.😊 ",
           "supportChunkIndices": [
             2
           ]
         }
       ]
     }
   }
 ]
}

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_number = "YOUR_PROJECT_NUMBER"
# engine_id = "YOUR_ENGINE_ID"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="default",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="How did Google do in 2020? Where can I find BigQuery docs?"
                )
            ],
        )
    ],
    system_instruction=discoveryengine.GroundedGenerationContent(
        parts=[
            discoveryengine.GroundedGenerationContent.Part(
                text="Add a smiley emoji after the answer."
            )
        ],
    ),
    # What to ground on.
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                inline_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.InlineSource(
                    grounding_facts=[
                        discoveryengine.GroundingFact(
                            fact_text=(
                                "The BigQuery documentation can be found at https://cloud.google.com/bigquery/docs/introduction"
                            ),
                            attributes={
                                "title": "BigQuery Overview",
                                "uri": "https://cloud.google.com/bigquery/docs/introduction",
                            },
                        ),
                    ]
                ),
            ),
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.SearchSource(
                    # The full resource name of the serving config for a Vertex AI Search App
                    serving_config=f"projects/{project_number}/locations/global/collections/default_collection/engines/{engine_id}/servingConfigs/default_search",
                ),
            ),
        ]
    ),
)
response = client.generate_grounded_content(request)

# Handle the response
print(response)

Gerar respostas com embasamento usando a Pesquisa Google

Você pode embasar as respostas geradas com dados da Web disponíveis publicamente.

Recuperação dinâmica

Você pode usar a recuperação dinâmica na sua solicitação para escolher quando desativar o embasamento com a Pesquisa Google. Isso é útil quando o comando não exige uma resposta com embasamento na Pesquisa Google e os modelos compatíveis podem fornecer uma resposta com base no conhecimento sem embasamento. Isso ajuda a gerenciar a latência, a qualidade e o custo com mais eficiência.

Pontuação e limite de previsão de recuperação dinâmica

Quando você envia uma solicitação para gerar uma resposta com embasamento, os aplicativos de IA atribuem uma pontuação de previsão ao comando. A pontuação de previsão é um valor de ponto flutuante no intervalo [0,1]. O valor depende se a instrução pode se beneficiar ao basear a resposta com as informações mais atualizadas da Pesquisa Google. Portanto, uma instrução que exige uma resposta com embasamento nos fatos mais recentes da Web tem uma pontuação de previsão mais alta, e uma instrução para a qual uma resposta gerada pelo modelo é suficiente tem uma pontuação de previsão mais baixa.

Confira exemplos de algumas solicitações e as notas de previsão delas.

Comando	Pontuação de previsão	Comentário
"Escreva um poema sobre peônias"	0,13	O modelo pode confiar no próprio conhecimento, e a resposta não precisa de embasamento.
"Sugira um brinquedo para uma criança de 2 anos"	0.36	O modelo pode confiar no próprio conhecimento, e a resposta não precisa de embasamento.
"Você pode dar uma receita de guacamole de inspiração asiática?"	0,55	A Pesquisa Google pode dar uma resposta com embasamento, mas o embasamento não é estritamente necessário. O conhecimento do modelo pode ser suficiente
"O que são aplicativos de IA? Como o embasamento é cobrado nos aplicativos de IA?"	0,72	Requer que a Pesquisa Google gere uma resposta com bom embasamento
"Quem ganhou o último Grande Prêmio de F1?"	0.97	Requer que a Pesquisa Google gere uma resposta com bom embasamento

Na solicitação de geração de respostas embasadas, é possível especificar uma configuração de recuperação dinâmica com um limite. O limite é um valor de ponto flutuante no intervalo [0,1] e tem o valor padrão 0,7. Se o valor de limite for zero, a resposta será sempre com embasamento na Pesquisa Google. Para todos os outros valores de limite, o seguinte é aplicável:

Se a pontuação da previsão for maior ou igual ao limite, a resposta será baseada na Pesquisa Google. Um limite mais baixo implica que mais comandos têm respostas geradas usando o Embasamento com a Pesquisa Google.
Se a pontuação da previsão for menor que o limite, o modelo ainda poderá gerar a resposta, mas ela não será baseada na Pesquisa Google.

Para encontrar um bom limite que atenda às necessidades da sua empresa, crie um conjunto representativo de consultas que você espera encontrar. Em seguida, você pode classificar as consultas de acordo com a pontuação de previsão na resposta e selecionar um limite adequado para seu caso de uso.

Basear a resposta na Pesquisa Google

O exemplo a seguir mostra como gerar uma resposta embasada de um comando especificando a Pesquisa Google como a fonte de embasamento. Este exemplo usa o método generateGroundedContent.

REST

Envie o comando na seguinte solicitação curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION"
   }
},
"groundingSpec": {
 "groundingSources": [
 {
     "googleSearchSource": {
          "dynamicRetrievalConfig": {
              "predictor":{
                  "threshold": DYNAMIC_RETRIEVAL_THRESHOLD
              }
          }
     }
 }
]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'

Substitua:

PROJECT_NUMBER: o número do seu projeto Google Cloud .
PROMPT_TEXT: o comando do usuário.
SYSTEM_INSTRUCTION: um campo opcional para fornecer um preâmbulo ou algum contexto adicional.
DYNAMIC_RETRIEVAL_THRESHOLD: um campo opcional para definir o limite para invocar a configuração de recuperação dinâmica. É um valor de ponto flutuante no intervalo [0,1]. Se você adicionar o campo dynamicRetrievalConfig, mas não definir os campos predictor ou threshold, o valor de limite será 0,7. Se você não definir o campo dynamicRetrievalConfig, a resposta sempre será embasada.
MODEL_ID: um campo opcional para definir o ID do modelo do Gemini que você quer usar para gerar a resposta embasada. Para uma lista de IDs de modelos disponíveis, consulte Modelos compatíveis.
TEMPERATURE: um campo opcional para definir a temperatura usada na amostragem. O Google recomenda uma temperatura de 0,0. Para mais informações, consulte Parâmetros do modelo do Gemini.
TOP_P: um campo opcional para definir o valor de top-P do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
TOP_K: um campo opcional para definir o valor de top-K do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do trecho retornado. Se o idioma não puder ser determinado pela consulta, esse campo será usado. O valor padrão é en. Para conferir uma lista de códigos de idioma, consulte Idiomas.
LATITUDE: um campo opcional para definir a latitude. Insira o valor em graus decimais, por exemplo, -25.34.
LONGITUDE: um campo opcional para definir a longitude. Insira o valor em graus decimais, por exemplo, 131.04.

Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore":GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
            "uri": "REDIRECTION_URI",
            "domain": "PUBLISHER_DOMAIN"
          }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "CLAIM_TEXT_2",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       },
     }
   }
 ]
}
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT"
         }
       ]
     },
     "groundingScore":GROUNDING_SCORE,
     "groundingMetadata": {
       "supportChunks": [
         {}
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "CLAIM_TEXT_2",
           "supportScore": SUPPORT_SCORE,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       },
       "retrievalMetadata": [
         {
           "source": "GOOGLE_SEARCH",
           "dynamicRetrievalMetadata": {
             "predictorMetadata": {
               "version": "V1_INDEPENDENT",
               "prediction": PREDICTION_SCORE
             }
           }
         }
       ]
     }
   }
 ]
}

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_number = "YOUR_PROJECT_NUMBER"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="default",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="How much is Google stock?"
                )
            ],
        )
    ],
    system_instruction=discoveryengine.GroundedGenerationContent(
        parts=[
            discoveryengine.GroundedGenerationContent.Part(text="Be comprehensive.")
        ],
    ),
    # What to ground on.
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                google_search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.GoogleSearchSource(
                    # Optional: For Dynamic Retrieval
                    dynamic_retrieval_config=discoveryengine.GenerateGroundedContentRequest.DynamicRetrievalConfiguration(
                        predictor=discoveryengine.GenerateGroundedContentRequest.DynamicRetrievalConfiguration.DynamicRetrievalPredictor(
                            threshold=0.7
                        )
                    )
                )
            ),
        ]
    ),
)
response = client.generate_grounded_content(request)

# Handle the response
print(response)

Exemplo de geração de resposta com interação única baseada na Pesquisa Google

No exemplo a seguir, a solicitação especifica a Pesquisa Google como a fonte de embasamento. Este exemplo usa o método generateGroundedContent. Este exemplo também usa uma instrução do sistema para terminar a resposta com um emoji de sorriso.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [{
  "role": "user",
  "parts": [{
    "text": "What is ai applications?"
}]
}],
"systemInstruction": {
   "parts": {
      "text": "Add a smiley emoji after the answer."
   }
},
"groundingSpec": {
  "groundingSources": [
  {
      "googleSearchSource": {
        "dynamicRetrievalConfig": {
               "predictor":{
                   "threshold": 0.6
               }
           }
      }
  }
 ]
},
"generationSpec": {
  "modelId": "gemini-1.5-flash"
}
}
'

Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.

{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "AI Applications is a platform developed by Google Cloud that simplifies the creation and deployment of generative AI agents. It offers both no-code and code-first approaches, allowing developers of all skill levels to build AI-powered agents. \n\nHere are some key features of AI Applications:\n\n* **No-code interface:**  Use natural language to design and build agents without writing code.\n* **Code-first approach:**  Utilize powerful orchestration and customization capabilities, including LangChain on Vertex AI.\n* **Enterprise-grade security and compliance:**  Built-in security, compliance, and governance features align with industry certifications like HIPAA, ISO 27000-series, SOC-1/2/3, VPC-SC, and CMEK.\n* **Integration with enterprise data:**  Easily ground your agents in enterprise data using Vertex AI Search and Retrieval Augmented Generation (RAG) APIs.\n* **Pre-built templates:**  Rapidly prototype and experiment with pre-built templates for conversational AI and process automation agents.\n* **Advanced integrations:**  Supports integrations with frameworks like LlamaIndex and LangChain for enhanced AI capabilities.\n* **Natural language understanding (NLU):**  Accurate query responses and support for multiple languages.\n\nAI Applications is designed to help developers create AI agents that can:\n\n* Answer complex questions\n* Provide support and personalize user experiences\n* Automate tasks and processes\n* Interact with backend systems\n\nOverall, AI Applications is a powerful tool that makes it easier for developers to build and deploy generative AI agents, regardless of their experience level. 😊 \n"
         }
       ]
     },
     "groundingScore": 0.80400103,
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
          "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/{unique_string}",
          "domain": "example.com"
         }
        }
       ],
       "groundingSupport": [
         {
           "claimText": "AI Applications is a platform developed by Google Cloud that simplifies the creation and deployment of generative AI agents.",
           "supportScore": 0.9541752,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "It offers both no-code and code-first approaches, allowing developers of all skill levels to build AI-powered agents.",
           "supportScore": 0.9648506,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **No-code interface:**  Use natural language to design and build agents without writing code.",
           "supportScore": 0.77115613,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Code-first approach:**  Utilize powerful orchestration and customization capabilities, including LangChain on Vertex AI.",
           "supportScore": 0.8540146,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Enterprise-grade security and compliance:**  Built-in security, compliance, and governance features align with industry certifications like HIPAA, ISO 27000-series, SOC-1/2/3, VPC-SC, and CMEK.",
           "supportScore": 0.9574074,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Integration with enterprise data:**  Easily ground your agents in enterprise data using Vertex AI Search and Retrieval Augmented Generation (RAG) APIs.",
           "supportScore": 0.9533333,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Pre-built templates:**  Rapidly prototype and experiment with pre-built templates for conversational AI and process automation agents.",
           "supportScore": 0.9457701,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Advanced integrations:**  Supports integrations with frameworks like LlamaIndex and LangChain for enhanced AI capabilities.",
           "supportScore": 0.9541752,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* **Natural language understanding (NLU):**  Accurate query responses and support for multiple languages.",
           "supportScore": 0.97726375,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* Provide support and personalize user experiences",
           "supportScore": 0.8540146,
           "supportChunkIndices": [
             0
           ]
         },
         {
           "claimText": "* Automate tasks and processes",
           "supportScore": 0.82046676,
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "what is ai applications"
       ],
       "searchEntryPoint": {
         "renderedContent": "\u003cstyle\u003e\n.container {\n  align-items: center;\n  border-radius: 8px;\n  display: flex;\n  font-family: Google Sans, Roboto, sans-serif;\n  font-size: 14px;\n  line-height: 20px;\n  padding: 8px 12px;\n}\n.chip {\n  display: inline-block;\n  border: solid 1px;\n  border-radius: 16px;\n  min-width: 14px;\n  padding: 5px 16px;\n  text-align: center;\n  user-select: none;\n  margin: 0 8px;\n  -webkit-tap-highlight-color: transparent;\n}\n.carousel {\n  overflow: auto;\n  scrollbar-width: none;\n  white-space: nowrap;\n  margin-right: -12px;\n}\n.headline {\n  display: flex;\n  margin-right: 4px;\n}\n.gradient-container {\n  position: relative;\n}\n.gradient {\n  position: absolute;\n  transform: translate(3px, -9px);\n  height: 36px;\n  width: 9px;\n}\n@media (prefers-color-scheme: light) {\n  .container {\n    background-color: #fafafa;\n    box-shadow: 0 0 0 1px #0000000f;\n  }\n  .headline-label {\n    color: #1f1f1f;\n  }\n  .chip {\n    background-color: #ffffff;\n    border-color: #d2d2d2;\n    color: #5e5e5e;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #f2f2f2;\n  }\n  .chip:focus {\n    background-color: #f2f2f2;\n  }\n  .chip:active {\n    background-color: #d8d8d8;\n    border-color: #b6b6b6;\n  }\n  .logo-dark {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #fafafa 15%, #fafafa00 100%);\n  }\n}\n@media (prefers-color-scheme: dark) {\n  .container {\n    background-color: #1f1f1f;\n    box-shadow: 0 0 0 1px #ffffff26;\n  }\n  .headline-label {\n    color: #fff;\n  }\n  .chip {\n    background-color: #2c2c2c;\n    border-color: #3c4043;\n    color: #fff;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #353536;\n  }\n  .chip:focus {\n    background-color: #353536;\n  }\n  .chip:active {\n    background-color: #464849;\n    border-color: #53575b;\n  }\n  .logo-light {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #1f1f1f 15%, #1f1f1f00 100%);\n  }\n}\n\u003c/style\u003e\n\u003cdiv class=\"container\"\u003e\n  \u003cdiv class=\"headline\"\u003e\n    \u003csvg class=\"logo-light\" width=\"18\" height=\"18\" viewBox=\"9 9 35 35\" fill=\"none\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M42.8622 27.0064C42.8622 25.7839 42.7525 24.6084 42.5487 23.4799H26.3109V30.1568H35.5897C35.1821 32.3041 33.9596 34.1222 32.1258 35.3448V39.6864H37.7213C40.9814 36.677 42.8622 32.2571 42.8622 27.0064V27.0064Z\" fill=\"#4285F4\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 43.8555C30.9659 43.8555 34.8687 42.3195 37.7213 39.6863L32.1258 35.3447C30.5898 36.3792 28.6306 37.0061 26.3109 37.0061C21.8282 37.0061 18.0195 33.9811 16.6559 29.906H10.9194V34.3573C13.7563 39.9841 19.5712 43.8555 26.3109 43.8555V43.8555Z\" fill=\"#34A853\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M16.6559 29.8904C16.3111 28.8559 16.1074 27.7588 16.1074 26.6146C16.1074 25.4704 16.3111 24.3733 16.6559 23.3388V18.8875H10.9194C9.74388 21.2072 9.06992 23.8247 9.06992 26.6146C9.06992 29.4045 9.74388 32.022 10.9194 34.3417L15.3864 30.8621L16.6559 29.8904V29.8904Z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 16.2386C28.85 16.2386 31.107 17.1164 32.9095 18.8091L37.8466 13.8719C34.853 11.082 30.9659 9.3736 26.3109 9.3736C19.5712 9.3736 13.7563 13.245 10.9194 18.8875L16.6559 23.3388C18.0195 19.2636 21.8282 16.2386 26.3109 16.2386V16.2386Z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003csvg class=\"logo-dark\" width=\"18\" height=\"18\" viewBox=\"0 0 48 48\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003ccircle cx=\"24\" cy=\"23\" fill=\"#FFF\" r=\"22\"/\u003e\n      \u003cpath d=\"M33.76 34.26c2.75-2.56 4.49-6.37 4.49-11.26 0-.89-.08-1.84-.29-3H24.01v5.99h8.03c-.4 2.02-1.5 3.56-3.07 4.56v.75l3.91 2.97h.88z\" fill=\"#4285F4\"/\u003e\n      \u003cpath d=\"M15.58 25.77A8.845 8.845 0 0 0 24 31.86c1.92 0 3.62-.46 4.97-1.31l4.79 3.71C31.14 36.7 27.65 38 24 38c-5.93 0-11.01-3.4-13.45-8.36l.17-1.01 4.06-2.85h.8z\" fill=\"#34A853\"/\u003e\n      \u003cpath d=\"M15.59 20.21a8.864 8.864 0 0 0 0 5.58l-5.03 3.86c-.98-2-1.53-4.25-1.53-6.64 0-2.39.55-4.64 1.53-6.64l1-.22 3.81 2.98.22 1.08z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath d=\"M24 14.14c2.11 0 4.02.75 5.52 1.98l4.36-4.36C31.22 9.43 27.81 8 24 8c-5.93 0-11.01 3.4-13.45 8.36l5.03 3.85A8.86 8.86 0 0 1 24 14.14z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003cdiv class=\"gradient-container\"\u003e\u003cdiv class=\"gradient\"\u003e\u003c/div\u003e\u003c/div\u003e\n  \u003c/div\u003e\n  \u003cdiv class=\"carousel\"\u003e\n    \u003ca class=\"chip\" href=\"https://www.google.com/search?q=what+is+ai-applications&client=app-vertex-grounding&safesearch=active\"\u003ewhat is ai applications\u003c/a\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n"
       },
       "retrievalMetadata": [
         {
           "source": "GOOGLE_SEARCH",
           "dynamicRetrievalMetadata": {
             "predictorMetadata": {
               "version": "V1_INDEPENDENT",
               "prediction": 0.671875
             }
           }
         }
       ]
     }
   }
 ]
}

Gerar uma resposta embasada em várias rodadas

Na geração de respostas com várias interações, em cada solicitação, você precisa enviar todo o texto trocado entre o usuário e o modelo em todas as interações anteriores. Isso garante a continuidade e mantém o contexto para gerar a resposta ao comando mais recente.

Para receber uma resposta embasada com a geração de respostas em várias etapas, faça o seguinte:

REST

Os exemplos a seguir mostram como enviar texto de solicitação de acompanhamento em várias interações. Esses exemplos usam o método generateGroundedContent e embasam as respostas com a Pesquisa Google. Você pode usar etapas semelhantes para gerar respostas embasadas usando outras fontes.

Envie o primeiro comando na seguinte solicitação curl.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_1"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION_TURN_1"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "googleSearchSource": {}
   }
 ]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'
```
Substitua:
- PROJECT_NUMBER: o número do seu projeto Google Cloud .
- PROMPT_TEXT_TURN_1: o texto do comando do usuário na primeira vez.
- SYSTEM_INSTRUCTION_TURN_1: um campo opcional para fornecer um preâmbulo ou algum contexto adicional. Para geração de respostas com várias interações, você precisa fornecer as instruções do sistema em cada interação.
- MODEL_ID: um campo opcional para definir o ID do modelo do Gemini que você quer usar para gerar a resposta embasada. Para uma lista de IDs de modelos disponíveis, consulte Modelos compatíveis.
- TEMPERATURE: um campo opcional para definir a temperatura usada na amostragem. O Google recomenda uma temperatura de 0,0. Para mais informações, consulte Parâmetros do modelo do Gemini.
- TOP_P: um campo opcional para definir o valor de top-P do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
- TOP_K: um campo opcional para definir o valor de top-K do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
- LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do trecho retornado. Se o idioma não puder ser determinado pela consulta, esse campo será usado. O valor padrão é en. Para conferir uma lista de códigos de idioma, consulte Idiomas.
- LATITUDE: um campo opcional para definir a latitude. Insira o valor em graus decimais, por exemplo, -25.34.
- LONGITUDE: um campo opcional para definir a longitude. Insira o valor em graus decimais, por exemplo, 131.04.
Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.
```
{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "ANSWER_TEXT_TURN_1"
       }
     ]
   },
   "groundingScore": GROUNDING_SCORE,
   "groundingMetadata": {
     "supportChunks": [],
     "groundingSupport": [
       {
         "claimText": "CLAIM_TEXT_1",
         "supportChunkIndices": [
           0,
           1
         ]
       },
       {
         "claimText": "CLAIM_TEXT_2",
         "supportChunkIndices": [
           1
         ]
       }
     ],
     "webSearchQueries": [
       "QUERY_BUILT_FROM_USER_PROMPT"
     ],
     "searchEntryPoint": {
       "renderedContent": "RENDERED_CONTENT"
     }
   }
 }
]
} 
```
Envie o segundo comando como acompanhamento. Adicione o primeiro comando do usuário seguido da resposta correspondente do modelo para contexto.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_NUMBER/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_1"
     }
   ]
 },
 {
   "role": "model",
   "parts": [
     {
       "text": "ANSWER_TEXT_TURN_1"
     }
   ]
 },
 {
   "role": "user",
   "parts": [
     {
       "text": "PROMPT_TEXT_TURN_2"
     }
   ]
 }
],
"systemInstruction": {
   "parts": {
       "text": "SYSTEM_INSTRUCTION_TURN_2"
   }
},
"groundingSpec": {
 "groundingSources": [
   {
     "googleSearchSource": {}
   }
 ]
},
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}'
```
Substitua:
- PROJECT_NUMBER: o número do seu projeto Google Cloud .
- PROMPT_TEXT_TURN_1: o texto do comando do usuário na primeira vez.
- ANSWER_TEXT_TURN_1: o texto da resposta do modelo na primeira vez.
- PROMPT_TEXT_TURN_2: o texto do comando do usuário na segunda vez.
- SYSTEM_INSTRUCTION_TURN_2: um campo opcional para fornecer um preâmbulo ou algum contexto adicional. Para geração de respostas com várias interações, você precisa fornecer as instruções do sistema em cada interação.
- MODEL_ID: um campo opcional para definir o ID do modelo do Gemini que você quer usar para gerar a resposta embasada. Para uma lista de IDs de modelos disponíveis, consulte Modelos compatíveis.
- TEMPERATURE: um campo opcional para definir a temperatura usada na amostragem. O Google recomenda uma temperatura de 0,0. Para mais informações, consulte Parâmetros do modelo do Gemini.
- TOP_P: um campo opcional para definir o valor de top-P do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
- TOP_K: um campo opcional para definir o valor de top-K do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
- LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do trecho retornado. Se o idioma não puder ser determinado pela consulta, esse campo será usado. O valor padrão é en. Para conferir uma lista de códigos de idioma, consulte Idiomas.
- LATITUDE: um campo opcional para definir a latitude. Insira o valor em graus decimais, por exemplo, -25.34.
- LONGITUDE: um campo opcional para definir a longitude. Insira o valor em graus decimais, por exemplo, 131.04.
Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.
```
{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "ANSWER_TEXT_TURN_2"
       }
     ]
   },
   "groundingScore": GROUNDING_SCORE,
   "groundingMetadata": {
     "supportChunks": [],
     "groundingSupport": [
       {
         "claimText": "CLAIM_TEXT_1",
         "supportChunkIndices": [
           0
         ]
       },
       {
         "claimText": "CLAIM_TEXT_2",
         "supportChunkIndices": [
           1,
           2
         ]
       }
     ],
     "webSearchQueries": [
       "QUERY_BUILT_FROM_USER_PROMPT"
     ],
     "searchEntryPoint": {
       "renderedContent": "RENDERED_CONTENT"
     }
   }
 }
]
}   
```
Repita esse processo para receber mais respostas de acompanhamento. Em cada interação, adicione todos os comandos anteriores do usuário seguidos pelas respostas correspondentes do modelo.

Exemplo de geração de respostas com várias interações

No exemplo a seguir, a solicitação especifica três textos de fatos inline como a fonte de embasamento para gerar respostas em dois turnos. Este exemplo usa o método generateGroundedContent. Este exemplo também usa uma instrução do sistema para terminar a resposta na primeira vez com um emoji de sorriso.

REST

Envie o primeiro comando na seguinte solicitação curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "Summarize what happened in 2023 in one paragraph."
     }
   ]
 }
],
"systemInstruction": {
  "parts": {
      "text": "Add a smiley emoji after the answer."
  }
},
"grounding_spec": {
 "grounding_sources": [
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come.",
           "attributes": {
             "title": "title_1",
             "uri": "some-uri-1"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries.",
           "attributes": {
             "title": "title_2",
             "uri": "some-uri-2"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources.",
           "attributes": {
             "title": "title_3",
             "uri": "some-uri-3"
           }
         }
       ]
     }
   }
 ]
},
"generationSpec": {
 "modelId": "gemini-1.5-flash"
}
}'

Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.

{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.  😊 \n"
       }
     ]
   },
   "groundingScore": 1,
   "groundingMetadata": {
     "supportChunks": [
       {
         "chunkText": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries. ",
         "source": "1",
         "sourceMetadata": {
           "uri": "some-uri-2",
           "title": "title_2"
         }
       },
       {
         "chunkText": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come. ",
         "source": "0",
         "sourceMetadata": {
           "uri": "some-uri-1",
           "title": "title_1"
         }
       },
       {
         "chunkText": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources. ",
         "source": "2",
         "sourceMetadata": {
           "title": "title_3",
           "uri": "some-uri-3"
         }
       }
     ],
     "groundingSupport": [
       {
         "claimText": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.",
         "supportScore": 1,
         "supportChunkIndices": [
           0,
           1,
           2
         ]
       }
     ]
   }
 }
]
}

Envie o segundo comando como acompanhamento. Adicione o primeiro comando do usuário seguido da resposta correspondente do modelo para contexto.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/123456/locations/global:generateGroundedContent" \
-d '
{
"contents": [
 {
   "role": "user",
   "parts": [
     {
       "text": "Summarize what happened in 2023 in one paragraph."
     }
   ]
 },
 {
   "role": "model",
   "parts": [
     {
       "text": "In 2023, the global average surface temperature increased, the world population surpassed 8 billion, and global e-commerce sales reached an estimated $5.7 trillion.  😊 \n"
     }
   ]
 },
 {
   "role": "user",
   "parts": [
     {
       "text": "Rephrase the answer in an abstracted list."
     }
   ]
 }
],
"grounding_spec": {
 "grounding_sources": [
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come.",
           "attributes": {
             "title": "title_1",
             "uri": "some-uri-1"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries.",
           "attributes": {
             "title": "title_2",
             "uri": "some-uri-2"
           }
         }
       ]
     }
   },
   {
     "inline_source": {
       "grounding_facts": [
         {
           "fact_text": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources.",
           "attributes": {
             "title": "title_3",
             "uri": "some-uri-3"
           }
         }
       ]
     }
   }
 ]
},
"generationSpec": {
 "modelId": "gemini-1.5-flash"
}
}'

Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.

{
"candidates": [
 {
   "content": {
     "role": "model",
     "parts": [
       {
         "text": "- The global average surface temperature increased in 2023.\n- The world population surpassed 8 billion in 2023.\n- Global e-commerce sales reached an estimated $5.7 trillion in 2023. \n"
       }
     ]
   },
   "groundingScore": 0.99073017,
   "groundingMetadata": {
     "supportChunks": [
       {
         "chunkText": "In 2023, the global average surface temperature was approximately 0.2 degrees Celsius higher than the 20th-century average. This continued the worrying trend of global warming, underscoring the urgency of worldwide climate initiatives, carbon reduction efforts, and investment in renewable energy sources. ",
         "source": "2",
         "sourceMetadata": {
           "uri": "some-uri-3",
           "title": "title_3"
         }
       },
       {
         "chunkText": "In 2023, the world population surpassed 8 billion. This milestone marked a significant moment in human history, highlighting both the rapid growth of our species and the challenges of resource management and sustainability in the years to come. ",
         "source": "0",
         "sourceMetadata": {
           "uri": "some-uri-1",
           "title": "title_1"
         }
       },
       {
         "chunkText": "In 2023, global e-commerce sales reached an estimated $5.7 trillion. The continued rise of online shopping solidified its position as a dominant force in retail, with major implications for traditional brick-and-mortar stores and the logistics networks supporting worldwide deliveries. ",
         "source": "1",
         "sourceMetadata": {
           "title": "title_2",
           "uri": "some-uri-2"
         }
       }
     ],
     "groundingSupport": [
       {
         "claimText": "- The global average surface temperature increased in 2023.",
         "supportScore": 0.9883382,
         "supportChunkIndices": [
           0
         ]
       },
       {
         "claimText": "- The world population surpassed 8 billion in 2023.",
         "supportScore": 0.9919262,
         "supportChunkIndices": [
           1
         ]
       },
       {
         "claimText": "- Global e-commerce sales reached an estimated $5.7 trillion in 2023.",
         "supportScore": 0.9919262,
         "supportChunkIndices": [
           2
         ]
       }
     ]
   }
 }
]
}

Mostrar respostas embasadas

Você pode transmitir as respostas do modelo. Isso é útil em casos de uso em que a resposta é muito longa e o envio de toda a resposta de uma só vez causa um atraso significativo. O streaming da resposta divide a resposta em uma matriz de vários candidatos que contêm partes sequenciais do texto da resposta.

Para receber uma resposta fundamentada e transmitida, faça o seguinte:

REST

O exemplo a seguir mostra como transmitir uma resposta embasada. Este exemplo usa o método streamGenerateGroundedContent e embasa a resposta com a Pesquisa Google sem a configuração de recuperação dinâmica. Você pode usar etapas semelhantes para gerar respostas embasadas usando outras fontes.

Envie o comando na seguinte solicitação curl.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_NUMBER/locations/global:streamGenerateGroundedContent" \
-d '
[
{
 "contents": [
   {
     "role": "user",
     "parts": [
       {
         "text": "PROMPT_TEXT"
       }
     ]
   }
 ],
 "systemInstruction": {
     "parts": {
         "text": "SYSTEM_INSTRUCTION"
     }
 },
 "groundingSpec": {
   "groundingSources": [
     {
       "googleSearchSource": {}
     }
   ]
 },
"generationSpec": {
 "modelId": "MODEL_ID",
 "temperature": TEMPERATURE,
 "topP": TOP_P,
 "topK": TOP_K
},
"user_context": {
 "languageCode: "LANGUAGE_CODE",
 "latLng": {
   "latitude": LATITUDE,
   "longitude": LONGITUDE
 },
}
}
]'

Substitua:

PROJECT_NUMBER: o número do seu projeto Google Cloud .
PROMPT_TEXT: o comando do usuário.
SYSTEM_INSTRUCTION: um campo opcional para fornecer um preâmbulo ou algum contexto adicional.
MODEL_ID: um campo opcional para definir o ID do modelo do Gemini que você quer usar para gerar a resposta embasada. Para uma lista de IDs de modelos disponíveis, consulte Modelos compatíveis.
TEMPERATURE: um campo opcional para definir a temperatura usada na amostragem. O Google recomenda uma temperatura de 0,0. Para mais informações, consulte Parâmetros do modelo do Gemini.
TOP_P: um campo opcional para definir o valor de top-P do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
TOP_K: um campo opcional para definir o valor de top-K do modelo. Para mais informações, consulte Parâmetros do modelo do Gemini.
LANGUAGE_CODE: um campo opcional que pode ser usado para definir o idioma da resposta gerada e do texto do trecho retornado. Se o idioma não puder ser determinado pela consulta, esse campo será usado. O valor padrão é en. Para conferir uma lista de códigos de idioma, consulte Idiomas.
LATITUDE: um campo opcional para definir a latitude. Insira o valor em graus decimais, por exemplo, -25.34.
LONGITUDE: um campo opcional para definir a longitude. Insira o valor em graus decimais, por exemplo, 131.04.

Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.

[{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_1"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_2"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "content": {
       "role": "model",
       "parts": [
         {
           "text": "ANSWER_TEXT_PART_3"
         }
       ]
     }
   }
 ]
},
{
 "candidates": [
   {
     "groundingMetadata": {
       "supportChunks": [
         {
          "source": "0",
          "sourceMetadata": {
            "uri": "REDIRECTION_URI",
            "domain": "PUBLISHER_DOMAIN"
          }
         }
       ],
       "groundingSupport": [
         {
           "claimText": "CLAIM_TEXT_1",
           "supportChunkIndices": [
             0
           ]
         }
       ],
       "webSearchQueries": [
         "QUERY_BUILT_FROM_USER_PROMPT"
       ],
       "searchEntryPoint": {
         "renderedContent": "RENDERED_CONTENT"
       }
     }
   }
 ]
}]

Python

from google.cloud import discoveryengine_v1 as discoveryengine

# TODO(developer): Uncomment these variables before running the sample.
# project_id = "YOUR_PROJECT_ID"

client = discoveryengine.GroundedGenerationServiceClient()

request = discoveryengine.GenerateGroundedContentRequest(
    # The full resource name of the location.
    # Format: projects/{project_number}/locations/{location}
    location=client.common_location_path(project=project_number, location="global"),
    generation_spec=discoveryengine.GenerateGroundedContentRequest.GenerationSpec(
        model_id="default",
    ),
    # Conversation between user and model
    contents=[
        discoveryengine.GroundedGenerationContent(
            role="user",
            parts=[
                discoveryengine.GroundedGenerationContent.Part(
                    text="Summarize how to delete a data store in Vertex AI Agent Builder?"
                )
            ],
        )
    ],
    grounding_spec=discoveryengine.GenerateGroundedContentRequest.GroundingSpec(
        grounding_sources=[
            discoveryengine.GenerateGroundedContentRequest.GroundingSource(
                google_search_source=discoveryengine.GenerateGroundedContentRequest.GroundingSource.GoogleSearchSource()
            ),
        ]
    ),
)
responses = client.stream_generate_grounded_content(iter([request]))

for response in responses:
    # Handle the response
    print(response)

Exemplo de respostas embasadas por streaming

No exemplo a seguir, a solicitação especifica a Pesquisa Google como a fonte de embasamento para transmitir uma resposta sem a configuração de recuperação dinâmica. A resposta transmitida é distribuída em vários candidatos a resposta. Este exemplo usa o método streamGenerateGroundedContent.

REST

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1alpha/projects/123456/locations/global:streamGenerateGroundedContent" \
-d '
[
{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Summarize How to delete a data store in AI Applications?"
        }
      ]
    }
  ],
  "groundingSpec": {
    "groundingSources": [
      {
        "googleSearchSource": {}
      }
    ]
  },
  "generationSpec": {
    "modelId": "gemini-1.5-flash"
  }
}
]'

Resposta

Você vai receber uma resposta JSON semelhante a esta, que está truncada. Para entender sua resposta, consulte Dados de saída.

[{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "To"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " delete a data store in AI Applications, you must first purge all data"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " from the data store. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "supportChunks": [
        {
          "source": "0",
          "sourceMetadata": {
            "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/{unique_string}",
            "domain": "cloud.google.com"
          }
        }
      ],
      "groundingSupport": [
        {
          "claimText": "To delete a data store in AI Applications, you must first purge all data from the data store. ",
          "supportChunkIndices": [
            0
          ]
        }
      ],
      "webSearchQueries": [
        "how to delete a data store in ai applications"
      ],
      "searchEntryPoint": {
        "renderedContent": "\u003cstyle\u003e\n.container {\n  align-items: center;\n  border-radius: 8px;\n  display: flex;\n  font-family: Google Sans, Roboto, sans-serif;\n  font-size: 14px;\n  line-height: 20px;\n  padding: 8px 12px;\n}\n.chip {\n  display: inline-block;\n  border: solid 1px;\n  border-radius: 16px;\n  min-width: 14px;\n  padding: 5px 16px;\n  text-align: center;\n  user-select: none;\n  margin: 0 8px;\n  -webkit-tap-highlight-color: transparent;\n}\n.carousel {\n  overflow: auto;\n  scrollbar-width: none;\n  white-space: nowrap;\n  margin-right: -12px;\n}\n.headline {\n  display: flex;\n  margin-right: 4px;\n}\n.gradient-container {\n  position: relative;\n}\n.gradient {\n  position: absolute;\n  transform: translate(3px, -9px);\n  height: 36px;\n  width: 9px;\n}\n@media (prefers-color-scheme: light) {\n  .container {\n    background-color: #fafafa;\n    box-shadow: 0 0 0 1px #0000000f;\n  }\n  .headline-label {\n    color: #1f1f1f;\n  }\n  .chip {\n    background-color: #ffffff;\n    border-color: #d2d2d2;\n    color: #5e5e5e;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #f2f2f2;\n  }\n  .chip:focus {\n    background-color: #f2f2f2;\n  }\n  .chip:active {\n    background-color: #d8d8d8;\n    border-color: #b6b6b6;\n  }\n  .logo-dark {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #fafafa 15%, #fafafa00 100%);\n  }\n}\n@media (prefers-color-scheme: dark) {\n  .container {\n    background-color: #1f1f1f;\n    box-shadow: 0 0 0 1px #ffffff26;\n  }\n  .headline-label {\n    color: #fff;\n  }\n  .chip {\n    background-color: #2c2c2c;\n    border-color: #3c4043;\n    color: #fff;\n    text-decoration: none;\n  }\n  .chip:hover {\n    background-color: #353536;\n  }\n  .chip:focus {\n    background-color: #353536;\n  }\n  .chip:active {\n    background-color: #464849;\n    border-color: #53575b;\n  }\n  .logo-light {\n    display: none;\n  }\n  .gradient {\n    background: linear-gradient(90deg, #1f1f1f 15%, #1f1f1f00 100%);\n  }\n}\n\u003c/style\u003e\n\u003cdiv class=\"container\"\u003e\n  \u003cdiv class=\"headline\"\u003e\n    \u003csvg class=\"logo-light\" width=\"18\" height=\"18\" viewBox=\"9 9 35 35\" fill=\"none\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M42.8622 27.0064C42.8622 25.7839 42.7525 24.6084 42.5487 23.4799H26.3109V30.1568H35.5897C35.1821 32.3041 33.9596 34.1222 32.1258 35.3448V39.6864H37.7213C40.9814 36.677 42.8622 32.2571 42.8622 27.0064V27.0064Z\" fill=\"#4285F4\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 43.8555C30.9659 43.8555 34.8687 42.3195 37.7213 39.6863L32.1258 35.3447C30.5898 36.3792 28.6306 37.0061 26.3109 37.0061C21.8282 37.0061 18.0195 33.9811 16.6559 29.906H10.9194V34.3573C13.7563 39.9841 19.5712 43.8555 26.3109 43.8555V43.8555Z\" fill=\"#34A853\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M16.6559 29.8904C16.3111 28.8559 16.1074 27.7588 16.1074 26.6146C16.1074 25.4704 16.3111 24.3733 16.6559 23.3388V18.8875H10.9194C9.74388 21.2072 9.06992 23.8247 9.06992 26.6146C9.06992 29.4045 9.74388 32.022 10.9194 34.3417L15.3864 30.8621L16.6559 29.8904V29.8904Z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath fill-rule=\"evenodd\" clip-rule=\"evenodd\" d=\"M26.3109 16.2386C28.85 16.2386 31.107 17.1164 32.9095 18.8091L37.8466 13.8719C34.853 11.082 30.9659 9.3736 26.3109 9.3736C19.5712 9.3736 13.7563 13.245 10.9194 18.8875L16.6559 23.3388C18.0195 19.2636 21.8282 16.2386 26.3109 16.2386V16.2386Z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003csvg class=\"logo-dark\" width=\"18\" height=\"18\" viewBox=\"0 0 48 48\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\n      \u003ccircle cx=\"24\" cy=\"23\" fill=\"#FFF\" r=\"22\"/\u003e\n      \u003cpath d=\"M33.76 34.26c2.75-2.56 4.49-6.37 4.49-11.26 0-.89-.08-1.84-.29-3H24.01v5.99h8.03c-.4 2.02-1.5 3.56-3.07 4.56v.75l3.91 2.97h.88z\" fill=\"#4285F4\"/\u003e\n      \u003cpath d=\"M15.58 25.77A8.845 8.845 0 0 0 24 31.86c1.92 0 3.62-.46 4.97-1.31l4.79 3.71C31.14 36.7 27.65 38 24 38c-5.93 0-11.01-3.4-13.45-8.36l.17-1.01 4.06-2.85h.8z\" fill=\"#34A853\"/\u003e\n      \u003cpath d=\"M15.59 20.21a8.864 8.864 0 0 0 0 5.58l-5.03 3.86c-.98-2-1.53-4.25-1.53-6.64 0-2.39.55-4.64 1.53-6.64l1-.22 3.81 2.98.22 1.08z\" fill=\"#FBBC05\"/\u003e\n      \u003cpath d=\"M24 14.14c2.11 0 4.02.75 5.52 1.98l4.36-4.36C31.22 9.43 27.81 8 24 8c-5.93 0-11.01 3.4-13.45 8.36l5.03 3.85A8.86 8.86 0 0 1 24 14.14z\" fill=\"#EA4335\"/\u003e\n    \u003c/svg\u003e\n    \u003cdiv class=\"gradient-container\"\u003e\u003cdiv class=\"gradient\"\u003e\u003c/div\u003e\u003c/div\u003e\n  \u003c/div\u003e\n  \u003cdiv class=\"carousel\"\u003e\n    \u003ca class=\"chip\" href=\"https://www.google.com/search?q=how+to+delete+a+data+store+in+ai+applications&client=app-vertex-grounding&safesearch=active\"\u003ehow to delete a data store in ai applications\u003c/a\u003e\n  \u003c/div\u003e\n\u003c/div\u003e\n"
      }
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You can purge data from a data store"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " using the Google Cloud console or the command line. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You can purge data from a data store using the Google Cloud console or the command line. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "Once the data is purged, you can delete the data store. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "Once the data is purged, you can delete the data store. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You cannot delete"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " a data store that is connected to an app. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You cannot delete a data store that is connected to an app. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You must first delete the app that the data store is connected to. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You must first delete the app that the data store is connected to. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You also"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " cannot delete a data store that is in the process of upgrading or downgrading. "
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You also cannot delete a data store that is in the process of upgrading or downgrading. ",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": "You must wait for the upgrade or downgrade to complete before deleting the data store."
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "content": {
      "role": "model",
      "parts": [
        {
          "text": " \n"
        }
      ]
    }
  }
]
}
,
{
"candidates": [
  {
    "groundingMetadata": {
      "groundingSupport": [
        {
          "claimText": "You must wait for the upgrade or downgrade to complete before deleting the data store. \n",
          "supportChunkIndices": [
            0
          ]
        }
      ]
    }
  }
]
}
]

Modelos compatíveis

Os seguintes modelos dão suporte ao embasamento:

Gemini 1.5 Pro apenas com entrada de texto
Flash 1.5 do Gemini 1.5 apenas com entrada de texto

Para saber mais sobre esses modelos do Gemini, consulte Versões e ciclo de vida do modelo Gemini.

Ao chamar o método generateGroundedContent, você pode usar os seguintes IDs de modelo:

ID do modelo	Atualizado automaticamente
`default`	Sim
`gemini-1.5-flash`	Sim
`gemini-1.5-flash-001`	Não
`gemini-1.5-flash-002`	Não
`gemini-1.5-pro`	Sim
`gemini-1.5-pro-001`	Não
`gemini-1.5-pro-002`	Não

A seguir

Aprenda a usar o método de geração embasada com outras APIs de RAG para gerar respostas embasadas com dados não estruturados.

Gerar respostas com base na realidade com o RAG Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Terminologia

Termos da RAG

Dados de entrada

Dados de saída

Gerar uma resposta embasada em uma única interação

Baseie a resposta no texto inline e no repositório de dados da Vertex AI para Pesquisa

REST

Resposta

Exemplo de geração de respostas em uma única interação embasada em texto inline e na Vertex AI para Pesquisa

REST

Resposta

Python

Gerar respostas com embasamento usando a Pesquisa Google

Recuperação dinâmica

Pontuação e limite de previsão de recuperação dinâmica

Basear a resposta na Pesquisa Google

REST

Resposta

Python

Exemplo de geração de resposta com interação única baseada na Pesquisa Google

REST

Resposta

Gerar uma resposta embasada em várias rodadas

REST

Resposta

Resposta

Exemplo de geração de respostas com várias interações

REST

Resposta

Resposta

Mostrar respostas embasadas

REST

Resposta

Python

Exemplo de respostas embasadas por streaming

REST

Resposta

Modelos compatíveis

A seguir

Gerar respostas com base na realidade com o RAG