Cómo obtener resúmenes de búsqueda

En esta página, se muestra cómo usar la API para obtener resúmenes de búsqueda con tus resultados de búsqueda. También se explican las opciones disponibles con los resúmenes de búsqueda. Solo para datos no estructurados y de sitios web.

Si deseas obtener información para obtener respuestas de IA generativa para tus consultas de datos de atención médica, consulta Cómo realizar búsquedas con consultas en lenguaje natural con respuestas de IA generativa.

Antes de comenzar

Según el tipo de app que tengas, completa los siguientes requisitos:

Obtén un resumen de la búsqueda

Un resumen de búsqueda es un resumen breve de uno o más resultados de la búsqueda principales que se muestran en una respuesta de búsqueda. El resumen en sí se toma de las respuestas extractivas que se muestran en la respuesta. Por lo tanto, para obtener un resumen, también debes obtener respuestas extractivas con los resultados de la búsqueda. Para obtener más información, consulta Cómo obtener respuestas extractivas (versión preliminar).

En la siguiente imagen, se muestra el resumen cuando se consultan los archivos PDF de un almacén de datos con summaryResultCount establecido en 5. El contenido del resumen puede variar según la configuración de la app.

La consulta es "Define operating expenses". La sección de resumen de la búsqueda muestra un resumen extraído de los resultados principales.
Figura 1. Widget de ejemplo con un resumen de la búsqueda.

Los resúmenes de búsqueda pueden incluir texto con formato Markdown. Por este motivo, considera usar un analizador de Markdown en tu aplicación para renderizar texto de Markdown.

Para obtener un resumen de la búsqueda, sigue estos pasos:

  1. Envía una solicitud de búsqueda que incluya contentSearchSpec.summarySpec y especifique valores para summaryResultCount y maxExtractiveAnswerCount. Para obtener más información sobre cómo enviar una solicitud de búsqueda, consulta Cómo obtener resultados de la búsqueda.

    En el siguiente ejemplo, summarySpec indica que deseas un resumen de la búsqueda y que este se debe generar a partir de los tres resultados principales de la búsqueda.

    "contentSearchSpec":
     {
       "summarySpec":
       {
         "summaryResultCount": 3
       },
       "extractiveContentSpec": { "maxExtractiveAnswerCount" : 1}
     }
    
    • summaryResultCount: Es la cantidad de resultados principales a partir de los cuales se generará el resumen de la búsqueda. Si la cantidad de resultados que se muestran es menor que summaryResultCount, el resumen se genera a partir de todos los resultados.

    • maxExtractiveAnswerCount: Es la cantidad de respuestas extractivas que se mostrarán para cada resultado de la búsqueda. El valor predeterminado es 0 y el máximo es 1.

  2. Obtén el resumen de la respuesta de la búsqueda. Se muestra una propiedad summary en cada respuesta.

    Este es un ejemplo de un resumen que se muestra al final de una respuesta de búsqueda:

    "summary":
    {
      "summaryText": "BigQuery is Google Cloud's fully managed and completely
      serverless enterprise data warehouse. BigQuery supports all data types,
      works across clouds, and has built-in machine learning and business
      intelligence, all within a unified platform."
    }
    

Genera resúmenes a partir de fragmentos semánticos

Puedes activar use_semantic_chunks para generar resúmenes a partir de los fragmentos de documentos más relevantes. El uso de fragmentos semánticos para la generación de resúmenes aumenta la recuperación en comparación con el comportamiento predeterminado de usar respuestas extractivas.

Cuando se activa el corte semántico para los resúmenes, la respuesta muestra el resumen y el contenido de cada fragmento que usó el resumen.

Para usar fragmentos semánticos para la generación de resúmenes, sigue estos pasos:

  1. Envía una solicitud de búsqueda que incluya contentSearchSpec.summarySpec y especifique "use_semantic_chunks": true. Para obtener más información sobre cómo enviar una solicitud de búsqueda, consulta Cómo obtener resultados de la búsqueda.

    En el siguiente ejemplo de summarySpec, se indica que deseas un resumen de búsqueda que use fragmentos semánticos, cuántos resultados incluir y si incluir citas.

    "contentSearchSpec":
     {
       "summarySpec":
       {
         "useSemanticChunks": SEMANTIC_CHUNK_BOOLEAN,
         "summaryResultCount": SUMMARY_RESULT_COUNT,
         "includeCitations": CITATIONS_BOOLEAN,
       }
     }
    
    • SEMANTIC_CHUNK_BOOLEAN: Es un valor booleano que especifica si se deben usar fragmentos semánticos para generar el resumen de la búsqueda. Si se establece en true, se usan fragmentos semánticos.
    • SUMMARY_RESULT_COUNT: Es la cantidad de resultados principales a partir de los cuales se genera el resumen de la búsqueda. El valor máximo es 10.
    • CITATIONS_BOOLEAN: Es un valor booleano que especifica si se muestran las citas. Si activaste el modo de fragmentos cuando creaste tu almacén de datos, las citas se refieren a los fragmentos. De lo contrario, las citas se refieren a los documentos de origen. Para obtener más información sobre el modo de fragmento, consulta Cómo analizar y dividir documentos.
  2. Obtén el resumen de la respuesta de la búsqueda.

    Este es un ejemplo de una respuesta de búsqueda que incluye un resumen generado a partir de fragmentos y citas. La parte references de la respuesta contiene el contenido de los fragmentos a partir de los cuales se genera el resumen.

    Respuesta

    {
      "results": [
        {
          "id": "123xyz",
          "document": {
            "name": "projects/exampleproject/locations/global/collections/default_collection/dataStores/exampledatastore/branches/0/documents/123xyz",
            "id": "123xyz",
            "derivedStructData": {
              "link": "gs://examplebucket/alphabet-investor-pdfs/2004_google_annual_report.pdf"
            }
          }
        }
      ],
      "totalSize": 8375,
      "attributionToken": "abcdefg",
      "nextPageToken": "hijklmnop",
      "guidedSearchResult": {},
      "summary": {
        "summaryText": "Google's search technology uses a combination of techniques to determine the importance of a web page independent of a particular search query and to determine the relevance of that page to a particular search query. [1]",
        "summaryWithMetadata": {
          "summary": "Google's search technology uses a combination of techniques to determine the importance of a web page independent of a particular search query and to determine the relevance of that page to a particular search query.",
          "citationMetadata": {
            "citations": [
              {
                "endIndex": "216",
                "sources": [
                  {}
                ]
              }
            ]
          },
          "references": [
            {
              "document": "projects/exampleproject/locations/global/collections/default_collection/dataStores/exampledatastore/branches/0/documents/123xyz",
              "chunkContents": [
                {
                  "content": "Groups contains more than 1 billion messages from Usenet Internet discussion groups dating back to 1981.The\ndiscussions in these groups cover a broad range of discourse and provide a comprehensive look at evolving\nviewpoints, debate and advice on many subjects.The new Google Groups adds in the ability to create your own\ngroups for you and your friends and an improved user interface.Google Mobile.Google Mobile offers people the ability to search and view both the "mobile web,"\nconsisting of pages created specifically for wireless devices, and the entire Google index of more than 8 billion\nweb pages.Google Mobile works on devices that support WAP, WAP 2.0, i-mode or j-sky mobile Internet\nprotocols.In addition, users can access a variety of information using Google SMS by typing a query to the\nGoogle shortcode.Google Mobile is available through many wireless and mobile phone services worldwide.",
                  "pageIdentifier": "17"
                },
                {
                  "content": "Google Labs is our playground for our engineers and for adventurous Google users.On Google\nLabs, we post product prototypes and solicit feedback on how the technology could be used or improved.Current Google Labs examples include:Google Personalized Search—provides customized search results based on an individual user's interests.Froogle Wireless—gives people the ability to search for product information from their mobile phones\nand other wireless devices.Google Maps—enables users to see maps, get directions, and find local businesses and services quickly\nand easily.Google Maps has several unique features, including draggable maps, integrated local search\nfrom Google Local, and keyboard shortcuts.Google Scholar—enables users to search specifically for scholarly literature, including peer-reviewed\npapers, theses, books, preprints, abstracts and technical reports from all broad areas of research.Google\nScholar can be used to find articles from a wide variety of academic publishers, professional societies,\npreprint repositories and universities, as well as scholarly articles available across the web.Google Suggest—guesses what you're typing and offers suggestions in real time.This is similar to\nGoogle's "Did you mean?"feature that offers alternative spellings for your query after you search, except\nthat it works in real time.",
                  "pageIdentifier": "17"
                },
                {
                  "content": "Groups contains more than 1 billion messages from Usenet Internet discussion groups dating back to 1981.The\ndiscussions in these groups cover a broad range of discourse and provide a comprehensive look at evolving\nviewpoints, debate and advice on many subjects.The new Google Groups adds in the ability to create your own\ngroups for you and your friends and an improved user interface.Google Mobile.Google Mobile offers people the ability to search and view both the "mobile web,"\nconsisting of pages created specifically for wireless devices, and the entire Google index of more than 8 billion\nweb pages.Google Mobile works on devices that support WAP, WAP 2.0, i-mode or j-sky mobile Internet\nprotocols.In addition, users can access a variety of information using Google SMS by typing a query to the\nGoogle shortcode.Google Mobile is available through many wireless and mobile phone services worldwide.\n\nGoogle Local.Google Local enables users to find relevant local businesses near a city, postal code, or specific\naddress.This service combines Yellow Page listings with information found on web pages, and plots their\nlocations on interactive maps.Google Print.Google Print brings information online that had previously not been available to web\nsearchers.Under this program, we enable a number of publishers to host their content and show their\npublications at the top of our search results.",
                  "pageIdentifier": "17"
                },
                {
                  "content": "Votes cast by important web pages with high PageRank weigh more heavily and are\nmore influential in deciding the PageRank of pages on the web.Text-Matching Techniques.Our technology employs text-matching techniques that compare search queries\nwith the content of web pages to help determine relevance.Our text-based scoring techniques do far more than\ncount the number of times a search term appears on a web page.For example, our technology determines the\nproximity of individual search terms to each other on a given web page, and prioritizes results that have the\nsearch terms near each other.Many other aspects of a page's content are factored into the equation, as is the\ncontent of pages that link to the page in question.By combining query independent measures such as PageRank\nwith our text-matching techniques, we are able to deliver search results that are relevant to what people are\ntrying to find.\n\nAdvertising Technology\nOur advertising program serves millions of relevant, targeted ads each day based on search terms people\n\nenter or content they view on the web.The key elements of our advertising technology include:\n\nGoogle AdWords Auction System.We use the Google AdWords auction system to enable advertisers to\nautomatically deliver relevant, targeted advertising.",
                  "pageIdentifier": "21"
                },
                {
                  "content": "Votes cast by important web pages with high PageRank weigh more heavily and are\nmore influential in deciding the PageRank of pages on the web.Text-Matching Techniques.Our technology employs text-matching techniques that compare search queries\nwith the content of web pages to help determine relevance.Our text-based scoring techniques do far more than\ncount the number of times a search term appears on a web page.For example, our technology determines the\nproximity of individual search terms to each other on a given web page, and prioritizes results that have the\nsearch terms near each other.Many other aspects of a page's content are factored into the equation, as is the\ncontent of pages that link to the page in question.By combining query independent measures such as PageRank\nwith our text-matching techniques, we are able to deliver search results that are relevant to what people are\ntrying to find.\n\nAdvertising Technology\nOur advertising program serves millions of relevant, targeted ads each day based on search terms people\n\nenter or content they view on the web.The key elements of our advertising technology include:",
                  "pageIdentifier": "21"
                },
                {
                  "content": "Google Maps—enables users to see maps, get directions, and find local businesses and services quickly\nand easily.Google Maps has several unique features, including draggable maps, integrated local search\nfrom Google Local, and keyboard shortcuts.Google Scholar—enables users to search specifically for scholarly literature, including peer-reviewed\npapers, theses, books, preprints, abstracts and technical reports from all broad areas of research.Google\nScholar can be used to find articles from a wide variety of academic publishers, professional societies,\npreprint repositories and universities, as well as scholarly articles available across the web.Google Suggest—guesses what you're typing and offers suggestions in real time.This is similar to\nGoogle's "Did you mean?"feature that offers alternative spellings for your query after you search, except\nthat it works in real time.Google Video—includes thousands of programs that play on our TVs every day.Google Video enables\nyou to search a growing archive of televised content—everything from sports to dinosaur\ndocumentaries to news shows.\n\n6",
                  "pageIdentifier": "17"
                },
                {
                  "content": "Every search query we process involves the automated\nexecution of an auction, resulting in our advertising system often processing hundreds of millions of auctions per\nday.To determine whether an ad is relevant to a particular query, this system weighs an advertiser's willingness\nto pay for prominence in the ad listings (the CPC) and interest from users in the ad as measured by the click\nthrough rate and other factors.If an ad does not attract user clicks, it moves to a less prominent position on the\npage, even if the advertiser offers to pay a high amount.This prevents advertisers with irrelevant ads from\n"squatting" in top positions to gain exposure.Conversely, more relevant, well-targeted ads that are clicked on\nfrequently move up in ranking, with no need for advertisers to increase their bids.Because we are paid only\nwhen users click on ads, the AdWords ranking system aligns our interests equally with those of our advertisers\nand our users.The more relevant and useful the ad, the better for our users, for our advertisers and for us.\n\nThe AdWords auction system also incorporates our AdWords discounter, which automatically lowers the\namount advertisers actually pay to the minimum needed to maintain their ad position.",
                  "pageIdentifier": "21"
                },
                {
                  "content": "Web Search Technology\nOur web search technology uses a combination of techniques to determine the importance of a web page\nindependent of a particular search query and to determine the relevance of that page to a particular search\nquery.We do not explain how we do ranking in great detail because some people try to manipulate our search\nresults for their own gain, rather than in an attempt to provide high-quality information to users.\n\nRanking Technology.One element of our technology for ranking web pages is called PageRank.While we\ndeveloped much of our ranking technology after Google was formed, PageRank was developed at Stanford\nUniversity with the involvement of our founders, and was therefore published as research.Most of our current\nranking technology is protected as trade-secret.PageRank is a query-independent technique for determining the\nimportance of web pages by looking at the link structure of the web.PageRank treats a link from web page A to\nweb page B as a "vote" by page A in favor of page B.The PageRank of a page is the sum of the PageRank of the\npages that link to it.The PageRank of a web page also depends on the importance (or PageRank) of the other\nweb pages casting the votes.",
                  "pageIdentifier": "21"
                },
                {
                  "content": "The Company recognizes as revenue the fees charged advertisers each time a user clicks on one of the text\nbased ads that are displayed next to the search results on Google web sites.Effective January 1, 2004, the\nCompany offered a single pricing structure to all of its advertisers based on the AdWords cost per click model.\n\nGoogle AdSense is the program through which the Company distributes its advertisers' text-based ads for\ndisplay on the web sites of the Google Network members.In accordance with Emerging Issues Task Force\n("EITF") Issue No. 99 19, Reporting Revenue Gross as a Principal Versus Net as an Agent, the Company recognizes\nas revenues the fees it receives from its advertisers.This revenue is reported gross primarily because the\nCompany is the primary obligor to its advertisers.\n\nThe Company generates fees from search services through a variety of contractual arrangements, which\ninclude per-query search fees and search service hosting fees.Revenues from set up and support fees and search\nservice hosting fees are recognized on a straight-line basis over the term of the contract, which is the expected\nperiod during which these services will be provided.The Company's policy is to recognize revenues from per\nquery search fees in the period queries are made and results are delivered.\n\nThe Company provides search services pursuant to certain AdSense agreements.",
                  "pageIdentifier": "85"
                },
                {
                  "content": "On Google Print pages, we provide links to book sellers that may\noffer the full versions of these publications for sale, and we show content-targeted ads that are served through\nthe Google AdSense program.Google Desktop Search.Google Desktop Search enables our users to perform a full text search on the\ncontents of their own computer, including email, files, instant messenger chats and web browser history.Users\ncan use this service to view web pages they have visited even when they are not online.Google Alerts.Google Alerts are email updates of the latest relevant Google results (web, news, etc.) based\non the user's choice of query or topic.Typical uses include monitoring a developing news story, keeping current\non a competitor or industry, getting the latest on a celebrity or event, or keeping tabs on a favorite sports team.Google Labs.Google Labs is our playground for our engineers and for adventurous Google users.On Google\nLabs, we post product prototypes and solicit feedback on how the technology could be used or improved.Current Google Labs examples include:Google Personalized Search—provides customized search results based on an individual user's interests.Froogle Wireless—gives people the ability to search for product information from their mobile phones\nand other wireless devices.",
                  "pageIdentifier": "17"
                }
              ]
            }
          ]
        }
      }
    }

Cómo obtener citas

Cuando se especifican, las citas son números que se colocan intercalados en un resumen de la búsqueda. Estos números indican de qué resultados de la búsqueda se toman oraciones específicas del resumen.

Para obtener citas, sigue estos pasos:

  1. Envía una solicitud de búsqueda que incluya contentSearchSpec.summarySpec y especifique "includeCitations": true. Para obtener más información sobre cómo enviar una solicitud de búsqueda, consulta Obtén resultados de la búsqueda.

    En el siguiente ejemplo, summarySpec indica que deseas un resumen de la búsqueda, que el resumen se debe generar a partir de los tres resultados de la búsqueda principales y que se deben incluir citas en el resumen.

    "contentSearchSpec":
     {
       "summarySpec":
       {
         "summaryResultCount": 3,
         "includeCitations": true
       },
       "extractiveContentSpec": { "maxExtractiveAnswerCount" : 1}
     }
    
    • summaryResultCount: Es la cantidad de resultados principales a partir de los cuales se genera el resumen de la búsqueda. Si la cantidad de resultados que se muestran es menor que summaryResultCount, el resumen se genera a partir de todos los resultados. El valor máximo es 5.
    • includeCitations: Es un valor booleano que especifica si se muestran las citas.
    • maxExtractiveAnswerCount: Es la cantidad de respuestas extractivas que se mostrarán para cada resultado de la búsqueda. El valor predeterminado es 0 y el máximo es 1.
  2. Obtén el resumen, con citas, de la respuesta de la búsqueda. Se muestra una propiedad summary en cada respuesta.

    Este es un ejemplo de un resumen, con citas y metadatos de citas, que se muestra al final de una respuesta de búsqueda:

    "summary": {
     "summaryText": "BigQuery is Google Cloud's fully managed and completely
      serverless enterprise data warehouse [1]. BigQuery supports all data types,
      works across clouds, and has built-in machine learning and business
      intelligence, all within a unified platform [2, 3].",
     "summaryWithMetadata": {
       "summary": "BigQuery is Google Cloud's fully managed and completely
       serverless enterprise data warehouse. BigQuery supports all data types,
       works across clouds, and has built-in machine learning and business
       intelligence, all within a unified platform.",
       "citationMetadata": {
         "citations": [
           {
             "startIndex": "0",
             "endIndex": "101",
             "sources": [
               {
                 "uri": "gs://example-dataset/html/6344007140738632642.html",
                 "title": "About BigQuery",
                 "id": "b6344007140738632642",
                 "referenceIndex": "0"
               },
               {
                 "uri": "gs://example-dataset/html/1365490014946172719.html",
                 "title": "Google Cloud article",
                 "id": "b1365490014946172719",
                 "referenceIndex": "1"
               },
               {
                 "uri": "gs://example-dataset/html/2687910668117268120.html",
                 "title": "BigQuery document",
                 "id": "a2687910668117268120",
                 "referenceIndex": "2"
               }
             ]
           },
           {
             "startIndex": "103",
             "endIndex": "230",
             "sources": [
               {
                 "referenceIndex": "0"
                },
               {
                 "referenceIndex": "1"
               },
               {
                 "referenceIndex": "2",
               }
             ]
           }
         ]
       },
       "references": [
       {
         "title": "Sports in the United States",
         "docName": "projects/123/locations/global/collections/default_collection/dataStores/ds-123/branches/0/documents/b6344007140738632642",
         "uri": "https://example.com/bigqueryA"
       },
       {
         "title": "Sports in the United States",
         "docName": "projects/123/locations/global/collections/default_collection/dataStores/ds-123/branches/0/documents/b1365490014946172719",
         "uri": "https://example.com/bigqueryB"
       },
       {
         "title": "Sports in the United States",
         "docName": "projects/123/locations/global/collections/default_collection/dataStores/ds-123/branches/0/documents/a268791066811726812",
         "uri": "https://example.com/bigqueryC"
       }
     ]
    }
    }
    
    • summaryText: Es el resumen de la búsqueda, con números de cita. Los números de cita se refieren a los resultados de la búsqueda que se muestran y están indexados a 1. Por ejemplo, [1] significa que la oración se atribuye al primer resultado de la búsqueda. [2, 3] significa que la oración se atribuye al segundo y tercer resultado de la búsqueda.
    • citations: Para cada oración del resumen que tenga una cita, se enumeran los metadatos de esa cita.
    • startIndex: Indica el inicio de la oración, medido en bytes Unicode.
    • endIndex: Indica el final de la oración, medido en bytes Unicode.
    • sources: Muestra el referenceIndex de cada fuente que se incluyó en la cita de la oración. referenceIndex es el número de índice asignado a una fuente. El referenceIndex de la primera fuente no siempre se muestra de forma explícita en la respuesta. Debido a que referenceIndex está indexada en 0, la primera fuente siempre tiene un referenceIndex de 0.
    • references: Muestra los metadatos de cada referencia que se citó en el resumen. Los metadatos incluyen title, docName y uri.

Ignora las consultas adversas

Las consultas adversas incluyen comentarios negativos o están diseñadas para generar resultados inseguros que incumplen las políticas. Puedes especificar que no se muestren resúmenes de búsqueda para las consultas adversas. Cuando se ignora una consulta adversaria, la propiedad summaryText contiene texto estándar que indica que no se muestra ningún resumen de búsqueda. Los documentos de búsqueda se muestran para las consultas adversas, aunque los resúmenes de búsqueda no.

Para especificar que no se deben mostrar resúmenes de búsqueda para las consultas adversariales, sigue estos pasos:

  1. Envía una solicitud de búsqueda que incluya contentSearchSpec.summarySpec y especifique "ignoreAdversarialQuery": true. Para obtener más información sobre cómo enviar una solicitud de búsqueda, consulta Obtén resultados de la búsqueda.

    En el siguiente ejemplo, summarySpec indica que deseas un resumen de la búsqueda, que el resumen se debe generar a partir de los tres resultados principales de la búsqueda, pero que no se debe mostrar ningún resumen para las consultas adversas.

    "contentSearchSpec":
     {
       "summarySpec":
       {
         "summaryResultCount": 3,
         "ignoreAdversarialQuery": true
       },
       "extractiveContentSpec": { "maxExtractiveAnswerCount" : 1}
     }
    
    • summaryResultCount: Es la cantidad de resultados principales a partir de los cuales se genera el resumen de la búsqueda. Si la cantidad de resultados que se muestran es menor que summaryResultCount, el resumen se genera a partir de todos los resultados. El valor máximo es 5.
    • ignoreAdversarialQuery: Es un valor booleano que especifica que no se deben mostrar resúmenes de búsqueda para las consultas adversariales.
    • maxExtractiveAnswerCount: Es la cantidad de respuestas extractivas que se mostrarán para cada resultado de la búsqueda. El valor predeterminado es 0 y el máximo es 1.
  2. Consulta la propiedad summary que se muestra para una solicitud de búsqueda adversaria.

    A continuación, se muestra un ejemplo:

    "summary":
    {
      "summaryText": "We do not have a summary for your query. Here are some
      search results.",
      "summarySkippedReasons": [
       "ADVERSARIAL_QUERY_IGNORED"
     ]
    }
    
    • summaryText: Texto de texto modelo que indica que no se muestra ningún resumen de la búsqueda.
    • summarySkippedReasons: Es una enumeración con valores para los motivos por los que se omitió el resumen.

Ignora las consultas de búsqueda que no son de resumen

Las consultas que no buscan resúmenes muestran resultados que no son adecuados para el resumen. Por ejemplo, "¿Por qué el cielo es azul?" y "¿Quién es el mejor jugador de fútbol del mundo?" son consultas de resumen, pero "Aeropuerto SFO" y "Copa Mundial 2026" no lo son. Es probable que sean consultas de navegación. Puedes especificar que no se deben mostrar resúmenes de búsqueda para las consultas que no buscan resúmenes. Los documentos de búsqueda se muestran para las búsquedas que no buscan resúmenes, aunque los resúmenes de búsqueda no se muestren.

Para especificar que no se deben mostrar resúmenes de búsqueda para las búsquedas que no buscan resúmenes, sigue estos pasos:

  1. Envía una solicitud de búsqueda que incluya contentSearchSpec.summarySpec y especifique "ignoreNonSummarySeekingQuery": true. Para obtener más información sobre cómo enviar una solicitud de búsqueda, consulta Cómo obtener resultados de la búsqueda.

    En el siguiente ejemplo, summarySpec indica que deseas un resumen de la búsqueda, que se debe generar a partir de los tres resultados principales de la búsqueda, pero que no se debe mostrar ningún resumen para las consultas que no buscan un resumen.

    "contentSearchSpec":
     {
       "summarySpec":
       {
         "summaryResultCount": 3,
         "ignoreNonSummarySeekingQuery": true
       },
       "extractiveContentSpec": { "maxExtractiveAnswerCount" : 1}
     }
    
    • summaryResultCount: Es la cantidad de resultados principales a partir de los cuales se genera el resumen de la búsqueda. Si la cantidad de resultados que se muestran es menor que summaryResultCount, el resumen se genera a partir de todos los resultados. El valor máximo es 5.
    • ignoreNonSummarySeekingQuery: Es un valor booleano que especifica que no se deben mostrar resúmenes de búsqueda para las consultas que no buscan resúmenes.
    • maxExtractiveAnswerCount: Es la cantidad de respuestas extractivas que se mostrarán para cada resultado de la búsqueda. El valor predeterminado es 0 y el máximo es 1.
  2. Consulta la propiedad summary que se muestra para una solicitud de búsqueda que no busca un resumen.

    A continuación, se muestra un ejemplo:

    "summary":
    {
      "summaryText": "We do not have a summary for your query. Here are some
      search results.",
      "summarySkippedReasons": [
        "NON_SUMMARY_SEEKING_QUERY_IGNORED"
     ]
    }
    
    • summaryText: Texto de texto modelo que indica que no se muestra ningún resumen de la búsqueda.
    • summarySkippedReasons: Es una enumeración con valores para los motivos por los que se omitió el resumen.

Obtén resúmenes personalizados

Puedes obtener resúmenes personalizados proporcionando instrucciones en lenguaje natural. Esta función está disponible para el widget de búsqueda a través de la consola y para la API ingresando instrucciones en el campo modelPromptSpec.preamble.

Puedes solicitar personalizaciones, como la longitud, el nivel de detalle, el estilo de la salida (como “simple”), el idioma de la salida, el enfoque de la respuesta y el formato (como tablas, viñetas y XML).

Por ejemplo, para la consulta What are the benefits of bigquery?, puedes ingresar instrucciones de personalización como en los siguientes ejemplos:

  • Ejemplo de instrucción: please show the answer format in an ordered list

    Respuesta de ejemplo:

    The benefits of BigQuery are:
    
    1. Increased business productivity
    2. IT staff productivity
    3. Reduced infrastructure costs
    4. Loading and exporting data are free
    
  • Ejemplo de instrucción: give a very detailed answer

    Respuesta de ejemplo:

    BigQuery is a serverless, highly scalable, and cost-effective cloud data warehouse that enables businesses to analyze all their data very quickly. It is a fully managed service that takes care of provisioning, scaling, and managing the underlying infrastructure, so you can focus on analyzing your data. BigQuery is also integrated with other Google Cloud services, such as Google Kubernetes Engine, Cloud Data Fusion, and Cloud Dataproc, making it easy to build and deploy data pipelines.
    
    Here are some of the benefits of using BigQuery:
    
    * **Fast and scalable:** BigQuery can process petabytes of data very quickly, and it can scale to handle even the most demanding workloads. * **Cost-effective:** BigQuery is a very cost-effective way to store and analyze data. You only pay for the data that you use, and there are no upfront costs or commitments. * **Secure:** BigQuery is a secure platform that meets the needs of even the most security-conscious organizations. * **Easy to use:** BigQuery is easy to use, even for non-technical users. It has a simple and intuitive user interface, and it supports a variety of data sources. * **Integrated with other Google Cloud services:** BigQuery is integrated with other Google Cloud services, making it easy to build and deploy data pipelines.
    
    If you are looking for a fast, scalable, and cost-effective way to analyze your data, then BigQuery is a great option.
    

Prácticas recomendadas para los resúmenes personalizados

Si planeas usar esta función, haz lo siguiente:

  • Solicita solo una personalización a la vez. No combines personalizaciones, por ejemplo, solicitar una tabla HTML en francés.
  • Google recomienda que impongas límites a las personalizaciones que pueden solicitar tus usuarios finales, por ejemplo, ofreciendo un selector con un conjunto de personalizaciones predefinidas.

Cómo personalizar los resúmenes

Puedes obtener resúmenes personalizados solo para el widget de búsqueda con la consola o, para cualquier solicitud de búsqueda, con la API.

Para obtener un resumen personalizado, sigue estos pasos:

Console

  1. En la consola de Google Cloud , ve a la página Agent Builder.

    Agent Builder

  2. Haz clic en el nombre de la app que deseas editar.

  3. Ve a Configurations > UI.

  4. Asegúrate de que el Tipo de búsqueda del widget de búsqueda esté configurado en Búsqueda con una respuesta o Búsqueda con preguntas adicionales. Esta función no está disponible si se selecciona Búsqueda.

  5. Activa Habilitar la personalización del resumen.

  6. Para ingresar instrucciones de resumen, realiza una de las siguientes acciones:

    • Ingresa instrucciones de formato libre: Ingresa tus propias instrucciones en lenguaje natural en el campo Preámbulo.
    • Usa instrucciones de plantilla: Haz clic en Reemplazar con una plantilla y selecciona una de las instrucciones de plantilla predefinidas. La plantilla predefinida aparecerá en el campo Preámbulo después de que la selecciones.
  7. Para probar la generación de resúmenes personalizados de tu app, busca en el panel Preview.

  8. Para restablecer el último conjunto de instrucciones guardado, haz clic en Restablecer preámbulo.

  9. Para guardar la configuración en el widget, haz clic en Guardar y publicar.

REST

  1. Envía una solicitud de búsqueda que incluya contentSearchSpec.summarySpec y especifique la instrucción de personalización en modelPromptSpec.preamble. Para obtener más información sobre cómo enviar una solicitud de búsqueda, consulta Cómo obtener resultados de la búsqueda.

    En el siguiente ejemplo, summarySpec indica que deseas un resumen de la búsqueda, que se debe generar a partir de los tres resultados de la búsqueda principales y que se debe personalizar como si se le explicara a un niño de 10 años.

    "contentSearchSpec":
      {
        "summarySpec":
        {
          "summaryResultCount": 3,
          "modelPromptSpec":
          {
            "preamble": "explain like you would to a ten year old"
          }
        }
      }
    
    • summaryResultCount: Es la cantidad de resultados principales a partir de los cuales se genera el resumen de la búsqueda. Si la cantidad de resultados que se muestran es menor que summaryResultCount, el resumen se genera a partir de todos los resultados. El valor máximo es 5.
    • preamble: Es la instrucción para la personalización.
  2. Obtén el resumen personalizado de la respuesta de la búsqueda.

    Este es un ejemplo de un resumen personalizado que se muestra:

    "summary":
    {
      "summaryText": "BigQuery is a serverless data warehouse that helps you
      analyze all your data very quickly. It's very easy to use and you don't
      need to worry about managing servers or infrastructure. BigQuery is also
      very scalable, so you can analyze large datasets without any problems."
    }
    
    • summaryText: Es el resumen de la búsqueda personalizada.

Especifica el modelo de resumen

Puedes especificar el modelo que quieres usar para generar resúmenes.

Puedes especificar stable, preview o una versión específica del modelo por nombre. Para conocer las versiones de modelos disponibles, consulta Versiones y ciclo de vida de los modelos de generación de respuestas.

Para cambiar la versión del modelo, sigue estos pasos:

  1. Envía una solicitud de búsqueda que incluya ContentSearchSpec.SummarySpec.ModelSpec para especificar la versión del modelo.

    "contentSearchSpec": {
      "summarySpec": {
        "modelSpec": {
          "version": "MODEL_VERSION"
         }
       }
     }
    
    • MODEL_VERSION: Especifica qué modelo se usará para generar resúmenes. Los valores admitidos son los que se detallan a continuación:

      • stable: Es una cadena. Especificación predeterminada cuando no se especifica ningún valor. stable apunta a una versión del modelo de GA que está ajustada para la generación de respuestas. El modelo al que stable apunta cambia a medida que se lanzan nuevas versiones de modelos de DG y se descontinuan las versiones de modelos anteriores. Para obtener la versión actualizada a la que apunta stable, consulta Versiones y ciclo de vida del modelo de generación de respuestas.
      • preview: Es una cadena. preview hace referencia al modelo de Gemini más reciente para responder preguntas. Para obtener más información sobre Gemini, consulta Descripción general de los modelos.
      • Para especificar una versión de modelo determinada, ingresa el nombre de la versión, como gemini-1.5-flash-002/answer_gen/v1. Para conocer las versiones compatibles, consulta Versiones y ciclo de vida del modelo de generación de respuestas.

Por ejemplo, la siguiente solicitud de búsqueda especifica preview como la versión del modelo:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1/projects/exampleproject/locations/global/collections/default_collection/dataStores/exampledatastore/servingConfigs/default_search:search" \
-d '{
  "query": "what is bigquery",
  "contentSearchSpec": {
    "summarySpec": {
      "modelSpec": {
        "version": "preview"
      }
    }
  }
}'

Limitaciones de los resúmenes de búsqueda

Es posible que encuentres las siguientes limitaciones cuando uses los resúmenes de búsqueda:

  • Debido a que los LLM se usan para generar citas y resúmenes de búsqueda, las limitaciones de los LLM también se aplican a los resúmenes de Vertex AI Search.

    Para obtener información general sobre estas limitaciones de los LLM, consulta las limitaciones de la API de PaLM en la documentación de Vertex AI.

  • Las búsquedas que requieren un razonamiento lógico o analítico complejo o una comprensión del mundo pueden generar resúmenes de búsqueda que contengan información incorrecta (alucinaciones) o que no esté presente en los datos no estructurados o del sitio web.

  • Es posible que algunas afirmaciones del resumen de la búsqueda no contengan una cita:

    • Si el sistema determina que una declaración no requiere justificación, no incluirá una cita. Faltan citas en oraciones como "Esto es lo que encontré" o "Existen muchos métodos que puedes seguir".

    • Las citas faltantes también pueden indicar que no se encontró una referencia válida. Es posible que los hechos sin citas no sean confiables.

  • En casos excepcionales, las citas pueden atribuirse de forma incorrecta a una afirmación.

  • Es posible que el LLM analice de forma incorrecta los documentos complejos. En este caso, es posible que el resumen esté incompleto o sea incorrecto.

  • Debido a que las instrucciones de personalización están en lenguaje natural, no se puede garantizar el cumplimiento de las instrucciones para todas las solicitudes.