Importar datos de autocompletado para la búsqueda

La función de autocompletar predice el resto de la palabra que está escribiendo un usuario, lo que puede mejorar su experiencia de búsqueda. Puede proporcionar sugerencias de escritura predictiva basadas en el conjunto de datos que hayas proporcionado o en los eventos de usuario que hayas enviado.

Importa datos de autocompletar solo si quieres tener controles adicionales (lista de no eliminar, lista de denegación) o si necesitas usar tus propios datos de autocompletar. Activar el aprendizaje automático es suficiente en la mayoría de los casos en los que se necesita la función Autocompletar. El aprendizaje automático proporciona un conjunto de datos de sugerencias basado en el aprendizaje automático a partir de los eventos de búsqueda de los usuarios. Consulta la sección Autocompletar para saber cómo activar el aprendizaje automático.

Estas instrucciones solo se aplican a la subida de tus propios datos de autocompletado. Manténlo actualizado si tienes previsto usar tu conjunto de datos de autocompletado en todo momento. Para obtener resultados de autocompletado en el momento de la consulta, consulta CompletionService.CompleteQuery. Los datos de autocompletado solo se usan para la búsqueda. Estos datos no se usan en las recomendaciones.

Antes de empezar

Antes de importar tu información de autocompletar, debes haber completado las instrucciones de la sección Antes de empezar, en concreto, configurar tu proyecto, crear una cuenta de servicio y añadir la cuenta de servicio a tu entorno local.

Para realizar la importación, debes tener el rol de gestión de identidades y accesos Editor de comercios minoristas.

Prácticas recomendadas para la importación de autocompletado

Cuando importe datos de autocompletar, asegúrese de implementar las siguientes prácticas recomendadas:

  • Consulte el esquema de BigQuery que se indica en las siguientes secciones y en la documentación de la API.

  • No utilice valores de marcador de posición.

  • Incluye tantos campos como sea posible.

  • Mantén actualizado tu propio conjunto de datos de autocompletado si tienes previsto usarlo.

  • No se permite importar datos de otro proyecto.

Importar datos de Autocompletar

Importar datos de autocompletado de BigQuery

Vertex AI Search for commerce admite la importación de datos de BigQuery para las listas de denegación, de no eliminación y de términos de sugerencia. Consulta más detalles en Autocompletar.

Para importar datos de autocompletado en el formato correcto desde BigQuery, usa el esquema de autocompletado de Vertex AI Search for commerce para crear una tabla de BigQuery con el formato correcto y cargar la tabla con tus datos de autocompletado. A continuación, suba sus datos a Vertex AI Search para el sector del comercio.

Para obtener más ayuda con las tablas de BigQuery, consulta el artículo Introducción a las tablas. Si necesitas ayuda con las consultas de BigQuery, consulta el artículo sobre cómo consultar datos de BigQuery.

Ubicación del conjunto de datos de BigQuery

Cuando crees por primera vez tu conjunto de datos de BigQuery para tus tablas de BigQuery de autocompletar, asegúrate de que la ubicación del conjunto de datos sea la multirregión "US". Si no lo hace correctamente, la solicitud de importación fallará más adelante. Para obtener más información sobre las ubicaciones de los conjuntos de datos de BigQuery, consulta el artículo Ubicaciones de los conjuntos de datos en la documentación de BigQuery.

Rellenar datos en BigQuery

Usa el esquema de autocompletado de búsqueda de Vertex AI Search for commerce para subir tus datos de autocompletado a BigQuery.

BigQuery puede usar el esquema para validar si los datos con formato JSON tienen los nombres y los tipos de campo correctos (como STRING, INTEGER y RECORD), pero no puede realizar validaciones como determinar lo siguiente:

  • Si un campo de cadena se asigna a un valor de enum reconocible.
  • Si un campo de cadena usa el formato correcto.
  • Si un campo de número entero o de número con decimales tiene un valor dentro de un intervalo válido.
  • Si falta un campo obligatorio.

Para asegurar la calidad de sus datos y la experiencia de búsqueda de los usuarios finales, consulte el esquema y la documentación de referencia para obtener información sobre los valores y el formato.

Configurar el acceso a un conjunto de datos de BigQuery

Para configurar el acceso, asegúrate de que tu conjunto de datos de BigQuery esté en el mismo proyecto que tu servicio Vertex AI Search for commerce y sigue estos pasos.

  1. Abre la página de IAM en la Google Cloud consola.

    Abre la página de gestión de identidades y accesos.

  2. Selecciona tu proyecto de Vertex AI Search para el sector del comercio.

  3. En la página IAM y administración, haz clic en  Conceder acceso.

  4. En Nuevos principales, introduce cloud-retail-customer-data-access@system.gserviceaccount.com y selecciona el rol BigQuery > Lector de datos de BigQuery.

    Si no quieres asignar el rol Lector de datos a todo el proyecto, puedes añadirlo directamente al conjunto de datos. Más información

  5. Haz clic en Guardar.

Activar la importación de datos en Vertex AI Search para el sector del comercio

Consola

  1. Ir a la página Controles

  2. Ve a la pestaña Controles de autocompletado.

  3. En la sección Listas de términos, busque el tipo de lista que quiera importar (Lista de denegación, Lista de no quitar o Lista de términos sugeridos) y haga clic en Importar o Reemplazar.

    Se abrirá el panel Importar.

  4. Introduce la ruta de BigQuery de la ubicación de tus datos o selecciona Buscar para elegir la ubicación.

    La ruta de BigQuery debe estar en el mismo proyecto y su esquema debe ser correcto. Para comprobarlo, haz clic en Examinar y, a continuación, en el nombre de la tabla para ver su contenido en la consola de BigQuery.

  5. En el panel Importar, haga clic en Importar.

    Empieza la importación. Puedes salir de la página sin interrumpir la importación.

cURL

  1. Crea un archivo de datos con los parámetros de entrada de la importación. Los valores de los parámetros de entrada dependen de si vas a importar datos de Cloud Storage o de BigQuery.

    Usa el objeto BigQuerySource para dirigirte a tu conjunto de datos de BigQuery.

    {
      "inputConfig":{
        "bigQuerySource": {
          "datasetId":"dataset-id",
          "tableId":"table-id",
          "dataSchema":"data-schema"
        }
      }
    }
  2. Para importar tu información de autocompletar a Vertex AI Search para el sector del comercio, haz una solicitud POST al método REST CompletionData:import y proporciona el nombre del archivo de datos (input.json en el ejemplo de abajo).

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" -d @./input.json
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/completionData:import"

    Puedes consultar el estado de forma programática mediante la API. Deberías recibir un objeto de respuesta similar a este:

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "done": false
    }

    El campo "name" es el ID del objeto de operación. Para solicitar el estado de este objeto, sustituya el campo name por el valor devuelto por el método import. Cuando se haya completado la importación, el campo done se mostrará como true:

    curl -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456"

    Cuando se completa la operación, el objeto devuelto tiene un valor done de true e incluye un objeto Status similar al siguiente ejemplo:

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "metadata": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportMetadata",
        "createTime": "2020-01-01T03:33:33.000001Z",
        "updateTime": "2020-01-01T03:34:33.000001Z",
        "successCount": "2",
        "failureCount": "1"
      },
      "done": true
      "response": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportCompletionDataResponse",
      }
    }

Formato de datos de autocompletado

Tu archivo JSON debería tener un aspecto similar al de los siguientes ejemplos. Los saltos de línea son para mejorar la legibilidad. Debes proporcionar toda la sugerencia en una sola línea. Cada sugerencia debe estar en una línea independiente.

Campos mínimos obligatorios de las sugerencias:

{
  "suggestion": "ABC",
  "globalScore": "0.5"
}

O:

{
  "suggestion": "ABC",
  "frequency": "100"
}

Duración de la importación de datos de Autocompletar

Por lo general, se tarda entre unos minutos y una hora en completar una importación de BigQuery.

Cuando se haya completado la importación del conjunto de datos, el campo done del objeto de operación se marcará como true. Después, los datos pueden tardar entre 1 y 2 días en indexarse y usarse en la publicación.

Mantener actualizado el conjunto de datos de autocompletado

Si tiene previsto usar su propio conjunto de datos subido, le recomendamos que lo mantenga actualizado con regularidad.

Actualización por lotes

Puede usar el método de importación para actualizar en bloque su función de autocompletar. Para ello, sigue los mismos pasos que para la importación inicial, que se describen en el artículo Importar datos de Autocompletar. Se sustituirá todo el conjunto de datos importado.

Monitorizar el estado de las importaciones

Es importante que mantengas actualizado tu conjunto de datos para obtener sugerencias de alta calidad cuando lo uses. Debe monitorizar las tasas de errores de importación y tomar medidas si es necesario.

Esquema de autocompletado de Vertex AI Search para el sector del comercio

Cuando importe un conjunto de datos de autocompletado de BigQuery, use el siguiente esquema de Vertex AI Search for commerce para crear tablas de BigQuery con el formato correcto y cargarlas con sus datos de autocompletado.

Esquema de sugerencias

Este conjunto de datos se usa para proporcionar tus propias frases de sugerencia de autocompletado con tus propias puntuaciones.

Esquema de la lista de no permitidas

Este conjunto de datos se usa como una lista de denegación para evitar que se sugieran frases.

Esquema de lista de permitidos

Este conjunto de datos se usa para omitir los procesos posteriores (como la corrección ortográfica y el filtrado de resultados nulos) de todas las frases de esta lista de permitidas.