Cette page décrit la fonctionnalité de saisie semi-automatique de base de Vertex AI Search. La saisie semi-automatique génère des suggestions de requêtes en fonction des premiers caractères saisis pour la requête.
Les suggestions générées par la saisie semi-automatique varient en fonction du type de données utilisé par l'application de recherche:
Données structurées et non structurées Par défaut, la saisie semi-automatique génère des suggestions en fonction du contenu des documents du data store. Après l'importation de documents, par défaut, la saisie semi-automatique ne commence à générer de suggestions qu'une fois que suffisamment de données de qualité sont disponibles, généralement au bout de quelques jours. Si vous envoyez des requêtes de saisie semi-automatique via l'API, la saisie semi-automatique peut générer des suggestions basées sur l'historique de recherche ou les événements utilisateur.
Données de sites Web : Par défaut, la saisie semi-automatique génère des suggestions à partir de l'historique des recherches. La saisie semi-automatique nécessite un trafic de recherche réel. Une fois le trafic de recherche lancé, la saisie semi-automatique met un jour ou deux avant de générer des suggestions. Des suggestions peuvent être générées à partir de données explorées sur le Web à partir de sites publics avec le modèle de données de documents avancé expérimental.
Données de santé Par défaut, une source de données médicales canonique est utilisée pour générer des suggestions de saisie semi-automatique pour les datastores de santé.
Le modèle de suggestions de requêtes détermine le type de données que la saisie semi-automatique utilise pour générer des suggestions. Il existe quatre modèles de suggestions de requêtes:
Document. Le modèle de document génère des suggestions à partir des documents importés par l'utilisateur. Ce modèle n'est pas disponible pour les données de site Web ni pour les données de santé.
Champs à compléter Le modèle de champs à compléter suggère du texte extrait directement des champs de données structurées. Seuls les champs annotés avec
completable
sont utilisés pour les suggestions de saisie semi-automatique. Ce modèle n'est disponible que pour les données structurées.Historique des recherches Le modèle d'historique des recherches génère des suggestions à partir de l'historique des appels d'API
SearchService.search
. N'utilisez pas ce modèle si aucun trafic n'est disponible pour la méthodeservingConfigs.search
. Ce modèle n'est pas disponible pour les données de santé.Événement utilisateur Le modèle d'événements utilisateur génère des suggestions à partir des événements importés par l'utilisateur de type
search
. Ce modèle n'est pas disponible pour les données de santé.
Les requêtes de saisie semi-automatique sont envoyées à l'aide de la méthode dataStores.completeQuery
.
Si vous ne souhaitez pas utiliser de modèle de suggestions de requêtes, vous pouvez également utiliser des suggestions importées qui fournissent des suggestions de saisie semi-automatique en fonction d'une liste de suggestions importée. Pour en savoir plus, consultez Utiliser une liste importée de suggestions de saisie semi-automatique.
Types de modèles disponibles en fonction du type de données
Le tableau suivant indique les types de modèles de suggestions de requêtes disponibles pour chaque type de données.
Modèle de suggestions de requêtes |
Source de données |
Données du site Web |
Données structurées |
Données non structurées |
---|---|---|---|---|
Document | Importé | ✔* (par défaut) | ✔ (par défaut) | |
Champs à compléter | Importé | ✔ | ||
Historique des recherches | Collectés automatiquement | ✔ (par défaut) | ✔ | ✔ |
Événements utilisateur | Importés ou collectés automatiquement par le widget | ✔ | ✔ | ✔ |
Contenu trouvé sur le Web | exploré à partir du contenu des sites Web publics que vous spécifiez ; | ✔† |
* : Le schéma du document doit contenir des champs title
ou description
, ou des champs qui ont été spécifiés comme propriétés de clé title
ou description
. Consultez Mettre à jour un schéma pour les données structurées.
† : Le contenu exploré sur le Web ne peut être utilisé comme source de données que si le modèle de données de document avancé expérimental pour la saisie semi-automatique est activé. Consultez le modèle de données de document avancé.
Si vous ne souhaitez pas utiliser le modèle par défaut pour votre type de données, vous pouvez spécifier un autre modèle lorsque vous envoyez votre requête de saisie semi-automatique. Les requêtes de saisie semi-automatique sont envoyées à l'aide de la méthode dataStores.completeQuery
. Pour en savoir plus, consultez Instructions relatives à l'API: envoyer une requête de saisie semi-automatique pour choisir un autre modèle.
Fonctionnalités de saisie semi-automatique
Vertex AI Search est compatible avec les fonctionnalités de saisie semi-automatique suivantes pour afficher les prédictions les plus utiles lors de la recherche:
Fonctionnalité | Description | Exemple ou plus d'informations |
---|---|---|
Corriger les fautes de frappe | Corriger l'orthographe des mots mal orthographiés | Milc → Milk .
|
Supprimer les termes dangereux |
|
Texte choquant, comme du contenu pornographique, à caractère sexuel, vulgaire ou violent |
Empêcher l'affichage d'informations permettant d'identifier personnellement l'utilisateur | Basée sur la protection des données sensibles, la recherche Vertex AI s'efforce de ne pas afficher les types de données personnelles de base, tels que les numéros de téléphone et les adresses e-mail. |
Si une adresse e-mail Pour mieux vous protéger contre les fuites d'informations permettant d'identifier personnellement l'utilisateur, Google vous recommande d'appliquer votre propre solution de protection contre la perte de données (DLP) en plus des détecteurs fournis par Vertex AI Search. Pour en savoir plus, consultez Protéger contre les fuites d'informations personnelles. |
Liste de refus |
|
Pour en savoir plus, consultez Utiliser la saisie semi-automatique pour les listes de blocage. |
Dédupliquer les termes |
|
Shoes for Women , Womens Shoes et Womans Shoes sont dédupliqués, et seul le plus populaire est suggéré. |
Suggestions de correspondance de fin |
|
Pour en savoir plus, consultez Suggestions de correspondances de fin de liste. |
Suggestions de correspondance de fin
Les suggestions de correspondance de fin sont générées à l'aide d'une correspondance exacte de préfixe avec le dernier mot d'une chaîne de requête.
Par exemple, supposons que la requête "chansons avec he" soit envoyée dans une requête de saisie semi-automatique. Lorsque la correspondance de fin est activée, la saisie semi-automatique peut déterminer que le préfixe complet "chansons avec he" ne correspond à aucune recherche. Toutefois, le dernier mot de la requête, "il", présente une correspondance exacte de préfixe avec "hello world" et "hello kitty". Dans ce cas, les suggestions renvoyées sont "chansons avec hello world" et "chansons avec hello kitty", car il n'y a pas de suggestions de correspondance exacte.
Vous pouvez utiliser cette fonctionnalité pour réduire le nombre de suggestions vides et augmenter la diversité des suggestions. Cela est particulièrement utile lorsque les sources de données (nombre d'événements utilisateur, historique de recherche et couverture des sujets des documents) sont limitées. Toutefois, l'activation des suggestions de correspondance de fin peut réduire la qualité globale des suggestions. Étant donné que la correspondance de fin ne correspond qu'au dernier mot du préfixe, certaines suggestions renvoyées peuvent ne pas avoir de sens. Par exemple, une requête telle que "chansons avec he" peut recevoir une suggestion de correspondance de fin telle que "chansons avec guides d'aide".
Les suggestions de correspondance de fin ne sont renvoyées que si:
include_tail_suggestions
est défini surtrue
dans la requêtedataStores.completeQuery
.Aucune suggestion de correspondance exacte avec le préfixe n'est disponible pour la requête.
Protéger contre les fuites d'informations personnelles
La définition des informations personnelles est large, et elles peuvent être difficiles à détecter. Par conséquent, Vertex AI Search ne peut pas garantir que des informations personnelles ne seront pas renvoyées dans les suggestions de saisie semi-automatique.
Vertex AI Search applique le service d'inspection Protection des données sensibles pour rechercher et bloquer les types courants d'informations permettant d'identifier personnellement l'utilisateur qui apparaissent en tant que suggestions. Toutefois, si vos entrepôts de données contiennent des informations permettant d'identifier personnellement l'utilisateur ou si vous utilisez les modèles d'suggestions de requêtes pour l'historique des recherches ou les événements utilisateur, consultez les points suivants et prenez les mesures appropriées:
Si les types d'informations permettant d'identifier personnellement l'utilisateur que vous souhaitez protéger sont assez standards, comme les numéros de téléphone et les adresses e-mail, commencez par tester de manière approfondie les suggestions de saisie semi-automatique pour votre application. Vertex AI Search ne peut pas garantir que les informations permettant d'identifier personnellement l'utilisateur ne seront pas renvoyées dans les suggestions de saisie semi-automatique.
Si des fuites d'informations permettant d'identifier personnellement un utilisateur sont détectées lors des tests de saisie semi-automatique ou si vous savez déjà que vous devez protéger des informations permettant d'identifier personnellement un utilisateur non standards (par exemple, des ID utilisateur propriétaires), essayez d'ajuster le seuil de saisie semi-automatique et les paramètres de diffusion de contenu. Pour en savoir plus, consultez Réduire le risque de renvoyer des suggestions contenant des informations personnelles.
Si l'ajustement des paramètres n'est pas suffisant pour empêcher les fuites de données à caractère personnel, implémentez votre propre solution de DLP. Personnalisez la solution de protection contre la perte des données en fonction des types d'informations personnelles les plus susceptibles d'être trouvés dans vos datastores, vos événements utilisateur ou vos requêtes de recherche. Vous pouvez utiliser la protection des données sensibles ou un service de protection contre la perte de données tiers. Choisissez l'une des options suivantes :
Filtrez les informations permettant d'identifier personnellement l'utilisateur avant d'importer les documents et les événements utilisateur dans vos data stores.
Examinez les suggestions de saisie semi-automatique avant de les présenter à l'utilisateur au moment de la diffusion et bloquez les suggestions contenant des informations personnelles.
Si vous utilisez le modèle d'historique des recherches ou d'événements utilisateur, ajoutez un texte d'information dans la barre de recherche pour demander aux utilisateurs de ne pas saisir d'informations personnelles dans leurs requêtes de recherche.
Si vous avez des questions ou rencontrez des difficultés particulières pour bloquer les informations personnelles, contactez votre ingénieur client ou l'équipe Comptes Google.
Activer ou désactiver la saisie semi-automatique pour un widget
Pour activer ou désactiver la saisie semi-automatique pour un widget, procédez comme suit:
Console
Dans la console Google Cloud , accédez à la page AI Applications.
Cliquez sur le nom de l'application que vous souhaitez modifier.
Cliquez sur Configurations.
Cliquez sur l'onglet UI (IUG).
Activez ou désactivez l'option Afficher les suggestions de saisie semi-automatique pour activer ou désactiver les suggestions de saisie semi-automatique pour le widget. Lorsque vous activez la saisie semi-automatique, attendez un jour ou deux avant de voir les suggestions.
Modifier les paramètres de saisie semi-automatique
Pour configurer les paramètres de saisie semi-automatique dans l'UI, procédez comme suit:
Console
Dans la console Google Cloud , accédez à la page AI Applications.
Cliquez sur le nom de l'application que vous souhaitez modifier.
Cliquez sur Configurations.
Cliquez sur l'onglet Saisie semi-automatique.
Saisissez ou sélectionnez de nouvelles valeurs pour les paramètres de saisie semi-automatique que vous souhaitez mettre à jour:
- Nombre maximal de suggestions:nombre maximal de suggestions de saisie semi-automatique pouvant être proposées pour une requête.
- Longueur minimale à déclencher:nombre minimal de caractères que vous pouvez saisir avant que des suggestions de saisie semi-automatique ne soient proposées.
- Ordre de correspondance: emplacement dans une chaîne de requête à partir duquel la saisie semi-automatique peut commencer à faire correspondre ses suggestions.
- Modèle de suggestions de requêtes: modèle de suggestions de requêtes utilisé pour générer les suggestions récupérées. Vous pouvez remplacer cette valeur dans
dataStores.completeQuery
à l'aide du paramètrequeryModel
. Activer la saisie semi-automatique: par défaut, la saisie semi-automatique ne commence à proposer de suggestions qu'une fois qu'elle dispose de données de qualité suffisantes, généralement au bout de quelques jours. Si vous souhaitez remplacer cette valeur par défaut et commencer à recevoir des suggestions de saisie semi-automatique plus tôt, sélectionnez Maintenant.
Même si vous sélectionnez Maintenant, la génération de suggestions peut prendre une journée. Certaines suggestions de saisie semi-automatique seront toujours manquantes ou de mauvaise qualité tant que vous n'aurez pas suffisamment de données de qualité.
Liste de blocage: importez une liste de blocage au format JSON dans un bucket Cloud Storage. Pour en savoir plus sur les contraintes et les spécifications des listes de blocage, consultez Utiliser la saisie semi-automatique pour les listes de blocage.
Cliquez sur Enregistrer et publier. Les modifications prennent effet dans quelques minutes pour les moteurs où la saisie semi-automatique est déjà activée.
Réduire le risque de renvoyer des suggestions contenant des informations personnelles
Les utilisateurs finaux disposent de toutes sortes d'informations personnelles, telles que des permis de conduire et des numéros de téléphone, qu'ils sont censés garder privées. Toutefois, toutes ces informations permettant d'identifier personnellement l'utilisateur peuvent être saisies dans la barre de recherche par des utilisateurs qui recherchent des résultats spécifiques à eux-mêmes.
Si vous utilisez le modèle d'historique de recherche ou d'événements utilisateur et que vos utilisateurs sont susceptibles de saisir des informations permettant d'identifier personnellement les utilisateurs dans la barre de recherche, vous pouvez réduire les fuites de ces informations en ajustant les paramètres suivants:
queryFrequencyThreshold
: avant qu'une requête puisse être renvoyée en tant que suggestion de saisie semi-automatique, elle doit avoir été saisie ce nombre de fois.numUniqueUsersThreshold
: avant qu'une requête puisse être renvoyée en tant que suggestion de saisie semi-automatique, elle doit avoir été saisie par ce nombre d'utilisateurs uniques. La valeur du champuserPseudoId
dans l'événement utilisateur de recherche détermine si l'utilisateur est unique.
Exemple de cas d'utilisation
Prenons l'exemple d'un cas où les utilisateurs disposent de numéros de compte qui doivent rester privés.
Si le modèle de suggestion de l'historique des recherches ou des événements utilisateur est utilisé, ces numéros de compte, ainsi que tous les autres termes recherchés par les utilisateurs finaux, sont utilisés pour générer des suggestions. Par conséquent, si le numéro de compte YZ-46789A
de l'utilisateur A a été saisi à plusieurs reprises dans la barre de recherche et que l'utilisateur B possède le numéro de compte YZ-42345B
, lorsque l'utilisateur B saisit YZ-4
dans la barre de recherche, la suggestion de saisie semi-automatique renvoyée peut être le numéro de compte de l'utilisateur A.
Pour réduire la probabilité de ce type de fuite, l'administrateur des applications d'IA décide de:
Augmentez la valeur du paramètre
queryFrequencyThreshold
à30
. Dans ce cas, il est très peu probable qu'un même numéro de compte soit saisi si souvent. Toutefois, les requêtes de recherche populaires seront saisies au moins aussi souvent.Augmentez la valeur du paramètre
numUniqueUsersThreshold
à6
. L'administrateur pense qu'il est peu probable que le même numéro de compte soit saisi dans la barre de recherche dans six événements de recherche, chacun associé à unuserPseudoId
différent.
Procédure
Il existe deux paramètres de seuil pour la saisie semi-automatique.
Ces paramètres ne sont pas disponibles dans la console Google Cloud , mais peuvent être définis à l'aide d'un appel d'API REST à la méthode updateCompletionConfig
.
Pour configurer les paramètres du seuil de saisie semi-automatique, procédez comme suit : Chaque étape est facultative, en fonction du paramètre que vous souhaitez modifier.
REST
Mettez à jour le champ
CompletionConfig.queryFrequencyThreshold
:curl -X PATCH \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -H "X-Goog-User-Project: PROJECT_ID" \ https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/completionConfig?updateMask=queryFrequencyThreshold \ -d '{ "name": "projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/completionConfig", "queryFrequencyThreshold": QUERY_FREQUENCY_THRESHOLD }'
Remplacez les éléments suivants :
PROJECT_ID
: numéro ou ID de votre Google Cloud projet.DATA_STORE_ID
: ID du data store associé à votre application.QUERY_FREQUENCY_THRESHOLD
: valeur entière qui indique le nombre minimal de fois qu'une requête de recherche doit être saisie avant de pouvoir être renvoyée en tant que suggestion de saisie semi-automatique. Le nombre est additionné sur une période glissante de plusieurs mois. La valeur par défaut est8
.
Mettez à jour le champ
CompletionConfig.numUniqueUsersThreshold
:curl -X PATCH \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -H "X-Goog-User-Project: PROJECT_ID" \ https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/completionConfig?updateMask=numUniqueUsersThreshold \ -d '{ "name": "projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/completionConfig", "numUniqueUsersThreshold": UNIQUE_USERS }'
Remplacez
UNIQUE_USERS
par une valeur entière représentant le nombre minimal d'utilisateurs uniques qui doivent saisir une requête de recherche donnée avant qu'elle puisse être renvoyée en tant que suggestion de saisie semi-automatique. Le nombre est totalisé sur une période glissante de plusieurs mois. La valeur par défaut est3
.
Mettre à jour les annotations de champ completable dans le schéma
Pour activer la saisie semi-automatique pour les champs du schéma de données structurées, procédez comme suit:
Console
Dans la console Google Cloud , accédez à la page AI Applications.
Cliquez sur le nom de l'application que vous souhaitez modifier. Il doit utiliser des données structurées.
Cliquez sur Data (Données).
Cliquez sur l'onglet Schéma.
Cliquez sur Modifier pour sélectionner les champs du schéma à marquer comme
completable
.Cliquez sur Enregistrer pour enregistrer les configurations des champs mises à jour. La génération et le retour de ces suggestions prennent environ une journée.
Envoyer des requêtes de saisie semi-automatique
Les exemples suivants montrent comment envoyer des requêtes de saisie semi-automatique.
REST
Pour envoyer une requête de saisie semi-automatique à l'aide de l'API, procédez comme suit:
Recherchez l'ID de votre data store. Si vous disposez déjà de l'ID de votre data store, passez à l'étape suivante.
Dans la console Google Cloud , accédez à la page AI Applications et cliquez sur Datastores dans le menu de navigation.
Cliquez sur le nom de votre data store.
Sur la page Données de votre datastore, obtenez l'ID du datastore.
Appelez la méthode
dataStores.completeQuery
.curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID:completeQuery?query=QUERY_STRING"
Remplacez les éléments suivants :
PROJECT_ID
: numéro ou ID de votre Google Cloud projet.DATA_STORE_ID
: ID du data store associé à votre application.QUERY_STRING
: entrée de saisie semi-automatique utilisée pour extraire des suggestions.
Envoyer une requête de saisie semi-automatique à un autre modèle
Pour envoyer une requête de saisie semi-automatique avec un autre modèle de suggestions de requêtes, procédez comme suit:
Recherchez l'ID de votre data store. Si vous disposez déjà de l'ID de votre data store, passez à l'étape suivante.
Dans la console Google Cloud , accédez à la page AI Applications et cliquez sur Datastores dans le menu de navigation.
Cliquez sur le nom de votre data store.
Sur la page Données de votre datastore, obtenez l'ID du datastore.
Appelez la méthode
dataStores.completeQuery
.curl -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID:completeQuery?query=QUERY_STRING&query_model=QUERY_SUGGESTIONS_MODEL"
Remplacez les éléments suivants :
PROJECT_ID
: numéro ou ID de votre Google Cloud projet.DATA_STORE_ID
: identifiant unique du data store associé à votre application.QUERY_STRING
: entrée de saisie semi-automatique utilisée pour extraire des suggestions.AUTOCOMPLETE_MODEL
: données de saisie semi-automatiqueQUERY_SUGGESTIONS_MODEL
: modèle de suggestions de requêtes à utiliser pour la requête:document
,document-completable
,search-history
ouuser-event
. Pour les données de santé, utilisezhealthcare-default
.
C#
Pour en savoir plus, consultez la documentation de référence de l'API Applications d'IA C#.
Pour vous authentifier auprès des applications d'IA, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Go
Pour en savoir plus, consultez la documentation de référence de l'API Applications d'IA Go.
Pour vous authentifier auprès des applications d'IA, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour en savoir plus, consultez la documentation de référence de l'API Applications d'IA Java.
Pour vous authentifier auprès des applications d'IA, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour en savoir plus, consultez la documentation de référence de l'API Applications d'IA Node.js.
Pour vous authentifier auprès des applications d'IA, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour en savoir plus, consultez la documentation de référence de l'API Applications d'IA Python.
Pour vous authentifier auprès des applications d'IA, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Ruby
Pour en savoir plus, consultez la documentation de référence de l'API Applications d'IA Ruby.
Pour vous authentifier auprès des applications d'IA, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Utiliser une liste de blocage pour la saisie semi-automatique
Vous pouvez utiliser une liste de blocage pour empêcher des termes spécifiques d'apparaître sous forme de suggestions de saisie automatique.
Prenons l'exemple d'une entreprise pharmaceutique. Si un médicament n'est plus approuvé par la FDA, mais qu'il est mentionné dans des documents de son data store, il peut souhaiter empêcher ce médicament d'apparaître en tant que requête suggérée. L'entreprise peut ajouter le nom de ce médicament à une liste de blocage pour éviter qu'il ne soit suggéré.
Les limites suivantes s'appliquent :
- Une liste de blocage par data store
- Importer une liste de blocage écrase toute liste de blocage existante pour ce data store.
- Jusqu'à 1 000 termes par liste de blocage
- Les termes ne sont pas sensibles à la casse.
- Une fois qu'une liste de blocage a été importée, elle prend effet dans un délai de 1 à 2 jours.
Chaque entrée de votre liste de blocage se compose d'un blockPhrase
et d'un matchOperator
:
blockPhrase
: saisissez une chaîne comme terme de la liste de blocage. Les termes ne sont pas sensibles à la casse.matchOperator
: accepte les valeurs suivantes :EXACT_MATCH
: empêche une correspondance exacte du terme de la liste de blocage d'apparaître en tant que requête suggérée.CONTAINS
: empêche l'affichage de toute suggestion contenant le terme de la liste de blocage.
Voici un exemple de liste de blocage avec quatre entrées:
{ "entries": [ {"blockPhrase":"Oranges","matchOperator":"CONTAINS"}, {"blockPhrase":"bAd apples","matchOperator":"EXACT_MATCH"}, {"blockPhrase":"Cool as A Cucumber","matchOperator":"EXACT_MATCH"}, {"blockPhrase":"cherry pick","matchOperator":"CONTAINS"} ] }
Avant d'importer une liste de blocage, vérifiez que les contrôles d'accès nécessaires sont définis pour l'accès de l'éditeur du moteur de découverte.
Les listes de blocage peuvent être importées à partir de données JSON locales ou de Cloud Storage. Pour supprimer une liste de blocage d'un data store, purgez-la.
Importer une liste de blocage à partir de données JSON locales
Pour importer une liste de blocage à partir d'un fichier JSON local contenant votre liste de blocage, procédez comme suit:
Créez votre liste de blocage dans un fichier JSON local au format suivant. Assurez-vous que chaque entrée de la liste de blocage se trouve sur une nouvelle ligne, sans saut de ligne.
{ "inlineSource": { "entries": [ { "blockPhrase":"TERM_1","matchOperator":"MATCH_OPERATOR_1" }, { "blockPhrase":"TERM_2","matchOperator":"MATCH_OPERATOR_2" } ] } }
Envoyez une requête POST à la méthode
suggestionDenyListEntries:import
, en indiquant le nom de votre fichier JSON.curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data @DENYLIST_FILE \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/suggestionDenyListEntries:import"
Remplacez les éléments suivants :
DENYLIST_FILE
: chemin d'accès local du fichier JSON contenant les conditions de la liste de blocage.PROJECT_ID
: numéro ou ID de votre Google Cloud projet.DATA_STORE_ID
: ID du data store associé à votre application.
Une fois votre liste de blocage importée, il faut compter un à deux jours pour commencer à filtrer les suggestions.
Importer une liste de blocage depuis Cloud Storage
Pour importer une liste de blocage à partir d'un fichier JSON dans Cloud Storage, procédez comme suit:
Créez votre liste de blocage dans un fichier JSON au format suivant, puis importez-la dans un bucket Cloud Storage. Assurez-vous que chaque entrée de la liste de blocage se trouve sur une nouvelle ligne, sans saut de ligne.
{ "blockPhrase":"TERM_1","matchOperator":"MATCH_OPERATOR_1" } { "blockPhrase":"TERM_2","matchOperator":"MATCH_OPERATOR_2" }
Créez un fichier JSON local contenant l'objet
gcsSource
. Utilisez-le pour pointer vers l'emplacement de votre fichier de liste de blocage dans un bucket Cloud Storage.{ "gcsSource": { "inputUris": [ "DENYLIST_STORAGE_LOCATION" ] } }
Remplacez
DENYLIST_STORAGE_LOCATION
par l'emplacement de votre liste de blocage dans Cloud Storage. Vous ne pouvez saisir qu'un seul URI. L'URI doit être saisi au format suivant :gs://BUCKET/FILE_PATH
.Envoyez une requête POST à la méthode
suggestionDenyListEntries:import
, y compris l'objetgcsSource
.curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data @GCS_SOURCE_FILE \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/suggestionDenyListEntries:import"
Remplacez les éléments suivants :
GCS_SOURCE_FILE
: chemin d'accès local du fichier contenant l'objetgcsSource
qui pointe vers votre liste de blocage.PROJECT_ID
: numéro ou ID de votre Google Cloud projet.DATA_STORE_ID
: ID du data store associé à votre application.
Une fois votre liste de blocage importée, il faut compter un à deux jours pour commencer à filtrer les suggestions.
Supprimer définitivement une liste de blocage
Pour supprimer une liste de blocage de votre data store, procédez comme suit:
Envoyez une requête POST à la méthode
suggestionDenyListEntries:purge
.curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/suggestionDenyListEntries:purge"
Remplacez les éléments suivants :
PROJECT_ID
: numéro ou ID de votre Google Cloud projet.DATA_STORE_ID
: ID du data store associé à votre application.
Utiliser une liste importée de suggestions de saisie semi-automatique
Vous pouvez choisir de fournir votre propre liste de suggestions de saisie semi-automatique au lieu d'utiliser des suggestions générées à partir d'un modèle de données de saisie semi-automatique.
Pour la plupart des applications, l'utilisation des suggestions générées par l'un des modèles de données de saisie semi-automatique génère de meilleurs résultats. Toutefois, il peut arriver que les suggestions du modèle ne correspondent pas à vos besoins. Dans ce cas, fournir une liste discrète de suggestions offre à vos utilisateurs une meilleure expérience de saisie semi-automatique.
Par exemple, une petite librairie en ligne importe sa liste de titres de livres en tant que suggestions de saisie semi-automatique. Lorsqu'un client commence à saisir du texte dans la barre de recherche, la suggestion de saisie semi-automatique est toujours un titre de livre de la liste importée. Lorsque la liste des livres change, la librairie purge la liste actuelle et importe la nouvelle liste. Voici un extrait de la liste:
{"suggestion": "Wuthering Heights", "globalScore": "0.52" },
{"suggestion": "The Time Machine", "globalScore": "0.26" },
{"suggestion": "Nicholas Nickleby", "globalScore": "0.38" },
{"suggestion": "A Little Princess", "globalScore": "0.71" },
{"suggestion": "The Scarlet Letter", "globalScore": "0.32" }
globalScore
est un nombre à virgule flottante compris entre 0 et 1 qui permet de classer la suggestion. Vous pouvez également utiliser un score frequency
, qui est un entier supérieur à un. Le score frequency
est utilisé pour classer les suggestions lorsque globalScore
n'est pas disponible (défini comme NULL).
Configurer et importer des suggestions de saisie semi-automatique
Pour configurer et importer une liste de suggestions de saisie semi-automatique à partir d'un BigQuery, procédez comme suit:
Créez votre liste de suggestions et chargez-la dans une table BigQuery.
Vous devez au minimum fournir chaque suggestion sous forme de chaîne et un score global ou une fréquence.
Utilisez le schéma de tableau suivant pour votre liste de suggestions:
[ { "description": "The suggestion text", "mode": "REQUIRED", "name": "suggestion", "type": "STRING" }, { "description": "Global score of this suggestion. Control how this suggestion would be scored and ranked. Set global score or frequency; not both.", "mode": "NULLABLE", "name": "globalScore", "type": "FLOAT" }, { "description": "Frequency of this suggestion. Used to rank suggestions when the global score is not available.", "mode": "NULLABLE", "name": "frequency", "type": "INTEGER" } ]
Consultez la documentation BigQuery pour savoir comment créer une table BigQuery et la charger avec votre liste de suggestions de saisie semi-automatique.
Importez la liste depuis BigQuery.
Envoyez une requête POST à la méthode
completionSuggestions:import
, en incluant l'objetbigquerySource
.curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/completionSuggestions:import" \ -d '{ "bigquery_source": {"project_id": "PROJECT_ID_SOURCE", "dataset_id": "DATASET_ID", "table_id": "TABLE_ID"} }'
Remplacez les éléments suivants :
PROJECT_ID
: numéro ou ID de votre Google Cloud projet.DATA_STORE_ID
: ID du data store Vertex AI Search.PROJECT_ID_SOURCE
: projet contenant l'ensemble de données que vous souhaitez importer.DATASET_ID
: ID de l'ensemble de données de la liste de suggestions que vous souhaitez importerTABLE_ID
: ID de la table pour la liste de suggestions que vous souhaitez importer
Facultatif: Notez la valeur
name
renvoyée, puis suivez les instructions de la section Obtenir des informations sur une opération de longue durée pour savoir quand l'opération d'importation est terminée.Si vous n'avez pas activé la saisie semi-automatique pour l'application, suivez la procédure Mettre à jour les paramètres de saisie semi-automatique. Assurez-vous de définir Activer la saisie semi-automatique sur Maintenant.
Attendez quelques jours que l'indexation soit terminée et que les suggestions importées soient disponibles.
Envoyer une requête de saisie semi-automatique
Pour envoyer une requête de saisie semi-automatique qui renvoie une suggestion importée au lieu d'une suggestion provenant d'un modèle de saisie semi-automatique:
- Suivez la procédure pour envoyer une requête de saisie semi-automatique à un autre modèle et définissez
AUTOCOMPLETE_MODEL
surimported-suggestion
.
Effacer la liste des suggestions de saisie semi-automatique importées
Avant d'importer une nouvelle liste de suggestions de saisie semi-automatique, supprimez la liste existante.
Pour supprimer une liste existante de suggestions de saisie semi-automatique, procédez comme suit:
Envoyez une requête POST à la méthode
completionSuggestions:purge
.curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/completionSuggestions:purge"
Remplacez les éléments suivants :
PROJECT_ID
: numéro ou ID de votre Google Cloud projet.DATA_STORE_ID
: ID du data store associé à votre application.
Modèle de données de document avancé
Les applications d'IA fournissent un modèle de données avancé pour la saisie semi-automatique. Sur la base des documents que vous importez, ce modèle de données génère des suggestions de saisie semi-automatique de haute qualité en exploitant les grands modèles de langage (LLM) de Google.
Cette fonctionnalité n'est pas disponible actuellement. Si vous souhaitez utiliser cette fonctionnalité, contactez l'équipe chargée de votre compte Google Cloud et demandez à être ajouté à la liste d'autorisation.
Le modèle de données de documents avancé n'est pas disponible pour la recherche Healthcare ni dans les ensembles multirégionaux des États-Unis et de l'UE.