Questa pagina descrive le app e i datastore di Vertex AI Search. Per informazioni sui datastore di Vertex AI Agents, consulta Datastore di Vertex AI Agents.
Con Vertex AI Search, crei un'app di ricerca o di consigli e la colleghi a un datastore. Un progetto Google Cloud può contenere più app.
Relazione tra app e datastore
La relazione tra app e datastore dipende dal tipo di app:
Le app di ricerca generica hanno un rapporto many-to-many con i datastore. Quando più datastore sono collegati a una singola app di ricerca generica, si parla di ricerca combinata. Per informazioni sulle limitazioni del collegamento di un'app di ricerca a più datastore, consulta Informazioni sulla ricerca combinata.
Un'app di suggerimenti generici ha una connessione uno a uno con il proprio data store.
Un'app multimediale ha una relazione many-to-one con il proprio datastore. Un'app può collegarsi a un solo datastore, mentre un determinato datastore può essere collegato a più app. Ad esempio, un'app di ricerca di contenuti multimediali e un'app di suggerimenti sui contenuti multimediali possono condividere un datastore.
Un'app di ricerca sanitaria ha una relazione many-to-one con il proprio datastore. Un'app può collegarsi a un solo datastore, mentre un determinato datastore può essere collegato a più app. Ad esempio, un'app rivolta ai pazienti e un'app rivolta ai fornitori possono connettersi allo stesso datastore.
Per un'importazione collettiva dei dati sanitari, i dati vengono importati in un datastore all'interno di un'app. Per l'importazione dei dati in streaming (anteprima) dei dati sanitari, i dati vengono importati in un'entità, ovvero un tipo di datastore all'interno di un connettore dati. Un connettore dati è anche un tipo di datastore all'interno di un'app.
Una volta collegato un datastore a un'app, non può essere scollegato.
Metodo di creazione dell'app e importazione dati
Il modo in cui crei un'app e importi i dati dipende dal tipo di dati di cui disponi:
Per i dati del sito web, utilizza la console Google Cloud, non l'API, per creare la tua app e importare i dati.
Per i dati strutturati o non strutturati, puoi utilizzare la console Google Cloud o l'API.
Per i dati sanitari, puoi utilizzare la console Google Cloud o l'API.
Documenti
Ogni datastore contiene uno o più record di dati, chiamati documenti. Il significato di un documento varia a seconda del tipo di dati nello datastore:
Sito web. Un documento è una pagina web.
Dati strutturati. Un documento è una riga di una tabella o un record JSON che segue uno schema specifico. Puoi fornire questo schema autonomamente o lasciare che Vertex AI Agent Builder lo derivi dai dati importati.
Dati strutturati per i contenuti multimediali. Un documento è una riga di una tabella o un record JSON che segue uno schema specifico per i contenuti multimediali. I documenti sono record relativi a contenuti multimediali, come video, articoli di notizie, file musicali e podcast. Un documento contiene informazioni che descrivono almeno il titolo, l'URI della posizione dei contenuti, le categorie, la durata e la data di disponibilità dell'elemento multimediale.
Dati strutturati per le origini dati di terze parti (anteprima con lista consentita). Un documento è un'entità specifica dell'origine dati di terze parti, ad esempio un problema Jira o uno spazio Confluence.
Dati non strutturati. Un documento è un file in formato HTML, PDF con testo incorporato o TXT. I formati PPTX e DOCX sono disponibili in Anteprima.
Dati FHIR sanitari. Un documento è una risorsa FHIR R4 supportata. Per un elenco delle risorse FHIR R4 supportate da Vertex AI Search, consulta la documentazione di riferimento dello schema di dati FHIR R4 per la salute.
Datastore e app
In Vertex AI Agent Builder esistono vari tipi di datastore. Un datastore può contenere un solo tipo di dati.
- Dati del sito web
- Dati strutturati
- Contenuti strutturati (media)
- Contenuti strutturati per le origini dati di terze parti
- Dati non strutturati
- Dati FHIR sanitari
Dati sui siti web
Un datastore con dati del sito web utilizza i dati indicizzati dai siti web pubblici. Puoi fornire un insieme di pattern URL da includere nel tuo datastore. Le pagine web che corrispondono ai pattern URL sono chiamate pagine web incluse. Puoi quindi configurare la ricerca o i consigli sui dati sottoposti a scansione dalle pagine web incluse.
Ad esempio, puoi fornire pattern di URL come yourexamplewebsite.com/faq/*
e yourexamplewebsite.com/events/*
e attivare la ricerca o i consigli per
i dati sottoposti a scansione da queste pagine web che corrispondono al pattern. Questi dati includono testo, immagini taggate con metadati e altri dati strutturati come tag meta
, attributi PageMap e dati schema.org.
Esistono due tipi di magazzini di dati dei siti web:
Ricerca di base su un sito web:
- Fornisce funzionalità di ricerca nell'indice della Ricerca Google esistente per i siti web inclusi.
- Non richiede la verifica del dominio.
Indicizzazione avanzata dei siti web:
- Fornisce funzionalità di ricerca avanzata su un indice generato in base a uno dei seguenti elementi: l'indice esistente della Ricerca Google per i siti web inclusi.
- I proprietari di app Vertex AI Search possono controllare quali pagine web vengono indicizzate inviando le sitemap e gestendole. Per saperne di più, consulta Indicizzare e aggiornare le pagine web utilizzando le sitemap. Questo procedura mantiene l'indice aggiornato senza intervento manuale.
- I proprietari di app Vertex AI Search possono eseguire un'indicizzazione iniziale che rispecchi l'indice della Ricerca Google e poi espandere la copertura dell'indice eseguendo la scansione dei siti web ogni volta che è necessario, mantenendolo aggiornato. Per ulteriori informazioni, consulta Aggiornare le pagine web. Le funzionalità avanzate dell'indicizzazione avanzata dei siti web sono elencate in Indicizzazione avanzata dei siti web.
- Richiede ai proprietari dei datastore di Vertex AI Search di verificare i domini a cui appartengono i siti web inclusi. Per ulteriori informazioni, consulta Verificare i domini dei siti web.
- Offre la possibilità di aggiungere dati strutturati allo schema del datastore.
Un sito web contiene dati non strutturati, ma puoi aggiungere dati strutturati alle tue pagine web sotto forma di tag
meta
, attributi PageMap e dati di schema.org. Puoi quindi utilizzare questi dati strutturati per modificare lo schema datastore come spiegato in Utilizzare i dati strutturati per l'indicizzazione avanzata del sito web.
- Fornisce funzionalità di ricerca avanzata su un indice generato in base a uno dei seguenti elementi: l'indice esistente della Ricerca Google per i siti web inclusi.
Passaggi successivi
Per la ricerca nel sito web:
- Per comprendere i prerequisiti dell'indicizzazione, scopri come preparare i dati per la ricerca sul sito web.
- Crea un datastore utilizzando i contenuti del sito web.
- Crea un'app di ricerca.
Per i consigli:
Dati strutturati
Un datastore con dati strutturati consente la ricerca semantica o i consigli sui dati strutturati. Puoi importare i dati da BigQuery o Cloud Storage. Puoi anche caricare manualmente i dati JSON strutturati tramite l'API.
Ad esempio, puoi attivare la ricerca o i consigli in un catalogo dei prodotti per la tua esperienza di e-commerce o una directory di medici per la ricerca o i consigli di fornitori.
Vertex AI Agent Builder rileva automaticamente lo schema dai dati che importi. Se vuoi, puoi fornire uno schema per i dati. Fornire uno schema per i dati in genere migliora la qualità dei risultati.
Passaggi successivi
Per la ricerca generica:
- Prepara i dati strutturati per l'importazione.
- Crea un datastore di ricerca utilizzando uno dei seguenti metodi:
- Crea un'app di ricerca.
Per consigli generici:
Dati strutturati per i contenuti multimediali
Le app multimediali possono essere collegate solo a datastore di contenuti multimediali. Gli archivi di dati multimediali sono archivi di dati strutturati con uno schema definito da Google o con il tuo schema personalizzato contenente un insieme specifico di cinque campi relativi ai contenuti multimediali. Per maggiori informazioni sullo schema, consulta Informazioni sui documenti multimediali e sui datastore.
Ad esempio, puoi attivare i consigli creando un'app di consigli sui contenuti multimediali per un catalogo di film o un sito di notizie, in modo che i tuoi utenti ricevano suggerimenti adatti e personalizzati.
Oltre ai documenti multimediali, i datastore multimediali contengono anche le informazioni sugli eventi utente che consentono a Vertex AI Search di personalizzare i consigli e cercare gli utenti. Gli eventi utente sono obbligatori per le app di suggerimenti sui contenuti multimediali e sono consigliati per le app di ricerca di contenuti multimediali. Per informazioni sugli eventi utente, consulta Registrare gli eventi utente in tempo reale.
Passaggi successivi
Dati strutturati per gli store di dati di terze parti
I seguenti connettori di origini dati di terze parti sono disponibili in anteprima con la lista consentita:
- Confluence
- Jira
- Salesforce
- SharePoint Online
- Slack
I dati di queste terze parti sono considerati dati strutturati.
Quando configuri un nuovo connettore, selezioni una frequenza di sincronizzazione. Puoi anche selezionare le entità da sincronizzare. Le entità variano a seconda della sorgente, ad esempio i problemi per Jira e i contenuti e gli spazi per Confluence. Viene creato un datastore univoco per ogni entità. I datastore delle entità vengono raggruppati per istanza del connettore.
Passaggi successivi
Per la rete di ricerca:
- Prepara i dati di terze parti per l'importazione.
- Collega un'origine dati di terze parti.
- Crea un'app di ricerca.
Per i consigli:
Dati non strutturati
Un datastore non strutturato consente la ricerca semantica o i consigli su dati come documenti e immagini.
Gli archivi di dati non strutturati supportano i documenti in formato HTML, PDF con testo incorporato e TXT. I formati PPTX e DOCX sono disponibili in Anteprima.
La ricerca fornisce risultati sotto forma di 10 URL e risposte riepilogative per le query in linguaggio naturale. I documenti devono essere caricati in un bucket Cloud Storage con le autorizzazioni di accesso appropriate. Ad esempio, un istituto finanziario può attivare la ricerca o i consigli nel proprio corpus privato di pubblicazioni di ricerca finanziaria oppure un'azienda di biotecnologia può attivare la ricerca o i consigli nel proprio repository privato di ricerche mediche.
Passaggi successivi
Per la rete di ricerca:
- Prepara i dati non strutturati per l'importazione.
- Crea un datastore di ricerca utilizzando uno dei seguenti metodi:
- Crea un datastore di ricerca per i tuoi dati non strutturati.
- Crea un'app di ricerca.
Per consigli generici:
Dati FHIR Healthcare
Un'app di ricerca sanitaria utilizza i dati FHIR R4 importati da un datastore FHIR dell'API Cloud Healthcare. Per un elenco delle risorse FHIR R4 supportate da Vertex AI Search, consulta la documentazione di riferimento dello schema di dati FHIR R4 per la salute. Un datastore FHIR R4 deve soddisfare alcuni requisiti prima di poter essere utilizzato come origine dati per il datastore Vertex AI Search. Per saperne di più, consulta come preparare i dati FHIR sanitari per l'importazione.
Passaggi successivi
- Prepara i dati FHIR R4 per l'importazione.
- Crea un datastore di ricerca sanitaria.
- Crea un'app di ricerca sanitaria.
Informazioni sulla ricerca combinata
Puoi creare un'app di ricerca combinata, in cui è possibile collegare più datastore a un'unica app di ricerca generica. Questa funzionalità ti consente di utilizzare un'app per eseguire ricerche in più origini e tipi di dati.
Per creare un'app di ricerca combinata, seleziona più datastore quando crei una nuova app di ricerca generica. Se non selezioni più datastore durante la creazione, non potrai aggiungerne altri in un secondo momento.
Quando ricevi i risultati di ricerca, puoi eseguire ricerche in tutti gli archivi dati o filtrare i risultati di un singolo datastore.
Si applicano le seguenti limitazioni:
- Aggiunta e rimozione di magazzini di dati:
- Per attivare la ricerca combinata per un'app, devi collegare almeno due magazzini di dati durante la creazione dell'app.
- Puoi aggiungere o rimuovere datastore da un'app di ricerca combinata, ma l'app non può avere meno di due datastore collegati in qualsiasi momento.
- Se colleghi un singolo datastore a un'app di ricerca durante la creazione dell'app, non potrai aggiungerlo o rimuoverlo.
- Per poter essere utilizzati per la ricerca combinata, i datastore dei siti web devono avere l'indicizzazione avanzata dei siti web attivata. Per ulteriori informazioni, consulta la sezione Indicizzazione avanzata dei siti web.
- Gli archivi di dati che contengono dati non strutturati importati utilizzando BigQuery non sono supportati.
- La ricerca combinata consente i seguenti campi nelle
richieste di ricerca:
query
pageSize
offset
dataStoreSpecs
pageToken
filter
spellCorrectionSpec
session
contentSearchSpec
summarySpec
extractiveContentSpec
searchResultMode
chunkSpec
- Oltre ai campi elencati in precedenza, i seguenti campi sono supportati per le app di ricerca combinata solo quando le richieste di ricerca vengono filtrate per ottenere risultati da un singolo datastore. Non sono supportati quando si ottengono risultati da più di un datastore:
facetSpec
- La ricerca combinata consente i seguenti campi in
dataStoreSpecs
:boostSpec
filter
: se sono specificati filtri sia perSearchRequest
sia perdataStoreSpecs
, entrambi i filtri vengono applicati ai risultati di ricerca
- Le operazioni CRUD (Create, Read, Update, Delete) sulle configurazioni di pubblicazione sono supportate per le app combinate. Solo i seguenti campi possono essere aggiunti o aggiornati
in una configurazione di pubblicazione:
name
displayName
solutionType
genericConfig
:contentSearchSpec
:summarySpec
extractiveContentSpec
searchResultMode
chunkSpec
boostControlIds
synonymsControlIds
onewaySynonymsControlIds
- Per le app di ricerca combinata sono supportate le operazioni CRUD sui seguenti controlli:
boostAction
synonymACtion
- Le app di ricerca combinata non supportano le seguenti funzionalità:
- Filtra, reindirizza, ignora, sostituisci e dissocia i controlli di pubblicazione
- Snippet che utilizzano
contentSearchSpec.snippetSpec
nelle richieste di ricerca o nelle configurazioni di pubblicazione - Ricerca con follow-up