Informazioni su app e datastore

Questa pagina descrive le app e i datastore di Vertex AI Search. Per informazioni sui datastore di Vertex AI Agents, consulta Datastore di Vertex AI Agents.

Con Vertex AI Search, crei un'app di ricerca o di consigli e la colleghi a un datastore. Un progetto Google Cloud può contenere più app.

Relazione tra app e datastore

La relazione tra app e datastore dipende dal tipo di app:

  • Le app di ricerca generica hanno un rapporto many-to-many con i datastore. Quando più datastore sono collegati a una singola app di ricerca generica, si parla di ricerca combinata. Per informazioni sulle limitazioni del collegamento di un'app di ricerca a più datastore, consulta Informazioni sulla ricerca combinata.

  • Un'app di suggerimenti generici ha una connessione uno a uno con il proprio data store.

  • Un'app multimediale ha una relazione many-to-one con il proprio datastore. Un'app può collegarsi a un solo datastore, mentre un determinato datastore può essere collegato a più app. Ad esempio, un'app di ricerca di contenuti multimediali e un'app di suggerimenti sui contenuti multimediali possono condividere un datastore.

  • Un'app di ricerca sanitaria ha una relazione many-to-one con il proprio datastore. Un'app può collegarsi a un solo datastore, mentre un determinato datastore può essere collegato a più app. Ad esempio, un'app rivolta ai pazienti e un'app rivolta ai fornitori possono connettersi allo stesso datastore.

    Per un'importazione collettiva dei dati sanitari, i dati vengono importati in un datastore all'interno di un'app. Per l'importazione dei dati in streaming (anteprima) dei dati sanitari, i dati vengono importati in un'entità, ovvero un tipo di datastore all'interno di un connettore dati. Un connettore dati è anche un tipo di datastore all'interno di un'app.

Una volta collegato un datastore a un'app, non può essere scollegato.

Metodo di creazione dell'app e importazione dati

Il modo in cui crei un'app e importi i dati dipende dal tipo di dati di cui disponi:

  • Per i dati del sito web, utilizza la console Google Cloud, non l'API, per creare la tua app e importare i dati.

  • Per i dati strutturati o non strutturati, puoi utilizzare la console Google Cloud o l'API.

  • Per i dati sanitari, puoi utilizzare la console Google Cloud o l'API.

Documenti

Ogni datastore contiene uno o più record di dati, chiamati documenti. Il significato di un documento varia a seconda del tipo di dati nello datastore:

  • Sito web. Un documento è una pagina web.

  • Dati strutturati. Un documento è una riga di una tabella o un record JSON che segue uno schema specifico. Puoi fornire questo schema autonomamente o lasciare che Vertex AI Agent Builder lo derivi dai dati importati.

  • Dati strutturati per i contenuti multimediali. Un documento è una riga di una tabella o un record JSON che segue uno schema specifico per i contenuti multimediali. I documenti sono record relativi a contenuti multimediali, come video, articoli di notizie, file musicali e podcast. Un documento contiene informazioni che descrivono almeno il titolo, l'URI della posizione dei contenuti, le categorie, la durata e la data di disponibilità dell'elemento multimediale.

  • Dati strutturati per le origini dati di terze parti (anteprima con lista consentita). Un documento è un'entità specifica dell'origine dati di terze parti, ad esempio un problema Jira o uno spazio Confluence.

  • Dati non strutturati. Un documento è un file in formato HTML, PDF con testo incorporato o TXT. I formati PPTX e DOCX sono disponibili in Anteprima.

  • Dati FHIR sanitari. Un documento è una risorsa FHIR R4 supportata. Per un elenco delle risorse FHIR R4 supportate da Vertex AI Search, consulta la documentazione di riferimento dello schema di dati FHIR R4 per la salute.

Datastore e app

In Vertex AI Agent Builder esistono vari tipi di datastore. Un datastore può contenere un solo tipo di dati.

Dati sui siti web

Un datastore con dati del sito web utilizza i dati indicizzati dai siti web pubblici. Puoi fornire un insieme di pattern URL da includere nel tuo datastore. Le pagine web che corrispondono ai pattern URL sono chiamate pagine web incluse. Puoi quindi configurare la ricerca o i consigli sui dati sottoposti a scansione dalle pagine web incluse.

Ad esempio, puoi fornire pattern di URL come yourexamplewebsite.com/faq/* e yourexamplewebsite.com/events/* e attivare la ricerca o i consigli per i dati sottoposti a scansione da queste pagine web che corrispondono al pattern. Questi dati includono testo, immagini taggate con metadati e altri dati strutturati come tag meta, attributi PageMap e dati schema.org.

Esistono due tipi di magazzini di dati dei siti web:

  • Ricerca di base su un sito web:

    • Fornisce funzionalità di ricerca nell'indice della Ricerca Google esistente per i siti web inclusi.
    • Non richiede la verifica del dominio.
  • Indicizzazione avanzata dei siti web:

    • Fornisce funzionalità di ricerca avanzata su un indice generato in base a uno dei seguenti elementi: l'indice esistente della Ricerca Google per i siti web inclusi.
      • I proprietari di app Vertex AI Search possono controllare quali pagine web vengono indicizzate inviando le sitemap e gestendole. Per saperne di più, consulta Indicizzare e aggiornare le pagine web utilizzando le sitemap. Questo procedura mantiene l'indice aggiornato senza intervento manuale.
      • I proprietari di app Vertex AI Search possono eseguire un'indicizzazione iniziale che rispecchi l'indice della Ricerca Google e poi espandere la copertura dell'indice eseguendo la scansione dei siti web ogni volta che è necessario, mantenendolo aggiornato. Per ulteriori informazioni, consulta Aggiornare le pagine web. Le funzionalità avanzate dell'indicizzazione avanzata dei siti web sono elencate in Indicizzazione avanzata dei siti web.
    • Richiede ai proprietari dei datastore di Vertex AI Search di verificare i domini a cui appartengono i siti web inclusi. Per ulteriori informazioni, consulta Verificare i domini dei siti web.
    • Offre la possibilità di aggiungere dati strutturati allo schema del datastore. Un sito web contiene dati non strutturati, ma puoi aggiungere dati strutturati alle tue pagine web sotto forma di tag meta, attributi PageMap e dati di schema.org. Puoi quindi utilizzare questi dati strutturati per modificare lo schema datastore come spiegato in Utilizzare i dati strutturati per l'indicizzazione avanzata del sito web.

Passaggi successivi

Per la ricerca nel sito web:

Per i consigli:

Dati strutturati

Un datastore con dati strutturati consente la ricerca semantica o i consigli sui dati strutturati. Puoi importare i dati da BigQuery o Cloud Storage. Puoi anche caricare manualmente i dati JSON strutturati tramite l'API.

Ad esempio, puoi attivare la ricerca o i consigli in un catalogo dei prodotti per la tua esperienza di e-commerce o una directory di medici per la ricerca o i consigli di fornitori.

Vertex AI Agent Builder rileva automaticamente lo schema dai dati che importi. Se vuoi, puoi fornire uno schema per i dati. Fornire uno schema per i dati in genere migliora la qualità dei risultati.

Passaggi successivi

Per la ricerca generica:

Per consigli generici:

Dati strutturati per i contenuti multimediali

Le app multimediali possono essere collegate solo a datastore di contenuti multimediali. Gli archivi di dati multimediali sono archivi di dati strutturati con uno schema definito da Google o con il tuo schema personalizzato contenente un insieme specifico di cinque campi relativi ai contenuti multimediali. Per maggiori informazioni sullo schema, consulta Informazioni sui documenti multimediali e sui datastore.

Ad esempio, puoi attivare i consigli creando un'app di consigli sui contenuti multimediali per un catalogo di film o un sito di notizie, in modo che i tuoi utenti ricevano suggerimenti adatti e personalizzati.

Oltre ai documenti multimediali, i datastore multimediali contengono anche le informazioni sugli eventi utente che consentono a Vertex AI Search di personalizzare i consigli e cercare gli utenti. Gli eventi utente sono obbligatori per le app di suggerimenti sui contenuti multimediali e sono consigliati per le app di ricerca di contenuti multimediali. Per informazioni sugli eventi utente, consulta Registrare gli eventi utente in tempo reale.

Passaggi successivi

Dati strutturati per gli store di dati di terze parti

I seguenti connettori di origini dati di terze parti sono disponibili in anteprima con la lista consentita:

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

I dati di queste terze parti sono considerati dati strutturati.

Quando configuri un nuovo connettore, selezioni una frequenza di sincronizzazione. Puoi anche selezionare le entità da sincronizzare. Le entità variano a seconda della sorgente, ad esempio i problemi per Jira e i contenuti e gli spazi per Confluence. Viene creato un datastore univoco per ogni entità. I datastore delle entità vengono raggruppati per istanza del connettore.

Passaggi successivi

Per la rete di ricerca:

Per i consigli:

Dati non strutturati

Un datastore non strutturato consente la ricerca semantica o i consigli su dati come documenti e immagini.

Gli archivi di dati non strutturati supportano i documenti in formato HTML, PDF con testo incorporato e TXT. I formati PPTX e DOCX sono disponibili in Anteprima.

La ricerca fornisce risultati sotto forma di 10 URL e risposte riepilogative per le query in linguaggio naturale. I documenti devono essere caricati in un bucket Cloud Storage con le autorizzazioni di accesso appropriate. Ad esempio, un istituto finanziario può attivare la ricerca o i consigli nel proprio corpus privato di pubblicazioni di ricerca finanziaria oppure un'azienda di biotecnologia può attivare la ricerca o i consigli nel proprio repository privato di ricerche mediche.

Passaggi successivi

Per la rete di ricerca:

Per consigli generici:

Dati FHIR Healthcare

Un'app di ricerca sanitaria utilizza i dati FHIR R4 importati da un datastore FHIR dell'API Cloud Healthcare. Per un elenco delle risorse FHIR R4 supportate da Vertex AI Search, consulta la documentazione di riferimento dello schema di dati FHIR R4 per la salute. Un datastore FHIR R4 deve soddisfare alcuni requisiti prima di poter essere utilizzato come origine dati per il datastore Vertex AI Search. Per saperne di più, consulta come preparare i dati FHIR sanitari per l'importazione.

Passaggi successivi

Informazioni sulla ricerca combinata

Puoi creare un'app di ricerca combinata, in cui è possibile collegare più datastore a un'unica app di ricerca generica. Questa funzionalità ti consente di utilizzare un'app per eseguire ricerche in più origini e tipi di dati.

Per creare un'app di ricerca combinata, seleziona più datastore quando crei una nuova app di ricerca generica. Se non selezioni più datastore durante la creazione, non potrai aggiungerne altri in un secondo momento.

Quando ricevi i risultati di ricerca, puoi eseguire ricerche in tutti gli archivi dati o filtrare i risultati di un singolo datastore.

Si applicano le seguenti limitazioni:

  • Aggiunta e rimozione di magazzini di dati:
    • Per attivare la ricerca combinata per un'app, devi collegare almeno due magazzini di dati durante la creazione dell'app.
    • Puoi aggiungere o rimuovere datastore da un'app di ricerca combinata, ma l'app non può avere meno di due datastore collegati in qualsiasi momento.
    • Se colleghi un singolo datastore a un'app di ricerca durante la creazione dell'app, non potrai aggiungerlo o rimuoverlo.
  • Per poter essere utilizzati per la ricerca combinata, i datastore dei siti web devono avere l'indicizzazione avanzata dei siti web attivata. Per ulteriori informazioni, consulta la sezione Indicizzazione avanzata dei siti web.
  • Gli archivi di dati che contengono dati non strutturati importati utilizzando BigQuery non sono supportati.
  • La ricerca combinata consente i seguenti campi nelle richieste di ricerca:
    • query
    • pageSize
    • offset
    • dataStoreSpecs
    • pageToken
    • filter
    • spellCorrectionSpec
    • session
    • contentSearchSpec
      • summarySpec
      • extractiveContentSpec
      • searchResultMode
      • chunkSpec
  • Oltre ai campi elencati in precedenza, i seguenti campi sono supportati per le app di ricerca combinata solo quando le richieste di ricerca vengono filtrate per ottenere risultati da un singolo datastore. Non sono supportati quando si ottengono risultati da più di un datastore:
    • facetSpec
  • La ricerca combinata consente i seguenti campi in dataStoreSpecs:
    • boostSpec
    • filter: se sono specificati filtri sia per SearchRequest sia per dataStoreSpecs, entrambi i filtri vengono applicati ai risultati di ricerca
  • Le operazioni CRUD (Create, Read, Update, Delete) sulle configurazioni di pubblicazione sono supportate per le app combinate. Solo i seguenti campi possono essere aggiunti o aggiornati in una configurazione di pubblicazione:
    • name
    • displayName
    • solutionType
    • genericConfig:
      • contentSearchSpec:
        • summarySpec
        • extractiveContentSpec
        • searchResultMode
        • chunkSpec
    • boostControlIds
    • synonymsControlIds
    • onewaySynonymsControlIds
  • Per le app di ricerca combinata sono supportate le operazioni CRUD sui seguenti controlli:
    • boostAction
    • synonymACtion
  • Le app di ricerca combinata non supportano le seguenti funzionalità:
    • Filtra, reindirizza, ignora, sostituisci e dissocia i controlli di pubblicazione
    • Snippet che utilizzano contentSearchSpec.snippetSpec nelle richieste di ricerca o nelle configurazioni di pubblicazione
    • Ricerca con follow-up