Crea un datastore multimediale

Questa pagina spiega come creare un datastore per i contenuti multimediali e importarvi i dati.

Prima di iniziare

Assicurati di svolgere le seguenti operazioni:

Scegli la procedura in base all'origine dati

Per creare un datastore di contenuti multimediali e importare documenti, vai alla sezione relativa all'origine che hai intenzione di utilizzare:

Importa da BigQuery

Console

Per utilizzare la console Google Cloud per creare un datastore multimediale e importare documenti ed eventi utente da BigQuery, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina Agent Builder.

    Agent Builder

  2. Vai alla pagina Datastore.

  3. Fai clic su Crea datastore.

  4. Nella pagina Origine, seleziona BigQuery.

  5. Seleziona Multimediali - tabella BigQuery con dati multimediali strutturati come tipo di dati che stai importando.

  6. Nel campo Percorso BigQuery, fai clic su Sfoglia, seleziona i dati BigQuery che hai preparato per l'importazione e poi fai clic su Seleziona. In alternativa, inserisci la posizione direttamente nel campo Percorso BigQuery.

  7. Se i tuoi dati sono nello schema predefinito di Google, scegli Schema predefinito di Google, fai clic su Continua e vai al passaggio 11.

  8. Se i dati si trovano nel tuo schema, scegli Schema personalizzato e fai clic su Continua.

  9. Controlla lo schema rilevato e utilizza il menu Proprietà chiave per assegnare le proprietà ai campi dello schema.

  10. Fai clic su Continua.

    Non puoi continuare finché le proprietà chiave richieste non sono mappate, il che è indicato da segni di spunta verdi anziché da segni di avviso arancioni .

  11. Inserisci un nome per il datastore e fai clic su Crea.

Importa da Cloud Storage

Console

Per utilizzare la console Google Cloud per creare un datastore di contenuti multimediali e importare documenti da Cloud Storage, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina Agent Builder.

    Agent Builder

  2. Vai alla pagina Datastore.

  3. Fai clic su Crea datastore.

  4. Nella pagina Origine, seleziona Cloud Storage.

  5. Seleziona Dati multimediali strutturati (JSONL contenente file multimediali) come tipo di dati da importare.

  6. Nella sezione Seleziona una cartella o un file da importare, seleziona Cartella o File.

  7. Fai clic su Sfoglia e scegli i dati che hai preparato per l'importazione, quindi fai clic su Seleziona. In alternativa, inserisci la località direttamente nel campo gs://.

  8. Se i tuoi dati sono nello schema predefinito di Google, scegli Schema predefinito di Google, fai clic su Continua e vai al passaggio 11.

  9. Se i dati si trovano nel tuo schema, scegli Schema personalizzato e fai clic su Continua.

  10. Controlla lo schema rilevato e utilizza il menu Proprietà chiave per assegnare le proprietà ai campi dello schema.

  11. Fai clic su Continua.

    Non puoi continuare finché le proprietà chiave richieste non sono mappate, il che è indicato da segni di spunta verdi anziché da segni di avviso arancioni .

  12. Inserisci un nome per il datastore e fai clic su Crea.

Importare documenti utilizzando l'API

Se utilizzi lo schema predefinito di Google, puoi importare i documenti inviando una richiesta POST al metodo REST Documents:import, utilizzando l'oggetto InlineSource per specificare i dati.

Per un esempio del formato del documento JSON, consulta Formato del documento JSON.

Requisiti di importazione

Di seguito sono riportati i requisiti per l'importazione di documenti multimediali utilizzando l'API:

  • Ogni documento deve essere inserito in una riga distinta.

  • Il numero massimo di documenti in un'unica importazione è 100.

Procedura

Per importare i documenti multimediali utilizzando l'API:

  1. Crea un datastore.

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
    -d '{
      "displayName": "DATA_STORE_DISPLAY_NAME",
      "industryVertical": "MEDIA"
    }'
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del tuo progetto Google Cloud.
    • DATA_STORE_ID: l'ID del datastore di Vertex AI Search che vuoi creare. Questo ID può contenere solo lettere minuscole, cifre, trattini bassi e trattini.
    • DATA_STORE_DISPLAY_NAME: il nome visualizzato del datastore di ricerca Vertex AI che vuoi creare.
  2. Crea il file JSON per il documento e chiamalo ./data.json:

    {
    "inlineSource": {
    "documents": [
      { DOCUMENT_1 },
      { DOCUMENT_2 }
    ]
    }
    }
    
  3. Chiama il metodo POST:

    curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     --data @./data.json \
    "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/branches/0/documents:import"
    • PROJECT_ID: l'ID del progetto.
    • DATA_STORE_ID: l'ID del tuo datastore.

Formato del documento JSON

Gli esempi riportati di seguito mostrano le voci Document in formato JSON.

Fornisci un intero documento su una singola riga. Ogni documento deve essere su una riga distinta.

Campi obbligatori minimi:

{
   "id": "sample-01",
   "schemaId": "default_schema",
   "jsonData": "{\"title\":\"Test document title\",\"categories\":[\"sports > clip\",\"sports > highlight\"],\"uri\":\"http://www.example.com\",\"media_type\":\"sports-game\",\"available_time\":\"2022-08-26T23:00:17Z\"}"
}

Oggetto completo:

{
   "id": "child-sample-0",
   "schemaId": "default_schema",
   "jsonData": "{\"title\":\"Test document title\",\"description\":\"Test document description\",\"language_code\":\"en-US\",\"categories\":[\"sports > clip\",\"sports > highlight\"],\"uri\":\"http://www.example.com\",\"images\":[{\"uri\":\"http://example.com/img1\",\"name\":\"image_1\"}],\"media_type\":\"sports-game\",\"in_languages\":[\"en-US\"],\"country_of_origin\":\"US\",\"content_index\":0,\"persons\":[{\"name\":\"sports person\",\"role\":\"player\",\"rank\":0,\"uri\":\"http://example.com/person\"},],\"organizations \":[{\"name\":\"sports team\",\"role\":\"team\",\"rank\":0,\"uri\":\"http://example.com/team\"},],\"hash_tags\":[\"tag1\"],\"filter_tags\":[\"filter_tag\"],\"production_year\":1900,\"duration\":\"100s\",\"content_rating\":[\"PG-13\"],\"aggregate_ratings\":[{\"rating_source\":\"imdb\",\"rating_score\":4.5,\"rating_count\":1250}],\"available_time\":\"2022-08-26T23:00:17Z\"}"
}

Monitorare l'importazione e visualizzare i dati

  1. Per controllare lo stato dell'importazione, vai alla pagina Datastore e fai clic sul nome del datastore per visualizzarne i dettagli nella pagina Dati.

  2. Fai clic sulla scheda Attività.

    Quando la colonna dello stato nella scheda Attività passa da In corso a Importazione completata, l'importazione è completata.

    A seconda delle dimensioni dei dati, l'importazione può richiedere diversi minuti o diverse ore.

  3. Fai clic su Documenti per visualizzare i dati importati.

Importa gli eventi utente

Gli eventi utente sono obbligatori se vuoi utilizzare il tuo datastore con un'app per suggerimenti sui contenuti multimediali.

Sebbene gli eventi utente non siano obbligatori per le app di ricerca di contenuti multimediali, includili per ottenere risultati di ricerca di qualità migliore.

Per importare gli eventi utente nel tuo datastore multimediale:

Passaggi successivi

  • Crea un'app di suggerimenti sui contenuti multimediali o un'app di ricerca di contenuti multimediali.

  • Mantieni aggiornati i dati del documento.

    Idealmente, dovresti aggiornare il tuo datastore quotidianamente importando dati aggiornati. La pianificazione delle importazioni periodiche impedisce il degrado della qualità del modello nel tempo. Puoi utilizzare Google Cloud Scheduler per automatizzare le importazioni.

    Puoi aggiornare solo i documenti nuovi o modificati oppure puoi importare l'intero datastore. Se importi documenti già presenti nel tuo datastore, questi non vengono aggiunti di nuovo. Tutti i documenti modificati vengono aggiornati.

  • Mantieni aggiornati i dati sugli eventi utente.

    È particolarmente importante mantenere aggiornati gli eventi utente. L'app dei consigli smette di funzionare se non ci sono eventi utente aggiornati sufficienti per soddisfare i requisiti relativi ai dati.

    Per informazioni sull'importazione dei dati sugli eventi utente in tempo reale, consulta Registrare gli eventi utente in tempo reale.

    Per informazioni sul monitoraggio dei requisiti relativi agli eventi utente, vedi Verificare la qualità dei dati per i consigli sui contenuti multimediali.