Questa pagina spiega come creare un datastore per i contenuti multimediali e importare i dati.
Prima di iniziare
Assicurati di svolgere le seguenti operazioni:
Esamina i concetti relativi ai dati e allo schema dei contenuti multimediali:
Decidi se utilizzare lo schema Google predefinito per i tuoi dati multimediali o il tuo schema.
Se utilizzi il tuo schema, assicurati che contenga campi che corrispondano bene alle proprietà dei media per lo schema personalizzato:
title
,url
,category
e così via.Inserisci i documenti multimediali nello schema JSON e carica i dati in BigQuery o Cloud Storage.
Esamina la sezione Informazioni sugli eventi utente multimediali e prepara gli eventi utente per l'importazione. Gli eventi utente sono obbligatori per tutte le app multimediali.
Scegli la procedura in base all'origine dati
Per creare un datastore di contenuti multimediali e importare documenti, vai alla sezione relativa all'origine che intendi utilizzare:
Importa da BigQuery
Console
Per utilizzare la console Google Cloud per creare un datastore multimediale e importare documenti ed eventi utente da BigQuery:
Nella Google Cloud console, vai alla pagina AI Applications.
Vai alla pagina Datastore.
Fai clic su Crea datastore.
Nella pagina Origine, seleziona BigQuery.
Seleziona Multimediali - tabella BigQuery con dati multimediali strutturati come tipo di dati che stai importando.
Nel campo Percorso BigQuery, fai clic su Sfoglia, seleziona i dati BigQuery che hai preparato per l'importazione e poi fai clic su Seleziona. In alternativa, inserisci la posizione direttamente nel campo Percorso BigQuery.
Se i tuoi dati sono nello schema Google predefinito, scegli Schema Google predefinito, fai clic su Continua e vai al passaggio 11.
Se i tuoi dati si trovano nel tuo schema, scegli Schema personalizzato e fai clic su Continua.
Controlla lo schema rilevato e utilizza il menu Proprietà chiave per assegnare le proprietà ai campi dello schema.
Fai clic su Continua.
Non puoi continuare finché le proprietà chiave richieste non vengono mappate, indicate da segni di spunta verdi
anziché da segni di avviso arancioni .Inserisci un nome per il datastore e fai clic su Crea.
Importa da Cloud Storage
Console
Per utilizzare la console Google Cloud per creare un datastore di contenuti multimediali e importare documenti da Cloud Storage:
Nella Google Cloud console, vai alla pagina AI Applications.
Vai alla pagina Datastore.
Fai clic su Crea datastore.
Nella pagina Origine, seleziona Cloud Storage.
Seleziona Dati multimediali strutturati (JSONL contenente file multimediali) come tipo di dati da importare.
Nella sezione Seleziona una cartella o un file da importare, seleziona Cartella o File.
Fai clic su Sfoglia e scegli i dati che hai preparato per l'importazione, poi fai clic su Seleziona. In alternativa, inserisci la posizione direttamente nel campo
gs://
.Se i tuoi dati sono nello schema Google predefinito, scegli Schema Google predefinito, fai clic su Continua e vai al passaggio 11.
Se i tuoi dati si trovano nel tuo schema, scegli Schema personalizzato e fai clic su Continua.
Controlla lo schema rilevato e utilizza il menu Proprietà chiave per assegnare le proprietà ai campi dello schema.
Fai clic su Continua.
Non puoi continuare finché le proprietà chiave richieste non vengono mappate, indicate da segni di spunta verdi
anziché da segni di avviso arancioni .Inserisci un nome per il datastore e fai clic su Crea.
Importare documenti utilizzando l'API
Se utilizzi lo schema predefinito di Google, puoi importare i documenti
effettuando una richiesta POST
al metodo REST
Documents:import
, utilizzando l'oggetto
InlineSource
per specificare i dati.
Per un esempio di formato del documento JSON, consulta Formato del documento JSON.
Requisiti di importazione
Di seguito sono riportati i requisiti per l'importazione di documenti multimediali utilizzando l'API:
Ogni documento deve essere su una riga separata.
Il numero massimo di documenti in una singola importazione è 100.
Procedura
Per importare documenti multimediali utilizzando l'API:
Crea un datastore.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \ -d '{ "displayName": "DATA_STORE_DISPLAY_NAME", "industryVertical": "MEDIA" }'
Sostituisci quanto segue:
PROJECT_ID
: l'ID del tuo Google Cloud progetto.DATA_STORE_ID
: l'ID del datastore Vertex AI Search che vuoi creare. Questo ID può contenere solo lettere minuscole, cifre, trattini bassi e trattini.DATA_STORE_DISPLAY_NAME
: il nome visualizzato del datastore Vertex AI Search che vuoi creare.
Crea il file JSON per il documento e chiamalo
./data.json
:{ "inlineSource": { "documents": [ { DOCUMENT_1 }, { DOCUMENT_2 } ] } }
Chiama il metodo POST:
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data @./data.json \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/branches/0/documents:import"
Sostituisci quanto segue:
PROJECT_ID
: l'ID progetto.DATA_STORE_ID
: l'ID del tuo datastore.
Formato del documento JSON
Gli esempi seguenti mostrano le voci Document
in formato JSON.
Fornisci un intero documento su una sola riga. Ogni documento deve essere su una riga separata.
Campi minimi obbligatori:
{ "id": "sample-01", "schemaId": "default_schema", "jsonData": "{\"title\":\"Test document title\",\"categories\":[\"sports > clip\",\"sports > highlight\"],\"uri\":\"http://www.example.com\",\"media_type\":\"sports-game\",\"available_time\":\"2022-08-26T23:00:17Z\"}" }
Oggetto completo:
{ "id": "child-sample-0", "schemaId": "default_schema", "jsonData": "{\"title\":\"Test document title\",\"description\":\"Test document description\",\"language_code\":\"en-US\",\"categories\":[\"sports > clip\",\"sports > highlight\"],\"uri\":\"http://www.example.com\",\"images\":[{\"uri\":\"http://example.com/img1\",\"name\":\"image_1\"}],\"media_type\":\"sports-game\",\"in_languages\":[\"en-US\"],\"country_of_origin\":\"US\",\"content_index\":0,\"persons\":[{\"name\":\"sports person\",\"role\":\"player\",\"rank\":0,\"uri\":\"http://example.com/person\"},],\"organizations \":[{\"name\":\"sports team\",\"role\":\"team\",\"rank\":0,\"uri\":\"http://example.com/team\"},],\"hash_tags\":[\"tag1\"],\"filter_tags\":[\"filter_tag\"],\"production_year\":1900,\"duration\":\"100s\",\"content_rating\":[\"PG-13\"],\"aggregate_ratings\":[{\"rating_source\":\"imdb\",\"rating_score\":4.5,\"rating_count\":1250}],\"available_time\":\"2022-08-26T23:00:17Z\"}" }
Monitorare l'importazione e visualizzare i dati
Per controllare lo stato dell'importazione, vai alla pagina Datastore e fai clic sul nome del datastore per visualizzarne i dettagli nella pagina Dati.
Fai clic sulla scheda Attività.
Quando la colonna Stato nella scheda Attività passa da In corso a Importazione completata, l'importazione è terminata.
A seconda delle dimensioni dei dati, l'importazione può richiedere diversi minuti o diverse ore.
Fai clic su Documenti per visualizzare i dati importati.
Importa gli eventi utente
Per importare eventi utente nel datastore multimediale:
- Segui le istruzioni riportate in Importare gli eventi utente storici.
Passaggi successivi
Mantieni aggiornati i dati dei documenti.
Idealmente, dovresti aggiornare il tuo datastore quotidianamente importando dati aggiornati. La pianificazione di importazioni periodiche impedisce il peggioramento della qualità del modello nel tempo. Puoi utilizzare Google Cloud Scheduler per automatizzare le importazioni.
Puoi aggiornare solo i documenti nuovi o modificati oppure importare l'intero datastore. Se importi documenti già presenti nel tuo datastore, questi non vengono aggiunti di nuovo. Viene aggiornato qualsiasi documento modificato.
Mantieni aggiornati i dati sugli eventi utente.
È particolarmente importante mantenere aggiornati gli eventi utente. L'app di consigli smette di funzionare se non ci sono eventi utente recenti sufficienti per soddisfare i requisiti dei dati.
Per informazioni sull'importazione dei dati sugli eventi utente in tempo reale, consulta Registrare gli eventi utente in tempo reale.
Per informazioni sul monitoraggio dei requisiti degli eventi utente, vedi Controllare la qualità dei dati per i suggerimenti sui contenuti multimediali.