Crea un datastore multimediale

Questa pagina spiega come creare un datastore per i contenuti multimediali e importare i dati.

Prima di iniziare

Assicurati di svolgere le seguenti operazioni:

Scegli la procedura in base all'origine dati

Per creare un datastore di contenuti multimediali e importare documenti, vai alla sezione relativa all'origine che intendi utilizzare:

Importa da BigQuery

Console

Per utilizzare la console Google Cloud per creare un datastore multimediale e importare documenti ed eventi utente da BigQuery:

  1. Nella Google Cloud console, vai alla pagina AI Applications.

    Applicazioni di AI

  2. Vai alla pagina Datastore.

  3. Fai clic su Crea datastore.

  4. Nella pagina Origine, seleziona BigQuery.

  5. Seleziona Multimediali - tabella BigQuery con dati multimediali strutturati come tipo di dati che stai importando.

  6. Nel campo Percorso BigQuery, fai clic su Sfoglia, seleziona i dati BigQuery che hai preparato per l'importazione e poi fai clic su Seleziona. In alternativa, inserisci la posizione direttamente nel campo Percorso BigQuery.

  7. Se i tuoi dati sono nello schema Google predefinito, scegli Schema Google predefinito, fai clic su Continua e vai al passaggio 11.

  8. Se i tuoi dati si trovano nel tuo schema, scegli Schema personalizzato e fai clic su Continua.

  9. Controlla lo schema rilevato e utilizza il menu Proprietà chiave per assegnare le proprietà ai campi dello schema.

  10. Fai clic su Continua.

    Non puoi continuare finché le proprietà chiave richieste non vengono mappate, indicate da segni di spunta verdi anziché da segni di avviso arancioni .

  11. Inserisci un nome per il datastore e fai clic su Crea.

Importa da Cloud Storage

Console

Per utilizzare la console Google Cloud per creare un datastore di contenuti multimediali e importare documenti da Cloud Storage:

  1. Nella Google Cloud console, vai alla pagina AI Applications.

    Applicazioni di AI

  2. Vai alla pagina Datastore.

  3. Fai clic su Crea datastore.

  4. Nella pagina Origine, seleziona Cloud Storage.

  5. Seleziona Dati multimediali strutturati (JSONL contenente file multimediali) come tipo di dati da importare.

  6. Nella sezione Seleziona una cartella o un file da importare, seleziona Cartella o File.

  7. Fai clic su Sfoglia e scegli i dati che hai preparato per l'importazione, poi fai clic su Seleziona. In alternativa, inserisci la posizione direttamente nel campo gs://.

  8. Se i tuoi dati sono nello schema Google predefinito, scegli Schema Google predefinito, fai clic su Continua e vai al passaggio 11.

  9. Se i tuoi dati si trovano nel tuo schema, scegli Schema personalizzato e fai clic su Continua.

  10. Controlla lo schema rilevato e utilizza il menu Proprietà chiave per assegnare le proprietà ai campi dello schema.

  11. Fai clic su Continua.

    Non puoi continuare finché le proprietà chiave richieste non vengono mappate, indicate da segni di spunta verdi anziché da segni di avviso arancioni .

  12. Inserisci un nome per il datastore e fai clic su Crea.

Importare documenti utilizzando l'API

Se utilizzi lo schema predefinito di Google, puoi importare i documenti effettuando una richiesta POST al metodo REST Documents:import, utilizzando l'oggetto InlineSource per specificare i dati.

Per un esempio di formato del documento JSON, consulta Formato del documento JSON.

Requisiti di importazione

Di seguito sono riportati i requisiti per l'importazione di documenti multimediali utilizzando l'API:

  • Ogni documento deve essere su una riga separata.

  • Il numero massimo di documenti in una singola importazione è 100.

Procedura

Per importare documenti multimediali utilizzando l'API:

  1. Crea un datastore.

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
    -d '{
      "displayName": "DATA_STORE_DISPLAY_NAME",
      "industryVertical": "MEDIA"
    }'
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del tuo Google Cloud progetto.
    • DATA_STORE_ID: l'ID del datastore Vertex AI Search che vuoi creare. Questo ID può contenere solo lettere minuscole, cifre, trattini bassi e trattini.
    • DATA_STORE_DISPLAY_NAME: il nome visualizzato del datastore Vertex AI Search che vuoi creare.
  2. Crea il file JSON per il documento e chiamalo ./data.json:

    {
    "inlineSource": {
    "documents": [
      { DOCUMENT_1 },
      { DOCUMENT_2 }
    ]
    }
    }
    
  3. Chiama il metodo POST:

    curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     --data @./data.json \
    "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/branches/0/documents:import"

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto.
    • DATA_STORE_ID: l'ID del tuo datastore.

Formato del documento JSON

Gli esempi seguenti mostrano le voci Document in formato JSON.

Fornisci un intero documento su una sola riga. Ogni documento deve essere su una riga separata.

Campi minimi obbligatori:

{
   "id": "sample-01",
   "schemaId": "default_schema",
   "jsonData": "{\"title\":\"Test document title\",\"categories\":[\"sports > clip\",\"sports > highlight\"],\"uri\":\"http://www.example.com\",\"media_type\":\"sports-game\",\"available_time\":\"2022-08-26T23:00:17Z\"}"
}

Oggetto completo:

{
   "id": "child-sample-0",
   "schemaId": "default_schema",
   "jsonData": "{\"title\":\"Test document title\",\"description\":\"Test document description\",\"language_code\":\"en-US\",\"categories\":[\"sports > clip\",\"sports > highlight\"],\"uri\":\"http://www.example.com\",\"images\":[{\"uri\":\"http://example.com/img1\",\"name\":\"image_1\"}],\"media_type\":\"sports-game\",\"in_languages\":[\"en-US\"],\"country_of_origin\":\"US\",\"content_index\":0,\"persons\":[{\"name\":\"sports person\",\"role\":\"player\",\"rank\":0,\"uri\":\"http://example.com/person\"},],\"organizations \":[{\"name\":\"sports team\",\"role\":\"team\",\"rank\":0,\"uri\":\"http://example.com/team\"},],\"hash_tags\":[\"tag1\"],\"filter_tags\":[\"filter_tag\"],\"production_year\":1900,\"duration\":\"100s\",\"content_rating\":[\"PG-13\"],\"aggregate_ratings\":[{\"rating_source\":\"imdb\",\"rating_score\":4.5,\"rating_count\":1250}],\"available_time\":\"2022-08-26T23:00:17Z\"}"
}

Monitorare l'importazione e visualizzare i dati

  1. Per controllare lo stato dell'importazione, vai alla pagina Datastore e fai clic sul nome del datastore per visualizzarne i dettagli nella pagina Dati.

  2. Fai clic sulla scheda Attività.

    Quando la colonna Stato nella scheda Attività passa da In corso a Importazione completata, l'importazione è terminata.

    A seconda delle dimensioni dei dati, l'importazione può richiedere diversi minuti o diverse ore.

  3. Fai clic su Documenti per visualizzare i dati importati.

Importa gli eventi utente

Per importare eventi utente nel datastore multimediale:

Passaggi successivi