L'API Video Intelligence può identificare le entità mostrate nei filmati utilizzando la funzionalità LABEL_DETECTION e annotare queste entità con etichette (tag). Questa funzionalità identifica oggetti, luoghi, attività, specie animali, prodotti e altro ancora.
Il rilevamento etichette è diverso dal monitoraggio degli oggetti. A differenza del monitoraggio degli oggetti, il rilevamento delle etichette fornisce etichette per l'intero frame (senza riquadri di delimitazione).
Ad esempio, per un video di un treno a un incrocio, l'API Video Intelligence restituisce etichette come "treno", "trasporto", "passaggio a livello" e così via. Ogni etichetta include un segmento di tempo con l'offset temporale (timestamp) per l'apparizione dell'entità dall'inizio del video. Ogni annotazione contiene anche informazioni aggiuntive, tra cui un ID entità che puoi utilizzare per trovare maggiori informazioni sull'entità nell'API Google Knowledge Graph Search.
Ogni entità restituita può includere anche le entità di categoria associate nel campo categoryEntities
. Ad esempio, l'etichetta dell'entità
"Terrier" ha una categoria "Cane". Le entità di categoria hanno una
gerarchia. Ad esempio, la categoria "Cane" è una categoria secondaria della categoria "Mammifero"
nella gerarchia. Per un elenco delle entità di categoria comuni utilizzate da
Video Intelligence, consulta
entry-level-categories.json.
L'analisi può essere suddivisa come segue:
- Livello segmento:
i segmenti di un video selezionati dall'utente possono essere specificati per l'analisi indicando i timestamp di inizio e fine ai fini dell'annotazione (vedi VideoSegment). Le entità vengono quindi identificate ed etichettate all'interno di ogni segmento. Se non vengono specificati segmenti, l'intero video viene trattato come un unico segmento. - Livello di inquadratura:
le inquadrature (note anche come scene) vengono rilevate automaticamente all'interno di ogni segmento (o video). Le entità vengono quindi identificate ed etichettate all'interno di ogni scena. Per maggiori dettagli, vedi Rilevamento dei cambi di inquadratura. - A livello di frame: le entità
vengono identificate ed etichettate all'interno di ogni frame (con un campionamento di un frame al secondo).
Per rilevare le etichette in un video, chiama il metodo
annotate
e specifica
LABEL_DETECTION
nel campo features
.
Consulta Analisi dei video per le etichette e Tutorial sul rilevamento delle etichette.
Visualizzatore dell'API Video Intelligence
Dai un'occhiata al visualizzatore dell'API Video Intelligence per vedere questa funzionalità in azione.