Rilevamento del testo esegue il riconoscimento ottico dei caratteri (OCR), che rileva ed estrae il testo all'interno di un video di input.
Il rilevamento del testo è disponibile per tutte le lingue supportate dall'API Cloud Vision.
Richiedere il rilevamento del testo per un video su Cloud Storage
Gli esempi riportati di seguito mostrano il rilevamento del testo in un file che si trova in Cloud Storage.
REST
Inviare una richiesta di annotazione video
Di seguito è riportato un esempio di come inviare una richiesta POST al metodo videos:annotate
. L'esempio utilizza Google Cloud CLI per creare un token di accesso. Per
istruzioni sull'installazione di gcloud CLI, consulta la
Guida rapida dell'API Video Intelligence.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- INPUT_URI: un bucket Cloud Storage contenente il file che vuoi annotare, incluso il nome del file. Deve
iniziare con
gs://
.
Ad esempio:"inputUri": "gs://cloud-videointelligence-demo/assistant.mp4",
- LANGUAGE_CODE: [facoltativo] ad esempio "en-US"
- PROJECT_NUMBER: L'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Corpo JSON della richiesta:
{ "inputUri": "INPUT_URI", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Se la risposta ha esito positivo, l'API Video Intelligence restituisce name
per l'operazione. Quanto sopra mostra un esempio di risposta, in cui:
project-number
è il numero del tuo progetto e operation-id
è l'ID dell'operazione di lunga durata creata per la richiesta.
- PROJECT_NUMBER: il numero del progetto
- LOCATION_ID: la regione Cloud in cui deve avvenire l'annotazione. Le regioni cloud supportate sono:
us-east1
,us-west1
,europe-west1
,asia-east1
. Se non viene specificata alcuna regione, ne verrà determinata una in base alla posizione del file video. - OPERATION_ID: l'ID dell'operazione a lunga esecuzione creata
per la richiesta e fornito nella risposta all'avvio dell'operazione, ad esempio
12345...
Recupero risultati annotazione
Per recuperare il risultato dell'operazione, invia una richiesta GET, utilizzando il nome dell'operazione restituito dalla chiamata a videos:annotate, come mostrato nell'esempio seguente.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- OPERATION_NAME: il nome dell'operazione restituito dall'API Video Intelligence. Il nome dell'operazione ha il formato
projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID
- PROJECT_NUMBER: L'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Le annotazioni di rilevamento del testo vengono restituite come elencotextAnnotations
.
Nota: il campo done viene restituito solo quando il suo valore è True.
Non è incluso nelle risposte per cui l'operazione non è stata completata.
Scaricare i risultati delle annotazioni
Copia l'annotazione dalla sorgente al bucket di destinazione: (vedi Copiare file e oggetti)
gcloud storage cp gcs_uri gs://my-bucket
Nota: se l'URI GCS di output viene fornito dall'utente, l'annotazione viene archiviata in questo URI GCS.
Go
Java
Per eseguire l'autenticazione in Video Intelligence, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per eseguire l'autenticazione in Video Intelligence, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per eseguire l'autenticazione in Video Intelligence, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: Segui le istruzioni di configurazione di C# nella pagina delle librerie client e poi visita la documentazione di riferimento di Video Intelligence per .NET.
PHP: Segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi visita la documentazione di riferimento di Video Intelligence per PHP.
Ruby: Segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi visita la documentazione di riferimento di Video Intelligence per Ruby.
Richiedere il rilevamento del testo per il video da un file locale
Gli esempi riportati di seguito mostrano il rilevamento del testo in un file archiviato localmente.
REST
Inviare una richiesta di annotazione video
Per eseguire l'annotazione su un file video locale, assicurati di codificare in base64
i contenuti del file video.
Includi i contenuti codificati in base64 nel campo inputContent
della richiesta.
Per informazioni su come
codificare in Base64 i contenuti di un file video, consulta la sezione Codifica Base64.
Di seguito è riportato un esempio di come inviare una richiesta POST al metodo videos:annotate
.
L'esempio utilizza Google Cloud CLI per creare un token di accesso.
Per istruzioni sull'installazione di Google Cloud CLI, consulta la
guida rapida dell'API Video Intelligence.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- "inputContent": BASE64_ENCODED_CONTENT
Ad esempio:
"UklGRg41AwBBVkkgTElTVAwBAABoZHJsYXZpaDgAAAA1ggAAxPMBAAAAAAAQCAA..."
- LANGUAGE_CODE: [facoltativo] ad esempio "en-US"
- PROJECT_NUMBER: L'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Corpo JSON della richiesta:
{ "inputContent": "BASE64_ENCODED_CONTENT", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Se la risposta ha esito positivo, l'API Video Intelligence restituisce il name
dell'operazione. Quanto sopra mostra un esempio di risposta, in cui
project-number
è il nome del tuo progetto e operation-id
è l'ID dell'operazione
a lunga esecuzione creata per la richiesta.
- OPERATION_ID: fornito nella risposta all'avvio dell'operazione, ad esempio
12345...
Recupero risultati annotazione
Per recuperare il risultato dell'operazione, invia una richiesta GET, utilizzando il nome dell'operazione restituito dalla chiamata a videos:annotate, come mostrato nell'esempio seguente.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_NUMBER: L'identificatore numerico del tuo progetto Google Cloud
Metodo HTTP e URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
Le annotazioni di rilevamento del testo vengono restituite come elenco textAnnotations
.
Nota: il campo done viene restituito solo quando il suo valore è True.
Non è incluso nelle risposte per cui l'operazione non è stata completata.
Go
Java
Node.js
Per eseguire l'autenticazione in Video Intelligence, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Linguaggi aggiuntivi
C#: Segui le istruzioni di configurazione di C# nella pagina delle librerie client e poi visita la documentazione di riferimento di Video Intelligence per .NET.
PHP: Segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi visita la documentazione di riferimento di Video Intelligence per PHP.
Ruby: Segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi visita la documentazione di riferimento di Video Intelligence per Ruby.