A API Video Intelligence transcreve a voz em texto a partir de ficheiros de vídeo suportados. Existem dois modelos suportados: "default" e "video".
Peça a transcrição de voz de um vídeo
REST
Envie o pedido de processamento
O exemplo seguinte mostra como enviar um pedido POST para o método videos:annotate.
O exemplo usa o token de acesso para uma conta de serviço configurada para o projeto
com a CLI do Google Cloud. Para ver instruções sobre como instalar a Google Cloud CLI, configurar um projeto com uma conta de serviço e obter um token de acesso, consulte o início rápido do Video Intelligence.
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- INPUT_URI: um contentor do Cloud Storage que contém o ficheiro que quer anotar, incluindo o nome do ficheiro. Tem de
começar com
gs://.
Por exemplo:"inputUri": "gs://cloud-videointelligence-demo/assistant.mp4", - LANGUAGE_CODE: [Opcional] Consulte os idiomas suportados
- PROJECT_NUMBER: o identificador numérico do seu Google Cloud projeto
Método HTTP e URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
Corpo JSON do pedido:
{
"inputUri": "INPUT_URI",
"features": ["SPEECH_TRANSCRIPTION"],
"videoContext": {
"speechTranscriptionConfig": {
"languageCode": "LANGUAGE_CODE",
"enableAutomaticPunctuation": true,
"filterProfanity": true
}
}
}
Para enviar o seu pedido, expanda uma destas opções:
Deve receber uma resposta JSON semelhante à seguinte:
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID"
}
Se o pedido for bem-sucedido, o Video Intelligence devolve o name para a sua operação. O exemplo acima mostra uma resposta deste tipo, em que project-number é o número do seu projeto e operation-id é o ID da operação de longa duração criada para o pedido.
Obtenha os resultados
Para receber os resultados do seu pedido, tem de enviar um GET, usando o nome da operação devolvido da chamada para videos:annotate, conforme mostrado no exemplo seguinte.
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- OPERATION_NAME: o nome da operação, conforme
devolvido pela API Video Intelligence. O nome da operação tem o formato
projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID - PROJECT_NUMBER: o identificador numérico do seu Google Cloud projeto
Método HTTP e URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Para enviar o seu pedido, expanda uma destas opções:
Deve receber uma resposta JSON semelhante à seguinte:
Transfira os resultados das anotações
Copie a anotação da origem para o contentor de destino: (consulte o artigo Copie ficheiros e objetos)
gcloud storage cp gcs_uri gs://my-bucket
Nota: se o URI do GCS de saída for fornecido pelo utilizador, a anotação é armazenada nesse URI do GCS.
Go
Para se autenticar no Video Intelligence, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Java
Para se autenticar no Video Intelligence, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Para se autenticar no Video Intelligence, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para se autenticar no Video Intelligence, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Idiomas adicionais
C#: Siga as instruções de configuração do C# na página das bibliotecas cliente e, em seguida, visite a documentação de referência da Video Intelligence API para .NET.
PHP: Siga as instruções de configuração do PHP na página das bibliotecas cliente e, em seguida, visite a documentação de referência da Video Intelligence API para PHP.
Ruby: Siga as instruções de configuração do Ruby na página das bibliotecas cliente e, em seguida, visite a documentação de referência da Video Intelligence API para Ruby.