Tutorial deteksi pergantian shot

Audiens

Tutorial ini dirancang untuk memungkinkan Anda secara cepat mulai menjelajahi dan mengembangkan aplikasi dengan Video Intelligence API. Dirancang untuk orang yang sudah memahami pemrograman dasar, meskipun tanpa banyak pengetahuan pemrograman, Anda akan dapat mengikutinya. Setelah mempelajari tutorial ini, Anda akan dapat menggunakan Dokumentasi referensi untuk membuat aplikasi dasar Anda sendiri.

Tutorial ini menjelaskan tentang aplikasi Video Intelligence API menggunakan kode Python. Tujuannya di sini bukan untuk menjelaskan library klien Python, tetapi untuk menjelaskan cara melakukan panggilan ke Video Intelligence API. Aplikasi di Java dan Node.js pada dasarnya serupa.

Jika Anda mencari contoh khusus kode atau contoh dalam bahasa lain, lihat panduan cara penggunaan pendamping.

Prasyarat

Tutorial ini memiliki beberapa prasyarat:

Membuat anotasi video menggunakan deteksi pergantian shot

Tutorial ini akan memandu Anda membuat aplikasi Video API dasar, menggunakan permintaan SHOT_CHANGE_DETECTION. Permintaan SHOT_CHANGE_DETECTION memberikan hasil anotasi:

  • Daftar semua pengambilan gambar yang terjadi dalam video
  • Untuk setiap bidikan, berikan waktu mulai dan berakhir bidikan

Kita akan menampilkan seluruh kode terlebih dahulu. (Perhatikan bahwa kami telah menghapus sebagian besar komentar dari kode ini untuk menunjukkan betapa singkatnya kode tersebut. Kami akan memberikan lebih banyak komentar saat membahas kode ini.)

import argparse

from google.cloud import videointelligence



def analyze_shots(path):
    """Detects camera shot changes."""
    video_client = videointelligence.VideoIntelligenceServiceClient()
    features = [videointelligence.Feature.SHOT_CHANGE_DETECTION]
    operation = video_client.annotate_video(
        request={"features": features, "input_uri": path}
    )
    print("\nProcessing video for shot change annotations:")

    result = operation.result(timeout=120)
    print("\nFinished processing.")


    for i, shot in enumerate(result.annotation_results[0].shot_annotations):
        start_time = (
            shot.start_time_offset.seconds + shot.start_time_offset.microseconds / 1e6
        )
        end_time = (
            shot.end_time_offset.seconds + shot.end_time_offset.microseconds / 1e6
        )
        print("\tShot {}: {} to {}".format(i, start_time, end_time))


if __name__ == "__main__":
    parser = argparse.ArgumentParser(
        description=__doc__, formatter_class=argparse.RawDescriptionHelpFormatter
    )
    parser.add_argument("path", help="GCS path for shot change detection.")
    args = parser.parse_args()

    analyze_shots(args.path)

Aplikasi sederhana ini melakukan tugas-tugas berikut:

  • Mengimpor library yang diperlukan untuk menjalankan aplikasi.
  • Mengambil file video yang disimpan di URI Cloud Storage sebagai argumen dan meneruskannya ke fungsi main().
  • Mendapatkan kredensial untuk menjalankan layanan Video Intelligence API.
  • Membuat permintaan anotasi video untuk dikirim ke layanan video.
  • Mengirim permintaan dan menampilkan operasi yang berjalan lama.
  • Melakukan loop pada operasi yang berjalan lama hingga video diproses dan menampilkan nilai yang tersedia.
  • Mengurai respons untuk layanan dan menampilkan respons kepada pengguna.

Kita akan membahas langkah-langkah ini secara lebih mendetail di bawah.

Mengimpor library

import argparse

from google.cloud import videointelligence

Kita mengimpor argparse untuk mengizinkan aplikasi menerima nama file input sebagai argumen.

Untuk menggunakan Video Intelligence API, kita juga mengimpor library google.cloud.videointelligence, yang menyimpan direktori panggilan API dan konstanta enumerasi.

Jalankan aplikasi Anda

parser = argparse.ArgumentParser(
    description=__doc__, formatter_class=argparse.RawDescriptionHelpFormatter
)
parser.add_argument("path", help="GCS path for shot change detection.")
args = parser.parse_args()

analyze_shots(args.path)

Di sini, kita mengurai argumen yang diteruskan untuk URI Google Cloud Storage dari nama file video dan meneruskannya ke fungsi main().

Melakukan autentikasi ke API

Sebelum berkomunikasi dengan layanan Video Intelligence API, Anda harus mengautentikasi layanan Anda menggunakan kredensial yang diperoleh sebelumnya. Dalam aplikasi, cara termudah untuk mendapatkan kredensial adalah dengan menggunakan Kredensial Default Aplikasi (ADC). Secara default, ADC akan mencoba mendapatkan kredensial dari file lingkungan GOOGLE_APPLICATION_CREDENTIALS, yang harus ditetapkan agar mengarah ke file kunci JSON akun layanan Anda. (Anda seharusnya telah menyiapkan akun layanan dan lingkungan untuk menggunakan ADC di Panduan memulai.) Lihat Menyiapkan Akun Layanan untuk mengetahui informasi selengkapnya.)

Buat permintaan

video_client = videointelligence.VideoIntelligenceServiceClient()
features = [videointelligence.Feature.SHOT_CHANGE_DETECTION]
operation = video_client.annotate_video(
    request={"features": features, "input_uri": path}
)

Sekarang setelah layanan Video Intelligence API kami siap, kami dapat membuat permintaan ke layanan tersebut. Permintaan ke Video Intelligence API diberikan sebagai objek JSON. Lihat Referensi Video Intelligence API untuk mengetahui informasi lengkap tentang struktur spesifik permintaan tersebut.

Cuplikan kode ini melakukan tugas-tugas berikut:

  1. Membuat JSON untuk permintaan POST ke metode annotate_video().
  2. Menyisipkan lokasi Google Cloud Storage dari nama file video yang diteruskan ke dalam permintaan.
  3. Menunjukkan bahwa metode annotate harus melakukan SHOT_CHANGE_DETECTION.

Buat operasi yang berjalan lama

Saat pertama kali menjalankan permintaan terhadap Video Intelligence API, kita tidak mendapatkan hasil langsung; melainkan mendapatkan nama operasi, yang disimpan dalam kolom name respons, yang kemudian dapat kita gunakan untuk memeriksa hasil di lain waktu.

Meneruskan nama operasi tersebut (yang merupakan string numerik) ke metode operations Operations Service Video Intelligence API akan menampilkan status operasi saat ini. Contoh respons ditampilkan di bawah:

{
   "response":{
      "@type":"type.googleapis.com/google.cloud.videointelligence.v1.AnnotateVideoResponse"
   },
   "name":"us-west1.17159971042783089144",
   "metadata":{
      "annotationProgress":[
         {
            "inputUri":"/video/gbikes_dinosaur.mp4",
            "updateTime":"2017-01-27T19:45:54.297807Z",
            "startTime":"2017-01-27T19:45:54.275023Z"
         }
      ],
      "@type":"type.googleapis.com/google.cloud.videointelligence.v1.AnnotateVideoProgress"
   }
}

Perhatikan bahwa kolom response saat ini hanya berisi kolom @type, yang menunjukkan jenis respons tersebut. Setelah hasil benar-benar tersedia, kolom respons akan berisi hasil jenis tersebut.

Memeriksa operasi

result = operation.result(timeout=120)
print("\nFinished processing.")

Dengan menggunakan permintaan operasi yang ada untuk operasi yang ada, kita membuat loop while untuk memeriksa status operasi tersebut secara berkala. Setelah operasi kita menunjukkan bahwa operasi tersebut done, kita keluar dari loop dan dapat mem-parsing respons.

Mengurai respons

for i, shot in enumerate(result.annotation_results[0].shot_annotations):
    start_time = (
        shot.start_time_offset.seconds + shot.start_time_offset.microseconds / 1e6
    )
    end_time = (
        shot.end_time_offset.seconds + shot.end_time_offset.microseconds / 1e6
    )
    print("\tShot {}: {} to {}".format(i, start_time, end_time))

Setelah operasi selesai, respons akan berisi AnnotateVideoResponse, yang terdiri dari daftar annotationResults, satu untuk setiap video yang dikirim dalam permintaan. Karena hanya mengirim satu video dalam permintaan, kita akan mengambil shotAnnotations pertama dari hasilnya. Kita akan membahas semua 'segmen' untuk video tersebut.

Menjalankan aplikasi kita

Untuk menjalankan aplikasi kita, cukup teruskan Cloud Storage URI video:

$ python shotchange.py gs://cloud-samples-data/video/gbikes_dinosaur.mp4
operationId=us-west1.12468772851081463748
Operation us-west1.12468772851081463748 started: 2017-01-30T01:53:45.981043Z
Processing video for shot change annotations:
Finished processing.
  Shot 0: 0.0 to 5.166666
  Shot 1: 5.233333 to 10.066666
  Shot 2: 10.1 to 28.133333
  Shot 3: 28.166666 to 42.766666

Selamat! Anda telah melakukan tugas anotasi menggunakan Video Intelligence API.