Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Video Intelligence API dapat mengidentifikasi entitas yang ditampilkan dalam rekaman video
menggunakan fitur LABEL_DETECTION
dan menganotasi entitas ini dengan label (tag). Fitur ini mengidentifikasi
objek, lokasi, aktivitas, spesies hewan, produk, dan lainnya.
Deteksi label berbeda dengan Pelacakan objek.
Tidak seperti pelacakan objek, deteksi label memberikan label untuk seluruh frame
(tanpa kotak pembatas).
Misalnya, untuk video kereta di perlintasan, Video Intelligence API
akan menampilkan label seperti "kereta", "transportasi", "perlintasan kereta api",
dan sebagainya. Setiap label menyertakan segmen waktu dengan selisih waktu (stempel waktu)
untuk kemunculan entitas dari awal video.
Setiap anotasi juga berisi informasi tambahan, termasuk ID entity
yang dapat Anda gunakan untuk menemukan informasi selengkapnya tentang
entity di API Penelusuran Grafik Pengetahuan Google.
Setiap entity yang ditampilkan juga dapat menyertakan entity kategori terkait
di kolom categoryEntities. Misalnya,
label entitas "Terrier" memiliki kategori "Anjing". Entitas kategori memiliki
hierarki. Misalnya, kategori "Anjing" adalah turunan dari kategori "Mamalia"
dalam hierarki. Untuk daftar entitas kategori umum yang digunakan
Video Intelligence, lihat
entry-level-categories.json.
Analisis dapat dibagi menjadi beberapa bagian sebagai berikut:
Tingkat segmen: Segmen video yang dipilih pengguna dapat ditentukan
untuk analisis dengan menetapkan stempel waktu awal dan akhir untuk tujuan
anotasi (lihat VideoSegment).
Entitas kemudian diidentifikasi dan diberi label dalam setiap segmen. Jika tidak ada segmen
yang ditentukan, seluruh video akan diperlakukan sebagai satu segmen.
Tingkat pengambilan gambar: Pengambilan gambar (juga dikenal sebagai adegan) otomatis terdeteksi dalam
setiap segmen (atau video). Entitas kemudian diidentifikasi dan diberi label dalam
setiap scene. Untuk mengetahui detailnya, lihat Deteksi perubahan bidikan
Tingkat frame: Entitas diidentifikasi dan diberi label dalam setiap frame
(dengan sampling satu frame per detik).
Untuk mendeteksi label dalam video, panggil metode annotate dan tentukan LABEL_DETECTION di kolom features.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-08-17 UTC."],[],[],null,["# Analyze videos for labels\n\nThe Video Intelligence API can identify entities shown in video footage\nusing the [LABEL_DETECTION](/video-intelligence/docs/reference/rest/v1/videos/annotate#feature)\nfeature and annotate these entities with labels (tags). This feature identifies\nobjects, locations, activities, animal species, products, and more.\n\nLabel detection differs from [Object tracking](/video-intelligence/docs/object-tracking).\nUnlike object tracking, label detection provides labels for the entire frame\n(without bounding boxes).\n\nFor example, for a video of a train at a crossing, the Video Intelligence API\nreturns labels such as \"train\", \"transportation\", \"railroad crossing\",\nand so on. Each label includes a time segment with the time offset (timestamp)\nfor the entity's appearance from the beginning of the video.\nEach annotation also contains additional information including an entity\nid that you can use to find more information about the\nentity in the [Google Knowledge Graph Search API](https://developers.google.com/knowledge-graph/).\n\nEach entity returned can also include associated\ncategory entities in the `categoryEntities` field. For example the\n\"Terrier\" entity label has a category of \"Dog\". Category entities have a\nhierarchy. For example, the \"Dog\" category is a child of the \"Mammal\"\ncategory in the hierarchy. For a list of the common category entities that the\nVideo Intelligence uses, see\n[entry-level-categories.json](/static/video-intelligence/docs/entry-level-categories.json).\n\nThe analysis can be compartmentalized as follows:\n\n- Segment level: \n User-selected segments of a video can be specified for analysis by stipulating beginning and ending timestamps for the purposes of annotation (see [VideoSegment](/video-intelligence/docs/reference/rest/v1/videos/annotate#videosegment)). Entities are then identified and labeled within each segment. If no segments are specified, the whole video is treated as one segment.\n\n \u003cbr /\u003e\n\n \u003cbr /\u003e\n\n- Shot level: \n Shots (also known as a *scene* ) are automatically detected within every segment (or video). Entities are then identified and labeled within each scene. For details, see [Shot change detection](#shot-change)\n- Frame level: \n Entities are identified and labeled within each frame (with one frame per second sampling).\n\n\u003cbr /\u003e\n\nTo detect labels in a video, call the\n[`annotate`](/video-intelligence/docs/reference/rest/v1/videos/annotate)\nmethod and specify\n[`LABEL_DETECTION`](/video-intelligence/docs/reference/rest/v1/videos#Feature)\nin the `features` field.\n\nSee\n[Analyzing Videos for Labels](/video-intelligence/docs/analyze-labels) and\n[Label Detection Tutorial](/video-intelligence/docs/label-tutorial).\n\nVideo Intelligence API Visualizer\n=================================\n\nCheck out the [Video Intelligence API visualizer](https://zackakil.github.io/video-intelligence-api-visualiser/#Label%20Detection) to see this feature in action."]]