Vision API dapat menyediakan anotasi online (langsung) untuk beberapa halaman atau frame dari file PDF, TIFF, atau GIF yang disimpan di Cloud Storage.
Anda dapat meminta deteksi fitur online dan anotasi sebanyak 5 frame (GIF; "gambar/gif") atau halaman (PDF; "aplikasi/pdf", atau TIFF; "gambar/tiff") yang Anda pilih pada setiap file.
Contoh anotasi pada halaman ini adalah untuk DOCUMENT_TEXT_DETECTION
, tetapi
anotasi batch kecil online tersedia untuk semua
fitur Vision.

Batasan
Maksimal 5 halaman yang akan dianotasi. Pengguna dapat menentukan 5 halaman tertentu yang akan dianotasi.
Autentikasi
Menyiapkan Google Cloud project dan autentikasi
Jenis fitur yang didukung saat ini
Jenis fitur | |
---|---|
CROP_HINTS |
Menetapkan verteks yang disarankan untuk area crop pada gambar |
DOCUMENT_TEXT_DETECTION |
Menjalankan OCR pada gambar teks padat, seperti dokumen (PDF/TIFF), dan gambar dengan tulisan tangan.
TEXT_DETECTION dapat digunakan untuk gambar teks yang renggang.
Lebih diutamakan jika ada DOCUMENT_TEXT_DETECTION dan
TEXT_DETECTION .
|
FACE_DETECTION |
Mendeteksi wajah dalam gambar. |
IMAGE_PROPERTIES |
Menghitung kumpulan properti gambar, seperti warna dominan di gambar. |
LABEL_DETECTION |
Menambahkan label berdasarkan konten gambar. |
LANDMARK_DETECTION |
Mendeteksi landmark geografis dalam gambar. |
LOGO_DETECTION |
Mendeteksi logo perusahaan dalam gambar. |
OBJECT_LOCALIZATION |
Mendeteksi dan mengekstrak beberapa objek dalam gambar. |
SAFE_SEARCH_DETECTION |
Menjalankan SafeSearch untuk mendeteksi konten yang berpotensi tidak aman atau tidak diinginkan. |
TEXT_DETECTION |
Menjalankan Pengenalan Karakter Optik (OCR) pada teks dalam gambar.
Deteksi teks dioptimalkan untuk area teks renggang dalam gambar yang lebih besar.
Jika gambar adalah dokumen (PDF/TIFF), memiliki teks padat, atau berisi tulisan tangan, gunakan DOCUMENT_TEXT_DETECTION sebagai gantinya.
|
WEB_DETECTION |
Mendeteksi entitas topik tertentu seperti berita, peristiwa, atau selebritas dalam gambar, serta menemukan gambar serupa di web menggunakan kecanggihan Penelusuran Gambar Google. |
Kode sampel
Anda dapat mengirim permintaan anotasi dengan file yang disimpan secara lokal, atau menggunakan file yang disimpan di Cloud Storage.
Menggunakan file yang disimpan secara lokal
Gunakan contoh kode berikut untuk mendapatkan fitur anotasi untuk file yang disimpan secara lokal.
REST
Untuk melakukan deteksi fitur PDF/TIFF/GIF online untuk file batch kecil, buat permintaan POST dan berikan isi permintaan yang sesuai:
Sebelum menggunakan salah satu data permintaan, buat pengganti berikut:
- BASE64_ENCODED_FILE: Representasi base64
(ASCII string) data file biner Anda. String ini akan terlihat seperti
string berikut:
JVBERi0xLjUNCiW1tbW1...ydHhyZWYNCjk5NzM2OQ0KJSVFT0Y=
- PROJECT_ID: Google Cloud Project ID Anda.
Pertimbangan khusus kolom:
inputConfig.mimeType
- Salah satu dari berikut ini: "aplikasi/pdf", "gambar/tiff", atau "gambar/gif".pages
- menentukan halaman tertentu dari file untuk melakukan deteksi fitur.
Metode HTTP dan URL:
POST https://vision.googleapis.com/v1/files:annotate
Isi JSON permintaan:
{ "requests": [ { "inputConfig": { "content": "BASE64_ENCODED_FILE", "mimeType": "application/pdf" }, "features": [ { "type": "DOCUMENT_TEXT_DETECTION" } ], "pages": [ 1,2,3,4,5 ] } ] }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "x-goog-user-project: PROJECT_ID" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://vision.googleapis.com/v1/files:annotate"
PowerShell
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://vision.googleapis.com/v1/files:annotate" | Select-Object -Expand Content
Permintaan annotate
yang berhasil akan segera menampilkan respons JSON.
Untuk fitur ini (DOCUMENT_TEXT_DETECTION
), respons JSON mirip dengan
permintaan deteksi teks dokumengambar. Responsnya
berisi kotak pembatas untuk blok yang dipecah menurut paragraf, kata, dan simbol
individual. Teks lengkap juga terdeteksi. Responsnya juga berisi kolom context
yang menunjukkan lokasi PDF atau TIFF yang ditentukan dan nomor halaman hasil pada
file tersebut.
JSON respons berikut hanya untuk satu halaman (halaman 2) dan telah dipersingkat agar lebih jelas.
Java
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Java di Panduan Memulai Vision API Menggunakan Library Klien. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Java Vision API.
Node.js
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Node.js di Panduan memulai Vision menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Vision Node.js API.
Untuk melakukan autentikasi ke Vision, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Python di Panduan memulai Vision menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Vision Python API.
Untuk melakukan autentikasi ke Vision, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Gunakan file di Cloud Storage
Gunakan contoh kode berikut untuk mendapatkan anotasi fitur untuk sebuah file di Cloud Storage.
REST
Untuk melakukan deteksi fitur PDF/TIFF/GIF online untuk file batch
kecil, membuat permintaan POST
dan berikan isi permintaan yang sesuai:
Sebelum menggunakan salah satu data permintaan, buat pengganti berikut:
- CLOUD_STORAGE_FILE_URI: jalur ke file
yang valid (PDF/TIFF) di bucket Cloud Storage. Anda setidaknya harus memiliki hak istimewa baca ke
file tersebut.
Contoh:
gs://cloud-samples-data/vision/document_understanding/custom_0773375000.pdf
- PROJECT_ID: Google Cloud Project ID Anda.
Pertimbangan khusus kolom:
inputConfig.mimeType
- Salah satu dari berikut ini: "aplikasi/pdf", "gambar/tiff", atau "gambar/gif".pages
- menentukan halaman tertentu dari file untuk melakukan deteksi fitur.
Metode HTTP dan URL:
POST https://vision.googleapis.com/v1/files:annotate
Isi JSON permintaan:
{ "requests": [ { "inputConfig": { "gcsSource": { "uri": "CLOUD_STORAGE_FILE_URI" }, "mimeType": "application/pdf" }, "features": [ { "type": "DOCUMENT_TEXT_DETECTION" } ], "pages": [ 1,2,3,4,5 ] } ] }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "x-goog-user-project: PROJECT_ID" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://vision.googleapis.com/v1/files:annotate"
PowerShell
Simpan isi permintaan dalam file bernama request.json
,
dan jalankan perintah berikut:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://vision.googleapis.com/v1/files:annotate" | Select-Object -Expand Content
Permintaan annotate
yang berhasil akan segera menampilkan respons JSON.
Untuk fitur ini (DOCUMENT_TEXT_DETECTION
), respons JSON mirip dengan
permintaan deteksi teks dokumengambar. Responsnya
berisi kotak pembatas untuk blok yang dipecah menurut paragraf, kata, dan simbol
individual. Teks lengkap juga terdeteksi. Responsnya juga berisi kolom context
yang menunjukkan lokasi PDF atau TIFF yang ditentukan dan nomor halaman hasil pada
file tersebut.
JSON respons berikut hanya untuk satu halaman (halaman 2) dan telah dipersingkat agar lebih jelas.
Java
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Java di Panduan Memulai Vision API Menggunakan Library Klien. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Java Vision API.
Node.js
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Node.js di Panduan memulai Vision menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Vision Node.js API.
Untuk melakukan autentikasi ke Vision, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Python di Panduan memulai Vision menggunakan library klien. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi Vision Python API.
Untuk melakukan autentikasi ke Vision, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Cobalah
Coba deteksi fitur online batch kecil di bawah ini.
Anda dapat menggunakan file PDF yang sudah ditentukan atau menentukan file Anda sendiri sebagai penggantinya.

Terdapat tiga jenis fitur yang ditetapkan untuk permintaan ini:
DOCUMENT_TEXT_DETECTION
LABEL_DETECTION
CROP_HINTS
Anda dapat menambahkan atau menghapus jenis fitur lainnya dengan mengubah objek yang sesuai dalam permintaan ({"type": "FEATURE_NAME"}
).
Kirim permintaan dengan memilih Jalankan.
Isi permintaan:
{ "requests": [ { "inputConfig": { "gcsSource": { "uri": "gs://cloud-samples-data/vision/document_understanding/custom_0773375000.pdf" }, "mimeType": "application/pdf" }, "features": [ { "type": "DOCUMENT_TEXT_DETECTION" }, { "type": "LABEL_DETECTION" }, { "type": "CROP_HINTS" } ], "pages": [ 1, 2, 3, 4, 5 ] } ] }