Pelajari cara melakukan pengenalan karakter optik (OCR) di Google Cloud Platform. Tutorial ini menunjukkan cara mengupload file gambar ke Cloud Storage, mengekstrak teks dari gambar menggunakan Cloud Vision, menerjemahkan teks menggunakan Cloud Translation API, lalu menyimpan kembali terjemahan Anda ke Cloud Storage. Pub/Sub digunakan untuk mengantrekan berbagai tugas dan memicu Cloud Functions yang tepat untuk menjalankannya.
Untuk informasi selengkapnya tentang mengirim permintaan deteksi teks (OCR), lihat Mendeteksi teks dalam gambar, Mendeteksi tulisan tangan dalam gambar, atau Mendeteksi teks dalam file (PDF/TIFF).
Tujuan
- Menulis dan men-deploy beberapa fungsi berbasis peristiwa.
- Mengupload gambar ke Cloud Storage.
- Mengekstrak, menerjemahkan, dan menyimpan teks yang ada dalam gambar yang diupload.
Biaya
Dalam dokumen ini, Anda menggunakan komponen Google Cloud yang dapat ditagih berikut:
- Cloud Functions
- Cloud Build
- Pub/Sub
- Artifact Registry
- Eventarc
- Cloud Run
- Cloud Logging
- Cloud Storage
- Cloud Translation API
- Cloud Vision
Untuk membuat perkiraan biaya berdasarkan proyeksi penggunaan Anda,
gunakan kalkulator harga.
Sebelum memulai
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Aktifkan API Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision.
- Menginstal Google Cloud CLI.
-
Untuk initialize gcloud CLI, jalankan perintah berikut:
gcloud init
-
Di konsol Google Cloud, pada halaman pemilih project, pilih atau buat project Google Cloud.
-
Pastikan penagihan telah diaktifkan untuk project Google Cloud Anda.
-
Aktifkan API Cloud Functions, Cloud Build, Cloud Run, Artifact Registry, Eventarc, Logging, Pub/Sub, Cloud Storage, Cloud Translation, and Cloud Vision.
- Menginstal Google Cloud CLI.
-
Untuk initialize gcloud CLI, jalankan perintah berikut:
gcloud init
- Siapkan lingkungan pengembangan Anda.
Jika Anda sudah menginstal gcloud CLI, update dengan menjalankan perintah berikut:
gcloud components update
Memvisualisasikan aliran data
Alur data dalam aplikasi tutorial OCR melibatkan beberapa langkah:
- Gambar yang berisi teks dalam bahasa apa pun akan diupload ke Cloud Storage.
- Cloud Function dipicu, yang menggunakan Vision API untuk mengekstrak teks dan mendeteksi bahasa sumber.
- Teks dimasukkan ke dalam antrean untuk diterjemahkan dengan memublikasikan pesan ke topik Pub/Sub. Terjemahan dimasukkan ke dalam antrean untuk setiap bahasa target yang berbeda dengan bahasa sumber.
- Jika bahasa target cocok dengan bahasa sumber, antrean terjemahan akan dilewati, dan teks akan dikirim ke antrean hasil, yang merupakan topik Pub/Sub yang berbeda.
- Cloud Function menggunakan Translation API untuk menerjemahkan teks dalam antrean terjemahan. Hasil terjemahan dikirim ke antrean hasil.
- Cloud Function lainnya menyimpan teks terjemahan dari antrean hasil ke Cloud Storage.
- Hasilnya ditemukan di Cloud Storage sebagai file teks untuk setiap terjemahan.
Anda dapat memvisualisasikan langkah-langkahnya:
Menyiapkan aplikasi
Buat bucket Cloud Storage untuk mengupload gambar, dengan
YOUR_IMAGE_BUCKET_NAME
sebagai nama bucket yang unik secara global:gsutil mb gs://
YOUR_IMAGE_BUCKET_NAME
Buat bucket Cloud Storage untuk menyimpan terjemahan teks, dengan
YOUR_RESULT_BUCKET_NAME
sebagai nama bucket yang unik secara global:gsutil mb gs://
YOUR_RESULT_BUCKET_NAME
Buat topik Cloud Pub/Sub untuk menjadi tujuan publikasi permintaan terjemahan, dengan
YOUR_TRANSLATE_TOPIC_NAME
sebagai nama topik permintaan terjemahan Anda:gcloud pubsub topics create
YOUR_TRANSLATE_TOPIC_NAME
Buat topik Cloud Pub/Sub untuk menjadi tujuan publikasi hasil terjemahan yang sudah selesai, dengan
YOUR_RESULT_TOPIC_NAME
sebagai nama topik hasil terjemahan Anda:gcloud pubsub topics create
YOUR_RESULT_TOPIC_NAME
Clone repositori aplikasi contoh ke komputer lokal Anda:
Node.js
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git
Atau, Anda dapat mendownload sampel sebagai file ZIP dan mengekstraknya.
Python
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
Atau, Anda dapat mendownload sampel sebagai file ZIP dan mengekstraknya.
Go
git clone https://github.com/GoogleCloudPlatform/golang-samples.git
Atau, Anda dapat mendownload sampel sebagai file ZIP dan mengekstraknya.
Java
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
Atau, Anda dapat mendownload sampel sebagai file ZIP dan mengekstraknya.
Ubah ke direktori yang memuat kode contoh Cloud Functions:
Node.js
cd nodejs-docs-samples/functions/v2/ocr/app/
Python
cd python-docs-samples/functions/v2/ocr/
Go
cd golang-samples/functions/functionsv2/ocr/app/
Java
cd java-docs-samples/functions/v2/ocr/ocr-process-image/
Memahami kode
Bagian ini menjelaskan dependensi dan fungsi yang membentuk sampel OCR.
Mengimpor dependensi
Aplikasi harus mengimpor beberapa dependensi untuk berkomunikasi dengan layanan Google Cloud Platform:
Node.js
Python
Go
Java
Memproses gambar
Fungsi berikut membaca file gambar yang diupload dari Cloud Storage dan memanggil fungsi untuk mendeteksi apakah gambar berisi teks:
Node.js
Python
Go
Java
Fungsi berikut mengekstrak teks dari gambar menggunakan Cloud Vision API dan mengantrekan teks tersebut untuk diterjemahkan:
Node.js
Python
Go
Java
Menerjemahkan teks
Fungsi berikut menerjemahkan teks yang diekstrak dan mengantrekan teks terjemahan untuk disimpan kembali ke Cloud Storage:
Node.js
Python
Go
Java
Simpan terjemahan
Terakhir, fungsi berikut menerima teks terjemahan dan menyimpannya kembali ke Cloud Storage:
Node.js
Python
Go
Java
Men-deploy fungsi-fungsinya
Untuk men-deploy fungsi pemrosesan image dengan pemicu Cloud Storage, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=processImage \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=process_image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=process-image \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-extract \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrProcessImage \ --memory=512MB \
--trigger-bucket YOUR_IMAGE_BUCKET_NAME \
--set-env-vars "^:^GCP_PROJECT=YOUR_GCP_PROJECT_ID:TRANSLATE_TOPIC=YOUR_TRANSLATE_TOPIC_NAME:RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME:TO_LANG=es,en,fr,ja"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.Ganti kode berikut:
- REGION: Nama region Google Cloud tempat Anda ingin men-deploy fungsi (misalnya,
us-west1
). - YOUR_IMAGE_BUCKET_NAME: Nama bucket Cloud Storage tempat Anda akan mengupload gambar. Saat men-deploy fungsi generasi ke-2, tentukan nama bucket saja tanpa awalan
gs://
; misalnya,--trigger-event-filters="bucket=my-bucket"
.
- REGION: Nama region Google Cloud tempat Anda ingin men-deploy fungsi (misalnya,
Untuk men-deploy fungsi terjemahan teks dengan pemicu Cloud Pub/Sub, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=translateText \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=translate_text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=translate-text \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-translate \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrTranslateText \ --memory=512MB \
--trigger-topic YOUR_TRANSLATE_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_TOPIC=YOUR_RESULT_TOPIC_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.Untuk men-deploy fungsi yang menyimpan hasil ke Cloud Storage dengan pemicu Cloud Pub/Sub, jalankan perintah berikut di direktori yang berisi kode contoh (atau untuk Java, file
pom.xml
):Node.js
gcloud functions deploy ocr-save \ --gen2 \ --runtime=nodejs20 \ --region=
REGION
\ --source=. \ --entry-point=saveResult \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime dari versi Node.js yang didukung untuk menjalankan fungsi Anda.Python
gcloud functions deploy ocr-save \ --gen2 \ --runtime=python312 \ --region=
REGION
\ --source=. \ --entry-point=save_result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Python yang didukung untuk menjalankan fungsi Anda.Go
gcloud functions deploy ocr-save \ --gen2 \ --runtime=go121 \ --region=
REGION
\ --source=. \ --entry-point=save-result \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Go yang didukung untuk menjalankan fungsi Anda.Java
gcloud functions deploy ocr-save \ --gen2 \ --runtime=java17 \ --region=
REGION
\ --source=. \ --entry-point=functions.OcrSaveResult \ --memory=512MB \
--trigger-topic YOUR_RESULT_TOPIC_NAME \
--set-env-vars "GCP_PROJECT=YOUR_GCP_PROJECT_ID,RESULT_BUCKET=YOUR_RESULT_BUCKET_NAME"Gunakan flag
--runtime
untuk menentukan ID runtime versi Java yang didukung untuk menjalankan fungsi Anda.
Upload gambar
Upload gambar ke bucket Cloud Storage gambar Anda:
gsutil cp
PATH_TO_IMAGE
gs://YOUR_IMAGE_BUCKET_NAME
dengan
PATH_TO_IMAGE
adalah jalur ke file gambar (yang berisi teks) di sistem lokal Anda.YOUR_IMAGE_BUCKET_NAME
adalah nama bucket tempat Anda mengupload gambar.
Anda dapat mendownload salah satu gambar dari project contoh.
Perhatikan log untuk memastikan eksekusi telah selesai:
gcloud functions logs read --limit 100
Anda dapat melihat terjemahan yang disimpan di bucket Cloud Storage yang Anda gunakan untuk
YOUR_RESULT_BUCKET_NAME
.
Pembersihan
Agar tidak perlu membayar biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, hapus project yang berisi resource tersebut, atau simpan project dan hapus setiap resource.
Menghapus project
Cara termudah untuk menghilangkan penagihan adalah dengan menghapus project yang Anda buat untuk tutorial.
Untuk menghapus project:
- Di konsol Google Cloud, buka halaman Manage resource.
- Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
- Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.
Menghapus Cloud Functions
Menghapus Cloud Functions tidak akan menghapus resource apa pun yang tersimpan di Cloud Storage.
Untuk menghapus Cloud Functions yang Anda buat dalam tutorial ini, jalankan perintah berikut:
gcloud functions delete ocr-extract gcloud functions delete ocr-translate gcloud functions delete ocr-save
Anda juga dapat menghapus Cloud Functions dari Konsol Google Cloud.