Menyiapkan project pengenalan karakter

Halaman ini membantu developer menyiapkan project air-gapped Google Distributed Cloud (GDC) untuk menggunakan layanan Optical Character Recognition (OCR). Proses ini mencakup pembuatan project, pengaktifan OCR API, penginstalan library klien, penentuan variabel lingkungan, dan autentikasi kredensial Anda. Jika Anda baru menggunakan Vertex AI, pelajari lebih lanjut fitur pengenalan karakter.

Anda menyiapkan project pengenalan karakter menggunakan konsol GDC dan gdcloud CLI sebagai berikut:

  • Konsol GDC: Aktifkan OCR API dan lihat status serta endpoint layanan.
  • gdcloud CLI: Konfigurasi akun layanan untuk berinteraksi dengan OCR API, instal library klien, dan autentikasi permintaan API.

Membuat project

Membuat project pengenalan karakter dalam hierarki resource Distributed Cloud mengatur resource OCR Anda, yang mencakup kolaborator, API yang diaktifkan, alat pemantauan, informasi penagihan, kredensial autentikasi, dan kontrol akses.

Untuk membuat project, lihat Menyiapkan project untuk Vertex AI. Anda memerlukan project ID saat melakukan panggilan API.

Meminta izin developer

Anda harus memiliki peran Developer OCR AI di project untuk mengakses fitur pengenalan karakter optik dan membuat token API untuk autentikasi dan otorisasi permintaan.

Minta Admin IAM Project Anda untuk memberikan peran AI OCR Developer (ai-ocr-developer) kepada pengguna atau akun layanan Anda dalam namespace project Anda. Untuk mengetahui informasi tentang peran ini, lihat Siapkan izin IAM.

Mengaktifkan OCR API

Anda harus mengaktifkan OCR API terlatih untuk project Anda. Jika diaktifkan, Anda dapat melihat status layanan dan endpoint untuk OCR API terlatih.

Menginstal library klien

Library klien tersedia untuk bahasa pemrograman Python. Sebaiknya gunakan library klien ini untuk melakukan panggilan ke OCR API karena library tersebut memudahkan akses ke API.

Instal library klien OCR dan ikuti langkah-langkah berikut untuk memastikan Anda memiliki versi yang benar:

  1. Periksa apakah library klien OCR sudah diinstal dan dapatkan nomor versinya:

    pip freeze | grep vision
    

    Jika library klien sudah diinstal, Anda akan mendapatkan output yang mirip dengan contoh berikut:

    google-cloud-vision==3.0.0
    

    Nomor versi yang Anda dapatkan harus cocok dengan library klien di endpoint berikut:

    https://GDC_URL/.well-known/static/client-libraries
    

    Ganti GDC_URL dengan URL organisasi Anda di GDC.

  2. Jika nomor versi tidak cocok, hapus instalasi library klien:

    pip uninstall google-cloud-vision
    
  3. Jika Anda menghapus instalasi library klien OCR, Anda harus menginstalnya kembali dengan menentukan nama file yang sesuai dengan sistem operasi Anda.

Menetapkan variabel lingkungan

Setelah menginstal library klien OCR, Anda dapat berinteraksi dengan API dari skrip Python.

Jika Anda menyiapkan akun layanan di project untuk membuat panggilan API yang sah secara terprogram, Anda dapat menentukan variabel lingkungan dalam skrip Python untuk mengakses nilai seperti kunci akun layanan saat dijalankan.

Ikuti langkah-langkah berikut untuk menetapkan variabel lingkungan yang diperlukan pada skrip Python:

  1. Buat notebook JupyterLab untuk berinteraksi dengan OCR API terlatih.

  2. Buat skrip Python di notebook JupyterLab.

  3. Tambahkan kode berikut ke skrip Python:

    import os
    
    os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
    

    Ganti APPLICATION_DEFAULT_CREDENTIALS_FILENAME dengan nama file JSON yang berisi kunci akun layanan yang Anda buat di project, seperti my-service-key.json.

  4. Simpan skrip Python dengan nama, seperti vision.py.

  5. Jalankan skrip Python untuk menetapkan variabel lingkungan:

    python SCRIPT_NAME
    

    Ganti SCRIPT_NAME dengan nama yang Anda berikan ke skrip Python, seperti vision.py.

Menyiapkan autentikasi

Sebelum dapat mulai menggunakan OCR API, Anda harus mengautentikasi kredensial klien dan meminta akses akun ke resource project Anda. Untuk mengetahui informasi selengkapnya, lihat Mengautentikasi permintaan API.