Menyiapkan project pengenalan ucapan

Halaman ini membantu developer menyiapkan project untuk menggunakan layanan Speech-to-Text. Proses ini mencakup pembuatan project, pengaktifan Speech-to-Text API, penginstalan library klien, penentuan variabel lingkungan, dan autentikasi kredensial Anda. Jika Anda baru menggunakan Vertex AI, pelajari lebih lanjut fitur pengenalan ucapan.

Anda menyiapkan project pengenalan ucapan menggunakan konsol GDC dan gdcloud CLI sebagai berikut:

  • Konsol GDC: Aktifkan Speech-to-Text API dan lihat status serta endpoint layanan.
  • gdcloud CLI: Konfigurasi akun layanan untuk berinteraksi dengan Speech-to-Text API, instal library klien, dan autentikasi permintaan API.

Membuat project

Membuat project pengenalan ucapan dalam hierarki resource Distributed Cloud mengatur resource Speech-to-Text Anda, yang mencakup kolaborator, API yang diaktifkan, alat pemantauan, informasi penagihan, kredensial autentikasi, dan kontrol akses.

Untuk membuat project, lihat Menyiapkan project untuk Vertex AI. Anda memerlukan project ID saat melakukan panggilan API.

Meminta izin developer

Anda harus memiliki peran AI Speech Developer di project untuk mengakses fitur pengenalan ucapan dan membuat token API untuk autentikasi dan otorisasi permintaan.

Minta Admin IAM Project Anda untuk memberikan peran AI Speech Developer (ai-speech-developer) kepada akun pengguna atau layanan Anda dalam namespace project Anda. Untuk mengetahui informasi tentang peran ini, lihat Siapkan izin IAM.

Mengaktifkan Speech-to-Text API

Anda harus mengaktifkan Speech-to-Text API terlatih sebelumnya untuk project Anda. Jika diaktifkan, Anda dapat melihat status layanan dan endpoint untuk Speech-to-Text API terlatih sebelumnya.

Menginstal library klien

Library klien tersedia untuk bahasa pemrograman Python. Sebaiknya gunakan library klien ini untuk melakukan panggilan ke Speech-to-Text API karena library tersebut memudahkan akses ke API.

Instal library klien Speech-to-Text dan ikuti langkah-langkah berikut untuk memastikan Anda memiliki versi yang benar:

  1. Periksa apakah library klien Speech-to-Text telah diinstal dan dapatkan nomor versinya:

    pip freeze | grep speech
    

    Jika library klien sudah diinstal, Anda akan mendapatkan output yang mirip dengan contoh berikut:

    google-cloud-speech==2.15.0
    

    Nomor versi yang Anda dapatkan harus cocok dengan library klien di endpoint berikut:

    https://GDC_URL/.well-known/static/client-libraries
    

    Ganti GDC_URL dengan URL organisasi Anda di GDC.

  2. Jika nomor versi tidak cocok, hapus instalasi library klien:

    pip uninstall google-cloud-speech
    
  3. Jika Anda meng-uninstal library klien Speech-to-Text, Anda harus menginstal ulang dengan menentukan nama file yang sesuai dengan sistem operasi Anda.

Menetapkan variabel lingkungan

Setelah menginstal library klien Speech-to-Text, Anda dapat berinteraksi dengan API dari skrip Python.

Jika Anda menyiapkan akun layanan di project untuk membuat panggilan API yang sah secara terprogram, Anda dapat menentukan variabel lingkungan dalam skrip Python untuk mengakses nilai seperti kunci akun layanan saat dijalankan.

Ikuti langkah-langkah berikut untuk menetapkan variabel lingkungan yang diperlukan pada skrip Python:

  1. Buat notebook JupyterLab untuk berinteraksi dengan Speech-to-Text API terlatih.

  2. Buat skrip Python di notebook JupyterLab.

  3. Tambahkan kode berikut ke skrip Python:

    import os
    
    os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
    

    Ganti APPLICATION_DEFAULT_CREDENTIALS_FILENAME dengan nama file JSON yang berisi kunci akun layanan yang Anda buat di project, seperti my-service-key.json.

  4. Simpan skrip Python dengan nama, seperti speech.py.

  5. Jalankan skrip Python untuk menetapkan variabel lingkungan:

    python SCRIPT_NAME
    

    Ganti SCRIPT_NAME dengan nama yang Anda berikan ke skrip Python, seperti speech.py.

Menyiapkan autentikasi

Sebelum dapat mulai menggunakan Speech-to-Text API, Anda harus mengautentikasi kredensial klien dan meminta akses akun ke resource project Anda. Untuk mengetahui informasi selengkapnya, lihat Mengautentikasi permintaan API.