Halaman ini membantu developer menyiapkan project untuk menggunakan layanan Speech-to-Text. Proses ini mencakup pembuatan project, pengaktifan Speech-to-Text API, penginstalan library klien, penentuan variabel lingkungan, dan autentikasi kredensial Anda. Jika Anda baru menggunakan Vertex AI, pelajari lebih lanjut fitur pengenalan ucapan.
Anda menyiapkan project pengenalan ucapan menggunakan konsol GDC dan gdcloud CLI sebagai berikut:
- Konsol GDC: Aktifkan Speech-to-Text API dan lihat status serta endpoint layanan.
- gdcloud CLI: Konfigurasi akun layanan untuk berinteraksi dengan Speech-to-Text API, instal library klien, dan autentikasi permintaan API.
Membuat project
Membuat project pengenalan ucapan dalam hierarki resource Distributed Cloud mengatur resource Speech-to-Text Anda, yang mencakup kolaborator, API yang diaktifkan, alat pemantauan, informasi penagihan, kredensial autentikasi, dan kontrol akses.
Untuk membuat project, lihat Menyiapkan project untuk Vertex AI. Anda memerlukan project ID saat melakukan panggilan API.
Meminta izin developer
Anda harus memiliki peran AI Speech Developer di project untuk mengakses fitur pengenalan ucapan dan membuat token API untuk autentikasi dan otorisasi permintaan.
Minta Admin IAM Project Anda untuk memberikan peran AI Speech Developer
(ai-speech-developer
) kepada akun pengguna atau layanan Anda
dalam namespace project Anda. Untuk mengetahui informasi tentang peran ini, lihat
Siapkan izin IAM.
Mengaktifkan Speech-to-Text API
Anda harus mengaktifkan Speech-to-Text API terlatih sebelumnya untuk project Anda. Jika diaktifkan, Anda dapat melihat status layanan dan endpoint untuk Speech-to-Text API terlatih sebelumnya.
Menginstal library klien
Library klien tersedia untuk bahasa pemrograman Python. Sebaiknya gunakan library klien ini untuk melakukan panggilan ke Speech-to-Text API karena library tersebut memudahkan akses ke API.
Instal library klien Speech-to-Text dan ikuti langkah-langkah berikut untuk memastikan Anda memiliki versi yang benar:
Periksa apakah library klien Speech-to-Text telah diinstal dan dapatkan nomor versinya:
pip freeze | grep speech
Jika library klien sudah diinstal, Anda akan mendapatkan output yang mirip dengan contoh berikut:
google-cloud-speech==2.15.0
Nomor versi yang Anda dapatkan harus cocok dengan library klien di endpoint berikut:
https://GDC_URL/.well-known/static/client-libraries
Ganti
GDC_URL
dengan URL organisasi Anda di GDC.Jika nomor versi tidak cocok, hapus instalasi library klien:
pip uninstall google-cloud-speech
Jika Anda meng-uninstal library klien Speech-to-Text, Anda harus menginstal ulang dengan menentukan nama file yang sesuai dengan sistem operasi Anda.
Menetapkan variabel lingkungan
Setelah menginstal library klien Speech-to-Text, Anda dapat berinteraksi dengan API dari skrip Python.
Jika Anda menyiapkan akun layanan di project untuk membuat panggilan API yang sah secara terprogram, Anda dapat menentukan variabel lingkungan dalam skrip Python untuk mengakses nilai seperti kunci akun layanan saat dijalankan.
Ikuti langkah-langkah berikut untuk menetapkan variabel lingkungan yang diperlukan pada skrip Python:
Buat notebook JupyterLab untuk berinteraksi dengan Speech-to-Text API terlatih.
Buat skrip Python di notebook JupyterLab.
Tambahkan kode berikut ke skrip Python:
import os os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
Ganti
APPLICATION_DEFAULT_CREDENTIALS_FILENAME
dengan nama file JSON yang berisi kunci akun layanan yang Anda buat di project, sepertimy-service-key.json
.Simpan skrip Python dengan nama, seperti
speech.py
.Jalankan skrip Python untuk menetapkan variabel lingkungan:
python SCRIPT_NAME
Ganti
SCRIPT_NAME
dengan nama yang Anda berikan ke skrip Python, sepertispeech.py
.
Menyiapkan autentikasi
Sebelum dapat mulai menggunakan Speech-to-Text API, Anda harus mengautentikasi kredensial klien dan meminta akses akun ke resource project Anda. Untuk mengetahui informasi selengkapnya, lihat Mengautentikasi permintaan API.