Harga Speech-to-Text
Harga Speech-to-Text didasarkan pada jumlah audio yang berhasil diproses oleh layanan setiap bulan, yang diukur dalam kelipatan satu detik. Jika API menampilkan respons, audio yang dikirim dalam permintaan berhasil diproses. Hal ini termasuk respons kosong, yang menunjukkan bahwa API memproses audio tetapi tidak dapat mentranskripsikannya. Permintaan yang menyebabkan error server tidak dihitung sebagai berhasil diproses sehingga tidak dikenakan biaya apa pun.
Anda dapat melihat status penagihan saat ini, termasuk penggunaan dan tagihan saat ini, di Konsol Google Cloud. Untuk detail selengkapnya tentang cara mengelola akun, lihat dokumentasi Penagihan Cloud atau dukungan penagihan dan pembayaran.
Tabel harga
Harga pada tabel di bawah berlaku untuk menit audio yang diproses per bulan untuk Speech-to-Text V1 API.
Kategori | Model | Harga | |
---|---|---|---|
0-60 Menit/Bulan | Di atas 60 Menit/Bulan | ||
Pengenalan Ucapan (tanpa logging data - default) | Standar¹ | Gratis | $0,024/menit ** |
Medis² | Gratis | $0,078/menit ** | |
Pengenalan Ucapan (dengan logging data yang aktif) | Standar¹ | Gratis | $0,016/menit ** |
Harga pada tabel di bawah berlaku untuk menit audio yang diproses per bulan untuk Speech-to-Text V2 API.
Kategori | Model | Harga | |||
---|---|---|---|---|---|
0-500.000 menit/bulan | 500.000-1.000.000 menit/bulan | 1.000.000-2.000.000 menit/bulan | 2.000.000+ menit/bulan | ||
Pengenalan ucapan (default) | Standar¹ | $0,016/menit ** | $0,010/menit ** | $0,008/menit ** | $0,004/menit ** |
Medis² | $0,078/menit ** | $0,078/menit ** | $0,078/menit ** | $0,078/menit ** | |
Pengenalan ucapan batch dinamis | Standar¹ | $0,003/menit ** | $0,003/menit ** | $0,003/menit ** | $0,003/menit ** |
Model Standar¹ mencakup: default
, command_and_search
, latest_short
, latest_long
, phone_call
, video
, chirp
(hanya Speech-to-Text V2).
Model Medis² mencakup: medical_conversation
, medical_dictation
.
** Setiap permintaan dibulatkan ke atas ke kenaikan 1 detik terdekat.
Faktor penentuan harga
Harga Speech-to-Text ditentukan oleh faktor berikut:
* Jumlah saluran dalam audio yang dikenali. * Durasi dan jumlah audio yang Anda kirim. * Model pengenalan yang Anda gunakan. * Metode batch yang Anda gunakan. * Versi API yang Anda gunakan.
Beberapa saluran
Setiap saluran audio ditagih secara terpisah. Jika Anda mengirim permintaan dengan beberapa saluran, Anda akan ditagih sesuai dengan jumlah total durasi audio yang diproses dari semua saluran. Penghitungan waktu ini berbeda dengan cara pelacakan batas penggunaan bulanan. Batas penggunaan tidak mempertimbangkan beberapa saluran dan ditentukan hanya berdasarkan durasi file audio. Misalnya, jika Anda mengirim permintaan dengan audio berdurasi 30 detik dan 4 saluran, Anda akan ditagih untuk 120 detik, tetapi hanya 30 detik yang akan mengurangi kuota bulanan. Lihat halaman kuota & batas untuk mengetahui detail selengkapnya.
Batch dinamis
Speech-to-Text V2 API memiliki opsi untuk menggunakan batch dinamis. Batch dinamis memproses audio pada tingkat urgensi yang lebih rendah. Jika mengaktifkan batch dinamis, Anda akan ditagih dengan tarif diskon.
Workload yang besar
Untuk pelanggan dengan workload sangat besar, diskon volume tambahan mungkin tersedia. Silakan hubungi bagian penjual untuk mempelajari lebih lanjut.
Biaya Google Cloud Platform
Jika Anda menyimpan file audio untuk dikenali di Google Cloud Storage, atau menggunakan resource Google Cloud Platform lainnya bersama dengan Speech-to-Text, seperti instance Google App Engine, maka Anda juga akan dikenai biaya atas penggunaan layanan tersebut. Lihat kalkulator harga Google Cloud Platform untuk menentukan biaya lainnya yang didasarkan pada tarif saat ini.
Langkah berikutnya
- Baca dokumentasi Speech-to-Text.
- Mulai menggunakan Speech-to-Text.
- Coba Kalkulator Harga.
- Pelajari solusi dan kasus penggunaan Speech-to-Text.