本文說明現行的 Speech-to-Text API 限制和用量上限。這些限制和用量上限如有變更,本頁面也會進行更新,以反映這些變更。Google 保留更改這些限制的權利。
如有需要,您也可以申請提高配額。如要進一步瞭解如何查看及管理配額,請參閱 Google Cloud 配額頁面。
在提出申請後,Google 可能會與您聯絡以便進一步瞭解相關資訊,並且會通知您申請是否獲得核准。
內容限制
同步要求
同步辨識要求 (使用 Recognize
方法) 接受音訊資料,可直接在要求的 content
欄位中提供,或在要求的 uri
欄位中提供 Cloud Storage URI。傳送至同步要求的音訊大小上限為 10 MB,或音訊長度上限為 1 分鐘 (以先達到者為準)。如要進一步瞭解同步辨識,請參閱同步辨識總覽。
串流要求
串流辨識要求 (使用 StreamingRecognize
方法) 只會接受要求 audio
欄位中的內嵌音訊。串流中的每個要求音訊大小上限為 25 KB。串流最多可保持開啟 5 分鐘,且音訊必須以近乎即時的速率傳送。如要串流超過 5 分鐘的內容,請參閱無限串流教學課程。如要進一步瞭解串流辨識功能,請參閱串流辨識總覽。
批次要求
批次辨識要求 (使用 BatchRecognize
方法) 只接受以 Cloud Storage URI 形式提供的音訊,且必須位於要求的 uri
欄位中。每個 BatchRecognizeRequest
最多可包含 15 個 files
轉錄內容。每個檔案的長度上限為 8 小時。如要進一步瞭解非同步辨識,請參閱批次辨識總覽。
多語言辨識
多語言辨識功能僅適用於全球、美國和歐盟的 Speech-to-Text 端點。
調適
您也可以在任何要求中提供 PhraseSet 和 CustomClass 資源。這些資源適用下列限制:
語音調整限制 | 值 |
---|---|
詞組增幅值上限 | 20 |
PhraseSet 中的詞組 | 1,200 |
每次要求的詞組數 | 5,000 |
每個詞組的字元數 | 100 |
每次要求的字元總數 | 100,000 |
CustomClass 中的項目數量上限 | 500 |
每個 CustomClass 項目最多可輸入的字元數 | 500 |
每個 SpeechAdaptation 的 PhraseSet 數量上限 | 20 |
每個 SpeechAdaptation 的 CustomClass 數量上限 | 20 |
資源限制
Speech-to-Text 目前的 API 資源限制如下 (未來可能異動):
限制類型 | 用量限制 |
---|---|
每個區域的辨識器數量 | 5,000 |
自訂類別數量 (每個區域) | 5,000 |
詞組集數量 (每個區域) | 5,000 |
要求限制
Speech-to-Text 目前的 API 用量限制如下 (未來可能異動):
限制類型 | 用量限制 |
---|---|
每 60 秒的資源要求數 (每個區域) | 100 |
每 60 秒的作業要求數 (每個區域) | 150 |
每 60 秒的同步辨識要求數 (每個區域) | 300 |
每 60 秒串流辨識要求數 (每個區域) * | 1,000,000 |
每 5 分鐘的串流辨識工作階段數 (每個區域) * | 300 |
每 60 秒的批次辨識要求數 (每個區域) | 150 |
* 串流辨識的配額限制為每 5 分鐘 300 個並行工作階段,以及每分鐘 3,000 項要求,這項限制適用於所有並行工作階段。工作階段的初始設定要求不會計入要求配額。
這些限制適用於每項 Speech-to-Text 開發人員專案,而且使用該開發人員專案的所有應用程式和 IP 位址必須共用上述額度。